서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회
혹시 3B 파라미터 이하 모델로 상위권 진입하신 분들 계신가요?
어떻게 하신거죠?? 모델 공유 좀 해주세요 ㅎㅎㅎ
저는 heegyu/polyglot-ko-1.3b-chat 사용했어요 이것도 코랩으로 간신히 돌렸네요 ㅎㅎ
벡터 DB 구축해서 사용자 질문을 받고 코사인 유사도로 벡터DB내에서 유사한 질문을 찾아서 다시 모델에 건네주는 방식으로 답변의 질을 높히고자 했었는데 만족할만한 결과는 안나오네요..
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저두 본업이 매우 바빠져서, 많이 진행을 못했습니다. 특히, RAG기반을 제대로 적용을 해보지 못한게 좀 아쉽긴합니다.
코랩을 사용하지는 않았고, 보유한 8GB VRAM GPU로 가능한 7B (qLora)모델까지 시도해 보았으나,
qLora 로는 baseline 모델(skt-gpt2)보다 뛰어난 점이 없이 거의 비슷했습니다.
qLora 를 사용하지 않는 방법으로는 1.3B 모델이 최대인 듯 했으나,
이 역시도 skt-gpt2와 같은 알고리즘이라서 인지 몰라도 성능향상이 크지는 않더군요.
단순 RAG 기반으로 시도도 하였으나 점수가 차이가 없더군요. 본업이 바빠져서 더 시도해보지 못했습니다.
혹시, 높은 점수를 얻으신 분들은 어떻게 얻으셨는지 궁금합니다.