혹시 3B 파라미터 이하 모델로 상위권 진입하신 분들 계신가요?

도배 하자 질의 응답 처리 : 한솔데코 시즌2 생성 AI 경진대회

비빅바

2024.03.11 10:33 2,972 조회

어떻게 하신거죠?? 모델 공유 좀 해주세요 ㅎㅎㅎ

저는 heegyu/polyglot-ko-1.3b-chat 사용했어요 이것도 코랩으로 간신히 돌렸네요 ㅎㅎ

벡터 DB 구축해서 사용자 질문을 받고 코사인 유사도로 벡터DB내에서 유사한 질문을 찾아서 다시 모델에 건네주는 방식으로 답변의 질을 높히고자 했었는데 만족할만한 결과는 안나오네요..

댓글 1개

로그인이 필요합니다

comment

0 / 1000

basslibrary

2024.03.15 12:57

저두 본업이 매우 바빠져서, 많이 진행을 못했습니다. 특히, RAG기반을 제대로 적용을 해보지 못한게 좀 아쉽긴합니다.
코랩을 사용하지는 않았고, 보유한 8GB VRAM GPU로 가능한 7B (qLora)모델까지 시도해 보았으나,
qLora 로는 baseline 모델(skt-gpt2)보다 뛰어난 점이 없이 거의 비슷했습니다.
qLora 를 사용하지 않는 방법으로는 1.3B 모델이 최대인 듯 했으나,
이 역시도 skt-gpt2와 같은 알고리즘이라서 인지 몰라도 성능향상이 크지는 않더군요.
단순 RAG 기반으로 시도도 하였으나 점수가 차이가 없더군요. 본업이 바빠져서 더 시도해보지 못했습니다.
혹시, 높은 점수를 얻으신 분들은 어떻게 얻으셨는지 궁금합니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!

목록으로

데이터 활용 신청

대회 - HD현대 AI Challenge

2년 전

현재 글

혹시 3B 파라미터 이하 모델로 상위권 진입하신 분들 계신가요?

대회 - 도배 하자 질의 응답 처리 : 한솔데코 시즌2 생성 AI 경진대회

2년 전

대회가 끝났네요 수고하셨습니다~!

대회 - 도배 하자 질의 응답 처리 : 한솔데코 시즌2 생성 AI 경진대회

2년 전