어렵네요!

도배 하자 질의 응답 처리 : 한솔데코 시즌2 생성 AI 경진대회

어렵네요!

오박사

2024.02.01 10:29 3,719 Views

처음 LLM을 접해보는데, 모르는게 많아 생소하고 어렵습니다 ㅜ.ㅜ

세상이 엄청 빠르게 변화하는데 못따라가는 느낌이네요.

모델을 고민하시는 분들은 아래의 링크가 있는지 알고 계셨는지 싶어서 올려드려요!

(사실 저는 몰라서 좀 방황했습니다.)

https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard

SOLAR모델이 잘 나가는 것 같네요!

그리고 고수분들께 질문 좀 드릴려구요.

https://huggingface.co/docs/transformers/model_doc/llama2

위 링크 중

A notebook on how to fine-tune Llama 2 in Google Colab using QLoRA and 4-bit precision. 🌎

를 통해서

beomi/llama-2-ko-7b 을 10 epoch쯤 돌리니, Public 0.675 겨우 달성했네요.

다들 파인튜닝 시 몇 epoch를 돌리시나요?

모델이 문제인지, 파라미터가 문제인지, epoch수가 부족했는지

복잡하고 어렵습니다.

서로 의견 공유했으면 해서 글 올립니다~!

7 Comments

comment

0 / 1000

신도림조기축구회_김덕배

2024.02.01 10:38

Loss를 보고 최적의 로스로 Checkpoint 에서 로드해서 쓰긴하는데요.. 개인적으로 이 대회는 데이터 싸움같기도하구요 저도 지금 스코어 6b 모델에 파인튜닝을 했는데 RAG 올리신코드보다 점수가 안나오는거보면 , 답으로 요구하는 키워드 같은게 들어가야하나 생각도 하고 있어요.

외부데이터를 어떻게 가져오냐가 중요해보이긴합니다. 모델문제인가 싶어서 GPT로 쿼리를 던져주고 응답 받아봤을때도 6b모델이랑 크게 차이는 없었습니다.

궁금하네요 ㅋㅋ

오박사

2024.02.01 17:07

그래서 데이터를 가지고 오자니, 지식인은 광고나 개인적인 의견도 있어 애매하더라구요. 확실히 모델보다는 데이터 싸움인 것 같더라구요. 제공해주신 pdf들도 학습해봤는데, 생각보다 효과는 못봤습니다 ㅜ

신도림조기축구회_김덕배

2024.02.01 17:15

저도 리트리버 해봤는데 , pdf 로 저걸 전처리하지 않는이상 관련되게 효과는 없을듯하더라구요 임베딩하는거 5개 뽑아보니 관련전혀없구 ㅋㅋㅋ

abdc

2024.02.01 12:54

코랩에는 solar 모델이 안올라가나요?

오박사

2024.02.01 17:08

올려서 진행해봤는데, 중간에 자리비웠다 오니 꺼져서 3시간 날렸네요 ㅜ.ㅜ