도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회

어렵네요!

2024.02.01 10:29 1,897 Views

처음 LLM을 접해보는데, 모르는게 많아 생소하고 어렵습니다 ㅜ.ㅜ

세상이 엄청 빠르게 변화하는데 못따라가는 느낌이네요.


모델을 고민하시는 분들은 아래의 링크가 있는지 알고 계셨는지 싶어서 올려드려요!

(사실 저는 몰라서 좀 방황했습니다.)


https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard


SOLAR모델이 잘 나가는 것 같네요!



그리고 고수분들께 질문 좀 드릴려구요.



https://huggingface.co/docs/transformers/model_doc/llama2


위 링크 중

  • notebook on how to fine-tune Llama 2 in Google Colab using QLoRA and 4-bit precision. 🌎


를 통해서


beomi/llama-2-ko-7b 을 10 epoch쯤 돌리니, Public 0.675 겨우 달성했네요.


다들 파인튜닝 시 몇 epoch를 돌리시나요?


모델이 문제인지, 파라미터가 문제인지, epoch수가 부족했는지

복잡하고 어렵습니다.



서로 의견 공유했으면 해서 글 올립니다~!

로그인이 필요합니다
0 / 1000
신도림조기축구회_김덕배
2024.02.01 10:38

Loss를 보고 최적의 로스로 Checkpoint 에서 로드해서 쓰긴하는데요.. 개인적으로 이 대회는 데이터 싸움같기도하구요 저도 지금 스코어 6b 모델에 파인튜닝을 했는데 RAG 올리신코드보다 점수가 안나오는거보면 , 답으로 요구하는 키워드 같은게 들어가야하나 생각도 하고 있어요.

외부데이터를 어떻게 가져오냐가 중요해보이긴합니다. 모델문제인가 싶어서 GPT로 쿼리를 던져주고 응답 받아봤을때도 6b모델이랑 크게 차이는 없었습니다.

궁금하네요 ㅋㅋ

홍짜장
2024.02.01 17:07

그래서 데이터를 가지고 오자니, 지식인은 광고나 개인적인 의견도 있어 애매하더라구요. 확실히 모델보다는 데이터 싸움인 것 같더라구요. 제공해주신 pdf들도 학습해봤는데, 생각보다 효과는 못봤습니다 ㅜ

신도림조기축구회_김덕배
2024.02.01 17:15

저도 리트리버 해봤는데 , pdf 로 저걸 전처리하지 않는이상 관련되게 효과는 없을듯하더라구요 임베딩하는거 5개 뽑아보니 관련전혀없구 ㅋㅋㅋ

abdc
2024.02.01 12:54

코랩에는 solar 모델이 안올라가나요?

홍짜장
2024.02.01 17:08

올려서 진행해봤는데, 중간에 자리비웠다 오니 꺼져서 3시간 날렸네요 ㅜ.ㅜ

abdc
2024.02.01 19:49

뭔가 코랩에선 11B 가까이 되는 모델은 안될것 같아서 코랩 프로 결제할지 고민 중이네요...
ko-llama2로도 충분하려나요..

꾸리에용
2024.02.05 16:57

리더보드 맹신하면 안좋은게 실제로 해보면 성능이 별로인 경우가 많더라구요 확인하고 사용해야할 것 같아요