분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회
어렵네요!
처음 LLM을 접해보는데, 모르는게 많아 생소하고 어렵습니다 ㅜ.ㅜ
세상이 엄청 빠르게 변화하는데 못따라가는 느낌이네요.
모델을 고민하시는 분들은 아래의 링크가 있는지 알고 계셨는지 싶어서 올려드려요!
(사실 저는 몰라서 좀 방황했습니다.)
https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard
SOLAR모델이 잘 나가는 것 같네요!
그리고 고수분들께 질문 좀 드릴려구요.
https://huggingface.co/docs/transformers/model_doc/llama2
위 링크 중
를 통해서
beomi/llama-2-ko-7b 을 10 epoch쯤 돌리니, Public 0.675 겨우 달성했네요.
다들 파인튜닝 시 몇 epoch를 돌리시나요?
모델이 문제인지, 파라미터가 문제인지, epoch수가 부족했는지
복잡하고 어렵습니다.
서로 의견 공유했으면 해서 글 올립니다~!
그래서 데이터를 가지고 오자니, 지식인은 광고나 개인적인 의견도 있어 애매하더라구요. 확실히 모델보다는 데이터 싸움인 것 같더라구요. 제공해주신 pdf들도 학습해봤는데, 생각보다 효과는 못봤습니다 ㅜ
저도 리트리버 해봤는데 , pdf 로 저걸 전처리하지 않는이상 관련되게 효과는 없을듯하더라구요 임베딩하는거 5개 뽑아보니 관련전혀없구 ㅋㅋㅋ
코랩에는 solar 모델이 안올라가나요?
올려서 진행해봤는데, 중간에 자리비웠다 오니 꺼져서 3시간 날렸네요 ㅜ.ㅜ
뭔가 코랩에선 11B 가까이 되는 모델은 안될것 같아서 코랩 프로 결제할지 고민 중이네요...
ko-llama2로도 충분하려나요..
리더보드 맹신하면 안좋은게 실제로 해보면 성능이 별로인 경우가 많더라구요 확인하고 사용해야할 것 같아요
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Loss를 보고 최적의 로스로 Checkpoint 에서 로드해서 쓰긴하는데요.. 개인적으로 이 대회는 데이터 싸움같기도하구요 저도 지금 스코어 6b 모델에 파인튜닝을 했는데 RAG 올리신코드보다 점수가 안나오는거보면 , 답으로 요구하는 키워드 같은게 들어가야하나 생각도 하고 있어요.
외부데이터를 어떻게 가져오냐가 중요해보이긴합니다. 모델문제인가 싶어서 GPT로 쿼리를 던져주고 응답 받아봤을때도 6b모델이랑 크게 차이는 없었습니다.
궁금하네요 ㅋㅋ