분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[private 2위] CSU_AI
저희는 여러 llm모델 추론 결과를 조합하는 방법을 중점으로 실험을 진행했습니다.
모든 코드를 다 올리면 너무 길어질 것 같아 보팅하는 코드만 올리고 나머지 코드는 github에 올려놓았습니다.
자세한 내용은 밑의 PDF와 github를 참고해주시길 바랍니다.
깃허브 : https://github.com/sungcoook/Decryption.git
- '1차 모델 코드' 폴더에는 초기보팅때 쓰인 모델을 학습하기 위한 코드와 추론하기 위한 코드가 들어있습니다.
- '2차 모델 코드'폴더에는 최종보팅때 쓰인 모델을 학습하기 위한 코드와 추론하기 위한 코드가 들어있습니다.
- '사용csv'폴더에는 각 모델/보팅로직(초기,최종) 을 이용해 나온 추론 결과 csv파일들이 들어있습니다.
- '1차+2차보팅최종코드.ipynb'는 각각의 모델에서 나온 추론 결과csv 파일을 보팅한 초기보팅로직과 최종보팅로직을 합쳐놓았습니다.
*gemma 모델의 경우 추론코드가 훈련코드와 분리되어있는데 '1차모델코드' 폴더에만 500steps씩 훈련한 모델이 저장되는 훈련코드파일을 넣어놨으며 3개(2500steps, 3000steps, 4179steps)의 추론코드는 각각 쓰여진 보팅로직 방법에 따라 해당하는 폴더에 넣어놓았습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
보팅의 효과가 정말 좋네요. 컴퓨팅 자원이랑 시간만 허용된다면 보팅 로직을 사용하는게 진짜 유용할 거 같네요. 좋은 내용 공유해 주셔서 감사합니다!