난독화된 한글 리뷰 복원 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 생성형 AI | LLM | F1 Score

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 2025.01.06 ~ 2025.02.28 09:59 + Google Calendar
  • 712명 마감

 

[private 2위] CSU_AI

공동작성자
2025.03.05 17:17 23,630 조회 language

저희는 여러 llm모델 추론 결과를 조합하는 방법을 중점으로 실험을 진행했습니다.
모든 코드를 다 올리면 너무 길어질 것 같아 보팅하는 코드만 올리고 나머지 코드는 github에 올려놓았습니다.  
자세한 내용은 밑의 PDF와 github를 참고해주시길 바랍니다.

깃허브 : https://github.com/sungcoook/Decryption.git

- '1차 모델 코드' 폴더에는 초기보팅때 쓰인 모델을 학습하기 위한 코드와 추론하기 위한 코드가 들어있습니다.
- '2차 모델 코드'폴더에는 최종보팅때 쓰인 모델을 학습하기 위한 코드와 추론하기 위한 코드가 들어있습니다.
- '사용csv'폴더에는 각 모델/보팅로직(초기,최종) 을 이용해 나온 추론 결과 csv파일들이 들어있습니다.
- '1차+2차보팅최종코드.ipynb'는 각각의 모델에서 나온 추론 결과csv 파일을 보팅한 초기보팅로직과 최종보팅로직을 합쳐놓았습니다.
*gemma 모델의 경우 추론코드가 훈련코드와 분리되어있는데 '1차모델코드' 폴더에만 500steps씩 훈련한 모델이 저장되는 훈련코드파일을 넣어놨으며 3개(2500steps, 3000steps, 4179steps)의 추론코드는 각각 쓰여진 보팅로직 방법에 따라 해당하는 폴더에 넣어놓았습니다.

PDF
코드
로그인이 필요합니다
0 / 1000
힐링이필요해
2025.03.06 09:20

보팅의 효과가 정말 좋네요. 컴퓨팅 자원이랑 시간만 허용된다면 보팅 로직을 사용하는게 진짜 유용할 거 같네요. 좋은 내용 공유해 주셔서 감사합니다!