ChatGPT 활용 AI 경진대회 월간 데이콘

알고리즘 | ChatGPT | 프롬프트 엔지니어링 | 언어 | 분류 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 1,200명 마감

 

[Private 11위] Bert-base with weighted classes

2023.04.10 17:10 1,206 조회 language

캐글 노트북 환경에서 학습할 수 있도록 코드를 작성했습니다.(코랩 대비 성능, 안정성이 높습니다)
순서를 간단히 정리하면 다음과 같습니다.
1. 구글 드라이브에 업로드 된 데이터를 다운로드 받는다.(주석처리했습니다)
2. 전처리를 수행한다.
3. Dataset 클래스를 정의한다.
4. Dataset을 구축하고 DataLoader로 불러온다.
5. Model, Criterion, Optimizer, Metric을 정의한다.
6. 로그 관리를 위한 Wandb Config를 설정한다.
7. Traininig/Validation Loop를 정의한다.
8. 가중치별로 각각 학습을 수행한다.
9. 가중치별로 수행된 학습 결과를 합쳐서 soft / hard / weighted voting을 진행한다.
제출했을 때 우수한 성능을 보였던 것은 hard voting이고 나머지는 코드가 적절히 작성되지 않았습니다.
이후 디버깅을 통해 다른 버전에서는 각 voting 결과를 뽑아낼 수 있었지만, 해당 버전에서는 아닙니다.

이 버전에서는 클래스별로 다른 가중치를 부여하여 네 개의 조합을 구성했습니다.
따라서 각 조합에 따라 모델이 학습한 결과가 다르고 그때의 model state를 각각 저장했습니다.
아래 링크는 제 구글드라이브에 저장된 해당 버전에서의 학습 결과가 저장된 4개의 모델 state 파일이고, 이를 조합하여 voting을 진행할 수 있습니다.
https://drive.google.com/file/d/1i2XG125td2mif8eyHWxb0bkbw9Fm_uxq/view?usp=share_link

첨부한 pdf 파일에는 GPT-3.5, GPT-4를 비교한 내용, 프롬프트 작성시 주의할/참고하면 좋을 사항들, 그리고 해당 버전을 만들 때 사용된 모든 프롬프트와 응답이 포함되어 있습니다(대화가 무척 깁니다).
참고로 다른 대화로부터 얻은 결과물을 다시 프롬프트로 제공하는 과정을 많이 거쳤기 때문에 시작부터 어색한 프롬프트로 느껴질 수 있습니다.

PDF
코드
로그인이 필요합니다
0 / 1000
다콘조아
2023.04.10 22:46

ChatGPT와 대화하듯 prompt를 구성하신게 재밌네요 ㅎㅎㅎ
잘 읽었습니다!

chanmuzi
2023.04.11 06:49

대화하다 열도 여러 번나서 승질도 냈던 것 같아요 ㅋㅋㅋㅋㅋ
감사합니다!!