분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 11위] Bert-base with weighted classes
캐글 노트북 환경에서 학습할 수 있도록 코드를 작성했습니다.(코랩 대비 성능, 안정성이 높습니다)
순서를 간단히 정리하면 다음과 같습니다.
1. 구글 드라이브에 업로드 된 데이터를 다운로드 받는다.(주석처리했습니다)
2. 전처리를 수행한다.
3. Dataset 클래스를 정의한다.
4. Dataset을 구축하고 DataLoader로 불러온다.
5. Model, Criterion, Optimizer, Metric을 정의한다.
6. 로그 관리를 위한 Wandb Config를 설정한다.
7. Traininig/Validation Loop를 정의한다.
8. 가중치별로 각각 학습을 수행한다.
9. 가중치별로 수행된 학습 결과를 합쳐서 soft / hard / weighted voting을 진행한다.
제출했을 때 우수한 성능을 보였던 것은 hard voting이고 나머지는 코드가 적절히 작성되지 않았습니다.
이후 디버깅을 통해 다른 버전에서는 각 voting 결과를 뽑아낼 수 있었지만, 해당 버전에서는 아닙니다.
이 버전에서는 클래스별로 다른 가중치를 부여하여 네 개의 조합을 구성했습니다.
따라서 각 조합에 따라 모델이 학습한 결과가 다르고 그때의 model state를 각각 저장했습니다.
아래 링크는 제 구글드라이브에 저장된 해당 버전에서의 학습 결과가 저장된 4개의 모델 state 파일이고, 이를 조합하여 voting을 진행할 수 있습니다.
https://drive.google.com/file/d/1i2XG125td2mif8eyHWxb0bkbw9Fm_uxq/view?usp=share_link
첨부한 pdf 파일에는 GPT-3.5, GPT-4를 비교한 내용, 프롬프트 작성시 주의할/참고하면 좋을 사항들, 그리고 해당 버전을 만들 때 사용된 모든 프롬프트와 응답이 포함되어 있습니다(대화가 무척 깁니다).
참고로 다른 대화로부터 얻은 결과물을 다시 프롬프트로 제공하는 과정을 많이 거쳤기 때문에 시작부터 어색한 프롬프트로 느껴질 수 있습니다.
대화하다 열도 여러 번나서 승질도 냈던 것 같아요 ㅋㅋㅋㅋㅋ
감사합니다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
ChatGPT와 대화하듯 prompt를 구성하신게 재밌네요 ㅎㅎㅎ
잘 읽었습니다!