분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 8위] Pre-trained model ensembles
ChatGPT Link: https://shareg.pt/EQzT9p8
Model Weights: https://drive.google.com/file/d/1dvmf7RJDNZeAvrOh4JG2uRFD6uQuSgAV/view?usp=sharing
OS: Ubuntu 20.04.4 LTS
GPU: NVIDIA RTX A6000 x 4
ChatGPT: GPT-3.5
Dacon 대회에 참여하는 것이 처음이라 부족한 점이 많습니다ㅠ
양해 부탁드립니다...
저는 ChatGPT를 통해 한 번에 전체 코드를 받지 않고, 기능별로 쪼개서 출력을 받았습니다.
Prompt 입력 순서는 다음과 같습니다.
1. 전반적인 task 설명
- 주어진 task에 대한 자세한 설명
- 사용해야 할 pre-trained model 입력
- 작성해야 할 전체 코드를 Step으로 나누고 정의
2. Dataset, DataLoader 정의
- train.csv로부터 데이터를 불러옴
- Dataset Class를 정의하고 DataLoader 변수 할당
3. Best model save에 활용될 metrics 정의
4. 모델 argument 정의
- 일부 하이퍼 파라미터 명시
- 모델 및 argument 선언
5. 모델 학습 및 best model 저장
- 3개의 모델에 대해 학습 수행
- validation set에 대해 앞서 정의한 metrics 평가
- 평가 결과에 따라 각 모델별 best model 저장
6. Robert-base model에 대한 학습
- tokenizer 재정의
- 학습 및 best model 저장
7. 저장된 모델에 대한 inference 수행
- 각 모델의 best model load
- test.csv에 대한 logit ensemble 수행
- 여러 가중치를 두며 test 수행
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Library-Version
- transformers==4.28.0
- pytorch=1.12.1