Dacon Monthly ChatGPT Utilization Generative AI Competition

Algorithm | ChatGPT | Prompt Engineering | NLP | Classification | Macro F1 Score

Certification
1,238 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[Private 8위] Pre-trained model ensembles

다콘조아

2023.04.10 23:40 4,164 Views language

ChatGPT Link: https://shareg.pt/EQzT9p8
Model Weights: https://drive.google.com/file/d/1dvmf7RJDNZeAvrOh4JG2uRFD6uQuSgAV/view?usp=sharing

OS: Ubuntu 20.04.4 LTS
GPU: NVIDIA RTX A6000 x 4
ChatGPT: GPT-3.5

Dacon 대회에 참여하는 것이 처음이라 부족한 점이 많습니다ㅠ
양해 부탁드립니다...

저는 ChatGPT를 통해 한 번에 전체 코드를 받지 않고, 기능별로 쪼개서 출력을 받았습니다.
Prompt 입력 순서는 다음과 같습니다.

1. 전반적인 task 설명
- 주어진 task에 대한 자세한 설명
- 사용해야 할 pre-trained model 입력
- 작성해야 할 전체 코드를 Step으로 나누고 정의

2. Dataset, DataLoader 정의
- train.csv로부터 데이터를 불러옴
- Dataset Class를 정의하고 DataLoader 변수 할당

3. Best model save에 활용될 metrics 정의

4. 모델 argument 정의
- 일부 하이퍼 파라미터 명시
- 모델 및 argument 선언

5. 모델 학습 및 best model 저장
- 3개의 모델에 대해 학습 수행
- validation set에 대해 앞서 정의한 metrics 평가
- 평가 결과에 따라 각 모델별 best model 저장

6. Robert-base model에 대한 학습
- tokenizer 재정의
- 학습 및 best model 저장

7. 저장된 모델에 대한 inference 수행
- 각 모델의 best model load
- test.csv에 대한 logit ensemble 수행
- 여러 가중치를 두며 test 수행

감사합니다.