분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
구조물 안정성 물리 추론 AI 경진대회
Public LB 0.01453 방법론 공유드립니다.
3-1. 데이터
3-2. 2-Stage 학습
3-3. Augmentation (핵심)
3-4. 기타
Train 1000개와 Dev 100개를 모두 학습에 활용했습니다. 10-Fold Stratified CV로 총 10개의 모델을 학습했습니다.
학습은 2단계로 진행했습니다. Stage-1에서는 전체 데이터로 18 epochs 학습했고, Stage-2에서는 Dev 데이터를 4배 업샘플링하여 추가로 8 epochs 학습했습니다. 이렇게 한 이유는 Dev가 Test와 동일한 환경이기 때문에, Stage-2에서 Dev 분포에 적응하도록 했습니다.
Augmentation이 가장 중요했습니다. Train의 고정된 조명 환경을 Test의 무작위 환경으로 시뮬레이션하기 위해 RandomBrightnessContrast, RandomGamma, CLAHE, HueSaturationValue, ColorJitter 등 강한 조명/색상 변환을 적용했습니다. 이 외에도 HorizontalFlip, ShiftScaleRotate, Mixup, Label Smoothing을 사용했습니다.
추론 시에는 TTA를 8회 적용했습니다. Flip, Brightness, Gamma, CLAHE 등의 조합으로 다양한 변환을 주고 예측을 평균했습니다. 10개 fold 모델의 logit을 평균하여 앙상블했고, Dev 데이터를 이용해 Temperature Scaling을 적용하여 확률을 보정했습니다. 최종 확률은 0.002~0.998 범위로 clip했습니다.
항목값 CV Score~0.017 Public LB 0.01453
EVA02 backbone은 val loss가 높아서 사용하지 않았습니다. Swin과의 앙상블은 오히려 성능이 악화되었습니다. 시뮬레이션 영상에서 프레임을 추출하여 학습 데이터를 증강하는 방법도 시도했으나, 기존 모델과 앙상블 시 성능이 나빠졌습니다.
시간 없어서 도중에 하차했는데 재밌는 문제였습니다.
감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved