분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
끝났으니 서로 공유해요
val과 리더보드 갭의 원인 중에 하나가 압축 손실이 있었습니다.
A.ImageCompression()
아마 test data를 처리(crop)하시고(다른 처리도 있었는지는 모르겠습니다.) jpg로 다시 저장하는 과정에서 압축 손실이 발생한거로 추측됩니다.
그래서 val에서는 성능 향상이 없으나 test에서만 있었습니다.
이러한 aug가 더 있지 않나 싶습니다.
val, 리더보드 갭이 작으신 분들 궁금해요
저는 랜덤으로 val 나누었을때 val loss 0.04 ~ 0.05 까지 떨어졌는데 제출해보면 0.12 ~ 0.15 나왔습니다.
저는 eva02_base_patch14_448.mim_in22k_ft_in22k_in1k 모델을 사용했는데요.
다른 부분은 별로 새로운게 없네요.. 그래서 순위가 저모냥
전 resnet, resnext를 백본으로 컬러증강만 사전에 적용하고, 온라인 증강으로 플립, 크롭 밝기 조절 등을 사용했는데 log loss가 0.10 실제 프라이빗 스코어는 0.13까지 나왔네요! SWA와 온도 스케일링이 효과가 가장 좋았습니다.
0.04 까지 떨어졌는데 0.12라면 3배 차이인데, Augment 차이가 있을 거 같네요.
저는 Loss함수를 FocalLoss로 사용했는데, 이부분도 참고하시면 좋을 듯 합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
aug 증강을 여러 가지로 시도해 봤는데, CV 상에서는 logloss가 증가하는 것으로 보여서 뭐가 좋은 방법인지 판단하는 방법 자체가 까다로웠습니다.
다른 분들은 어떤 방식으로 증강 넣는 걸 판단하셨는지 궁금합니다!
예를 들어, 저희 팀은
1. EDA 분석 상에서 밝기별 logloss가 다르다는 점을 바탕으로 (0.2~0.4 구간의 logloss가 train에서 다소 높았습니다)
밝기 증강을 집중적으로 넣었습니다.
2. 학습 후 EDA를 했을 때 클래스 구분은 사실상 너무 잘하는데, 인접 클래스 구분을 어려워하는 (이를테면 2022년식과 2023년식을 혼동)
문제 때문에 세부 패턴을 높여줄 수 있는 sharpen이나 crop 증강도 신경 썼습니다. 특히 centercrop시 이미지를 100% 사용하는 것보다 80~90% crop했을 때 정확도가 높아진다는 분석이 있었습니다.