분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
힘드네요...
오랜만에 참여하여 "코딩재활훈련소"라는 팀명으로 참여했습니다.
멈추었던 대회참가에 기름칠을 하고자 참여했습니다.
우선,,, 학생땐 대회 참여 자체가 재미있고 즐거웠습니다.
몇 년 전 직장 다니며 참여하는 것이 어렵다고 하는 분들의 경험을 학생때는 모르니 공감을 못했었는데요.
직접 경험해보니 정말 힘드네요.
아직 private 최종 점수가 나오진 않았지만 대회 참여하며 목표했던 10% 이내 입성하기는 달성하여 기쁩니다. private도 큰 shakeup 없었으면 좋겠네요...
이번 대회는 train data, test data의 차이가 좀 있었던 것 같습니다.
많은 분들이 이 갭을 줄이려고 노력했던 것 같은데, 저는 여러가지 시도를 해보았지만 크게 줄어들지가 않았습니다.
validation에서 0.06-0.07의 loss가 나와도 제출에선 0.10xx 내외로 차이가 났어요.
시도했던 augmentation을 추가할 수록 점수는 loss는 점점 올라가고 너무 힘들었습니다.
저는 augmentation을 위해
등등 적용했지만 크게 점수 상승을 못했네요.
생각보다 이미지 사이즈에 따른 점수 변화가 저는 컸던 것 같네요.
상위권 분들의 솔루션이 궁금하네요~
마지막으로, 학생 뿐만 아니라 일반인도 참여할 수 있는 대회가 많아지면 좋을 것 같습니다.
이번 대회 문제도 재미있고 심플해서 재미있게 참여했습니다.
고생하셨습니다.
고생 많으셨습니다!
private에서 좋은 결과 있으시길 빕니다.
저도 재미있게 하긴했습니다 ㅎㅎ 재미만 있었지만요
재밌으면 된거죠~수고 많으셨습니다
뭔가, 간단한 태스크의 대회라도 고사양 gpu가 없으면 상위권은 힘들겠다라는 생각이 드네요.
저도 391종으로 합치니 오히려 성능이 소폭 하락했습니다만, 후반부에서는 그래도 합쳐서 진행했었습니다.
gridmix superpixelmix mixup은 효과 못봤고
randaug cutmix 512res 로 덕을 봤습니다.
tta는 항상 성능이 하락했어요.
TTA는 저는 제출 횟수가 모자라서 마지막엔 그냥 냅다 넣었습니다. Horizontal만 넣었어요.
고생하셨습니다~ 재미있었어요
고생하셨습니다!
저도 이미지 사이즈에서 점수 향상 제일 컸던 것 같네요..
그 다음으로는 Mixup & Cutmix 적용이었던 것 같고
이 외에는 앙상블 전략으로 최대한 끌어올렸던 것 같습니다.
저도 제출에서 val_loss 와 차이가 0.1 내외로 계속 나서 힘들었네요 ㅠㅠ 고생 많으셨습니다
아 제가 mixup을 적용 안해보았었는데...
왜냐면 mixup은 경험에 의하면 성능 향상 효과를 못봤었거든요
mixup 적용에 따른 실험 결과가 공유 가능하다면 유의미한 성능 상승이 있었을까요?
모델은 TinyViT 사용했습니다.
차량 내부 사진이나 다른 이상치에 대해 모델이 잘 확신하지 못하고 틀려서
LightGlue 이용해서 가장 높게 예측한 클래스가 0.5 이하인 테스트 데이터셋을 훈련 데이터셋과 전부 매칭해봐서 매칭점 가장 많은 클래스로 예측하도록 해봤습니다.
일부 내부 사진에 대해서는 맞는 거 같은데 대부분 너무 이상하게 예측해서 오히려 점수가 안좋아지더라고요
상위권분들은 차량 내부 사진이나 다른 이상치를 어떻게 처리했는지 궁금하네요..
고생하셨습니다:)
음 ... 조심스럽지만 대회 규정상 테스트 데이터셋을 활용하는 방법은 제한되는 것으로 알고있습니다.
goorm님도 고생하셨습니다!
아하.. 테스트 데이터 분석 후 인사이트를 훈련에 적용하는 방식은 아니어서 크게 생각하지 않았습니다.
TTA와 비슷하게 생각했는데 제한되는 방법일 수도 있겠군요.. 감사합니다:)
저도 직장다니면서 해보니... 시간이 참 부족했지만 여러 모델들과 sota모델들을 비교하며 디코더 바꿔가면서 시간이 많이 걸렸네요
다들 어떤 모델의 아키텍처를 사용했는지 궁금해지네요 ㅎㅎ
저는 efficientnet 계열로 초반 실험하다가 convnext도 사용해보고 vit 계열도 사용해보았었습니다.
그렇군요! 저는 convnext 모델의 4개의 stage 중 2,3,4 번째를 각각 분리해서 각 stage에 대해 블러, 노이즈, 복원 3가지 loss를 통해 학습시켰습니다! 결과는 복원 loss를 제외하고 학습하기 어려운 경향을 보였네요... 아무래도 구조를 잘못 설계한게 아닌가 싶습니다ㅠㅠ
항상 전 GPU를 좋은 걸 가지고 있으면 어땠을까 하는 아쉬운 마음이 드네요ㅠ
전 계층적 분류로 아키텍처를 복잡하게 가져간게 좀 패착이지 않았나 싶기도 합니다.
고생하셨습니다!
저도 GPU가 3090이라 ... 지금은 이제 GPU도 구형이 되어버렸네요.
저는 그래서 마지막 훈련에는 runpod 을 활용해서 클라우드 비용 결제를 해보았습니다.
처음 세팅에 좀 어려웠는데 생각보다 괜찮더라구요
저도 정확히 같은 문제로 고통받아 매우 공감이 가는 글입니다.
하나 인사이트가 있다면 이미지 사이즈가 성능에 관건이었다고 생각되는데,
progressive resizing 테크닉으로 학습 초반에는 224 등 낮은 해상도로 학습하다가
학습 후반에 768px 이상으로 끌어올리는 방법이 학습 시간을 단축하는데 많은 도움이 됐던 것 같습니다.
오 이런 방법이 있었군요 ~ 새로운 방법을 또 알아갑니다.
정말 고생하셨습니다.
네네 convnext나 maxvit 계열에만 적용 가능한 방법이긴 한데 꽤 유용했습니다.
대회 정말 고생하셨습니다~~
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
그리고 396개의 class에서 5개쌍이 복수 정답 처리되어서 그 5개쌍을 묶어서 391개 class로 학습했었는데, 점수가 상당히 안 좋아지더라고요.
여기서 며칠을 헤매었습니다...