HAI(하이)! - Hecto AI Challenge : 2025 First Half Hecto Recruitment AI Competition

Recruit | Algorithm | Hecto | Vision | Classification

26,000,000 KRW
1,426 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

끝났으니 서로 공유해요

박솜

2025.06.16 17:04 1,026 Views

val과 리더보드 갭의 원인 중에 하나가 압축 손실이 있었습니다.

A.ImageCompression()

아마 test data를 처리(crop)하시고(다른 처리도 있었는지는 모르겠습니다.) jpg로 다시 저장하는 과정에서 압축 손실이 발생한거로 추측됩니다.

그래서 val에서는 성능 향상이 없으나 test에서만 있었습니다.

이러한 aug가 더 있지 않나 싶습니다.

val, 리더보드 갭이 작으신 분들 궁금해요

저는 랜덤으로 val 나누었을때 val loss 0.04 ~ 0.05 까지 떨어졌는데 제출해보면 0.12 ~ 0.15 나왔습니다.

4 Comments

comment

0 / 1000

NAJUNGHWAN

2025.06.16 17:11

aug 증강을 여러 가지로 시도해 봤는데, CV 상에서는 logloss가 증가하는 것으로 보여서 뭐가 좋은 방법인지 판단하는 방법 자체가 까다로웠습니다.
다른 분들은 어떤 방식으로 증강 넣는 걸 판단하셨는지 궁금합니다!

예를 들어, 저희 팀은
1. EDA 분석 상에서 밝기별 logloss가 다르다는 점을 바탕으로 (0.2~0.4 구간의 logloss가 train에서 다소 높았습니다)
밝기 증강을 집중적으로 넣었습니다.
2. 학습 후 EDA를 했을 때 클래스 구분은 사실상 너무 잘하는데, 인접 클래스 구분을 어려워하는 (이를테면 2022년식과 2023년식을 혼동)
문제 때문에 세부 패턴을 높여줄 수 있는 sharpen이나 crop 증강도 신경 썼습니다. 특히 centercrop시 이미지를 100% 사용하는 것보다 80~90% crop했을 때 정확도가 높아진다는 분석이 있었습니다.