사이버 공격 유형 예측 해커톤: 트래픽 속 위협을 식별하라!

shake-up....

2025.07.31 10:21 431 조회

최근 대회들 보면 비전대회를 제외한다면 갑상선대회도 그렇고 요즘 정형데이터 대회들은 왜 다 이런지.. 리더보드의 의미가 없네요 그냥..

컴페티션 자체가 일반화를 많이 요한다지만.. 입문자를 위한 교육목적 해커톤이라면서 이건 좀 너무한거아닌가요..? 심지어 2등하신분은 70위권으로 밀려나셨는데..

데이터셋 열었을 때 불균형 비율 극단적일때부터 쎄하긴했는데 역시네요..

외부기관에서 후원으로 하는거면 몰라도 "입문자들 교육용대회" 가 이런식으로 운영하는건 아닌것 같습니다. 이럴거면 입문자 대회라고 커리어 반영이 안되니 그런소리 하지말고 월간데이콘처럼 업적인증서라도 나오도록 하는게 맞다고 봅니다. 1,2,3등일수록 순위유지를 위해서 시간투자를 많이하는데.. 이정도의 결과가 나온다면 누가 데이콘해커톤에 진심으로 할까요? 그냥 대충 적당한 성능 만들어서 던져놓고 다들 월간데이콘이나 상금걸린대회만하죠.

일반화 중요하죠. 과적합이나 편향은 방지해야하는게 맞으니까요. 다만 어떤때는 그 과적합이 오히려 private에서 더 높은 성능을 낼 때도 있는데 "입문자" 들한테 중요한 지표인 public 리더보드 다 재끼고 일반화 신경쓸지 어느정도의 과적합으로 성능을 우선으로 신경쓸지 하는 그런 스킬까지 요하는건가요?


로그인이 필요합니다
0 / 1000
NAJUNGHWAN
2025.07.31 22:25

해묵은 문제라고 생각합니다. 
Kaggle 등 국제 경진대회에서도 종종 이런 일이 발생하곤 하는데, 데이콘과의 차이점은 빠른 수정이 이뤄진다는 점입니다.
다만 데이터에 문제가 있다고 제기해도 그걸 반영할만큼의 전문 인력이 데이콘에 있진 않다고 생각합니다.
데이콘은 20명 미만의 "작은 회사"니까요. 
국내 ML 커뮤니티 기여도가 큰 만큼, 향후 중점적인 개선이 필요한 사항이라 생각합니다.
대회 참여 의지가 많이 꺾인다는 점에서 공감합니다.

해가울면해운대
2025.08.01 02:20

전 그나마 상금없는 대회지만.. 선생님은 정말 더 힘드실것같습니다..

NN_is_all_you_need
2025.08.01 10:27

캐글이 shake up에 대해서 결과를 수정한 일이 있었나요?
저는 오히려 shake up을 유도하는 경향이 있다고 느끼는데...

NAJUNGHWAN
2025.08.01 11:43

@NN_is_all_you_need 제가 수상했던 LLM 대회를 기준으로 말씀드리면, 동일 코드를 제출해도 LLM 특성상 score가 왔다갔다하는 대회였습니다.
최종 점수에서 걱정이 많았는데, 이후 discussion을 통해 대회 마감 후 최종 private은 내부 서버에서 여러 번 돌리는 방식으로 수정되었고 꽤나 안정적으로 결과가 나왔던 것으로 기억하고 있습니다.

NN_is_all_you_need
2025.08.01 10:24

저는 대회기간이 비교적 긴 캐글을 주로 하고 있지만
shake up은 정말 심적으로 매우 어렵고 예측하기 어려운 부분이긴 합니다. 하지만 퍼블릭 점수 자체에는 큰 의미를 두지 않는 편이고 오히려 로컬 CV와 LB 간의 상관관계가 얼마나 잘 맞는지를 기준으로 이 대회에 계속 참여할지 여부를 판단합니다. 하다가 로컬CV랑 LB가 따로 노는거 같으면 가차없이 포기합니다 ㅎㅎ
퍼블릭 점수만 올리는 대회면 진짜 편하긴 하겠는데 오버피팅 대회가 의미가 있을까요

해가울면해운대
2025.08.01 11:40

마지막문단에 말씀드렸습니다만.. 입문자들을 대상으로한 대회라는 취지에 부합하지않는점을 말씀드린겁니다.
저도 입문자 입장이지만 기업대회나 월간데이콘 같은 대회는 수준높은 이론이나 논문베이스로 리더보드보다 과적합에 신경쓰시겠고 그에 대해선 매우 동의합니다
하지만 이 대회는 대놓고 입문자용 대회라 해놓고 이러는게 말이 안된다는거죠.
입문자들이 과적합됐을거라고 짐작은 한다해도 리더보드상의 점수가 더 눈에 밟히지않겠습니까?
한 예로 저번 갑상선대회에선 거의 찍다싶이한 모델이 상위권을 다 먹었습니다.. 점수분포가 너무 극단적으로 한값으로 몰려있는데 정상적이라곤 생각할수가없죠.
결론은 대회취지에 맞게 데이터셋 정제를 신경을 쓰거나 정규대회로 인정해줬으면 하는겁니다. 입문용대회에서 이정도로 지나치게 shake-up이되면 입문이 될까싶네요. 

NAJUNGHWAN
2025.08.01 11:46

@해가울면해운대 입문용 대회는 그런 점에서 개인적으로 target 값 기준으로 stratified sampling만 해도 이런 문제는 방지할 수 있다고 생각되긴 합니다. 

해가울면해운대
2025.08.01 11:58

그전략도 사용해봤지만 웬만한 불균형도 아니고 천몇개의 타겟중에 단 6개밖에없는 타겟도 존재했기에 사실상 smote도 적용하기 힘들었고 적용한다해도 LB와 CV 격차가 더 커져서 의미가 없다고 판단했습니다..

김범주
2025.08.16 15:40

늦었지만 혹시 보신다면 답변 부탁드리겠습니다. 혹시 cv점수가 몇점정도 나오셨나요? 저는 public 4등에서 private 10등으로 내려간 케이스인데 저랑 등락폭이 비슷한 것 같아서 여쭤봅니다.

해가울면해운대
2025.08.16 16:11

cv는 optuna 돌렸을 때 0.85~0.88나왔습니다. 다만.. cv랑 관계없이 예측은 거의 동일했습니다.  데이터도 별로없고 희소클래스의 비율이 극심해서인지모르겠지만..ㅠ

CamilleJohnson
2025.08.16 17:12

Interesting points! I agree the public leaderboard volatility seems excessive, especially for beginners. Maybe consider adding a scoring metric less sensitive to slight overfitting? It's tough, because generalization is crucial, but discouraging for newcomers. It's like trying a Moto X3M level on your first bike ride!  https://motox3mfree.io