경진대회 함정피하는 법(?)

2025.03.07 17:39 356 Views

경진대회할 때 저는 주어진 데이터 다 써서 무조건 돌려보는 편인데, 경진대회 참여할수록 하는 방법이.. 정형화되는 것 같아요ㅠ

특히 정형데이터를 쓰는 대회가 그런것 같아요.

모든 변수를 넣으면 좋다는 착각

  • 변수가 많다고 항상 성능이 좋은 것은 아닙니다.

이상치를 무조건 제거하는 습관 주의

  • 이상치는 무조건 제거하는 게 아니라 중요한 힌트를 담고 있을 수 있습니다.
  • 이상치를 무조건 제거하는 것은 아니라고 생각합니다.

데이터 리키지 확인하기

  • 이거는 늘 방지해야한다고 생각합니다.
  • 모델 성능이 비정상적으로 높다면 데이터 리키지 의심


저처럼 하는 분들 계실까봐 공유합니다ㅎㅎ

Login Required
0 / 1000
겔겔
2025.03.10 10:51

기껏 변수가 있는데 안쓰면 아까운 기분이라 알면서도 변수는 최대한 넣게 되더라고요...