분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HAI(하이)! - Hecto AI Challenge : 2025 하반기 헥토 채용 AI 경진대회
Test 셋 공개, 리키지 관련
안녕하세요!
벌써 상위권 분들은 0.95 이상을 찍으신거 보고, 놀랬습니다..
혹시 다들 테스트셋을 보시고 rule based로 후처리를 하시는건지..?
테스트 셋을 보는건 리키지가 아닌지 궁금합니다..
저는 아직 모델 선택 단계이지만, 벌써 부터 0.9를 찍으신 고수분들이 계셔서 초조한 마음으로 토크 글 올립니다 ㅠㅠ
다만 그건 경험의 측면이지 규칙위반은 아니라 생각합니다. 아무래도 그런거땜에 초반 격차가 큰거같아요
인공지능팩토리에서 했던 대회 말씀하시는게 맞을까요?
답변 감사드립니다~!!
다만, 제가 말씀드린 포인트는 테스트 셋 공개 부분입니다!!
테스트 셋을 참고하여 후처리를 적용한다면 이거 또한 규칙 위반이 아닌지 궁금했습니다 ㅎㅎ
평가 데이터는 오직 추론에만 활용되어야합니다.
데이콘 대회의 경우 어쩔 수 없는것 같습니다.
경험상 test 데이터 셋을 직접 참고했다는 물증이 없으면 그냥 넘어갈 수 밖에 없는거 같아요.
test셋 참고해서 하더라도 실험적으로 이런 방식이 가장 좋았다라고 하면 대회 주최측에서 검증 할 수 있는 방법이 없는것 같아요.
특히 비전, 분류쪽으론 더 취약한것 같습니다.
항상 대회 참여하면서 느꼈고, 캐글처럼 test셋 공개하지 않고 진행하는 방법으로 개선이 되야할 것 같습니다.
너무 공감합니다.
테스트 셋이 공개된 상황에서, 테스트 셋과 유사한 샘플로 파인튜닝하는 방식은 개인적으로는 데이터 리키지에 가깝다고 느껴집니다.
다만 모든 참가자가 동일한 조건에서 경쟁한다는 점에서는, 이를 공정한 환경으로 해석할 수도 있다고 생각합니다.
이러한 환경에서도 모델의 일반화 성능을 평가하는 요소가 충분히 반영되었으면 좋겠다는 바람입니다 ㅎㅎ
다들 대회 파이팅!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
딥페이크 대회가 얼마전에 열린적이있어서 동일 수상자 분들이 아닐까 합니다.. 대회가 완전히 같다고 들어서요 아무래도 학습데이터셋도 이미 구성되어있던게 있을수도있구요