분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 행동 데이터 분석 인공지능 AI 경진대회
sample_submission row에 관하여
train dataset row = 67091776
test dataset row = 28714849
sample_submission row = 16787
입니다.
game_id, player 컬럼을 기준으로 grouping 했을 때
test dataset row = 33574로 sample_submission row의 2배가 됩니다.
sample_submission에 game_id, winner 두 컬럼만 있는데
game_id, player, winner 세 컬럼이 있어야 되는 것 아닌지 궁금합니다.
submission을 하는데 있어 제가 잘못 이해하고 있는 부분이 무엇인지 토론을 통해 알 수 있는 기회가 되었으면 좋겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Kang님 안녕하세요. 해당 질문을 주셔서 감사드립니다.
submission 파일의 의도는 각 게임에서 player=1의 승리 확률을 예측하는 것이었습니다.
명세에 설명이 분명하지 않았습니다. 혼동을 드려 죄송합니다.
winner 컬럼의 설명을 수정하였습니다.
추가로 submission 파일의 winner에 0,1로 제출하는 것과 확률 값을 제출하는 것 모두 허용됩니다.
좋은 결과 있길 바라겠습니다.
감사합니다:)