월간 데이콘 행동 데이터 분석 인공지능 AI 경진대회

sample_submission row에 관하여

2020.03.03 12:34 4,209 조회

train dataset row = 67091776


test dataset row = 28714849


sample_submission row = 16787


입니다.


game_id, player 컬럼을 기준으로 grouping 했을 때


test dataset row = 33574로 sample_submission row의 2배가 됩니다.


sample_submission에 game_id, winner 두 컬럼만 있는데


game_id, player, winner 세 컬럼이 있어야 되는 것 아닌지 궁금합니다.


submission을 하는데 있어 제가 잘못 이해하고 있는 부분이 무엇인지 토론을 통해 알 수 있는 기회가 되었으면 좋겠습니다.

로그인이 필요합니다
0 / 1000
DACONIO
2020.03.03 13:24

Kang님 안녕하세요. 해당 질문을 주셔서 감사드립니다.
submission 파일의 의도는 각 게임에서 player=1의 승리 확률을 예측하는 것이었습니다.
명세에 설명이 분명하지 않았습니다. 혼동을 드려 죄송합니다.
winner 컬럼의 설명을 수정하였습니다.

추가로 submission 파일의 winner에 0,1로 제출하는 것과 확률 값을 제출하는 것 모두 허용됩니다.

좋은 결과 있길 바라겠습니다.
감사합니다:)

Kang
2020.03.03 13:35

궁금한 점이 해결되었습니다!
감사합니다!