분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Track1 알고리즘 부문 : K리그-서울시립대 공개 AI 경진대회
외부데이터 범위 관련 질문드립니다.
안녕하세요. 대회 규칙에 외부데이터 사용 금지 조항이 있는데, 범위가 어디까진지 명확히 알고싶어서 문의드립니다.
1) 대회에서 제공된 data_Description.xlsx의 내용이나 match_info.csv의 내용은 feature engineering에 사용해도 되는지 궁금합니다.
1-1) 불가능하다면, 오직 train.csv에서 제공된 내용만을 활용하여 feature engineering을 해야하는지 궁금합니다.
1-2) 그게 가능하다면, 간접적으로 인사이트를 얻는게 아니라, 제공된 data_Description.xlsx의 두개의 셀(컬럼정의서 or 이벤트타입)에 있는 내용(ex. event type 셀은 training data뿐만 아니라 test set의 event type종류까지 전부 포함하고 있음)을 이용하여 직접적으로 training data의 피처엔지니어링에 사용하여 모델 훈련에 사용하는 것도 가능한지 궁금합니다. 좀더 자세하게 말하면 이 경우는 test set에 접근해서 data leakeage로 그 value를 얻어오는게 아니라, 말그대로 어떤 value가 존재하는지 미리 알고 있는 상태이기 때문에 그 "종류"에 대한 정보를 사용해도 되는지가 궁금합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
data_Description.xlsx와 match_info.csv는 대회 제공 데이터이므로 활용 가능합니다.
categorical column의 범위도 명세에서 지정해두었다면 활용 가능합니다.