분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
submission 파일 관련 문의
201901-202003.csv에는 총 41개의 시도('CARD_SIDO_NM')와 17개의 업종('STD_CLSS_NM')이 존재합니다.
submission.csv 파일에서 4월과 7월의 예측 결과에 대한 행의 갯수는 각각 697개로, 모든 시도와 모든 업종에 대한 예측 결과에 해당합니다.
하지만 실제로 특정 시도의 특정 업종에 대한 데이터는 존재하지 않는 경우가 있는데, 이러한 경우에 해당 업종에 대한 AMT값을 예측하는 것이 다소 비논리적이라고 생각이 됩니다.
예를 들어, 강원 지역에는 '정기 항공 운송업'에 대한 데이터가 존재하지 않습니다. 하지만 submission 파일을 제출할 때는 강원도의 정기 항공 운송업의 AMT값을 포함하여 제출해야합니다.
물론 베이스라인 코드와 같은 방식으로 예측을 한다면 결과값을 구하는 것은 어렵지 않겠지만, 해당 지역에 관련 업종에 대한 데이터가 없는 상황에서 이를 예측하는 것이 의미가 있을지 잘 모르겠습니다.
이에 대한 의견 공유해주시면 감사하겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
기간내 소비가 발생하지 않은 경우 데이터로 표기되지 않습니다.
https://dacon.io/m/competitions/official/235615/talkboard/401081
강원지역의 정기 항공 운송업에서 집계되지 않았다면 소비가 발생하지 않았다는 의미로 해석할 수 있습니다. 실제로 강원도에 양양 국제공항이 있지만 이용률은 낮은 것 같네요.