분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터 문의
다른 문의 글에서 데이터 수집 시점이 20년 1월이라고 확인하였습니다.
train.csv를 보면 다음과 같이 모든 독립변수 들이 같은 값을 가지고 있는 것으로 확인했는데요.
그렇다면 각각의 데이터 값들은 서로 다른 날에
동일한 지역에서 동일한 지역으로 동일한 품목이 이동한 운송건수인가요?
아, 제 설명이 틀렸습니다. 다른 문의에도 나와있는 사항인데, 해당 값에 절사가 이루어져 ex) 4148000000000000 이렇게 0으로 채워져있다고 확인을 했습니다.
답변 감사합니다.! 같은 4148000000000000로 표기되었으나 사실은 0으로 채워진 자리(읍동면 이하의 세부적인 지역)가 서로 다른 데이터라는 설명으로 이해했습니다.
추가 질문 있습니다. 학습데이터와 테스트 데이터가 어떻게 나누어진 것인지 알고싶습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 대회 참가자 중 한명입니다.
SEND와 RECEIVE의 id에 대한 값은 지수 표기법으로 나타나, 저 사진의 값은 같아 보이나, 실제 값은 다를 겁니다.
해당 두 열의 default data type이 float 일텐데, int로 변경해 확인하시면 값이 다름을 보실 수 있습니다.
말씀하신 나머지 두 열(ex. 여행/문화, 문화컨텐츠) 에 대해서는 동일하다고 볼 수 있겠습니다.
화이팅 하십쇼!