제주 신용카드 빅데이터 경진대회

데이터 관련 질문드립니다.

2020.07.05 18:03 4,561 조회

안녕하세요. 이번 소비데이터 관련해서 궁금한 점이 있어 질문드립니다.


  1. `내역이 없는 경우 소비를 안한건가요?` 토론에서 데이터가 없는 경우에는 두가지 이유가 있다고 적어주셨습니다. 그 중 이용 고객이 적어 데이터가 삭제된 경우에는 이용 금액 또한 무시할 수 있는 수준인지 궁금합니다.
  2. '인천의 버스 운송업'처럼 주어진 모든 기간동안 특정 지역에 존재하지 않는 업종은 4월과 7월 데이터에도 존재하지 않아 AMT 집계에 빠져있는지 궁금합니다.
  3. '대구의 버스 운송업' 데이터를 살펴보면 2019년 8월까지의 데이터만 존재하고 이후 기간 데이터는 존재하지 않습니다. 2019년 9월의 경우 코로나가 유행하기 이전 날짜이므로 이용고객 수가 급격히 떨어졌다기보다 해당 기간이후 데이터가 집계되지 않았다고 생각됩니다. 이러한 업종의 경우,  4월과 7월의 소비금액을 예측할 때도 해당 업종의 데이터는 없다고 판단할수 있는지 궁금합니다.
로그인이 필요합니다
0 / 1000
DACONIO
2020.07.06 12:29

1. 비식별 조치로 삭제된 데이터 금액은 전체 사용액 대비 상당히 낮은 비율입니다. 상세 비율은 밝힐 수 없는 점 양해바랍니다.
2. 모든 기간에서 집계에 빠져있는 업종이라도 사용량이 많다면 집계될 수 있습니다. 
3. 4월 데이터는 대회 종료 전 공개되어 확인이 가능합니다. 7월 데이터는 정답에 해당하는 값으로 규정상 밝히지 않습니다.

namepen
2020.07.06 18:51

답변 감사합니다 :)