CSTMR_CNT,CNT를 활용한 각 지역별, 날짜별에 대한 산업 업종의 특징 찾아보기

  • day2020.06.30 22:42
  • views1448 views
  • language Python
  • writer by 낙지
댓글 9
CSTMR_CNT와 CNT 변수를 활용해서 EDA를 해보면 어떨까싶어서 해봤습니다. 주관적인 생각이 많이 들어가 있으므로 참고만 해보시면 좋을 것 같습니다. 결과론적으로 CSTMR_CNT데이터와 CNT데이터는 AMT를 예측하는데 활용할 수는 없지만 분명 다른 데이터와 잘 결합을 하면 충분히 CNT와 CSTMR_CNT 데이터도 활용이 가능할 수 있을 것 같습니다. (마지막에 그래프를 주석처리 했지만 돌려보면 CNT와 CSTMR_CNT와 AMT는 거의 평행인 급으로 비슷하게 진행되는 것을 볼 수있습니다.) 또한 지역별, 월별 특징을 잘 찾으면 특정산업군의 특징을 찾을 수 있는 변수를 생각하는데 도움이 될 것 같다고 생각했습니다. 데이터가 시계열 모델로 접근하기엔 불가능할 것 같고, 회귀분석으로 접근을 하는 것이 좋을 것 같습니다. 고득점에있는 분들은 어떤지 모르겠지만 확실히 특징을 잘 찾아서 변수화를 시키는 것이 이번 대회의 key point가 될 것 같습니다. 다들 화이팅하세요!! 여러분들의 EDA와 Modeling도 공유해주세요!♥
코드
댓글 9개
  • 한성hansung.dev 2020.07.01 00:21

    EDA 감사합니다. :)

  • 국진회기역싸무라이 2020.07.01 00:45

    수고하셨습니다. 도움이 많이 될거 같습니다.

  • NN섭시 2020.07.01 09:39

    감사합니다!

  • 광남제루스챈스 2020.07.01 13:39

    대단합니다! EDA 감사합니다 :)

  • NA 2020.07.01 14:25

    감사합니다 :)

  • 동김낙지 2020.07.01 15:17

    다들 참고하시면 좋은게 업종별 value_count()만 봐도 상당히 불균형적이기 때문에 이 부분 또한 고려하는 것이 상당히 도움이 될 것으로 보입니다.

  • NN데분홍 2020.07.01 16:31

    감사합니다 :)

  • 동김낙지 2020.07.04 01:38

    SIDO 변수로 그래프를 만들 때, 인덱싱을 하나 빼먹어서 지역명 '세종'이 그래프에서 빠지게 됐습니다 :(. 세종시 같은 경우는 따로 그래프를 그려서 확인해 보시는 것이 좋을 것 같습니다. 감사합니다.

  • NN윤기석 2020.07.05 16:35

    많이 배우고 갑니다! 감사합니다

로그인이 필요합니다
목록으로
이전 글

[Pytorch] Pytorch 용 baseline 코드 공개

대회 - 진동데이터 활용 충돌체 탐지 AI 경진대회

12 vote
429 views
댓글 4
14일 전
현재 글

CSTMR_CNT,CNT를 활용한 각 지역별, 날짜별에 대한 산업 업종의 특징 찾아보기

대회 - 제주 신용카드 빅데이터 경진대회

28 vote
1,448 views
댓글 9
14일 전
다음 글

데이터 편하게 다운받고 압축 풀어놓는 소스

대회 - 음성 중첩 데이터 분류 AI 경진대회

14 vote
321 views
댓글 3
14일 전