분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
한번 끄적여본 EDA 및 데이터 전처리 (Pubplic: 0.87301 / Private: 0.84375)
공부삼아 작성해본 파일입니다.
크게 의미는 없습니다.
결측치의 경우 대부분 금액과 관련된 부분인데, 해당 부분을 대체하기 위한 깔끔한 방법이 떠 오르지 않아 통일된 수치로 대체했습니다.
결측치가 없는 데이터만 따로 모아서, 상관 관계를 분석해 케이스별로 결측치를 채우는 방법도 고려 해 볼 수 있겠네요 :)
공부하는데 큰 도움이 되는 자료 감사합니다.!
혹시 시도 데이터를 충남, 충북 -> 충 이런식으로 병합하신 이유가 있을까요??
도움이 되었다니 다행이네요..!
큰 의미는 없었습니다. 주석에 적어놨듯이 전남과 전북은 전라도라는 하나의 범주로 줄일 수 있으니,
단순히 지역정보를 최소한으로 줄인 것입니다.
경상도 = 경북/경남, 충청도 = 충북/충남 ...
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
먼저 데이터 분석 하신 거 잘 봤습니다!
궁금한 점이 있습니다.float 변수의 결측치를 왜 -999로 대체 했는지가 궁금합니다!!