분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
한번 끄적여본 EDA 및 데이터 전처리 (Pubplic: 0.87301 / Private: 0.84375)
공부삼아 작성해본 파일입니다.
크게 의미는 없습니다.
결측치의 경우 대부분 금액과 관련된 부분인데, 해당 부분을 대체하기 위한 깔끔한 방법이 떠 오르지 않아 통일된 수치로 대체했습니다.
결측치가 없는 데이터만 따로 모아서, 상관 관계를 분석해 케이스별로 결측치를 채우는 방법도 고려 해 볼 수 있겠네요 :)
공부하는데 큰 도움이 되는 자료 감사합니다.!
혹시 시도 데이터를 충남, 충북 -> 충 이런식으로 병합하신 이유가 있을까요??
도움이 되었다니 다행이네요..!
큰 의미는 없었습니다. 주석에 적어놨듯이 전남과 전북은 전라도라는 하나의 범주로 줄일 수 있으니,
단순히 지역정보를 최소한으로 줄인 것입니다.
경상도 = 경북/경남, 충청도 = 충북/충남 ...
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
먼저 데이터 분석 하신 거 잘 봤습니다!
궁금한 점이 있습니다.float 변수의 결측치를 왜 -999로 대체 했는지가 궁금합니다!!