hospital opening / closing classification prediction

Algorithm | Structured | Classification | Hospital | Accuracy

  • moneyIcon Prize : $3,500 + 40,000ZPR
  • 1,072 Users Completed

 

한번 끄적여본 EDA 및 데이터 전처리 (Pubplic: 0.87301 / Private: 0.84375)

2022.07.14 20:46 4,163 Views language

공부삼아 작성해본 파일입니다.

Code
Login Required
0 / 1000
니영너영
2023.01.18 09:30

먼저 데이터 분석 하신 거 잘 봤습니다!
궁금한 점이 있습니다.float 변수의 결측치를 왜 -999로 대체 했는지가 궁금합니다!!

빛이란
2023.01.18 15:01

크게 의미는 없습니다.
결측치의 경우 대부분 금액과 관련된 부분인데, 해당 부분을 대체하기 위한 깔끔한 방법이 떠 오르지 않아 통일된 수치로 대체했습니다.

결측치가 없는 데이터만 따로 모아서, 상관 관계를 분석해 케이스별로 결측치를 채우는 방법도 고려 해 볼 수 있겠네요 :)

flyinghooniman
2023.07.17 15:27

공부하는데 큰 도움이 되는 자료 감사합니다.!
혹시 시도 데이터를 충남, 충북 -> 충 이런식으로 병합하신 이유가 있을까요??

빛이란
2023.07.19 22:14

도움이 되었다니 다행이네요..!
큰 의미는 없었습니다. 주석에 적어놨듯이 전남과 전북은 전라도라는 하나의 범주로 줄일 수 있으니,
단순히 지역정보를 최소한으로 줄인 것입니다.
경상도 = 경북/경남, 충청도 = 충북/충남 ...