중고차 가격 예측 AI 해커톤

정형 | NMAE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 623명 마감

 

Baseline EDA에서 한 발자국만 들어간 데이터 살펴보고 가공해보기

2022.05.30 16:19 2,520 Views language

안녕하세요. 처음 인사 올립니다.
여태 코드 공유 탭에서 읽고 댓글만 작성하거나 리더보드에서만 간간히 보였는데 처음으로 직접 글을 작성하게 되었습니다.
설명과 작성한 노트북은 처음이라서 깔끔하지 못하지만, 차츰 수정해가며 읽기 편하게 수정하도록 하겠습니다.

모든 코드는 colab에서 작성하였습니다. 

틀린 부분이나 질문 있으시면 수정 및 답변 남겨드리겠습니다. 감사합니다.

Code
로그인이 필요합니다
0 / 1000
프리랜Seo
2022.05.31 12:46

잘 참조하겠습니다.  :-)

그런데, 
"print('brand의 unique 카테고리 개수 : ', len(train['paint'].unique()))", 
"print('brand의 unique 카테고리 개수 : ', len(test['paint'].unique()))" 

에서 'brand' -> 'paint' 가 맞는 의미이겠죠? 

홍재
2022.05.31 12:54

색상에 대한 unique 카테고리 개수이니 paint가 맞는 의미입니다. 수정하겠습니다. 

감사합니다.

서미님
2022.06.03 03:53

- 2626년 자동차도 벌써 중고차로 나와있네요. 딜러분께서 영업을 엄청 잘하시는 것 같습니다.
이 부분에서 한참 웃었네요. 너무 잘 읽었습니다. 감사합니다.

홍재
2022.06.03 12:22

말씀 감사합니다 ^^ 소소한 재미라도 챙겨야죠 ㅎㅎ

풋풋한_풋사과
2022.06.06 17:03

좋은 EDA이네요 , 유니크한 값만 뽑아서 살펴본다는건 신선한 시각인것 같아요!!(매번 바로 회귀만 때려서 이런식의 분석은 신선하네요)

홍재
2022.06.07 12:23

감사합니다! 아무래도 통계적으로 유의미한 자료를 뽑아내는 것 보단 현실에 맞추어 EDA를 하다보니 저도 처음 해보는 시도입니다.