분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Baseline EDA에서 한 발자국만 들어간 데이터 살펴보고 가공해보기
안녕하세요. 처음 인사 올립니다.
여태 코드 공유 탭에서 읽고 댓글만 작성하거나 리더보드에서만 간간히 보였는데 처음으로 직접 글을 작성하게 되었습니다.
설명과 작성한 노트북은 처음이라서 깔끔하지 못하지만, 차츰 수정해가며 읽기 편하게 수정하도록 하겠습니다.
모든 코드는 colab에서 작성하였습니다.
틀린 부분이나 질문 있으시면 수정 및 답변 남겨드리겠습니다. 감사합니다.
색상에 대한 unique 카테고리 개수이니 paint가 맞는 의미입니다. 수정하겠습니다.
감사합니다.
- 2626년 자동차도 벌써 중고차로 나와있네요. 딜러분께서 영업을 엄청 잘하시는 것 같습니다.
이 부분에서 한참 웃었네요. 너무 잘 읽었습니다. 감사합니다.
말씀 감사합니다 ^^ 소소한 재미라도 챙겨야죠 ㅎㅎ
좋은 EDA이네요 , 유니크한 값만 뽑아서 살펴본다는건 신선한 시각인것 같아요!!(매번 바로 회귀만 때려서 이런식의 분석은 신선하네요)
감사합니다! 아무래도 통계적으로 유의미한 자료를 뽑아내는 것 보단 현실에 맞추어 EDA를 하다보니 저도 처음 해보는 시도입니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
잘 참조하겠습니다. :-)
그런데,
"print('brand의 unique 카테고리 개수 : ', len(train['paint'].unique()))",
"print('brand의 unique 카테고리 개수 : ', len(test['paint'].unique()))"
에서 'brand' -> 'paint' 가 맞는 의미이겠죠?