[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[데이터 전처리 code] train + 기타 데이터
train 데이터 있는 칼럼들뿐만 아니라 제공되는 기타 데이터들도 합친 데이터 전처리 코드를 작성했습니다.
사용할 수 있는 정보가 많을 수록 예측력이 좋아질 거라 예상했는데 생각보다 좋은 결과가 나오지 않네요 🥺
전처리하면서 무조건 사용할 수 있는 정보가 많다고 좋은 건 아닐 수도 있구나 하고 깨달았습니다 🥲
네, 맞습니다 ! PCA도 적용해봤는데 성능이 그닥 좋지 않아서...
아예 변수의 개수를 줄여서 다시 돌려볼까 생각중입니다 🙃
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
ML에서는 feature 수가 많을수록 '차원의 저주'에 빠질 가능성이 높아집니다.
모델의 복잡성을 줄이기 위해 다른 방법이 필요합니다.