분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[데이터 전처리 code] train + 기타 데이터
train 데이터 있는 칼럼들뿐만 아니라 제공되는 기타 데이터들도 합친 데이터 전처리 코드를 작성했습니다.
사용할 수 있는 정보가 많을 수록 예측력이 좋아질 거라 예상했는데 생각보다 좋은 결과가 나오지 않네요 🥺
전처리하면서 무조건 사용할 수 있는 정보가 많다고 좋은 건 아닐 수도 있구나 하고 깨달았습니다 🥲
네, 맞습니다 ! PCA도 적용해봤는데 성능이 그닥 좋지 않아서...
아예 변수의 개수를 줄여서 다시 돌려볼까 생각중입니다 🙃
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
ML에서는 feature 수가 많을수록 '차원의 저주'에 빠질 가능성이 높아집니다.
모델의 복잡성을 줄이기 위해 다른 방법이 필요합니다.