분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[DSU, Public 38위, Score 0.90244] Random Forest Classifier
공동작성자
[DSU, Public 38위, Score 0.90244] Random Forest Classifier
기존의 train 데이터셋에서 'nerdiness' 특성을 제외하고 train과 test를 병합한 데이터셋에 적용시킨 모델을 기반으로 학습하였습니다.
첫 대회라 이것저것 돌리며 고군분투했는데 저와 팀원 모두 좋은 경험이 된 것 같습니다.
대회 참가하신 모든 분들 고생하셨습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
combined_data = combined_data.fillna(combined_data.mean())
위 부분에서 train 데이터와 test 데이터 전체를 합친 combined_data의 평균값을 활용해 결측치를 처리하는 것은 Data Leakage에 해당하는 것 같습니다.