데이스쿨 할인 리턴즈
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[DSU, Public 38위, Score 0.90244] Random Forest Classifier
공동작성자
[DSU, Public 38위, Score 0.90244] Random Forest Classifier
기존의 train 데이터셋에서 'nerdiness' 특성을 제외하고 train과 test를 병합한 데이터셋에 적용시킨 모델을 기반으로 학습하였습니다.
첫 대회라 이것저것 돌리며 고군분투했는데 저와 팀원 모두 좋은 경험이 된 것 같습니다.
대회 참가하신 모든 분들 고생하셨습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
combined_data = combined_data.fillna(combined_data.mean())
위 부분에서 train 데이터와 test 데이터 전체를 합친 combined_data의 평균값을 활용해 결측치를 처리하는 것은 Data Leakage에 해당하는 것 같습니다.