SW중심대학 공동 AI 경진대회 ❮예선❯

SW중심대학 | 예선 | 심리성향 | AUC

  • moneyIcon -
  • 771 Users Completed

 

[DSU, Public 38위, Score 0.90244] Random Forest Classifier

공동작성자

stroke
2022.08.27 03:46 290 Views language

[DSU, Public 38위, Score 0.90244] Random Forest Classifier
기존의 train 데이터셋에서 'nerdiness' 특성을 제외하고 train과 test를 병합한 데이터셋에 적용시킨 모델을 기반으로 학습하였습니다.

첫 대회라 이것저것 돌리며 고군분투했는데 저와 팀원 모두 좋은 경험이 된 것 같습니다.
대회 참가하신 모든 분들 고생하셨습니다!

Code
Login Required
0 / 1000
비회원
2022.09.02 17:35

combined_data = combined_data.fillna(combined_data.mean())

위 부분에서 train 데이터와 test 데이터 전체를 합친 combined_data의 평균값을 활용해 결측치를 처리하는 것은 Data Leakage에 해당하는 것 같습니다.