분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[MLVC, Private 78위, 점수 0.807] LGBM + ET+XGB+RF
공동작성자
저희는 extratree, xgboost, randomforest, lgbm 4가지 모델을 각각 StratifiedKFold로 학습을 진행한 후에 TabNetMultiTaskClassifier을 활용하여 stacking ensemble을 진행하였습니다.
train data의 경우 이상치와 결측치를 -1로 대체하였고, test date도 결측치를 -1로 대체하였습니다.
또한 Q 문항에 대해 상관관계를 분석하여 각각의 문항에 weight를 주어 상관관계가 높은 column인 plus_weight4를 생성하였습니다.
더불어 age,testelapse,introelapse,surveyelapse의 경우 이상치들을 각각 평균과 최댓값을 고려하여 처리하였습니다.
country의 경우 미국과 미국이 아닌 국가로 나누어 주었습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved