분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[MLVC, Private 78위, 점수 0.807] LGBM + ET+XGB+RF
저희는 extratree, xgboost, randomforest, lgbm 4가지 모델을 각각 StratifiedKFold로 학습을 진행한 후에 TabNetMultiTaskClassifier을 활용하여 stacking ensemble을 진행하였습니다.
train data의 경우 이상치와 결측치를 -1로 대체하였고, test date도 결측치를 -1로 대체하였습니다.
또한 Q 문항에 대해 상관관계를 분석하여 각각의 문항에 weight를 주어 상관관계가 높은 column인 plus_weight4를 생성하였습니다.
더불어 age,testelapse,introelapse,surveyelapse의 경우 이상치들을 각각 평균과 최댓값을 고려하여 처리하였습니다.
country의 경우 미국과 미국이 아닌 국가로 나누어 주었습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved