SW중심대학 공동 AI 경진대회 ❮예선❯

SW중심대학 | 예선 | 심리성향 | AUC

  • moneyIcon 상금 : 총 0만원
  • 772명 마감

 

[MLVC, Private 78위, 점수 0.807] LGBM + ET+XGB+RF

공동작성자

stroke
2022.08.29 13:28 1,523 조회 language

저희는 extratree, xgboost, randomforest, lgbm 4가지 모델을 각각 StratifiedKFold로 학습을 진행한 후에 TabNetMultiTaskClassifier을 활용하여 stacking ensemble을 진행하였습니다. 

train data의 경우 이상치와 결측치를 -1로 대체하였고, test date도 결측치를 -1로 대체하였습니다.
또한 Q 문항에 대해 상관관계를 분석하여 각각의 문항에 weight를 주어 상관관계가 높은 column인 plus_weight4를 생성하였습니다. 

더불어 age,testelapse,introelapse,surveyelapse의 경우 이상치들을 각각 평균과 최댓값을 고려하여 처리하였습니다. 

country의 경우 미국과 미국이 아닌 국가로 나누어 주었습니다. 

코드