전화 해지 여부 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 산업 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 796명 마감

 

[public 69위,0.83754] lightgbm

2023.03.27 20:30 562 조회 language

randomforest, lightgbm 다해봤는데 lightgbm이 성능이 제일 좋아서 이걸로 했습니다.
boxplot을 보니 이상치가 너무 많아서 지우고 대체도 해보고 scaling도 해봤는데, robust scaling이 제일 좋게 나와서 robustscaling으로 preprocessing했습니다.
randomsearchcv로 대략적인 범위를 특정하고 gridsearcv로 다시 learning rate와 n_estimator 등을 조정했습니다.
이후 threshold를 조정했네요
smote나 feature engineering 등등 다해봤는데 눈에 띄는 성능 향상은 없었습니다. 아마도 분류 결정 경계가 확연하지 않기 때문에 oversampling이 noise만 늘린 것 같습니다.
겨우 0.03인데 그거 올리기가 이렇게 힘들 줄이야...ㅎㅎ
하이퍼 파라미터는 일단은 지워놨습니다.

코드