분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 69위,0.83754] lightgbm
randomforest, lightgbm 다해봤는데 lightgbm이 성능이 제일 좋아서 이걸로 했습니다.
boxplot을 보니 이상치가 너무 많아서 지우고 대체도 해보고 scaling도 해봤는데, robust scaling이 제일 좋게 나와서 robustscaling으로 preprocessing했습니다.
randomsearchcv로 대략적인 범위를 특정하고 gridsearcv로 다시 learning rate와 n_estimator 등을 조정했습니다.
이후 threshold를 조정했네요
smote나 feature engineering 등등 다해봤는데 눈에 띄는 성능 향상은 없었습니다. 아마도 분류 결정 경계가 확연하지 않기 때문에 oversampling이 noise만 늘린 것 같습니다.
겨우 0.03인데 그거 올리기가 이렇게 힘들 줄이야...ㅎㅎ
하이퍼 파라미터는 일단은 지워놨습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved