분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3nd, 0.20693] Feature Engineering + XGBoost Regress
처음 데이터 분석을 진행했을 때, 이상치가 거의 없었고 변수 간 상관관계도 대부분 0에 가까워 큰 의미가 없다고 판단했습니다. 따라서 다른 접근 방식보다는 파생변수 생성에 더 많은 노력을 기울였고, 이후 후진소거법(Backward Elimination)으로 feature selection을 진행했습니다. 다만, 일부 변수는 후진소거 과정에서 제거되었으나, 변수별 중요도를 확인해보니 오히려 성능에 긍정적인 영향을 주는 변수들이 있어 일부를 복원해 적용했습니다. 이러한 과정 덕분에 성능을 개선할 수 있었습니다.
마지막으로 Optuna를 활용해 하이퍼파라미터 튜닝을 진행해 전체 코드를 최적화했고, 이번 대회에서는 다소 운이 따랐던 것 같습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved