분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 16위] CatBoostRegressor 단일 모델
모델의 경우 CatBoostRegressor 단일 모델을 사용하였습니다.
하이퍼파라미터 튜닝의 경우 베이지안 옵티마이제이션을 사용하였으나, 기본 하이퍼파라미터 보다 좋은 성능을 내는 결과를 찾지 못하여 기본 하이퍼파라미터에서 수기로 하나씩 변경해가며 튜닝하였습니다.
전처리의 경우 특성 중요도 결과를 보아
1. quality 특성과 duration 특성의 중요도가 높게나와 두 특성을 이용하여 특성공학을 진행하였습니다.
2. subcontinent 특성 중 아메리카에 해당되는 값들 중 중앙아메리카 이남의 국가들을 라틴 아메리카로 분류, 중앙아프리카 이남의 국가들을 사하라 이남 아프리카로 분류하였습니다.
3. 거래 수익은 0, 거래 횟수가 1인 것을 이상치로 판단하여 제거하는 작업을 수행하였고, quality와 duration 값에 비해 타겟이 너무 높은 이상치도 제거하였습니다.
모델 학습 환경
- Intel i7-13700k
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved