분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 16위] CatBoostRegressor 단일 모델
모델의 경우 CatBoostRegressor 단일 모델을 사용하였습니다.
하이퍼파라미터 튜닝의 경우 베이지안 옵티마이제이션을 사용하였으나, 기본 하이퍼파라미터 보다 좋은 성능을 내는 결과를 찾지 못하여 기본 하이퍼파라미터에서 수기로 하나씩 변경해가며 튜닝하였습니다.
전처리의 경우 특성 중요도 결과를 보아
1. quality 특성과 duration 특성의 중요도가 높게나와 두 특성을 이용하여 특성공학을 진행하였습니다.
2. subcontinent 특성 중 아메리카에 해당되는 값들 중 중앙아메리카 이남의 국가들을 라틴 아메리카로 분류, 중앙아프리카 이남의 국가들을 사하라 이남 아프리카로 분류하였습니다.
3. 거래 수익은 0, 거래 횟수가 1인 것을 이상치로 판단하여 제거하는 작업을 수행하였고, quality와 duration 값에 비해 타겟이 너무 높은 이상치도 제거하였습니다.
모델 학습 환경
- Intel i7-13700k
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved