분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[PRIVATE SCORE: 3.28509] CatBoostRegressor + Optuna
안녕하세요. 민만두우입니다.
전처리는 'Age' :이상치 제거 및 10살 단위 구간화, 'Year-Of-Publication' : 이상치 범주화, 'Location' : 텍스트 전처리 및 나라, 주, 도시로 분리 'location_country': 주와 도시 데이터로 가장 많이 함께 나온 나라로 대체 했습니다.
cbm.yaml 파일 예시
data:
use_features: ["User-ID", "Book-ID", "Age","Year-Of-Publication","Publisher","location_country","Book-Author","location_state","location_city"]
label: ["Book-Rating"]
cat_features: ["User-ID", "Book-ID","Publisher","location_country","Book-Author","location_state","location_city"]
preprocess_features: {"Age":"preprocess_age", "Year-Of-Publication":preprocess_year2}
num_features: []
model:
model_name: cbm_regressor
cat_features: ["User-ID", "Book-ID","Age","Year-Of-Publication","Publisher","location_country","Book-Author","location_state","location_city"] #모델에 적용할 cat_features
train:
seed: 42
CatBoostRegressor와 Optuna를 활용했고, Optuna의 경우 맥북 M1 로컬에서 돌렸습니다.
감사합니다! :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved