분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
헬스케어 데이터 경진대회 : Track 1 대상 코드 공유
공동작성자
python으로 개발을 했으며, 네이버에서 제공하는 NaverCloud 서버 환경에서 개발했습니다.
CatBoost -> XGBoost -> Stack model -> Auto sklearn -> Auto learning 모델 순으로 개발했습니다.
CatBoost 모델에서 자체 라벨링을 하여 Object Type에 대해서 대처했습니다.
Stack model - 성능이 좋았던 ml 모델들을 앙상블 하는 것은 효과적이기 때문에 stack model를 활용해 보았습니다.
auto learning - stack model로 하이퍼 파라미터 튜닝을 하기 번거로웠습니다. 그래서 하이퍼 파라미터 튜닝을 진행해 주는 model인 auto learning을 선택하게 되었고, 다양한 stack model을 활용할 수 있어 선택하게 되었습니다.
최대 12시간 하이퍼 파라미터 튜닝을 진행해 봤지만 성능 향상에 유의미한 결과는 나오지 않았습니다.
최종으로는 모델별 가중치를 주어 앙상블하여 제출했습니다.
아래 주소는 model를 참고한 사이트입니다.
제가 Naver connect 소속에서 공부하고 있어 무료로 사용했습니다!
한달에 약 300만원 정도 하는 것 같습니다!
아하 그렇군요!! 답변 감사합니다 :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
작성해주신 코드 잘 봤습니다.
NaverCloud 서버 환경 사용하셨다고 하셨는데 비용이 얼마나 나오셨는 지 궁금합니다 ㅎㅎㅎㅎ