헬스케어 데이터 경진대회 : Track 1

Tabular | Algorithm | Healthcare | Medical

  • moneyIcon Prize : 상금 및 상품 300 만원
  • 2024.10.28 ~ 2024.11.08 09:59 + Google Calendar
  • 75 Users Completed
Closed

 

헬스케어 데이터 경진대회 : Track 1 대상 코드 공유

공동작성자
2024.11.15 12:35 439 Views language

python으로 개발을 했으며, 네이버에서 제공하는 NaverCloud 서버 환경에서 개발했습니다.
CatBoost -> XGBoost -> Stack model -> Auto sklearn -> Auto learning 모델 순으로 개발했습니다.

CatBoost 모델에서 자체 라벨링을 하여 Object Type에 대해서 대처했습니다.
Stack model - 성능이 좋았던 ml 모델들을 앙상블 하는 것은 효과적이기 때문에 stack model를 활용해 보았습니다.
auto learning - stack model로 하이퍼 파라미터 튜닝을 하기 번거로웠습니다. 그래서 하이퍼 파라미터 튜닝을 진행해 주는 model인 auto learning을 선택하게 되었고, 다양한 stack model을 활용할 수 있어 선택하게 되었습니다.

최대 12시간 하이퍼 파라미터 튜닝을 진행해 봤지만 성능 향상에 유의미한 결과는 나오지 않았습니다.

최종으로는 모델별 가중치를 주어 앙상블하여 제출했습니다. 

아래 주소는 model를 참고한 사이트입니다.

Code
Login Required
0 / 1000
진현림
2024.11.20 11:37

작성해주신 코드 잘 봤습니다.
NaverCloud 서버 환경 사용하셨다고 하셨는데 비용이 얼마나 나오셨는 지 궁금합니다 ㅎㅎㅎㅎ

jiwan
2024.11.20 22:20

제가 Naver connect 소속에서 공부하고 있어 무료로 사용했습니다!
한달에 약 300만원 정도 하는 것 같습니다!

진현림
2024.11.20 22:15

아하 그렇군요!! 답변 감사합니다 :)

Previous
헬스케어 데이터 경진대회 : Track 1 우수상 코드 공유
Competition - 헬스케어 데이터 경진대회 : Track 1
Likes 2
Views 607
Comments 0
9mo ago
Current
헬스케어 데이터 경진대회 : Track 1 대상 코드 공유
Competition - 헬스케어 데이터 경진대회 : Track 1
Likes 4
Views 439
Comments 3
9mo ago
Next
No Next Post