헬스케어 데이터 경진대회 : Track 1

정형 | 알고리즘 | 헬스케어 | 의료

  • moneyIcon 상금 : 상금 및 상품 300 만원
  • 75명 마감
마감

 

헬스케어 데이터 경진대회 : Track 1 대상 코드 공유

공동작성자

stroke
2024.11.15 12:35 387 조회 language

python으로 개발을 했으며, 네이버에서 제공하는 NaverCloud 서버 환경에서 개발했습니다.
CatBoost -> XGBoost -> Stack model -> Auto sklearn -> Auto learning 모델 순으로 개발했습니다.

CatBoost 모델에서 자체 라벨링을 하여 Object Type에 대해서 대처했습니다.
Stack model - 성능이 좋았던 ml 모델들을 앙상블 하는 것은 효과적이기 때문에 stack model를 활용해 보았습니다.
auto learning - stack model로 하이퍼 파라미터 튜닝을 하기 번거로웠습니다. 그래서 하이퍼 파라미터 튜닝을 진행해 주는 model인 auto learning을 선택하게 되었고, 다양한 stack model을 활용할 수 있어 선택하게 되었습니다.

최대 12시간 하이퍼 파라미터 튜닝을 진행해 봤지만 성능 향상에 유의미한 결과는 나오지 않았습니다.

최종으로는 모델별 가중치를 주어 앙상블하여 제출했습니다. 

아래 주소는 model를 참고한 사이트입니다.

코드
로그인이 필요합니다
0 / 1000
진현림
2024.11.20 11:37

작성해주신 코드 잘 봤습니다.
NaverCloud 서버 환경 사용하셨다고 하셨는데 비용이 얼마나 나오셨는 지 궁금합니다 ㅎㅎㅎㅎ

jiwan
2024.11.20 22:20

제가 Naver connect 소속에서 공부하고 있어 무료로 사용했습니다!
한달에 약 300만원 정도 하는 것 같습니다!

진현림
2024.11.20 22:15

아하 그렇군요!! 답변 감사합니다 :)

이전 글
헬스케어 데이터 경진대회 : Track 1 우수상 코드 공유
대회 - 헬스케어 데이터 경진대회 : Track 1
좋아요 2
조회 507
댓글 0
7달 전
현재 글
헬스케어 데이터 경진대회 : Track 1 대상 코드 공유
대회 - 헬스케어 데이터 경진대회 : Track 1
좋아요 4
조회 387
댓글 3
7달 전
다음 글
다음 글이 존재하지 않습니다.