헬스케어 데이터 경진대회 : Track 1

Tabular | Algorithm | Healthcare | Medical

3,000,000 KRW
75 Users Completed

Closed

Overview Data Code (share) Talk Leaderboard

Submission

헬스케어 데이터 경진대회 : Track 1 대상 코드 공유

jiwan

공동작성자

2024.11.15 12:35 1,169 Views language

python으로 개발을 했으며, 네이버에서 제공하는 NaverCloud 서버 환경에서 개발했습니다.
CatBoost -> XGBoost -> Stack model -> Auto sklearn -> Auto learning 모델 순으로 개발했습니다.

CatBoost 모델에서 자체 라벨링을 하여 Object Type에 대해서 대처했습니다.
Stack model - 성능이 좋았던 ml 모델들을 앙상블 하는 것은 효과적이기 때문에 stack model를 활용해 보았습니다.
auto learning - stack model로 하이퍼 파라미터 튜닝을 하기 번거로웠습니다. 그래서 하이퍼 파라미터 튜닝을 진행해 주는 model인 auto learning을 선택하게 되었고, 다양한 stack model을 활용할 수 있어 선택하게 되었습니다.

최대 12시간 하이퍼 파라미터 튜닝을 진행해 봤지만 성능 향상에 유의미한 결과는 나오지 않았습니다.

최종으로는 모델별 가중치를 주어 앙상블하여 제출했습니다.

아래 주소는 model를 참고한 사이트입니다.