분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
시험 당일 코드 공유
앞서 많은 분들이 높은 정확도를 갖는 코드를 많이 공유해주신 것 같아서
시험 당일에 했던 코드와 모델을 고도화하고자 했던 방향에 대해 간단한 설명을 덧붙여보고자 합니다.
시험 당일 점수는 0.52517점 이었으며, 코드는 거의 수업시간에 배운 코드를 살짝 변형하여 활용하였기 때문에 활용하기 좋으실 거라고 생각합니다 !
저는 우선 모델을 고도화 하는 방법중에서
1. 하이퍼 파라미터 설정
2. 모델의 앙상블 학습
이 가장 좋다고 생각했었기 때문에 "2가지를 모두 써보자!" 라는 생각으로 시험을 시작했습니다.
(이때 발생할 수 있는 과적합을 피하기 위해 정규화를 진행했고, 데이터셋을 분할해서 교차검증코드를 생성하였습니다)
그래서 시험을 볼 당시 가장 좋은 모델 2가지를 앙상블학습(모델 2가지를 합쳐서 구현) 하는 방법을 시도했습니다.
MAE 점수가 꽤 높게 나왔던 랜덤포레스트 모델과 xgb모델 각각의 하이퍼 파라미터를 찾고 두 모델을 앙상블학습하였습니다.
그런데 랜덤포레스트의 하이퍼 파라미터만 설정해줘도 시간이 너~무 오래 걸리는 일이 벌어졌습니다 ㅎㅎ...
앙상블학습까지 하니 한 코드를 돌리는데 5분이 넘게 걸리더군요
그래서 과감하게 랜덤 포레스트와의 앙상블 학습 방법을 버리고 !! XBG모델의 하이퍼파라미터를 찾아 고도화를 진행한 뒤 제출하게 되었습니다.
아래는 제가 시험 당시 제출했던 코드입니다.
+
아직 저도 수정을 하지 않은지라 (시간이 된다면) 위 방법뿐만 아니라 이것저것 시도해보고자 합니다.
더 높은 점수를 받게 된다면 그 코드도 추후에 공유해보겠습니다.!!!
다들 재미있는 아이디어가 생각나면 알려주세요..저도 도전해볼게요 >..<
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
짧은 시간에 멋지게 잘하셨네요 짝짝짝