월간 데이콘 생체 광학 데이터 분석 AI 경진대회

알고리즘 | 정형 | 회귀 | 바이오 | MAE

  • moneyIcon 상금 : 총 360만원
  • 961명 마감

 

3등 솔루션

2020.07.04 18:17 7,391 조회 language

대회를 많이 해봤더라도 항상 새롭고 참여하면서 많이 배웁니다.
같이 팀으로 해서 더 재밌게 했던 것 같습니다.

성능이 오르지 않아 코드가 많이 복잡한데,

큰 흐름은 Feature Set 1로 Dart -> GBDT -> CATBOOST -> XGBOOST 만들고,
Feature Set 2로 역시 Dart -> GBDT -> CATBOOST -> XGBOOST 만듭니다.
그 후 Ridge로 2nd Layer Stacking을 수행합니다.

딥러닝 같은 경우 Target별로 예측하는 부분과 Target을 통합하는 모델 2개로 나눴습니다.
그 후 딥러닝은 2가지 모델을 Target별로 가중치를 다르게 하여 합치고,

위에서 만든 Tree계열 모델과 역시 Target별로 가중치를 다르게 하여 합칩니다.

최종 점수는 791로 마감하였고 모델이 복잡많아서 읽기 힘드시겠지만 양해부탁드립니다. ㅠㅠ
궁금한 사항은 답변부탁드립니다.

2020/07/09 수정사항
Web에서 보여지는 것이 느리다고 하여 npy파일을 Load하는 것으로 수정하였습니다.

코드
로그인이 필요합니다
0 / 1000
처음해봐요
2020.07.04 18:28

https://drive.google.com/file/d/1hSXOpiYkc5Ewv2OSx4jYrWeWEhhjORxJ/view?usp=sharing

당쇠
2020.07.05 17:38

공유 감사드립니다.
내용이 많다  보니5분 정도 기다리시면 위의 내용이 보입니다. ^^

처음해봐요
2020.07.09 01:30

코드 수정하였습니다!

당쇠
2020.07.12 09:12

감사합니다.