월간 데이콘 심리 성향 예측 AI 경진대회

알고리즘 | 정형 | 분류 | 심리 | AUC

  • moneyIcon Prize : 100만원+애플워치
  • 2,100명 마감

 

Private 31위, Public Score:0.78218 CAT+LGBM+XGB

2020.11.22 23:59 7,621 Views language

- NN 모델을 사용하신 코드 공유글이 많아, 부스팅 모델을 사용한 코드도 공유해보려고 합니다.
  크게 도움이 될지 모르겠지만, 저도 다른 분들의 도움을 많이 받았기 때문에 혹여 도움이 될 분들을 위해 올려봅니다.

- 하나의 노트북 파일로 짧게 담아 올리기 위해 생략된 부분이 있습니다.(모델별로 적용한 데이터가 약간씩 다릅니다. 몇 가지는 표현을 해 두었습니다.)
- EDA 관련 부분은 시간상 따로 추가하지 못했습니다.
- Feature Engineering에 대한 부분은 특별한 주석을 달지 않았습니다.
- 모델 파라미터 값은 최대 소수점 6자리까지만 표시했습니다.(실제 제출 파일은 소수점을 생략하지 않고 모델링 했습니다.)

- 모델별 하이퍼 파라미터 탐색에는 BayesianOptimization 모듈을 사용했으며, 사용 방법은 코드 공유에 다른 분께서 올려주신 글이 있더군요.
- 물론 저는 조금 다르게 사용해서, 최대한 Validation AUC 를 높이는 방법으로 사용했습니다.
  (이 방법에 대해서는 두 경우를 비교하여 공유글을 올려볼 지 생각중입니다.)
  하지만 개인적인 사정으로 최종 제출 시간까지 최적의 하이퍼 파라미터를 찾지 못하고 제출하게 되어 아쉽습니다.
  이후에 연습으로 변환되고 다시 제출이 가능하다면, 해당 파라미터를 적용한 모델로 결과를 생성하여 제출해보고싶네요.
 + 추가로 많은 분들이 Junho Sun님께서 공유해주신 NN 모델을 앙상블 하셨는데, 그 부분도 적용해보고싶습니다.

끝으로 질문 또는 개선 사항에 대한 피드백은 언제나 환영입니다!

Code
로그인이 필요합니다
0 / 1000
당쇠
2020.12.04 08:33

수고하셨습니다.