웹 광고 클릭률 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 분류 | 웹 로그 | AUC

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 931명 마감

 

[Private 2위 0.79049] LightGBM + CatBoost + xDeepFM + FiBiNet

2024.06.04 18:35 1,257 조회 language

먼저 해당 대회를 주최해주신 데이콘 임직원 분들께 진심으로 감사의 말씀 드립니다.
최근 ctr task에 관심이 생겨 논문을 읽던 도중 해당 대회를 알게 되었고 바로 참가하게 되었습니다. 저의 솔루션이 대회와 핏이 잘 맞아 수상권안에 들었다고 생각합니다.
대회를 하면서 많은 아이디어와 시행착오가 있었습니다. 그중 메모리 이슈 때문에 어떤 식으로 학습을 해야할지 고민을 많이 하였습니다. csv를 parquet파일로 바꾸었으며 negative sampling 기법을 통해 학습을 진행했다는 점이 이 대회에 핵심 솔루션이었던 것 같습니다. 저의 솔루션 중 가장 강조하고 싶은 점은 해당 모델에 맞는 feature engineering을 진행하여 앙상블 한다면 엄청난 결과를 얻을 것이라고 생각합니다.

해당 코드는 https://github.com/ds-wook/web-ctr-prediction 통해 확인해주세요.
저의 솔루션이 다른 대회에서 좋은 영향이 있길 바라며 공유합니다. 
감사합니다.

PDF
코드