웹 광고 클릭률 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 분류 | 웹 로그 | AUC

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 931명 마감

 

[private 5위 0.78959] CatBoost + LightGBM / CE, RF loss

2024.06.06 08:05 916 조회 language

좋은 대회 열어주신 데이콘 운영진분들께 감사드립니다.
CTR 데이터는 처음 다뤄본 만큼 새로 배울 점들이 많았습니다. 
특히, 대용량 데이터와 비식별 처리된 데이터 특성상 자유롭게 EDA를 하거나 분석으로 인사이트를 얻기에는 힘든 태스크였던 것 같습니다.
따라서, 주로 모델링 관점으로 접근하여서 관련된 몇 가지 논문을 찾아보며 실험을 진행하였습니다.
진행 과정에서 가장 고민했던 부분은 CatBoost 라이브러리가 CPU 기반 라이브러리이기 때문에 GPU 훈련 자체는 지원을 하지만,
현재 버전에서는 사용자 정의 손실 함수가 지원되지 않는 문제가 있기 때문에 사용자 정의 함수를 쓰려면 
CPU로 꾸역꾸역 훈련을 진행하는 방법밖에 선택지가 없었습니다. (아마 이번년도 하반기에는 CatBoost에서 이를 지원해 줄 것 같습니다)
최종 제출에는 시간 여건상 ppt에 계획한 대로 8개의 단일 모델 훈련을 모두 진행하지는 못하여서 아쉬움이 남지만, 이번 대회를 경험 삼아 다음번에는 효율적인 계획을 세울 수 있을 것 같습니다.

감사합니다. 모두 고생하셨습니다.

PDF
코드
로그인이 필요합니다
0 / 1000
MuHyeonSon
2024.06.07 23:48

공유 감사합니다. 좋은 인사이트 얻어갑니다!