웹 광고 클릭률 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 분류 | 웹 로그 | AUC

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 931명 마감

 

[Private 4위] Catboost

2024.06.05 21:50 789 조회 language

안녕하세요, 
먼저 대회를 주최해주신 데이콘 관계자 여러분께 감사드립니다.
처음으로 ML 대회에 참가해 보았는데 운이 좋게 순위권에 들어간 것 같습니다.
Catboost 모델을 사용하여 예측을 진행했고, 메모리 사용량을 줄이기 위해 encoding과 sampling을 수행하고 parquet 형태로 데이터를 바꾸어 학습을 진행했습니다.
메모리 사용량으로 인해 Inference 시에는 batch단위로 Inference를 진행하였습니다.
메모리 사용량과 시간 관계상 전체 데이터를 사용하지 못하고 Hyperparameter tuning을 제대로 수행하지 못했는데 이를 수행하면 더 나은 결과를 얻을 수 있을 것 같습니다.
평소에는 중요하게 생각하지 않았던 메모리 사용량에 대해서 많이 고민해보고 조사해보는 대회가 된 것 같습니다.

감사합니다.

PDF
코드