웹 광고 클릭률 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 분류 | 웹 로그 | AUC

  • moneyIcon Prize : 인증서 + 데이스쿨
  • 1,000명 마감

 

웹 광고 클릭률 예측 AI 경진대회 수상자 인터뷰 minky

2024.06.21 13:07 427 Views

Q) 우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

처음으로 이런 분석 경진대회에 참여했는데 수상까지 할 수 있게 돼서 기쁩니다.

Q) 팀의 이야기를 들려주세요.

  • 여러분이 모인 계기, 팀명의 뜻, 혹은 개인 참가자로서의 여정 등을 자유롭게 나눠주세요.

저는 개인 참가자로서 '웹 광고 클릭률 예측 AI 경진대회'에 참가했습니다. 데이터 분석과 AI 모델링에 대한 관심이 커서 이번 대회에 도전하게 되었습니다. 다양한 데이터셋을 다루며 실력을 키우는 동시에, 실제 문제를 해결하는 경험을 쌓고 싶었습니다. 이러한 대회에 참가하면서 얻는 성취감과 배움의 기회가 항상 저를 자극했습니다.

Q) 여러분을 돋보이게 한 특별한 점은 무엇인가요?

  • 팀의 독특한 전략이나, 개인의 강점 등을 공유해 주세요.

저는 다른 참가자들과 유사하게 범주형 변수 처리에 강점이 있는 Catboost 모델을 사용하여 예측을 수행했습니다. 다만 데이터 용량이 커서 메모리 한계를 극복하기 위해 데이터를 parquet 형식으로 변환하고 batch 단위로 inference를 수행했습니다. 이러한 전략 덕분에 최대한 많은 데이터를 사용하여 성능을 극대화할 수 있었습니다.

Q) 이번 성과의 비결은 무엇이라고 생각하시나요?

대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

  • 도전을 결심한 순간부터 수상의 순간까지, 여러분의 여정을 들려주세요.

이번 성과의 비결은 앞서서 말씀드렸던 메모리 한계를 극복하기 위한 parquet 변환과 batch inference 전략이었다고 생각합니다. 처음에는 빠른 학습을 위해 전체 데이터의 약 10% 정도만 sampling해서 사용했지만 성능이 좋지 못했습니다. 그래서 최대한 많은 데이터를 활용할 수 있도록 고민했고, 이를 통해 성능이 향상되었을 때가 가장 기억에 남고 기뻤습니다.

Q) 데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

  • 여러분만의 노하우나 루틴을 공개해 주세요.

제가 학습할 때 데이터의 용량이 너무 커서 모델을 학습한 후 자꾸 kernel이 죽어서 새로 학습해야 하는 문제가 발생했습니다. Catboost 모델에서 snapshot을 저장해서 kernel이 죽는 문제가 발생해도 이어서 학습할 수 있도록 해서 이러한 문제를 방지했습니다.

Q) 수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?

앞으로의 목표와 꿈을 말씀해 주세요.

수상을 기념하여 바라는 한 가지 소원은, 더 많은 대회에 참가하여 지속적으로 성장할 수 있는 기회를 얻는 것입니다. 또한 이러한 경험을 통해 얻은 지식을 다른 사람들과 공유하며, 함께 발전해 나가는 것이 제 꿈입니다.

Q) 데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?

  • 여러분의 기대와 제안을 자유롭게 나눠주세요.

데이콘 커뮤니티에 바라는 점은, 다양한 분야의 문제를 다룰 수 있는 대회가 앞으로도 많이 개최됐으면 좋겠습니다. 또한 참가자들 간의 교류와 협업을 촉진할 수 있는 장이 마련되기를 기대합니다.