데이콘 x BDA 학습자 수료 예측 AI 경진대회

알고리즘 | 월간 데이콘 | 정형 | F1 Score

  • moneyIcon 데이스쿨 프로 구독권
  • 553명 마감

 

[Private 74th] Ensemble 기반 학습자 수료 여부 예측

2025.09.12 17:25 570 조회 language

본 대회를 통해 학습자의 다양한 학습 데이터를 기반으로 수료 여부를 예측하고자 하였습니다. 이를 위해 Random Forest, XGBoost, AdaBoost, K-최근접 이웃(KNN), LightGBM 등 여러 머신러닝 분류 모델을 적용하여 성능을 비교하였습니다.

분석 결과, 여러 모델을 적용한 단순 실험에서는 성능이 모두 1.0으로 수렴하여 사실상 baseline과 동일한 결과를 보였습니다. 이는 단순 모델링만으로는 의미 있는 차별성을 확보하기 어렵고 Random Forest 기반 단일 모델 의존도가 성능을 결정짓는 한계가 있다는 점을 보여줍니다. 결국 데이터 전처리와 피처 엔지니어링 과정이 성능 향상의 핵심이며 모델 다양성을 확보하고 일반화된 예측 능력을 높이는 방향으로 개선이 필요합니다. 이번 결과는 다소 아쉬웠지만 오히려 데이터 처리와 변수 설계가 모델링보다 더 큰 영향력을 발휘한다는 사실을 확인한 계기라 할 수 있습니다.

코드