분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 74th] Ensemble 기반 학습자 수료 여부 예측
본 대회를 통해 학습자의 다양한 학습 데이터를 기반으로 수료 여부를 예측하고자 하였습니다. 이를 위해 Random Forest, XGBoost, AdaBoost, K-최근접 이웃(KNN), LightGBM 등 여러 머신러닝 분류 모델을 적용하여 성능을 비교하였습니다.
분석 결과, 여러 모델을 적용한 단순 실험에서는 성능이 모두 1.0으로 수렴하여 사실상 baseline과 동일한 결과를 보였습니다. 이는 단순 모델링만으로는 의미 있는 차별성을 확보하기 어렵고 Random Forest 기반 단일 모델 의존도가 성능을 결정짓는 한계가 있다는 점을 보여줍니다. 결국 데이터 전처리와 피처 엔지니어링 과정이 성능 향상의 핵심이며 모델 다양성을 확보하고 일반화된 예측 능력을 높이는 방향으로 개선이 필요합니다. 이번 결과는 다소 아쉬웠지만 오히려 데이터 처리와 변수 설계가 모델링보다 더 큰 영향력을 발휘한다는 사실을 확인한 계기라 할 수 있습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved