Malicious URL Classification AI Competition

Algorithm | Montly Dacon | NLP | Tabular | Feature Engineering | ROC-AUC

DASCHOOL Pro Subscription
813 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[LB:0.96182] TF-IDF 앙상블 모델을 활용한 URL 기반 악성 분류

고미아빠

2025.04.04 20:14 1,793 Views language

벡터화 방식 (TF-IDF)
텍스트를 수치 벡터로 변환 (TF-IDF 방식)
char_wb n-gram (3~5) 기반 특징 추출
URL 내 문자 패턴을 효과적으로 학습 가능
모델 구성

Logistic Regression: 빠르고 간단한 선형 모델
LightGBM: 부스팅 기반, 속도와 성능 우수
XGBoost: 정밀도 높은 부스팅 모델

PDF

Code