분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[LB:0.96182] TF-IDF 앙상블 모델을 활용한 URL 기반 악성 분류
벡터화 방식 (TF-IDF)
텍스트를 수치 벡터로 변환 (TF-IDF 방식)
char_wb n-gram (3~5) 기반 특징 추출
URL 내 문자 패턴을 효과적으로 학습 가능
모델 구성
Logistic Regression: 빠르고 간단한 선형 모델
LightGBM: 부스팅 기반, 속도와 성능 우수
XGBoost: 정밀도 높은 부스팅 모델
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved