분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[LB:0.96182] TF-IDF 앙상블 모델을 활용한 URL 기반 악성 분류
벡터화 방식 (TF-IDF)
텍스트를 수치 벡터로 변환 (TF-IDF 방식)
char_wb n-gram (3~5) 기반 특징 추출
URL 내 문자 패턴을 효과적으로 학습 가능
모델 구성
Logistic Regression: 빠르고 간단한 선형 모델
LightGBM: 부스팅 기반, 속도와 성능 우수
XGBoost: 정밀도 높은 부스팅 모델
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved