분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 24th] URL 탐지를 위한 BERT 기반 Pretrained 활용
기존 r3ddkahili/final-complete-malicious-url-model 을 활용하여 parameter 조정을 통해 손을 보고있다가,
autogloun을 공유해주신 덕분에 편하게 재현했던 것 같습니다.
feature 생성 -> r3ddkahili -> kmack/malicious-url-detection -> weight ensemble (for AUC)
feature 생성에는 'php' ,나 국가 이름, 안전과 관련된 키워드들이 악성 URL에 많이 분포해 있단 것을 초반에 EDA를 통해 확인했다가
변수를 만드는 것에 한계를 느껴 이미 만들어진 token이 많은 pretrained 를 이용해야겠다는 판단이 들었습니다.
코드 공유해주신 분들 정말 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved