분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 24th] URL 탐지를 위한 BERT 기반 Pretrained 활용
기존 r3ddkahili/final-complete-malicious-url-model 을 활용하여 parameter 조정을 통해 손을 보고있다가,
autogloun을 공유해주신 덕분에 편하게 재현했던 것 같습니다.
feature 생성 -> r3ddkahili -> kmack/malicious-url-detection -> weight ensemble (for AUC)
feature 생성에는 'php' ,나 국가 이름, 안전과 관련된 키워드들이 악성 URL에 많이 분포해 있단 것을 초반에 EDA를 통해 확인했다가
변수를 만드는 것에 한계를 느껴 이미 만들어진 token이 많은 pretrained 를 이용해야겠다는 판단이 들었습니다.
코드 공유해주신 분들 정말 감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved