분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 0.75069] 새벽반 - BoW + Random Forest 코드 공유
BoW(Bag of Word) + Random Forest를 사용한 코드를 공유합니다.
1. BoW
Length=6.과 Window size=1로 하여 Epitope에 자주 등장하는 패턴을 6000개 추출합니다.
이렇게 자주 등장하는 길이가 6인 단백질 서열 패턴의 개수를 Train과 Test Data의 Feature에 추가해줍니다.
2. Random Forest
앞에서 BoW를 통해 추출한 6000개의 Feature와 기존의 Tabular Feature를 Random Forest로 학습합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved