서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 0.75069] 새벽반 - BoW + Random Forest 코드 공유
공동작성자
BoW(Bag of Word) + Random Forest를 사용한 코드를 공유합니다.
1. BoW
Length=6.과 Window size=1로 하여 Epitope에 자주 등장하는 패턴을 6000개 추출합니다.
이렇게 자주 등장하는 길이가 6인 단백질 서열 패턴의 개수를 Train과 Test Data의 Feature에 추가해줍니다.
2. Random Forest
앞에서 BoW를 통해 추출한 6000개의 Feature와 기존의 Tabular Feature를 Random Forest로 학습합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved