2022 AI 대학원 챌린지

LG | 채용 | B-cell | Epitope | Classification | macro-f1

  • moneyIcon 상금 : 총 2,500만원
  • 304명 마감

 

[Private 0.75069] 새벽반 - BoW + Random Forest 코드 공유

공동작성자

stroke
2022.08.04 20:45 1,412 조회 language

BoW(Bag of Word) + Random Forest를 사용한 코드를 공유합니다.
1. BoW
Length=6.과 Window size=1로 하여 Epitope에 자주 등장하는 패턴을 6000개 추출합니다.
이렇게 자주 등장하는 길이가 6인 단백질 서열 패턴의 개수를 Train과 Test Data의 Feature에 추가해줍니다.
2. Random Forest
앞에서 BoW를 통해 추출한 6000개의 Feature와 기존의 Tabular Feature를 Random Forest로 학습합니다.

코드