영화 리뷰 감성분석 해커톤

NLP | Accuracy

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 644명 마감

 

간단하게 CountVectorizer + LR (Public LB = 0.8410)

2022.01.18 14:16 1,695 Views language

프로토타입을 만들기 위해 간단하게 작성한 코드입니다.
데이터의 양이 많지는 않기 때문에 형태소분석기로 stemming을 지원하는 Okt를 사용하였습니다.
EDA와 다른 분들 코드를 참고하면서 전처리 및 튜닝을 조금 더 해보려 합니다.

Code