분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3rd] NeighbourhoodCleaningRule+ LogisticRegression
다양한 모델을 테스트해본 결과 학습시간 대비 score가 비슷해서 머신러닝 모델을 사용했습니다.
전처리를 위해 nltk와 re, imblearn의 NeighbourhoodCleaningRule을 사용했습니다.
first, second_party의 경우 CountVectorizer를, facts의 경우 TfidfVectorizer를 ngram_range=(1,2)로 설정하여 벡터화 후,
train_test_split함수를 이용하여 train데이터의 25%를 validation으로 설정하고 LogisticRegression모델로 학습진행하였습니다.
더 테스트해볼게 많았는데 다 해보지는 못해서 아쉽지만, 최선을 다한 결과에 만족스럽고 재밌었습니다.
다들 앞으로도 화이팅하시고 좋은 결과 있으시길 기원합니다! 감사합니다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved