분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3rd] NeighbourhoodCleaningRule+ LogisticRegression
다양한 모델을 테스트해본 결과 학습시간 대비 score가 비슷해서 머신러닝 모델을 사용했습니다.
전처리를 위해 nltk와 re, imblearn의 NeighbourhoodCleaningRule을 사용했습니다.
first, second_party의 경우 CountVectorizer를, facts의 경우 TfidfVectorizer를 ngram_range=(1,2)로 설정하여 벡터화 후,
train_test_split함수를 이용하여 train데이터의 25%를 validation으로 설정하고 LogisticRegression모델로 학습진행하였습니다.
더 테스트해볼게 많았는데 다 해보지는 못해서 아쉽지만, 최선을 다한 결과에 만족스럽고 재밌었습니다.
다들 앞으로도 화이팅하시고 좋은 결과 있으시길 기원합니다! 감사합니다!!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved