분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 전처리 14/14 python 파이썬 TF-IDF (2)
안녕하세요 여러분! 🕵️♀️🕵️♀️
이번 시간에는 TF-IDF를 이용하여 청와대 청원 데이터를 벡터화 시켜 보도록 하겠습니다.
실습 순서는 다음과 같습니다.
그럼 바로 실습을 진행해보도록 하겠습니다 ❗❕
------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 라이브러리 로딩
from sklearn.feature_extraction.text import TfidfVectorizer
#TF-IDF으로 train 데이터를 피처 벡터화 변환 수행
vect = TfidfVectorizer()
vect.fit(train['data'])
train_x = vect.transform(train['data'])
print('train 데이터 사이즈', train_x.shape)
#Train Data로 fit()된 TF-IDF를 이용해 테스트 데이터를 Feature Vector화 변환 수행
test_x = vect.transform(test['data'])
print('test 데이터 사이즈', test_x.shape)
------------------------------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn
# TfidfVectorizer
✅
✅
done
✅
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅