분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 전처리 9/14 python 파이썬 형태소 분석기 - (3)
안녕하세요 🤦♀️🤦♂️ 이번 시간과 다음 시간에는 형태소 분석기를 이용해 청와대 청원 데이터의 형태소를 분석하고 데이터의 형태소 중 조사를 제거하는 실습을 진행 해보도록 하겠습니다.
데이터에서 조사를 제거하는 이유는 조사는 큰 의미를 가지고 있지 않기 때문에 오히려 분석에 방해가 될 수 있습니다.
실습 순서는 다음과 같습니다.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 조사를 제거하기 위함 함수 정의
def func(text):
# 형태소 분석
okt_pos = okt.pos(str(text),norm=True, stem=True)
# 조사를 제거한 새로운 문자열 정의
new_word = ''
for word,pos in okt_pos:
# 품사가 조사가 아니면
if pos != 'Josa':
# 새로운 문자열에 추가
new_word+=word
return new_word
train['data'] = train['data'].apply(lambda x : func(x))
test['data'] = test['data'].apply(lambda x : func(x))
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
👨💻데이스쿨 로 Up-Skill Re-Skill👩🏻💻
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn #텍스트 제거
✅
✅
done
✅
✅
done
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅