분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 전처리 2/14 python 파이썬 특정 텍스트 제거 - (1)
안녕하세요🧏♂️🧏♀️
이번 시간 부터 텍스트 데이터에서 특정 텍스트를 제거하는 4가지 방법에 대해 알아 보겠습니다.
특정 텍스트를 제거하는 작업은 텍스트 데이터를 다룰 때 꼭 필요한 작업입니다.
예를 들어 ★,<,※ 와 같은 특수 기호나, <head> , & 와 같은 html,xml 태그 등 몇몇 텍스트는 오히려 모델의 성능에 방해가 되는 요소이기 때문에 제거해주는 것이 좋습니다.
첫번째로 알아 볼 방법은 replace() 메소드를 사용하는 방법입니다.
replace() 메소드는 특정 문자를 새로운 문자로 변경(제거)하는 기능을 가지고 있습니다.
사용방법은 문자열.replace(old, new, [count]) 형식으로 사용 할 수 있습니다.
- old : 현재 문자열에서 변경하고 싶은 문자
- new : 새로 바꿀 문자
- count : 변경할 횟수
※ 횟수를 입력하지 않으면 old의 문자열 전체를 변경합니다. 또한 문자열에서 특정 문자열을 제거하고 싶다면 new 에 ''를 넣어주면 됩니다.※
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
string = '123,456,789'
# 출력값 : 123456,789
print(string.replace(',','',1))
# 출력값 : 123456789
print(string.replace(',' , '' ))
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn #replace() #텍스트 데이터 변경
✅
✅
done
✅
✅
done
✅
✅
done
✅
✅
✅
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅