Python 튜토리얼

Lv1 전처리 2/14 python 파이썬 특정 텍스트 제거 - (1)

2021.09.23 16:41 3,268 조회

안녕하세요🧏‍♂️🧏‍♀️

이번 시간 부터 텍스트 데이터에서 특정 텍스트를 제거하는 4가지 방법에 대해 알아 보겠습니다.

특정 텍스트를 제거하는 작업은 텍스트 데이터를 다룰 때 꼭 필요한 작업입니다.

예를 들어 ★,<,※ 와 같은 특수 기호나, <head> , &amp; 와 같은 html,xml 태그 등  몇몇 텍스트는 오히려 모델의 성능에 방해가 되는 요소이기 때문에 제거해주는 것이 좋습니다.


💫 replace()


첫번째로 알아 볼 방법은 replace() 메소드를 사용하는 방법입니다.

replace() 메소드는 특정 문자를 새로운 문자로 변경(제거)하는 기능을 가지고 있습니다.

사용방법은 문자열.replace(old, new, [count]) 형식으로 사용 할 수 있습니다.

- old : 현재 문자열에서 변경하고 싶은 문자

- new : 새로 바꿀 문자

- count : 변경할 횟수


※ 횟수를 입력하지 않으면 old의 문자열 전체를 변경합니다. 또한 문자열에서 특정 문자열을 제거하고 싶다면 new 에 ''를 넣어주면 됩니다.



------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

string = '123,456,789'


# 출력값 : 123456,789 

print(string.replace(',','',1))


# 출력값 : 123456789 

print(string.replace(',' , '' ))

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

[Colab 실습 링크]



↩️ 오늘의 파이썬 리스트


#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn #replace() #텍스트 데이터 변경


로그인이 필요합니다
0 / 1000
다욤
2021.09.26 15:52

왼쪽눈썹왁싱
2021.11.03 10:30

페드로
2021.11.18 09:16

녹삭
2021.12.19 20:23

done

moran
2022.01.04 14:53

dbnoid
2022.01.20 12:31

acebed
2022.03.11 14:50

done

비회원
2022.04.06 14:07

krooner
2022.05.20 00:42

pysung
2022.09.11 11:34

done

baeksh0330
2022.10.02 17:35

센트럴푸
2022.11.07 11:19

highllight
2023.02.12 15:23