분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 전처리 2/14 python 파이썬 특정 텍스트 제거 - (1)
안녕하세요🧏♂️🧏♀️
이번 시간 부터 텍스트 데이터에서 특정 텍스트를 제거하는 4가지 방법에 대해 알아 보겠습니다.
특정 텍스트를 제거하는 작업은 텍스트 데이터를 다룰 때 꼭 필요한 작업입니다.
예를 들어 ★,<,※ 와 같은 특수 기호나, <head> , & 와 같은 html,xml 태그 등 몇몇 텍스트는 오히려 모델의 성능에 방해가 되는 요소이기 때문에 제거해주는 것이 좋습니다.
첫번째로 알아 볼 방법은 replace() 메소드를 사용하는 방법입니다.
replace() 메소드는 특정 문자를 새로운 문자로 변경(제거)하는 기능을 가지고 있습니다.
사용방법은 문자열.replace(old, new, [count]) 형식으로 사용 할 수 있습니다.
- old : 현재 문자열에서 변경하고 싶은 문자
- new : 새로 바꿀 문자
- count : 변경할 횟수
※ 횟수를 입력하지 않으면 old의 문자열 전체를 변경합니다. 또한 문자열에서 특정 문자열을 제거하고 싶다면 new 에 ''를 넣어주면 됩니다.※
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
string = '123,456,789'
# 출력값 : 123456,789
print(string.replace(',','',1))
# 출력값 : 123456789
print(string.replace(',' , '' ))
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn #replace() #텍스트 데이터 변경
✅
✅
done
✅
✅
done
✅
✅
done
✅
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅