[자연어 처리] 특수 문자 제거 - re 함수, Stopword(불용어) 제거
import re 특수문자 제거 text_data = '특수문자를 제거 할 데이터' text_data = re.sub('[\{\}\[\]\/?.,;:|\)*~`!^\-_+@\#$%&\\\=\(\'\"]', '', text_data) # re 함수 파라미터 # 1번 input : 전처리 할 데이터 # 2번 input : 불용어를 대체할 텍스트, '' 으로 공백표시 하기도함 # 3번 input : 전처리 한 데이터를 담을 공간 불용어 제거 리스트에 제거할 단어들을 정의한다. For문을 실행하며, re 함수를 활용해 제거한다. stopword =['추천','제가','나는','한자','영어','헤'] for word in stopword: text_data = re.sub(word, '', text_data) ..
2022. 11. 20.
단축키
내 블로그
내 블로그 - 관리자 홈 전환 |
Q
Q
|
새 글 쓰기 |
W
W
|
블로그 게시글
글 수정 (권한 있는 경우) |
E
E
|
댓글 영역으로 이동 |
C
C
|
모든 영역
이 페이지의 URL 복사 |
S
S
|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.