본문 바로가기

분류 전체보기117

[자연어 처리] 특수 문자 제거 - re 함수, Stopword(불용어) 제거 import re 특수문자 제거 text_data = '특수문자를 제거 할 데이터' text_data = re.sub('[\{\}\[\]\/?.,;:|\)*~`!^\-_+@\#$%&\\\=\(\'\"]', '', text_data) # re 함수 파라미터 # 1번 input : 전처리 할 데이터 # 2번 input : 불용어를 대체할 텍스트, '' 으로 공백표시 하기도함 # 3번 input : 전처리 한 데이터를 담을 공간 불용어 제거 리스트에 제거할 단어들을 정의한다. For문을 실행하며, re 함수를 활용해 제거한다. stopword =['추천','제가','나는','한자','영어','헤'] for word in stopword: text_data = re.sub(word, '', text_data) .. 2022. 11. 20.
[Pandas] read_csv(), read_excel() '파일위치' : 확장자까지 입력하기 ex) '/content/파일.csv' CSV 파일 import pandas as pd csv_data = pd.read_csv('파일위치') excel 파일 pip install openpyxl excel_data = pd.read_excel('파일위치',engine='openpyxl') tsv 파일 tsv_data = pd.read_csv('파일위치',delimiter='\t') 다른 방식 with open("파일위치",'r',encoding='utf-8') as f: file_data = f.readlines() 판다스를 안쓰고 밑에 방식으로도 파일 읽어오기 가능. 'r'은 읽어오기, 'w'은 쓰기 readline() 은 라인별로 읽어오기 함수 2022. 11. 20.
UI 설계원칙 4가지 - 정보처리기사 핵심 요약 정리 직관성 : 누구나 쉽게 이해하고 사용 유효성 : 사용자의 목적을 정확히 달성, 유용하고 효과적 이여야한다. 학습성 : 사용자가 쉽게 배우고 익힐수 있어야 한다. 유연성 : 사용자 요구를 최대한 수용하고, 오류를 최소화 해야한다. 직유학유 2022. 11. 17.
728x90