pandas10 데이터프레임 중복 제거 - drop_duplicates() df.drop_duplicates() 2024. 1. 17. [Pandas] iloc, loc loc # 1행만 가져오기 df_data.loc[1] # 슬라이싱 하고 특정 컬럼의 행만 가져오기 df_data.loc[1:4, "특정 컬럼"] # 특정 컬럼 다중 선택 df_data.loc[1:4, ["특정 컬럼1", "특정 컬럼2"]] iloc # 첫번째 행 가져오기 df_data.iloc[0] # 특정 여러 행 가져오기 df_data.iloc[[0,3,4]] # 슬라이싱 df_data.iloc[4:7] 조건 활용 # 일치 df_data[df_data["label"]==0].loc[4:7] # OR df_data[(df_data['label'] == 0) | (df_data['label'] == 1)].iloc[4:7] # AND df_data[(df_data['label'] == 0) & (df_d.. 2023. 7. 24. [Pandas] 'utf-8' codec can't decode byte 0xc4 in position 7239: invalid continuation byte import pandas as pd pd.read_csv(encoding='ISO-8859-1') encoding 파라미터를 추가하자. 2023. 6. 30. [Pandas] read_csv(), read_excel() '파일위치' : 확장자까지 입력하기 ex) '/content/파일.csv' CSV 파일 import pandas as pd csv_data = pd.read_csv('파일위치') excel 파일 pip install openpyxl excel_data = pd.read_excel('파일위치',engine='openpyxl') tsv 파일 tsv_data = pd.read_csv('파일위치',delimiter='\t') 다른 방식 with open("파일위치",'r',encoding='utf-8') as f: file_data = f.readlines() 판다스를 안쓰고 밑에 방식으로도 파일 읽어오기 가능. 'r'은 읽어오기, 'w'은 쓰기 readline() 은 라인별로 읽어오기 함수 2022. 11. 20. 이전 1 2 다음 728x90