728x90
반응형
데이터 전처리를 하면서 raw data를 한 번에 가져와서 전처리 하기 보다는,
쿼리든 함수든 한 번 필터링이 가능 하다면 속도와 효율성에서 큰 효과를 얻을 수 있다.
from sklearn import datasets
import pandas as pd
# 샘플파일
iris = datasets.load_iris()
df_iris = pd.DataFrame(data=iris.data,columns=iris.feature_names)
df_iris['label'] = iris.target
groupby("특정컬럼이름").연산함수()
# groupby
df_iris.groupby("label").sum()
반응형
'데이터분석 > Pandas' 카테고리의 다른 글
데이터프레임 중복 제거 - drop_duplicates() (0) | 2024.01.17 |
---|---|
[Pandas] iloc, loc (0) | 2023.07.24 |
[Pandas] 'utf-8' codec can't decode byte 0xc4 in position 7239: invalid continuation byte (0) | 2023.06.30 |
[Pandas] index(인덱스) 설정 (0) | 2023.02.06 |
[Pandas] read_csv(), read_excel() (0) | 2022.11.20 |
댓글