본문 바로가기

데이터분석43

분류 모델 평가 지표 정리 (with 파이썬 머신러닝 완벽가이드) 이진 분류의 경우 데이터의 구성에 따라 ML Model 성능을 왜곡할 수 있기 때문에 정확도 수치 하나만 가지고 성능을 평가하지 않는다. 이 문구를 통해 평가 지표에 대한 공부의 필요성을 느꼈다. 분류 모델에서 대표적인 평가 지표를 정리해봤다. 정확도(Accuracy) 직관적으로 모델 예측 성능을 나타내는 평가 지표. 불균형한 레이블 값 분포에서 모델 성능을 판단할 경우, 적합한 평가 지표가 아니다. 정확도는 데이터 분포도가 균일할 때 사용 혼동행렬(오차행렬) Confusion Matrix Negative Positive Negative TN 예측 : Negative 실제 : Negative FP 예측 : Positive 실제 : Negative Positive FN 예측 : Negative 실제 : P.. 2023. 11. 30.
Window Pycharm(파이참) GPU 연결 with tensorflow 먼저 https://kc9302.tistory.com/114 이걸 참고해서 1~4번까지 하고 나서 다음 내용을 확인해볼 수 있다. 구분 버전 GPU GeForce GTX 1050 Ti Anaconda Anaconda3-2023.09-0-Windows-x86_64 Python 3.8 CUDA cuda_11.2.0_460.89_win10 tensorflow-gpu 2.5.0 torchvision 0.9.0 torchaudio 0.8.0 cudatoolkit 11.1 이전에 설정한 환경과 동일하다. 하지만 처음 동작시 GPU를 인식하지 못했다. 원인은 tensorflow 버전이 맞지 않았다. https://spltech.co.uk/installing-tensorflow-2-9-with-gpu-support/ .. 2023. 11. 26.
Window Pycharm(파이참) GPU 연결 with pytorch 구분 버전 GPU GeForce GTX 1050 Ti Anaconda Anaconda3-2023.09-0-Windows-x86_64 Python 3.8 CUDA cuda_11.2.0_460.89_win10 pytorch 1.8.0 torchvision 0.9.0 torchaudio 0.8.0 cudatoolkit 11.1 import torch.cuda.is_available() 결과값이 False 일 때 해결법. 1. 컴퓨터 GPU를 확인한다. win10 기준 제어판 - 하드웨어 및 소리 - 장치 및 프린터 - 장치관리자 - 디스플레이 어댑터로 들어가면 해당 GPU 모델명 확인 가능 2, 아나콘다를 설치한다. https://www.anaconda.com/download 이곳에서 다운로드 및 설치 크게 .. 2023. 11. 26.
[논문 리뷰] 추천 시스템 DeepFM(Factorization Machines) 분석 FM에 이어서 DeepFM 데이터 흐름도를 그려보았습니다. 논문 이해에 도움이 되었으면 좋겠습니다. DeepFM 논문 링크입니다. https://arxiv.org/pdf/1703.04247.pdf 홍러닝 블로그님의 게시글을 참고하여 제작하였습니다. https://hongl.tistory.com/264 RecSys - DeepFM RecSys - Factorization Machines (1) ResSys - Factorization Machines (2) RecSys - Field-aware Factorization Machines 유저가 추천된 아이템에 대하여 클릭할 확률을 예측하는 CTR (Click Through Rate) prediction은 온라인 광고, 유튜 hongl.tistory.com 크.. 2023. 8. 2.
[논문 리뷰] 추천 시스템 FM(Factorization Machines) 분석 아래 블로그를 참고해서 모델에 관한 주석과 Data Flow를 그려봤습니다. 모델을 이해하는데 도움이 되었으면 좋겠습니다. FM 논문 링크입니다. https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 홍러닝 블로그님의 게시글을 참고하여 제작하였습니다. https://hongl.tistory.com/242 RecSys - Factorization Machines (1) 유튜브, 넷플리스, 이커머스 등의 플랫폼을 사용하다보면 연관된 영상과 제품이 여러 사용자의 다양한 데이터와 머신러닝 알고리즘에 기반하여 추천됩니다. 내가 이 플랫폼을 처음 사용한다거 hongl.tistory.com FM에 전체 구조는 위에 그림처럼 구성됩니다. 차례대로 살펴 보겠습니다. F.. 2023. 7. 28.
[Pandas] iloc, loc loc # 1행만 가져오기 df_data.loc[1] # 슬라이싱 하고 특정 컬럼의 행만 가져오기 df_data.loc[1:4, "특정 컬럼"] # 특정 컬럼 다중 선택 df_data.loc[1:4, ["특정 컬럼1", "특정 컬럼2"]] iloc # 첫번째 행 가져오기 df_data.iloc[0] # 특정 여러 행 가져오기 df_data.iloc[[0,3,4]] # 슬라이싱 df_data.iloc[4:7] 조건 활용 # 일치 df_data[df_data["label"]==0].loc[4:7] # OR df_data[(df_data['label'] == 0) | (df_data['label'] == 1)].iloc[4:7] # AND df_data[(df_data['label'] == 0) & (df_d.. 2023. 7. 24.
728x90