본문 바로가기

데이터분석43

[파이썬 시각화] 워드클라우드(wordcloud) 활용 '금리' 라는 키워드를 가진 뉴스 제목을 수집하여 워드클라우드로 시각화 해보기. 데이터 수집 방법이 궁금하다면. 링크 참고. # 데이터 수집 생략 # 필요 라이브러리 from collections import Counter from wordcloud import WordCloud import matplotlib.pyplot as plt from konlpy.tag import * okt = Okt() data = '수집된 데이터' nouns_sen = []# 기사제목 당 명사만을 담을 리스트 for sen in data: nouns_sen.extend(okt.nouns(sen)) count = Counter(nouns_sen).most_common(20)# 가장 빈도가 높은 명사들을 20개만 추려보기. .. 2022. 11. 28.
[Pytorch] 파이토치로 GPU 사용 print("GPU 가용여부 ", torch.cuda.is_available()) print("GPU 갯수 ", torch.cuda.device_count()) print("GPU 이름 ", torch.cuda.get_device_name(0)) device = "cuda:0" if torch.cuda.is_available() else "cpu" print(device) # 결과 값 GPU 가용여부 True GPU 갯수 2 GPU 이름 NVIDIA GeForce RTX 3080 Ti cuda:0 2022. 11. 28.
[Pytorch] Tensor CPU, GPU 변경 sample_tensor.is_cuda # gpu 텐서 확인 리턴값 bool sample_tensor.to(device) # 설정한 디바이스로 텐서 타입 변경 sample_tensor.cuda() # 다른 방식 1 sample_tensor = sample_tensor.to(device. dtype=torch.float64) # 다른방식 2 sample_tensor = torch.as_tensor(sample_tensor, dtype=torch.float32, device='gpu') # 다른방식 3 sample_tensor.cpu() # CPU로 옮길 때 2022. 11. 28.
[Pytorch] Tensor(텐서) 오류 해결 모음 RuntimeError : expected scalar type Double but found Float Pytorch는 Tensor연산시 Float32으로 진행 해결 : Float32로 바꿔주기. EX) sample_tensor.to(device, dtype=torch.float32) Expected all tensors to be on the same device, but found at least two devices 사용하는 텐서가 두종류(CPU,GPU)가 충돌한다는 의미 해결 : sample_tensor.CPU(), sample_tensor.GPU()를 사용하여 텐서의 흐름을 통일 시켜주기 2022. 11. 28.
[Pytorch] 파이토치 Tensor(텐서)의 최대 값, 인덱스 sample_tensor.max(dim=0) # dim=0은 행에서 최대값, 인덱스 sample_tensor.max(dim=1) # dim=1은 열에서 최대값, 인덱스 2022. 11. 28.
[파이썬] 네이버 뉴스 제목 크롤링(crawling) # 라이브러리 불러오기 from bs4 import BeautifulSoup as bs import requests from selenium import webdriver import pandas as pd # 함수 정의 def naver_news_crawling(keyword,pages): try: chromeOptions_options = webdriver.ChromeOptions()# 크롬 실행 chromeOptions_options.add_argument("headless")# 창을 띄우지 않고 실행 # start수를 1, 11, 21, 31 ...만들어 주는 함수, 페이지 수를 의미 count = pages # 올바른 range 동작을 위해 +1 page = []# 페이지 수 for i in r.. 2022. 11. 28.
728x90