728x90
반응형
'금리' 라는 키워드를 가진 뉴스 제목을 수집하여 워드클라우드로 시각화 해보기.
데이터 수집 방법이 궁금하다면. 링크 참고.
# 데이터 수집 생략
# 필요 라이브러리
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from konlpy.tag import *
okt = Okt()
data = '수집된 데이터'
nouns_sen = [] # 기사제목 당 명사만을 담을 리스트
for sen in data:
nouns_sen.extend(okt.nouns(sen))
count = Counter(nouns_sen).most_common(20) # 가장 빈도가 높은 명사들을 20개만 추려보기.
wc = WordCloud(font_path='C:/Windows/Fonts/H2MJSM.TTF' # 폰트 설정, 해당 위치에서 폰트 가져오기
,background_color="black") # 배경 설정
cloud = wc.generate_from_frequencies(dict(count)) # 워드클라우드(단어빈도) 설정
plt.figure(figsize=(10,10)) # 이미지 사이즈 지정
plt.imshow(cloud) # 이미지 설정
plt.axis('off') # x y 축 숫자 제거
plt.show() # 시각화
반응형
'데이터분석' 카테고리의 다른 글
파이썬 UV 라이브러리 사용법 완전 정복: 더 빠르고 효율적인 파이썬 환경 구축하기 (0) | 2025.04.18 |
---|---|
[우분투 폴더 삭제] rm -r directory (0) | 2024.03.04 |
[파이썬] 네이버 뉴스 제목 크롤링(crawling) (0) | 2022.11.28 |
댓글