본문 바로가기
데이터분석

[파이썬 시각화] 워드클라우드(wordcloud) 활용

by Kc93 2022. 11. 28.
728x90
반응형

python

 

'금리' 라는 키워드를 가진 뉴스 제목을 수집하여 워드클라우드로 시각화 해보기.

데이터 수집 방법이 궁금하다면. 링크 참고.

# 데이터 수집 생략 

# 필요 라이브러리
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from konlpy.tag import *
okt = Okt()
data = '수집된 데이터'
nouns_sen = []						# 기사제목 당 명사만을 담을 리스트
 
for sen in data:
     nouns_sen.extend(okt.nouns(sen))
     
count = Counter(nouns_sen).most_common(20)		# 가장 빈도가 높은 명사들을 20개만 추려보기. 

wc = WordCloud(font_path='C:/Windows/Fonts/H2MJSM.TTF'	# 폰트 설정, 해당 위치에서 폰트 가져오기
               ,background_color="black")		# 배경 설정

cloud = wc.generate_from_frequencies(dict(count))	# 워드클라우드(단어빈도) 설정
plt.figure(figsize=(10,10))	# 이미지 사이즈 지정
plt.imshow(cloud)		# 이미지 설정
plt.axis('off')			# x y 축 숫자 제거
plt.show()			# 시각화

워드클라우드 결과값

반응형

댓글