Python 詞云是一種數(shù)據(jù)可視化的工具,通過統(tǒng)計詞頻,將文本中的關(guān)鍵詞展示在一張圖中,形成詞云。在使用 python 詞云時,有時會出現(xiàn)詞云模糊不清的問題,下面我們來探討如何解決這個問題。
# 導入需要的庫 from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt import numpy as np from PIL import Image # 讀入文本 text = open('text.txt', 'r', encoding='utf-8').read() # 讀入圖片 mask = np.array(Image.open('mask.png')) # 設(shè)置停用詞 stop_words = set(STOPWORDS) # 設(shè)置詞云參數(shù) wc = WordCloud(background_color='white', mask=mask, stopwords=stop_words, max_words=200, max_font_size=100, random_state=42) # 生成詞云 wc.generate(text) # 顯示詞云 plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show()
使用以上代碼可以生成一張詞云圖,但在顯示時可能出現(xiàn)模糊的情況。這是因為 dpi 設(shè)置不夠,可以通過以下代碼將 dpi 設(shè)置為 300,從而提高分辨率。
# 設(shè)置 dpi wc = WordCloud(background_color='white', mask=mask, stopwords=stop_words, max_words=200, max_font_size=100, random_state=42, dpi=300)
除了設(shè)置 dpi,還可以通過設(shè)置 collocations=False 來禁用詞組,從而減少重復出現(xiàn)的詞語。
# 禁用詞組 wc = WordCloud(background_color='white', mask=mask, stopwords=stop_words, max_words=200, max_font_size=100, random_state=42, dpi=300, collocations=False)
通過以上方法,就可以有效解決 python 詞云模糊的問題。
上一篇vue cli 跨越