色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

python 詞云模糊

傅智翔2年前9瀏覽0評論

Python 詞云是一種數(shù)據(jù)可視化的工具,通過統(tǒng)計詞頻,將文本中的關(guān)鍵詞展示在一張圖中,形成詞云。在使用 python 詞云時,有時會出現(xiàn)詞云模糊不清的問題,下面我們來探討如何解決這個問題。

# 導入需要的庫
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
# 讀入文本
text = open('text.txt', 'r', encoding='utf-8').read()
# 讀入圖片
mask = np.array(Image.open('mask.png'))
# 設(shè)置停用詞
stop_words = set(STOPWORDS)
# 設(shè)置詞云參數(shù)
wc = WordCloud(background_color='white', 
mask=mask, 
stopwords=stop_words,
max_words=200, 
max_font_size=100,
random_state=42)
# 生成詞云
wc.generate(text)
# 顯示詞云
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()

使用以上代碼可以生成一張詞云圖,但在顯示時可能出現(xiàn)模糊的情況。這是因為 dpi 設(shè)置不夠,可以通過以下代碼將 dpi 設(shè)置為 300,從而提高分辨率。

# 設(shè)置 dpi
wc = WordCloud(background_color='white', 
mask=mask, 
stopwords=stop_words,
max_words=200, 
max_font_size=100,
random_state=42,
dpi=300)

除了設(shè)置 dpi,還可以通過設(shè)置 collocations=False 來禁用詞組,從而減少重復出現(xiàn)的詞語。

# 禁用詞組
wc = WordCloud(background_color='white', 
mask=mask, 
stopwords=stop_words,
max_words=200, 
max_font_size=100,
random_state=42,
dpi=300,
collocations=False)

通過以上方法,就可以有效解決 python 詞云模糊的問題。