Python 詞云工具是一款非常實用的文本可視化工具。它能夠將文本數據進行分詞、關鍵詞提取、詞頻統計等操作,然后將結果生成美觀的詞云圖。
在 Python 中,有很多詞云工具可供選擇。其中比較受歡迎的幾個包括:
import wordcloud import jieba from PIL import Image import numpy as np import matplotlib.pyplot as plt
首先,我們需要將文本進行分詞處理。這里我們使用 jieba 分詞庫:
text = '今天是周末,天氣很好,適合出門玩耍。' words = jieba.cut(text) word_list = list(words)
然后,我們將分詞結果進行詞頻統計:
word_counts = {} for word in word_list: if len(word) == 1: continue word_counts[word] = word_counts.get(word, 0) + 1
接下來,我們可以使用 wordcloud 包中的 WordCloud 類生成詞云圖:
mask = np.array(Image.open("cloud.png")) # 詞云圖的形狀 wc = wordcloud.WordCloud( background_color="white", max_words=200, mask=mask, font_path='msyh.ttf', # 設置字體,可以選擇自己喜歡的字體 contour_width=3, contour_color='steelblue' ) wc.generate_from_frequencies(word_counts) plt.imshow(wc, interpolation='bilinear') plt.axis("off") plt.show()
最后,我們得到一張美觀的詞云圖:
總結:
Python 詞云工具使我們可以用一種直觀的方式展示文本數據。它不僅可以用于分析常規文本數據,還可以用于分析社交媒體數據、新聞數據等。