Python怎么生成Wordcloud词云
这篇文章主要讲解了“Python怎么生成Wordcloud词云”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么生成Wordcloud词云”吧!
成都创新互联是一家集网站建设,玉溪企业网站建设,玉溪品牌网站建设,网站定制,玉溪网站建设报价,网络营销,网络优化,玉溪网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。
当然最直接的是 pip
pip install wordcloud
但很多同学会发现直接 pip 是会报错的,所以这里提供第二种安装方式:
下载 whl 手动安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
静静等待页面加载完成,然后选择适合自己 Python 的 wordcloud 版本,最后运行以下命令。filepath 替换为你的安装文件完整路径。
pip install filepath\wordcloud-1.2.1-cp35-cp35m-win_amd64.whl
wordcloud 在安装过程中会自动安装其依赖的库。
基本的用法
我们读入一本英文小说,取其中的词汇生成一张词云图
# 导入 wordcloud 模块和 matplotlib 模块
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读入一个txt文件
text = open('Jane Eyre.txt','r').read()
# 生成词云
wordcloud = WordCloud().generate(text)
# 显示词云图片
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
# 保存图片
wordcloud.to_file('test.jpg')
结果如图所示
运行脚本之后就可以看到生成的图片了,是不是很简单。本文主要讲 wordcloud。代码中涉及到的 matplotlib 就不做更详细解释。
除了直接读入文本生成词云,也可以使用字典格式的词频作为输入
# 读入一组词频字典文件
text_dict = {
'you': 2993,
'and': 6625,
'in': 2767,
'was': 2525,
'the': 7845,
}
wordcloud = WordCloud().generate_from_frequencies(text_dict)
还可以将词云填充到指定的形状之中。为达到填充指定形状的效果,需要使用 png 格式的图片。
# 读入图片
from scipy.misc import imread
bg_pic = imread('Anne_Hathaway.png')
# 配置词云参数
wc = WordCloud(
# 设置字体
font_path = 'BeaverScratches.ttf',
# 设置背景色
background_color='white',
# 允许最大词汇
max_words=200,
# 词云形状
mask=bg_pic,
# 最大号字体
max_font_size=100,
)
# 生成词云
wc.generate(text)
# 保存图片
wc.to_file('word.jpg')
还可以结合 jieba分词,实现用中文填充的词云图(如果不通过分词,无法直接生成正确的中文词云)。使用中文填充时一定得指定中文的字体,否则会出现乱码。如果报错找不到字体,就复制一个中文字体文件放在代码目录下。
#-*- coding:utf-8 -*-
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
from collections import Counter
# 读入 西游记 txt 文件,windows 下过滤编码错误
text = open('西游记.txt',encoding='utf-8',errors='ignore').read()
# 使用 jieba 分词
text_jieba = list(jieba.cut(text))
# 使用 counter 做词频统计,选取出现频率前 100 的词汇
c = Counter(text_jieba)
common_c = c.most_common(100)
# 读入图片
bg_pic = imread('Anne_Hathaway.png')
# 配置词云参数
wc = WordCloud(
# 设置字体
font_path = '李旭科书法1.4.ttf',
# 设置背景色
background_color='white',
# 允许最大词汇
max_words=200,
# 词云形状
mask=bg_pic,
# 最大号字体
max_font_size=100,
)
# 生成词云
wc.generate_from_frequencies(dict(common_c))
# 生成图片并显示
plt.figure()
plt.imshow(wc)
plt.axis('off')
plt.show()
# 保存图片
wc.to_file('anne.jpg')
感谢各位的阅读,以上就是“Python怎么生成Wordcloud词云”的内容了,经过本文的学习后,相信大家对Python怎么生成Wordcloud词云这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!
分享文章:Python怎么生成Wordcloud词云
文章路径:http://scyanting.com/article/gjpsid.html