使用Python一秒看完十九大报告

发表于:2017-10-26 10:15

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:CC先生    来源:腾讯云

#
Python
分享:
  
19meeting.png
  使用到的知识点:
  ●制作词云的基本步骤和原理
  ●Python3实现词云制作
  ●wordcloud扩展包的使用
  ●使用图片制作词云,分析十九大的关键词
  思路:
  词云的原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示出词汇,生成图片。频率高的词汇显示的大,频率低的词汇显示的小。文本数据可以是本地数据,也可是是爬虫动态从网络中获取的。
  需要安装包:
  $ pip install numpy
  $ pip install python-matplotlib
  $ pip install python-pil
  $ pip install wordcloud
  实现代码:
  from os import path
  from wordcloud import WordCloud
  import numpy as np
  from PIL import Image
  from os import path
  import matplotlib.pyplot as plt
  import random
  d = path.dirname(__file__)
  # 使用numpy中的mask
  mask = np.array(Image.open(path.join(d, "stormtrooper_mask.png")))
  # 读取数据来源
  text = open(path.join(d, '19meeting.txt')).read()
  # 生成词云图片
  wordcloud = WordCloud().generate(text)
  # 显示生成的图片
  wc = WordCloud(max_words=2000, mask=mask, margin=10,
                 random_state=1).generate(text)
  plt.figure()
  plt.imshow(wc)
  plt.axis("off")
  plt.show()
  以上代码里面用到了两个文件,一个是词云的原图片(可以看得出来原图片是什么吗?哈哈),一个是十九大报告的原文。
  看,是不是秒读 十九大报告。
精选软件测试好文,快来阅读吧~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号