Word_cloud

获取词云的代码

import jieba
import matplotlib.pyplot as plt
from collections import Counter
import jieba.posseg as psg
from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator


artic = open('2.txt', 'r', encoding='utf8').read()
# 取到不需要的字符
r='!.:;\n?“。,……”\u3000:的!,    '
for i in r:
    artic = artic.replace(i, '')
# 生成词组
cut =','.join(jieba.cut(artic))
lcut = jieba.lcut(artic)
# 统计数量
count = Counter(lcut).most_common(20)
print(cut)


path_of_font = './arialuni.ttf'
bg_path = 'C:/Users/Administrator/Pictures/map1.jpg'
bg_img = imread(bg_path)
my_wordcloud = WordCloud(font_path=path_of_font,max_font_size=100,mask=bg_img).generate(cut)
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()

效果图:

Figure_2


  转载请注明: 微笑看你 Word_cloud

 上一篇
Odoo Odoo
#### 定义: - Qweb被用作OpenERP的web客户端模板引擎。它是一种基于XML的模板语言。 - 特征: - 完全在客户端浏览器中完成渲染 - 一个模板文件中可以包含多个模
2019-05-10
下一篇 
正则表达式 正则表达式
re\w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内) [^\x00-\xff] 注:可以用来计算字符串的长度(一个双
2019-01-19
  目录