关于python词云的频次统计机制
importwordcloudimportjiebafromscipy.miscimportimreadmask=imread("./AUTO/timg.jpg")#需要...
import wordcloudimport jiebafrom scipy.misc import imreadmask=imread("./AUTO/timg.jpg")#需要新建AUTO文件with open("./AUTO/firstfile.txt","r",encoding="ANSI") as f: t=f.read()ls=jieba.lcut(t)#这里↓txt="".join(ls)#这里↑w=wordcloud.WordCloud(font_path = "C:\\Windows\\Fonts\\simkai.ttf",\ mask=mask,background_color='white',\ width=2000,height=1400,\ collocations=False,max_words=100,scale=2, random_state=100)print(txt)w.generate(txt)w.to_file("first4.png")
展开
展开全部
使用wordcloud库和jieba库可以使用图片上的效果,
这个就是将一个文本先进行分词,然后再统计每个词的词频,选出词频较高的一些词语,然后按照词频的大小设定不同的字体大小,随机生成颜色,随后形成图片。
这个就是将一个文本先进行分词,然后再统计每个词的词频,选出词频较高的一些词语,然后按照词频的大小设定不同的字体大小,随机生成颜色,随后形成图片。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
万山数据
2024-11-14 广告
2024-11-14 广告
作为北京万山数据科技有限公司的工作人员,对于数据反向治理有一定的了解。数据反向治理可以理解为对数据治理流程的逆向操作,旨在确保数据的准确性、一致性和安全性。在数据治理过程中,如果发现数据问题或异常,可以通过反向治理进行追溯和修正。我们公司拥...
点击进入详情页
本回答由万山数据提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询