Python作业求助
作业要求如下:(1)下载某个歌手的全部歌词或一部长篇小说,存成一个UTF-8编码的文本文件;(2)从文件中读取全部文本进行预处理:将标点符号全部替换成空格;(3)将预处理...
作业要求如下:
(1)下载某个歌手的全部歌词或一部长篇小说,存成一个UTF-8编码的文本文件;
(2)从文件中读取全部文本进行预处理:将标点符号全部替换成空格;
(3)将预处理之后的文本进行分词,统计每个单词出现的次数,生成词频字典;
现在我只做出来词频分析,但是不懂得标点符号如何替换成空格,以下是我写的半成品 求大佬修改,感激不尽!
import jieba
txt = open("绝代风华.txt","r",encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(15):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count)) 展开
(1)下载某个歌手的全部歌词或一部长篇小说,存成一个UTF-8编码的文本文件;
(2)从文件中读取全部文本进行预处理:将标点符号全部替换成空格;
(3)将预处理之后的文本进行分词,统计每个单词出现的次数,生成词频字典;
现在我只做出来词频分析,但是不懂得标点符号如何替换成空格,以下是我写的半成品 求大佬修改,感激不尽!
import jieba
txt = open("绝代风华.txt","r",encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(15):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count)) 展开
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询