Python作业求助

作业要求如下:（1）下载某个歌手的全部歌词或一部长篇小说，存成一个UTF-8编码的文本文件；（2）从文件中读取全部文本进行预处理：将标点符号全部替换成空格；（3）将预处理... 作业要求如下:
（1）下载某个歌手的全部歌词或一部长篇小说，存成一个UTF-8编码的文本文件；
（2）从文件中读取全部文本进行预处理：将标点符号全部替换成空格；
（3）将预处理之后的文本进行分词，统计每个单词出现的次数，生成词频字典；
现在我只做出来词频分析，但是不懂得标点符号如何替换成空格，以下是我写的半成品求大佬修改，感激不尽！
import jieba
txt = open("绝代风华.txt","r",encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(15):
word, count = items[i]
print("{0:<10}{1:>5}".format(word, count)) 展开

 我来答

7个回答

#热议# 为什么有人显老，有人显年轻？

张淼森8l
2018-12-26 · 超过79用户采纳过TA的回答

知道小有建树答主

回答量：286

采纳率：58%

帮助的人：51.8万

我也去答题访问个人页

关注

展开全部

就做一下标点符号的替换吧

txt = open("绝代风华.txt","r+",encoding='utf-8').read()#修改访问模式为"r+"
txt2=txt.replace(",",' ').replace("。",' ')#还有什么符号就自己加吧
txt3=open("E://绝代风华2.txt","w+",encoding='utf-8')#设置路径比较好，在文件名前加
txt3.write(txt2)#写入替换好的文本，形成新文本

#以下三句放在代码的后面
txt.close()
txt3.close()

#打开新文本,若查看的文本内容无误，这两行代码可以注释。
pl=open("E://绝代风华2.txt","r",encoding='utf-8').read()
pl.close()

已赞过 已踩过<

评论收起

慕课网

广告2024-12-24

class.imooc.com

软件测试微课堂
2018-12-26 · 超过18用户采纳过TA的回答

知道答主

回答量：169

采纳率：16%

帮助的人：13万

我也去答题访问个人页

关注

展开全部

python里面可以用replace的方法来替换为空格，这个方法是比较好的，语法是string为字符串，string.replace（）

已赞过 已踩过<

评论收起

百度网友24c4a23
2018-12-25

知道答主

回答量：47

采纳率：14%

帮助的人：5万

我也去答题访问个人页

关注

展开全部

标点符号可以通过replace替换，写一个单独的方法，或者用正则匹配

追问

详细说下可以吗

已赞过 已踩过<

评论收起

大橙橙橙橙biu
2018-12-25

知道答主

回答量：35

采纳率：0%

帮助的人：2.4万

我也去答题访问个人页

关注

展开全部

这个嘛，用派森的话，我建议你去网上查，这个指令很难的，我也不是很懂

已赞过 已踩过<

评论收起

百度网友0f5b130
2018-12-25 · 贡献了超过531个回答

知道答主

回答量：531

采纳率：7%

帮助的人：36.9万

我也去答题访问个人页

关注

展开全部

主要作业产品求助

已赞过 已踩过<

评论收起

更多回答（5）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

范文范本十篇

www.gzoffice.cn

python脚本编写在线学习，自动化运维全流程—慕课网

coding.imooc.com

Python作业求助

您可能关注的内容

其他类似问题

为你推荐：