NLTK 在python上 对文本文件内容进行停词处理 90

已经下载好了nltk在python上,手头上的文件是英文的文本文件,想请问,python上如何利用nltk对这个文件进行停词处理。步骤第一导入txt文件(例如这个文件在桌... 已经下载好了nltk在python上,手头上的文件是英文的文本文件,想请问,python上如何利用nltk对这个文件进行停词处理。
步骤第一 导入txt文件(例如这个文件在桌面的 1.txt 文件)
第二 使用默认的停词表即可(如果能够添加自己想停的词也可以教一下我)
第三 停词的命令
第四 把删去了停用词的内容 以新txt文件导出
不胜感激!
展开
 我来答
百度网友6eaf0de
2018-04-27 · TA获得超过1490个赞
知道小有建树答主
回答量:6449
采纳率:51%
帮助的人:570万
展开全部
Nltk是python下处理语言的主要工具包,可以实现去除停用词、词性标注以及分词和分句等。
安装nltk,写python一般使用的是集成环境EPD,其中有包管理,可以在线进行安装。如果不是集成环境,可以通过pip install nltk安装。
》pip install nltk #安装nltk
》nltk.download() #弹出一个选择框,可以按照自己需要的语义或者是功能进行安装
一般要实现分词,分句,以及词性标注和去除停用词的功能时,需要安装stopwords,punkt以及
当出现LookupError时一般就是由于缺少相关模块所导致的
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式