NLTK 在python上 对文本文件内容进行停词处理 90
已经下载好了nltk在python上,手头上的文件是英文的文本文件,想请问,python上如何利用nltk对这个文件进行停词处理。步骤第一导入txt文件(例如这个文件在桌...
已经下载好了nltk在python上,手头上的文件是英文的文本文件,想请问,python上如何利用nltk对这个文件进行停词处理。
步骤第一 导入txt文件(例如这个文件在桌面的 1.txt 文件)
第二 使用默认的停词表即可(如果能够添加自己想停的词也可以教一下我)
第三 停词的命令
第四 把删去了停用词的内容 以新txt文件导出
不胜感激! 展开
步骤第一 导入txt文件(例如这个文件在桌面的 1.txt 文件)
第二 使用默认的停词表即可(如果能够添加自己想停的词也可以教一下我)
第三 停词的命令
第四 把删去了停用词的内容 以新txt文件导出
不胜感激! 展开
1个回答
展开全部
Nltk是python下处理语言的主要工具包,可以实现去除停用词、词性标注以及分词和分句等。
安装nltk,写python一般使用的是集成环境EPD,其中有包管理,可以在线进行安装。如果不是集成环境,可以通过pip install nltk安装。
》pip install nltk #安装nltk
》nltk.download() #弹出一个选择框,可以按照自己需要的语义或者是功能进行安装
一般要实现分词,分句,以及词性标注和去除停用词的功能时,需要安装stopwords,punkt以及
当出现LookupError时一般就是由于缺少相关模块所导致的
安装nltk,写python一般使用的是集成环境EPD,其中有包管理,可以在线进行安装。如果不是集成环境,可以通过pip install nltk安装。
》pip install nltk #安装nltk
》nltk.download() #弹出一个选择框,可以按照自己需要的语义或者是功能进行安装
一般要实现分词,分句,以及词性标注和去除停用词的功能时,需要安装stopwords,punkt以及
当出现LookupError时一般就是由于缺少相关模块所导致的
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询