如何用 Python 中的 NLTK 对中文进行分析和处理

 我来答

1个回答

#热议# 普通体检能查出癌症吗？

健美又超然的工匠329
2017-09-25 · TA获得超过185个赞

知道小有建树答主

回答量：629

采纳率：0%

帮助的人：647万

我也去答题访问个人页

关注

展开全部

我感觉用nltk 处理中文是完全可用的。其重点在于中文分词和文本表达的形式。
中文和英文主要的不同之处是中文需要分词。因为nltk 的处理粒度一般是词，所以必须要先对文本进行分词然后再用nltk 来处理（不需要用nltk 来做分词，直接用分词包就可以了。严重推荐结巴分词，非常好用）。
中文分词之后，文本就是一个由每个词组成的长数组：[word1, word2, word3…… wordn]。之后就可以使用nltk 里面的各种方法来处理这个文本了。比如用FreqDist 统计文本词频，用bigrams 把文本变成双词组的形式：[(word1, word2), (word2, word3), (word3, word4)……(wordn-1, wordn)]。

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

广州市魔书科技有限公司

广告2024-12-28

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

笨方法学python-4.0Turbo-国内入口

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co广告

如何用 Python 中的 NLTK 对中文进行分析和处理

您可能关注的内容

其他类似问题

为你推荐：