求助中文文本挖掘和文本矩阵遇到的问题 40

为什么分词矩阵最后包含\n这个符号（换行符号）语句如下demo<-c("《文本挖掘(英文版)》是一部文本挖掘领域名著","作者为世界知名的权威学者。书中涵盖了核心文本挖掘... 为什么分词矩阵最后包含\n这个符号（换行符号）语句如下

demo<-c("《文本挖掘(英文版)》是一部文本挖掘领域名著","作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术","分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容，很好地结...")segcn<-segmentCN(as.character(demo$goodsName))segcn<-segmentCN(as.character(demo))corpus<-Corpus(VectorSource(segcn))matrix<-DocumentTermMatrix(corpus)其中corpus 和 matrix 请用inspect() 函数观察数据请不要黏贴复制网上的文本挖掘我看了不少了谢谢
我说的是R语言范畴内，请不要对我说其他的挖掘算法系统或是平台。展开

 我来答

2个回答

#合辑# 面试问优缺点怎么回答最加分？

匿名用户
2017-06-25

展开全部

用 segmentCN 函数进行分词的时候，加上 returnType = 'tm'，就可以啦

txt <- segmentCN(as.character(temp_df$X7),returnType = 'tm')

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

求助 中文文本挖掘和文本矩阵遇到的问题 40

其他类似问题

为你推荐：

求助中文文本挖掘和文本矩阵遇到的问题 40