求助 中文文本挖掘和文本矩阵遇到的问题 40
为什么分词矩阵最后包含\n这个符号(换行符号)语句如下demo<-c("《文本挖掘(英文版)》是一部文本挖掘领域名著","作者为世界知名的权威学者。书中涵盖了核心文本挖掘...
为什么 分词矩阵最后包含\n这个符号(换行符号)语句如下
demo<-c("《文本挖掘(英文版)》是一部文本挖掘领域名著","作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术","分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结...")segcn<-segmentCN(as.character(demo$goodsName))segcn<-segmentCN(as.character(demo))corpus<-Corpus(VectorSource(segcn))matrix<-DocumentTermMatrix(corpus)其中corpus 和 matrix 请用inspect() 函数观察数据请不要黏贴复制网上的文本挖掘 我看了不少了谢谢
我说的是R语言范畴内,请不要对我说其他的挖掘算法系统或是平台。 展开
demo<-c("《文本挖掘(英文版)》是一部文本挖掘领域名著","作者为世界知名的权威学者。书中涵盖了核心文本挖掘操作、文本挖掘预处理技术","分类、聚类、信息提取、信息提取的概率模型、预处理应用、可视化方法、链接分析、文本挖掘应用等内容,很好地结...")segcn<-segmentCN(as.character(demo$goodsName))segcn<-segmentCN(as.character(demo))corpus<-Corpus(VectorSource(segcn))matrix<-DocumentTermMatrix(corpus)其中corpus 和 matrix 请用inspect() 函数观察数据请不要黏贴复制网上的文本挖掘 我看了不少了谢谢
我说的是R语言范畴内,请不要对我说其他的挖掘算法系统或是平台。 展开
2个回答
2017-06-25
展开全部
用 segmentCN 函数 进行分词的时候,加上 returnType = 'tm',就可以啦
txt <- segmentCN(as.character(temp_df$X7),returnType = 'tm')
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询