中文分词向量怎样转换成LIBSVM里面需要的数据

两个类型的多个文档,每个类型的文档分别进行了文本分词->权重计算->使用X^2进行特征选取,这些都已经完成了,每个分词后的词语现在已经知道了单词的词频下一步是怎么把现有的... 两个类型的多个文档,每个类型的文档分别进行了文本分词->权重计算->使用X^2进行特征选取,这些都已经完成了,
每个分词后的词语现在已经知道了单词的词频
下一步是怎么把现有的数据给转换成LibSVM里面需要的那种数据格式?
看了好多的论文,都是理论,没有找到真正实用的地方.请有这方面研究的同行给点提示.谢谢. 展开

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

碧茂科技
2023-10-18 广告

作为上海碧茂信息科技有限公司的工作人员，对于Hadoop集群中小文件过多的问题，可以采取以下处理方法：1. 使用Hadoop Archive（HAR）文件技术。HAR是一种Hadoop文件系统中的归档格式，可将小文件组合成一个大文件，从而降... 点击进入详情页

本回答由碧茂科技提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

中文分词向量怎样转换成LIBSVM里面需要的数据

其他类似问题

为你推荐：