中文分词向量怎样转换成LIBSVM里面需要的数据

两个类型的多个文档,每个类型的文档分别进行了文本分词->权重计算->使用X^2进行特征选取,这些都已经完成了,每个分词后的词语现在已经知道了单词的词频下一步是怎么把现有的... 两个类型的多个文档,每个类型的文档分别进行了文本分词->权重计算->使用X^2进行特征选取,这些都已经完成了,
每个分词后的词语现在已经知道了单词的词频
下一步是怎么把现有的数据给转换成LibSVM里面需要的那种数据格式?
看了好多的论文,都是理论,没有找到真正实用的地方.请有这方面研究的同行给点提示.谢谢.
展开
 我来答
匿名用户
2013-09-21
展开全部
你用logic表示不就行了吗,有这个分词是为1,没有这个分词的时候为-1.试一试LIBLINEAR,在下载LIBSVM的那个网站上能下到。
碧茂科技
2023-10-18 广告
作为上海碧茂信息科技有限公司的工作人员,对于Hadoop集群中小文件过多的问题,可以采取以下处理方法:1. 使用Hadoop Archive(HAR)文件技术。HAR是一种Hadoop文件系统中的归档格式,可将小文件组合成一个大文件,从而降... 点击进入详情页
本回答由碧茂科技提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式