两个类型的多个文档,每个类型的文档分别进行了文本分词->权重计算->使用X^2进行特征选取,这些都已经完成了,
每个分词后的词语现在已经知道了单词的词频
下一步是怎么把现有的数据给转换成LibSVM里面需要的那种数据格式?
看了好多的论文,都是理论,没有找到真正实用的地方.请有这方面研究的同行给点提示.谢谢.
中文分词向量怎样转换成LIBSVM里面需要的数据
答案:2 悬赏:70 手机版
解决时间 2021-03-06 03:46
- 提问者网友:謫仙
- 2021-03-05 19:35
最佳答案
- 五星知识达人网友:孤独入客枕
- 2021-03-05 20:08
你用logic表示不就行了吗,有这个分词是为1,没有这个分词的时候为-1.试一试LIBLINEAR,在下载LIBSVM的那个网站上能下到。
全部回答
- 1楼网友:duile
- 2021-03-05 20:35
搜一下:中文分词向量怎样转换成LIBSVM里面需要的数据
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯