simhash中如何抽取文本关键字及权重
答案:1 悬赏:70 手机版
解决时间 2021-11-12 02:37
- 提问者网友:那叫心脏的地方装的都是你
- 2021-11-11 21:40
simhash中如何抽取文本关键字及权重
最佳答案
- 五星知识达人网友:污到你湿
- 2021-11-11 23:02
传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别很大。所以传统的Hash是无法在签名的维度上来衡量原内容的相似度,而SimHash本身属于一种局部敏感哈希算法,它产生的hash签名在一定程度上可以表征原内容的相似度。追问您好,我是想问问,SimHash如何保证完全不同的关键字生成完全不同的指纹?
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯