求关于文档相似度

要做一个毕业设计,编写一个软件,关于检测文档相似度的,检测句子文本之间和文档之间的相似度的,单机或者网络版的都行。网上可以找到论文,但我更需要程序代码,因为通过代码来写论... 要做一个毕业设计,编写一个软件,关于检测文档相似度的,检测句子文本之间和文档之间的相似度的,单机或者网络版的都行。
网上可以找到论文,但我更需要程序代码,因为通过代码来写论文可以,但是通过论文写代码就难了。
求发一份代码给我,有代码请私信我喔,酬谢喔。
展开
 我来答
匿名用户
2016-11-10
展开全部
对于文档/文本相似度的判定采取的主要算法有3种:
1、最长公共子串算法(Longest-common-subsequence , LCS算法)。LCS算法就是求两个字符串的公共子串的最大可能长度。
2、余弦定理 (向量空间算法)。这是利用余弦定理和广义Jaccard系数来计算文本相似度。
3、距离编辑算法(Levenshtein Distance,LD算法)。距离编辑的定义是将字符串A转换为字符串B所用的最少字符操作数。

有用“距离编辑算法”写了毕业论文和代码,某宝上搜索“文档相似度检测系统 代码”可以买到
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式