求关于文档相似度
要做一个毕业设计,编写一个软件,关于检测文档相似度的,检测句子文本之间和文档之间的相似度的,单机或者网络版的都行。网上可以找到论文,但我更需要程序代码,因为通过代码来写论...
要做一个毕业设计,编写一个软件,关于检测文档相似度的,检测句子文本之间和文档之间的相似度的,单机或者网络版的都行。
网上可以找到论文,但我更需要程序代码,因为通过代码来写论文可以,但是通过论文写代码就难了。
求发一份代码给我,有代码请私信我喔,酬谢喔。 展开
网上可以找到论文,但我更需要程序代码,因为通过代码来写论文可以,但是通过论文写代码就难了。
求发一份代码给我,有代码请私信我喔,酬谢喔。 展开
2016-11-10
展开全部
对于文档/文本相似度的判定采取的主要算法有3种:
1、最长公共子串算法(Longest-common-subsequence , LCS算法)。LCS算法就是求两个字符串的公共子串的最大可能长度。
2、余弦定理 (向量空间算法)。这是利用余弦定理和广义Jaccard系数来计算文本相似度。
3、距离编辑算法(Levenshtein Distance,LD算法)。距离编辑的定义是将字符串A转换为字符串B所用的最少字符操作数。
有用“距离编辑算法”写了毕业论文和代码,某宝上搜索“文档相似度检测系统 代码”可以买到
1、最长公共子串算法(Longest-common-subsequence , LCS算法)。LCS算法就是求两个字符串的公共子串的最大可能长度。
2、余弦定理 (向量空间算法)。这是利用余弦定理和广义Jaccard系数来计算文本相似度。
3、距离编辑算法(Levenshtein Distance,LD算法)。距离编辑的定义是将字符串A转换为字符串B所用的最少字符操作数。
有用“距离编辑算法”写了毕业论文和代码,某宝上搜索“文档相似度检测系统 代码”可以买到
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询