常见相似度衡量方法

 我来答
白露饮尘霜17
2022-07-10 · TA获得超过1.2万个赞
知道大有可为答主
回答量:6676
采纳率:100%
帮助的人:36.2万
展开全部
参考邹博的PPT对5种常见的相似度的衡量方法进行一下汇总。
1、 Minkowski distance :

2、 Jaccard distance :

3、 cosine similarity :

4、 pearson correlation coefficient :

关于欧式距离、余弦相似度和pearson系数的关系可以查看 知乎上的讨论 。总结的说:
a、 在数据标准化后,Pearson相关性系数、余弦相似度、欧式距离的平方可认为是等价的。
b、 pearson相关系数是余弦相似度在维度值缺失情况下的一种改进。

5、 Kullback-Leibler divergence(相对熵、KL散度)

a、 KL散度是不对称的,即P到Q的距离不等于Q到P的距离;
b、 KL散度不满足三角距离公式,两边之和大于第三边,两边之差小于第三边。

参考文献:
1、 https://en.wikipedia.org/wiki/Minkowski_distance
2、 https://en.wikipedia.org/wiki/Simple_matching_coefficient
3、 https://en.wikipedia.org/wiki/Jaccard_index
4、 https://en.wikipedia.org/wiki/Cosine_similarity
5、 https://en.wikipedia.org/wiki/Pearson_correlation_coefficient
6、 https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
7、 https://blog.csdn.net/u012885320/article/details/81059915
8、 https://blog.csdn.net/zb1165048017/article/details/48937135
9、 https://www.zhihu.com/question/19734616
10、 https://www.zhihu.com/question/41252833
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式