kmeans聚类效果的评估指标有

 我来答

1个回答

GUOVEI0
2023-03-15 · TA获得超过131个赞

知道小有建树答主

回答量：685

采纳率：100%

帮助的人：9.7万

关注

展开全部

kmeans聚类效果的评估指标有轮廓系数协方差系数

常用机器学习算法包括分类、回归、聚类等几大类型，以下针对不同模型总结其评估指标:

一、分类模型

常见的分类模型包括：逻辑回归、决策树、朴素贝叶斯、SVM、神经网络等，模型评估指标包括以下几种：

二分类问题

1、混淆矩阵，准确率A：预测正确个数占总数的比例，精准率P：正例样本中有多少被预测正确了，召回率R：预测的正例样本中有多少是正确的，F1 Score(精准率与召回率集成)：2P*R/(P+R)。

2、ROC曲线：ROC曲线应尽量偏离参考线，越靠近左上越好。

3、AUC：ROC曲线下面积，参考线面积为0.5，AUC应大于0.5，且偏离越多越好。

4、Lift曲线：表示“运用该模型”与“未运用该模型即随机选择”所得结果的比值，Lift应该移植大于1，且Lift(提升指数)越大，模型预测效果越好。多分类问题，评价多分类模型一般采用准确率作为评估指标

二、回归模型

常见的回归模型包括线性回归、多项式回归、Lasso回归、岭回归、弹性网络、SVM、神经网络，评估指标见以下总结：

1、MSE均方误差，SSE/m，值越小代表拟合效果越好，用来衡量不同模型对于同一数据集的拟合。

2、R^2决定系数，1-SSE/SST，用于度量模型的解释能力，是相关系数的平方，取值范围为0~1，越接近1表示模型参考价值越高，在scikit-learn中LinearRegression.score就是使用的决定系数，也可以使用专门的库metrics.r2_score。

3、修正的R^2在多元线性回归中，决定系数会虚高，加一个自变量就会增大，加公式进行修正 1-[SSE/(n-p-1)/[SST/(n-1)]，得到修正的决定系数。

三、聚类模型

常见的聚类模型有KMeans、密度聚类、层次聚类等，主要从簇内的稠密成都和簇间的离散程度来评估聚类的效果，评估指标包括：

1、轮廓系数 Silhouette Corfficient，轮廓系数由凝聚度和分离度共同构成，组内SSE越小，组间SSB越大，聚类效果越好，轮廓系数在-1~1之间，值越大，聚类效果越好。

2、协方差系数 Calinski-Harabaz Index，类别内部数据协方差越小越好，类别之间协方差越大越好，这样协方差系数会越高。

已赞过 已踩过<

评论收起

Sievers分析仪
2024-10-13 广告

是的。传统上，对于符合要求的内毒素检测，最终用户必须从标准内毒素库存瓶中构建至少一式两份三点标准曲线；必须有重复的阴性控制；每个样品和PPC必须一式两份。有了Sievers Eclipse内毒素检测仪，这些步骤可以通过使用预嵌入的内毒素标准... 点击进入详情页

本回答由Sievers分析仪提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

其他类似问题