推荐系统为什么要分测试集和训练集

 我来答

1个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

殿对5443
2017-05-26 · TA获得超过293个赞

知道答主

回答量：374

采纳率：0%

帮助的人：96万

我也去答题访问个人页

关注

展开全部

在信息检索、统计分类、识别、预测、翻译等领域，两个最基本指标是准确率和召回率，用来评价结果的质量。
准确率（Precision），又称“精度”、“正确率”、“查准率”，表示在检索到的所有文档中，检索到的相关文档所占的比例。
召回率（Recall），又称“查全率”，表示在所有相关文档中，检索到的相关文档所占的比率。
两者的公式为：
准确率 = 检索到的相关文档数量 / 检索到的所有文档总数
召回率 = 检索到的相关文档数量 / 系统中所有相关文档的总数
图示如下：

举例来说：一个数据库中有500个文档，其中有50个文档符合定义的问题。系统检索到75个文档，其中只有45个文档符合定义的问题。
准确率 = 45 / 75 = 60%
召回率 = 45 / 50 = 90%
若将所有文档都检索到，这些指标有何变化：
准确率 = 50 / 500 = 10%
召回率 = 50 / 50 = 100%
可见，准确率和召回率是相互影响的，理想情况下肯定是两者都高，但是一般情况下准确率高，召回率就低；召回率高，准确率就低；如果两者都低，那肯定是什么环节有问题了。
比如，在检索系统中，如果希望提高召回率，即希望更多的相关文档被检索到，就要放宽“检索策略”，便会在检索中伴随出现一些不相关的结果，从而影响到准确率。如果希望提高准确率，即希望去除检索结果中的不相关文档时，就需要严格“检索策略”，便会使一些相关文档不能被检索到，从而影响到召回率。
针对不同目的，如果是做搜索，那就是优先提高召回率，在保证召回率的情况下，提升准确率；如果做疾病监测、反垃圾，则是优先提高准确率，保准确率的条件下，提升召回率。

那么，在两者都要求高的情况下，如何综合衡量准确率和召回率呢？一般使用F值。
F-Measure是准确率（P）和召回率（R）的加权调和平均。公式为：

当参数α=1时，就是最常见的F1，即

可见F1综合了P和R的结果，可用于综合评价实验结果的质量。

已赞过 已踩过<

评论收起

富港检测技术（东莞）有限公司_
2024-06-06 广告

ISTA3L是一个基于研究、数据驱动的测试协议，它模拟了由零售公司完成的产品订单被直接运送给消费者时所经历的危险，它允许用户评估包装产品的能力，以承受运输和处理包装产品时所经历的供应链危险，从接收到任何电子商务零售商履行操作，直到最终消费者... 点击进入详情页

本回答由富港检测技术（东莞）有限公司_提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

系统测试介绍，实践操作及教程

带你全面掌握系统测试自动化测试，系统测试，运行，卸载测试资料干货应有尽有

www.51testing.com广告

系统测试报告模板范文，树熊AI助手，提升办公效率!

智能AI写作，一键在线生成内容，系统测试报告模板范文，原创真实，采用4.0模型引擎，助力高效办公。系统测试报告模板范文，可任意复制编辑，提供丰富场景模块，满足职场写作需求，省时省力，免费体验!

ai.koalaoffice.com广告

系统测试方案模板，树熊AI助手，提升办公效率!

智能AI写作，一键在线生成内容，系统测试方案模板，原创真实，采用4.0模型引擎，助力高效办公。系统测试方案模板，可任意复制编辑，提供丰富场景模块，满足职场写作需求，省时省力，免费体验!

ai.koalaoffice.com广告

推荐系统为什么要分测试集和训练集

您可能关注的内容

其他类似问题

为你推荐：