朴素贝叶斯分类器是什么意思?

 我来答
SPSSAU
2023-11-10 · 百度认证:SPSSAU官方账号,优质教育领域创作者
SPSSAU
SPSSAU,也称"在线SPSS",一款网页版数据科学算法平台系统,提供"拖拽点一下"的极致体验和智能化分析结果。
向TA提问
展开全部

贝叶斯模型是利用先贝叶斯定理进行计算的一种机器学习模型,并且此处涉及先验概率和后验概率。比如我们都知道去赌场会十赌九输,此是以前的经验,即为先验概率,也或者大家都知道抛硬币时上下面第一次都是1/2概率,这均为先验概率;如果发现一个人准备跳楼,那么此时他是因为赌博导致的概率是多少?此为后验概率。有了先验概率和后验证概率理解,结合贝叶斯定量即可计算出概率信息值。

接着,朴素贝叶斯是基于贝叶斯定量,并且加上条件(特征之间独立)的一种模型。此处特征属性之间独立是指比如:有100个数据,第1行数据与第2行,第3行等其它任意行数据之间并没有关系,此前提条件非常重要,但现实中较难成立,但这并没有妨碍其的广泛使用,可能原因在于朴素贝叶斯模型通于分类问题处理,其内部算法上会关注于条件概率排序并非具体概率数字,因而其具有一定容错能力,并且特征属性之间假如有着关系并不完全独立,其内部可能存在相关抵消现象。整体上看,朴素贝叶斯模型原理较为简单,且应用较为广泛,比如输入法时可能会进行纠错功能处理,也或者垃圾邮件的识别等。

朴素贝叶斯模型的原理较为简单,其利用贝叶斯概率公式,分别如下:

接着假定各特征属性独立,并且将公式进行展示成如下:

如果特征即自变量X全部均为连续定量数据,那么选择高斯分布即可(此为默认值);如果说特征即自变量X中全部均是定类数据且每个X的类别数量大于2,此时可选择多项式分布。如果每个特征全部都是0和1共两个数字,此时选择伯努利分布。如果特征中即包括连续定量数据,又包括定类数据,建议可对定类数据进行哑变量设置后,选择高斯分布。

训练集比例默认选择为:0.8即80%(150*0.8=120个样本)进行训练朴素贝叶斯模型,余下20%即30个样本(测试数据)用于模型的验证。需要注意的是,此处不进行处理也可以,尤其是自变量X中有定类数据是,建议默认不进行处理。

接着对参数设置如下:

上海上恒
2024-02-18 广告
数字滤波器可以按所处理信号的维数分为一维、二维或多维数字滤波器。一维数字滤波器处理的信号为单变量函数序列,例如时间函数的抽样值。二维或多维数字滤波器处理的信号为两个或多个变量函数序列。例如,二维图像离散信号是平面坐标上的抽样值。一维滤波器,... 点击进入详情页
本回答由上海上恒提供
福瑞宜数智
2023-01-28 · 专注于数据采集、分析与挖掘服务的百家号
福瑞宜数智
向TA提问
展开全部

朴素贝叶斯分类器是一种基于贝叶斯定理和特征条件独立性假设的分类算法。贝叶斯定理告诉我们,在给定特征条件下,目标类别的概率可以由特征条件和目标类别的先验概率计算得出。而朴素贝叶斯分类器假设所有特征条件之间相互独立,这样就可以将计算复杂度降低。朴素贝叶斯分类器常用于文本分类和垃圾邮件过滤等任务中。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式