【机器学习基础】朴素贝叶斯分类器完全解读

栏目: 数据库 · 发布时间: 6年前

内容简介:【联合概率】 表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B)。【条件概率】 条件概率是指事件A在事件B发生的条件下发生的概率.【全概率公式】 若事件A1,A2,…构成一个完备事件组且都有正概率,则对任意一个事件B,有如下公式成立:

【基础知识】

【联合概率】 表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B)。

【条件概率】 条件概率是指事件A在事件B发生的条件下发生的概率.

P(A|B)=P(A,B)/P(B)

【全概率公式】 若事件A1,A2,…构成一个完备事件组且都有正概率,则对任意一个事件B,有如下公式成立:

【机器学习基础】朴素贝叶斯分类器完全解读
【贝叶斯公式内涵】

想理解朴素贝叶斯,就要先明白什么是贝叶斯公式。贝叶斯公式主要是描述了两种条件概率之间的关系,即P(A|B)与P(B|A)的关系。

P(A|B)=P(A)*P(B|A)/P(B)

在这个公式当中,相当于我们最后想知道在事件B的条件下事件A发生的概率,

P(A):事件A的先验概率,即在没有任何条件的情况下吗,对事件的基本判断。

P(A|B):后验概率,是在条件B之下事件A发生的概率。

P(B|A)/P(B):相当于一个调整因子,使得先验概率经过调整得到后验概率,当这部分等于1,说明事件B的加入对于判断A的可能性没有帮助,先验等于后验。当它大于1,说明A发生的概率由于B的加入增大了。

【朴素贝叶斯原理】

朴素二字从哪来的,因为在这个分类器中,我们假设在类别确定的情况下,各个特征之间是条件独立的,这就使得贝叶斯变的简单朴素,但是以牺牲一些分类准确性为代价,因为我们无法保证各个特征之间真的完全不相关。所以说,朴素贝叶斯比较适合特征之间相关性较弱的分类模型。

由于我们假设在类别确定的情况下各个特征之间条件独立,那么当有n个特征的时候

【机器学习基础】朴素贝叶斯分类器完全解读

其实朴素贝叶斯分类器就是在给定特征x的情况下,看该数据属于各个类的概率,选概率最大的那一个为最终类。

【机器学习基础】朴素贝叶斯分类器完全解读

所以说,最终的分类器就是公式4.7,由于分母部分对于一个固定的x来说不管计算y=c1,还是y=cn都是一样的,所以最终的结果就是取决于分子。

后验概率的最大化背后的原理等同于期望误差最小化,证明过程如下:

【机器学习基础】朴素贝叶斯分类器完全解读
【机器学习基础】朴素贝叶斯分类器完全解读

【举个例子】

如果觉得已经懂了,做个例子:

【机器学习基础】朴素贝叶斯分类器完全解读

【解答过程】

【机器学习基础】朴素贝叶斯分类器完全解读

【思考题】

在对特征空间的划分上,朴素贝叶斯与决策树的区别?

答案参考我师兄的这篇朴素贝叶斯


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

浪潮之巅

浪潮之巅

吴军 / 电子工业出版社 / 2011-8 / 55.00元

近一百多年来,总有一些公司很幸运地、有意识或无意识地站在技术革命的浪尖之上。在这十几年间,它们代表着科技的浪潮,直到下一波浪潮的来临。 从一百年前算起,AT&T 公司、IBM 公司、苹果公司、英特尔公司、微软公司、思科公司、雅虎公司和Google公司都先后被幸运地推到了浪尖。虽然,它们来自不同的领域,中间有些已经衰落或正在衰落,但是它们都极度辉煌过。本书系统地介绍了这些公司成功的本质原因及科......一起来看看 《浪潮之巅》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

MD5 加密
MD5 加密

MD5 加密工具