[译] 机器学习中常用的几个概率不等式及证明

栏目: 数据库 · 发布时间: 5年前

内容简介:第一时间获取好内容

点击上方“ 大数据与人工智能 ”,“星标或置顶公众号”

第一时间获取好内容

[译] 机器学习中常用的几个概率不等式及证明

作者丨stephenDC

这是作者的第 9 篇文章

马尔科夫不等式、霍夫丁不等式和詹森不等式,是机器学习中经常遇到的几个概率不等式。本文对它们进行简单介绍,并加以证明,然后对它们在机器学中的应用进行举例说明。

主要内容包括:

马尔科夫不等式(Markov’s Inequality)

 定义     

[译] 机器学习中常用的几个概率不等式及证明        

证明 

[译] 机器学习中常用的几个概率不等式及证明

应用 

a.用于估计一个概率的上界,比如假设你所在公司的人均工资是1万,那么随机选一个你司员工,其工资超过10万的概率,不会超过1/10。

b.用于其他概率不等式的证明,比如下面的霍夫丁不等式。

霍夫丁不等式(Hoeffding’s Inequality)

霍夫丁不等式的证明,除了要用到上面的马尔科夫不等式外,还要用到霍夫丁引理。因此,下面先介绍霍夫丁引理。

霍夫丁引理 

定义 

[译] 机器学习中常用的几个概率不等式及证明

证明 

[译] 机器学习中常用的几个概率不等式及证明

[译] 机器学习中常用的几个概率不等式及证明

[译] 机器学习中常用的几个概率不等式及证明

霍夫丁不等式 

定义 

[译] 机器学习中常用的几个概率不等式及证明

证明 

[译] 机器学习中常用的几个概率不等式及证明

应用 

用于给出二分类问题的泛化误差上界

[译] 机器学习中常用的几个概率不等式及证明

詹森不等式(Jensen’s Inequality)

定义 

[译] 机器学习中常用的几个概率不等式及证明

证明 

凸函数定义 + 归纳法

应用 

[译] 机器学习中常用的几个概率不等式及证明

[译] 机器学习中常用的几个概率不等式及证明

[译] 机器学习中常用的几个概率不等式及证明

1. 有些公式里很多变量没给出来具体意义啊?

如果你已学过相关内容,这里可以帮助你回顾一下;如果你还没学习相关内容,不必了解其中变量的具体含义,这里重在形式推导。

2. 咦,那么巧?概率统计中log和exp的函数形式如此常见(比如,对数似然函数、指数分布族),而-log(x)和exp(x)刚好都是凸函数,可以各种使用詹森不等式。

NO,是因为-log(x)是凸函数,我们才对似然函数求对数,因为exp(x)是凸函数,我们才更喜欢用指数分布族建模的。所以,那么多的偶遇其实都是注定,因为那个他(她)早在那里等你多时了!

参考文献:

李航 《统计学习方法》 第二版

-END-

[译] 机器学习中常用的几个概率不等式及证明


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

新零售:低价高效的数据赋能之路

新零售:低价高效的数据赋能之路

刘润 / 中信出版集团 / 2018-9 / 65.00元

小米新零售,如何做到20倍坪效? 天猫小店,如何利用大数据助力线下零售? 盒马鲜生,为什么坚持必须用App才能买单? 名创优品,实体小店在电商冲击下,如何拥抱春天? 新零售的未来在何方?什么样的思维模式才可应对? 新零售,不是商界大佬的专用名词,它就在我们生活触手可及的各个角落——小到便利店的酸奶,大到京东商城的冰箱,都蕴含着消费者、货物、经营场所三者共同作用的经济逻......一起来看看 《新零售:低价高效的数据赋能之路》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码