【机器学习基础】GBDT--梯度提升树实例分析完全解读

栏目: 数据库 · 发布时间: 6年前

内容简介:GBDT是集成学习中的一员,想要理解梯度提升,必须先理解什么是提升树,想理解提升树要了解什么是提升方法。提升方法本身是采用了加法模型(基函数的线性组合)和前向分步算法,从弱学习算法出发,反复学习,得到一系列弱学习器,然后通过组合弱学习器得到强学习器。当每个弱学习器是CART树的时候,就是提升树。对于回归问题一般采用平方误差作为损失函数,分类问题采用指数损失函数,一般问题用一般的损失函数。每一步生成一棵树,不断优化当前的学习器,用优化后的学习器学习到的值,和每一轮的初始拟合数据计算残差,继续将残差作为下一棵树

GBDT是集成学习中的一员,想要理解梯度提升,必须先理解什么是提升树,想理解提升树要了解什么是提升方法。

提升方法本身是采用了加法模型(基函数的线性组合)和前向分步算法,从弱学习算法出发,反复学习,得到一系列弱学习器,然后通过组合弱学习器得到强学习器。当每个弱学习器是CART树的时候,就是提升树。对于回归问题一般采用平方误差作为损失函数,分类问题采用指数损失函数,一般问题用一般的损失函数。

一、提升树

每一步生成一棵树,不断优化当前的学习器,用优化后的学习器学习到的值,和每一轮的初始拟合数据计算残差,继续将残差作为下一棵树的初始数据进行拟合,每一棵树都是CART回归树,因为每次迭代拟合的目标是残差,是连续值。

【机器学习基础】GBDT--梯度提升树实例分析完全解读

回归问题中提升树的生成方法:

【机器学习基础】GBDT--梯度提升树实例分析完全解读
【机器学习基础】GBDT--梯度提升树实例分析完全解读
二、梯度提升

那么为什么要用负梯度呢?对于损失函数是平方误差的回归问题,我们可以简单优化,但是对于一般的损失函数用损失函数的负梯度来拟合本轮损失的近似值,利用最速下降法的近似方法来起到和回归问题中的残差近似的效果。

【机器学习基础】GBDT--梯度提升树实例分析完全解读
三、梯度提升实例
【机器学习基础】GBDT--梯度提升树实例分析完全解读
【机器学习基础】GBDT--梯度提升树实例分析完全解读
【机器学习基础】GBDT--梯度提升树实例分析完全解读
四、梯度提升实例

用一个稍微复杂一点点的例子来说明一下,上个例子中只有一个特征,不易理解。要求最大深度为3,树5棵。

【机器学习基础】GBDT--梯度提升树实例分析完全解读

调用sklearn跑出来的5棵树如下图,

初始值,f0(x)=1.475

第一棵树:

【机器学习基础】GBDT--梯度提升树实例分析完全解读

第二棵树:

【机器学习基础】GBDT--梯度提升树实例分析完全解读

第三棵树:

【机器学习基础】GBDT--梯度提升树实例分析完全解读

第四棵树:

【机器学习基础】GBDT--梯度提升树实例分析完全解读

第五棵树:

【机器学习基础】GBDT--梯度提升树实例分析完全解读

详细解答过程:(感谢大神) mp.weixin.qq.com/s/ljC2dYfUz…


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

第三次浪潮

第三次浪潮

托夫勒 / 黄明坚 / 中信出版社 / 2006-6 / 38.00元

《第三次浪潮》作者托夫勒在20多年前预见的未来是:跨国企业将盛行;电脑发明使SOHO(在家工作)成为可能;人们将摆脱朝九晚五工作的桎梏;核心家庭的瓦解;DIY(自己动手做)运动的兴起……时过境迁,如今我们才发现托夫勒的预言竟大多已成为了现实。   20年前的《第三次浪潮》在打开国门之初给人们心灵造成的冲击,其影响至今仍然连绵不绝。托夫勒在这本书中将人类社会划分为三个阶段:第一次浪潮为农业阶段......一起来看看 《第三次浪潮》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具