内容简介:尽管近年来神经网络复兴并大为流行,但提升算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。目前代表性的提升方法有 CatBoost、Light GBM 和XGBoost等,本文介绍一项新的开源工作,它构建了另一种基于 GPU 的极速梯度提升决策树和随机森林算法。项目地址:https://github.com/Xtra-Computing/thundergbm那么我们为什么加速 GBDT 和随机森林?2017 年,一份 Kaggle 调查显示,数据挖掘和机器学习从业者中分别有
尽管近年来神经网络复兴并大为流行,但提升算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。目前代表性的提升方法有 CatBoost、Light GBM 和XGBoost等,本文介绍一项新的开源工作,它构建了另一种基于 GPU 的极速梯度提升决策树和随机森林算法。
项目地址:https://github.com/Xtra-Computing/thundergbm
那么我们为什么加速 GBDT 和随机森林?2017 年,一份 Kaggle 调查显示,数据挖掘和机器学习从业者中分别有 50%、46% 和 24% 的人使用决策树、随机森林和 GBM。GBDT 和 随机森林 经常被用来创建当前最佳的数据科学解决方案,这就要求我们能使用 GPU 在大型数据集上完成高效训练。
两棵决策树的集成方法,选自XGBoost文档。
尽管XGBoost等库已经支持 GPU 了,但毕竟不是一开始就为 GPU 而设计的,因此在优化和加速上会有一些瑕疵。而 ThunderGBM 旨在帮助用户轻松高效地应用 GBDT 和随机森林来解决问题,它可以利用 GPU 完成高效训练。
对于 GPU 而言,ThunderGBM 在很多任务上都比其它几个库要快。
ThunderGBM 的主要特征如下:
-
通常是其它库的 10 倍。
-
支持 Python(scikit-learn)接口。
-
支持操作系统 Linux。
-
支持分类、回归和排序。
ThunderGBM 预测和训练的整体流程。
ThunderGBM 主要作者包括新加坡国立大学的 Zeyi Wen 和 Qinbin Li、华南理工大学的 Jiashuai Shi 等,指导教师为 NUS 的 Bingsheng He。
入门指南
ThunderGBM 要求开发环境满足 cmake 2.8 或更高版本;对于 Linux,使用 gcc 4.8 或更高版本;C++boost; CUDA 8 或更高版本。
下载:
git clone https://github.com/zeyiwen/thundergbm.git cd thundergbm # under the directory of thundergbm git submodule init cub && git submodule update
在 Linux 上构建:
#under the directory of thundergbm mkdir build && cd build && cmake .. && make -j
快速测试:
./bin/thundergbm-train ../dataset/machine.conf ./bin/thundergbm-predict ../dataset/machine.conf
成功运行后,你将看到 RMSE = 0.489562。
相关研究
如果读者对实现的技术及模型细节感兴趣,可以查阅原论文:
论文地址:https://www.comp.nus.edu.sg/~wenzy/papers/thundergbm.pdf
其它相关文献:
-
论文:Efficient Gradient Boosted Decision Tree Training on GPUs
-
作者:Zeyi Wen, Bingsheng He, Kotagiri Ramamohanarao, Shengliang Lu, and Jiashuai Shi
-
地址:https://www.comp.nus.edu.sg/~hebs/pub/IPDPS18-GPUGBDT.pdf
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 闪电网络最新漏洞分析:仅需攻击85个节点便可窃取闪电节点通道资金
- BlitzScaling -- 闪电式扩张 - 1
- 闪电页面速度的12个步骤
- 闪电智能平台 让 AI帮你轻松创作
- 在发了1000笔闪电网络交易之后,我们有话说
- 程序猿菜鸟打怪升级:一路火花带闪电
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
人人都是产品经理
苏杰 / 电子工业出版社 / 2010年4月 / 45.00元
这是写给“-1到3岁的产品经理”的书,适合刚入门的产品经理、产品规划师、需求分析师,以及对做产品感兴趣的学生,用户体验、市场运营、技术部门的朋友们,特别是互联网、软件行业。作为一名“4岁的产品经理”,作者讲述了过去3年的经历与体会,与前辈们的书不同,本书就像你走到作者身边,说“嗨哥们!晚上有空吃个饭么,随便聊聊做产品的事吧”,然后作者说“好啊”。 书名叫“人人都是产品经理”,是因为作者觉得过......一起来看看 《人人都是产品经理》 这本书的介绍吧!