内容简介:现在很多想从事于机器学习的朋友都存在很多困惑,主要是很多相关的书看不懂,尤其是数学部分,机器学习的基础是数学。数学并非是一个可选可不选的理论方法,而是不可或缺的支柱。对于机器学习算法工程师而言,微积分、线性代数、概率论毫无疑问是需要掌握的。毫无疑问机器学习中数学是重要的,例如你需要:1.选择合适的算法,包括考虑精度、训练时间、模型的复杂性、参数和数量特征;
现在很多想从事于机器学习的朋友都存在很多困惑,主要是很多相关的书看不懂,尤其是数学部分,机器学习的基础是数学。数学并非是一个可选可不选的理论方法,而是不可或缺的支柱。对于机器学习算法工程师而言,微积分、线性代数、概率论毫无疑问是需要掌握的。
为什么要强调数学?
毫无疑问机器学习中数学是重要的,例如你需要:
1.选择合适的算法,包括考虑精度、训练时间、模型的复杂性、参数和数量特征;
2.选择参数设置和验证策略;
3.通过了解偏差方差权衡来识别拟合不足与过度拟合;
4.估计正确的置信区间和不确定性。
你必需具备的数学知识
概率论
-
离散型和连续型随机变量
-
主要分布(伯努利分布、二项式分布、正态分布、 指数分布、 泊松分布、Beta 和 Gamma 分布)
-
矩估计和最大似然估计
-
贝叶斯统计
-
相关性系数和协方差(Correlation and Covariance)
概率是机器学习算法中频繁用到的。不过基础的概率知识在统计学中已经包括了,而比较深入的概率知识其实在机器学习算法设计的时候并不经常用到。
线性代数
-
向量和矩阵
-
矩阵的行列式
-
特征向量和特征值
-
矩阵分解(如 SVD)
线性代数在深度学习领域有着举足轻重的作用,它是深度学习各种算法的基本数学工具。尤其是矩阵的各种变换,因为大量机器学习算法都是在和矩阵打交道。
微积分
-
极限与导数
-
微分和积分
-
数值计算与最优化方法
比如,现在无比热门的神经网络,优化方法几乎全是基于梯度下降,而梯度下降,其实就是链式求导。不过,理工科应该都学过这方面的课程。
最好要掌握:
离散数学:毕竟离散数学是描述计算机问题的基础。许多算法的思想也是基于离散数学的。离散数学研究的一些问题对于描述计算机问题也有很大启发。
随机过程,实分析:机器学习往深里做肯定需要用这种,高级的数学语言去对问题进行描述。
泛函:泛函分析是一门非常抽象的课程。泛函的很多内容都是从数学分析,线性代数,实分析等抽象出来的,同时也是它们的推广,泛函研究更广泛更一般的空间,研究共性的问题。而数学分析,高等代数研究的是个性的问题,都很具体。
各种算法和理论用到的数学知识
下面我们一张图来看典型算法和理论结论所用到的数学知识:
推荐书目
-
《An Introduction Statistical to Learning 》
-
《 The Elements of Statistical Learning 》
它们讲述的都是统计学习,或者机器学习的方法。其中前一本可以看成是后一本的简化版。它更通俗、更简单一些,后面这个稍微有些难。这两本书可以反复阅读,每次都有不同的收获。
以上所述就是小编给大家介绍的《机器学习中那些必要又困惑的数学知识》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 学机器学习有必要懂数学吗?深入浅出机器学习与数学的关系
- 机器学习 15 种常用数学符号
- 资料 | 1800页33章数学方法精要笔记 —深入数学建模, 机器学习和深度学习的数学基础
- 机器学习、Python和数学学习资料汇总
- 机器学习数学基础:常见分布与假设检验
- 非真,亦非假—20世纪数学悖论入侵机器学习
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
程序员的算法趣题
[ 日] 增井敏克 / 绝 云 / 人民邮电出版社 / 2017-7 / 55.00元
本书是一本解谜式的趣味算法书,从实际应用出发,通过趣味谜题的解谜过程,引导读者在愉悦中提升思维能力、掌握算法精髓。此外,本书作者在谜题解答上,通过算法的关键原理讲解,从思维细节入手,发掘启发性算法新解,并辅以Ruby、JavaScript等不同语言编写的源代码示例,使读者在算法思维与编程实践的分合之间,切实提高编程能力。 本书适合已经学习过排序、搜索等知名算法,并想要学习更多有趣算法以提升编程技巧......一起来看看 《程序员的算法趣题》 这本书的介绍吧!