PYTHON3:数据分析与机器学习实战
出版信息
龙马高新教育 / 北京大学出版社 / 2018-9-1 / 69.00
内容简介
机器学习(Machine Learning, ML)是一门多领域交叉学科,是人工智能的核心,其应用遍及人工智能的各个领域,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在机器学习过程中,需要使用大量数据,而数据分析是指用适当的方法对收集的大量数据进行分析,提取有用信息并形成结论,进而对数据加以详细研究和概括总结的过程。本书结合机器学习数据分析的过程,以实际案例问题为驱动,深入浅出地介绍常用的机器学习算法及数据分析方法:数据预处理、分类问题、预测分析、关联分析、网络爬虫、集成学习、深度学习、数据降维和压缩等。
全书共17章,分为三大块:第0~3章介绍本书的技术体系、Python基础知识、Python的安装与配置和Python 3基础语法;第4~7章介绍Python 3的编程、机器学习基础、Python机器学习及分析工具和数据预处理;第8~16章分别介绍常用的机器学习分析算法,每章都使用多个经典案例图文并茂地介绍机器学习的原理和实现方法。
本书通俗易懂,是学习Python及机器学习和数据分析的入门课程,特别是对于Python还不熟悉的编程者,同时对于想学习机器学习相关算法的初学者非常适合。
作者简介
龙马高新教育团队成员有多年的编程工作经验,曾供职于某大型科技公司,担任软件工程师,从事大数据研发。Python技术的深度爱好者,对Java、Python有深入研究,做过大量的Python技术的课程培训。
目录
第0章 本书的技术体系
0.1 Python的发展趋势
0.2 人工智能时代学习python的重要性
0.3 本书的技术体系
0.4 学习本书需要注意的事项
第1章 Python基础知识
1.1 Python简介
1.1.1 了解Python的起源与发展历史
1.1.2 Python的特色
1.1.3 学习Python的原因
1.2 Python的当前版本
1.3 Python的优缺点
1.4 Python与其他语言的区别
1.5 Python的应用领域
第2章 Python的安装、配置与卸载
2.1 Python的安装
2.1.1 Python的下载
2.1.2 Python的安装
2.2 Python的配置
2.2.1 Python环境变量的设置
2.2.2 Python的启动
2.3 Python的卸载
第3章 Python 3 基础语法
3.1 第一个Python程序
3.2 Python的输入和输出
3.2.1 Python的输出语句
3.2.2 Python的输入语句
3.3 Python的基本数据类型
3.3.1 数字
3.3.2 字符串
3.3.3 列表
3.3.4 元组
3.3.5 集合
3.3.6 字典
3.4 Python库的导入
3.5 Python的集成开发环境
3.6 自测练习
第4章 Python 3的编程
4.1 条件语句
4.2 循环语句
4.2.1 while循环
4.2.2 for循环
4.3 函数
4.4 模块
4.5 自测练习
第5章 机器学习基础
5.1 机器学习概述
5.2 监督学习简介
5.3 非监督学习简介
5.4 增强学习简介
5.5 深度学习简介
5.6 机器学习常用术语
第6章 Python 机器学习及分析工具
6.1 矩阵操作函数库(Numpy)
6.1.1 Numpy的安装
6.1.2 Numpy的基本使用
6.2 科学计算的核心包(Scipy)
6.2.1 科学计算的核心包的安装
6.2.2 科学计算的核心包的基本使用
6.3 Python的绘图库(Matplotlib)
6.3.1 Matplotlib简介及安装
6.3.2 Matplotlib的基本使用
6.4 数据分析包(Pandas)
6.4.1 Pandas简介和安装
6.4.2 Pandas的基本使用方法
6.5 机器学习函数库(scikit-learn)
6.6 统计建模工具包(StatsModels)
6.7 深度学习框架(TensorFlow)
第7章 数据预处理
7.1 数据预处理概述
7.2 数据清理
7.2.1 异常数据处理
7.2.2 缺失值处理
7.2.3 噪声数据处理
7.3 数据集成
7.4 数据变换
7.5 数据归约
7.6 Python的主要数据预处理函数
7.6.1 Python的数据结构
7.6.2 数据缺失处理函数
第8章 分类问题
8.1 分类概述
8.2 常用方法
8.2.1 k-近邻算法
8.2.2 朴素贝叶斯
8.2.3 支持向量机
8.2.4 AdaBoost算法
8.2.5 决策树
8.2.6 Multi-layer Perceptron 多层感知机
8.3 项目实战
8.3.1 实例1:使用k-近邻算法实现约会网站的配对效果
8.3.2 实例2:使用朴素贝叶斯过滤垃圾邮件
8.3.3 实例3:SVM实现手写识别系统
8.3.4 实例4:基于单层决策树构建分类算法
8.3.5 实例5:使用决策树对iris数据集分类
8.3.6 实例6:使用决策树对身高体重数据进行分类
8.3.7 实例7:使用k-近邻算法对鸢尾花数据进行交叉验证
8.3.8 使用多层感知器分析,根据葡萄酒的各项化学特征来
判断葡萄酒的优劣
8.4 自测练习
第9章 预测分析
9.1 预测概述
9.2 常用方法
9.2.1 时间序列分析预测法
9.2.2 BP神经网络模型
9.3 项目实战
9.3.1 实例1:根据一年的历史数据预测后十年的数据趋势
9.3.2 实例2:使用神经网络预测公路运量
9.4 自测练习
第10章 关联分析
10.1 关联分析概述
10.2 基本方法
10.2.1 Apriori算法
10.2.2 FP-growth算法
10.3 项目实战(解决目前流行的实际问题)
10.3.1 用Apriori进行关联分析的实例
10.3.2 使用FP-growth算法提取频繁项集
10.4 自测练习
第11章 网络爬虫
11.1 网络爬虫概述
11.1.1 网络爬虫原理
11.1.2 爬虫分类
11.2 网页抓取策略和方法
11.2.1 网页抓取策略
11.2.2 网页抓取的方法
11.3 项目实战
11.3.1 用python抓取指定的网页
11.3.2 用python抓取包含关键词的网页
11.3.3 下载贴吧中的图片
11.3.4 股票数据抓取
11.4 自测练习
第12章 集成学习
12.1 集成学习概述
12.2 常用方法
12.2.1 Bagging和随机森林
12.2.2 boosting和AdaBoost
12.3 项目实战
12.3.1 使用随机森林方法预测乘员的存活概率
12.3.2 使用Adaboost方法进行二元分类
12.4 自测练习
第13章 深度学习
13.1 深度学习概述
13.2 常用方法
13.2.1 监督学习的深度学习网络结构
13.2.2 非监督学习的深度学习网络结构
13.3 项目实战
13.3.1 使用TensorFlow框架进行MNIST数据集生成
13.3.2 使用Theano框架进行MNIST数字识别
13.4 自测练习
第14章 数据降维及压缩
14.1 数据降维及压缩概述
14.1.1 数据降维
14.1.2 图像压缩
14.2 基本方法
14.2.1 主成分分析
14.2.2 奇异值分解
14.3 项目实战
14.3.1 主成分分析PCA实例
14.3.2 使用奇异值分解进行图像压缩
14.4 自测练习
第15章 聚类分析
15.1 聚类分析概述
15.2 K-means算法
15.2.1 K-means算法与步骤
15.2.2 K-means算法涉及的问题
15.2.3 实际聚类问题的处理流程
15.3 项目实战
15.3.1 K-means算法实现二维数据聚类
15.3.2 使用scikit-learn中的方法进行聚类分析
15.4 自测练习
第16章 回归分析问题
16.1 回归分析概述
16.2 基本方法
16.2.1 一元回归分析
16.2.2 多元线性回归
16.2.3 回归的计算方法
16.2.4 逻辑回归分析
16.3 项目实战
16.3.1 身高与体重的回归分析
16.3.2 房价预测
16.3.3 产品销量与广告的多元回归分析
16.3.4 鸢尾花数据的逻辑回归分析
16.4 自测练习