机器学习之决策树在sklearn中的实现

栏目: 编程工具 · 发布时间: 6年前

内容简介：小伙伴们大家好~o(Python3.7.1（你的版本至少要3.4以上Scikit-learn0.20.0 （你的版本至少要0.20

决策树在sklearn中的实现

小伙伴们大家好~o( ￣▽￣ )ブ，首先声明一下，我的开发环境是 Jupyter lab ，所用的库和版本大家参考：

Python3.7.1（你的版本至少要3.4以上

Scikit-learn0.20.0 （你的版本至少要0.20

Graphviz0.8.4 (没有画不出决策树哦，安装代码conda install python-graphviz

Numpy1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0

用SKlearn 建立一棵决策树

这里采用的数据集是SKlearn中的红酒数据集。

1 导入需要的算法库和模块

from sklearn import tree                                 #导入tree模块 
 from sklearn.datasets import load_wine                   #导入红酒数据集 
 from sklearn.model_selection import train_test_split     #导入训练集和测试集切分包

2 探索数据

wine = load_wine() 
 wine.data 
 wine.data.shape 
 wine.target 
 wine.target.shape

运行的结果是这样子的：

机器学习之决策树在sklearn中的实现

data就是该数据集的特征矩阵，从运行结果可以看出，该红酒数据集一共有178条记录，13个特征。

机器学习之决策树在sklearn中的实现

特征矩阵中有178条记录，相对应的标签Y就有178个数据。

如果wine是一张表，应该长这样：

import pandas as pd 
 pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)

机器学习之决策树在sklearn中的实现

这是数据集特征列名和标签分类

wine.feature_names

wine.target_names

机器学习之决策树在sklearn中的实现

3 分训练集和测试集

这里选取30%作为测试集。切分好之后，训练集有124条数据，测试集有54条数据。

Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data,wine.target,test_size=0.3) 
 Xtrain.shape 
 Xtest.shape

机器学习之决策树在sklearn中的实现

4 建立模型

clf = tree.DecisionTreeClassifier(criterion="entropy") #初始化树模型 
 clf = clf.fit(Xtrain, Ytrain)                          #实例化训练集 
 score = clf.score(Xtest, Ytest)                        #返回预测的准确度 
  
 score

机器学习之决策树在sklearn中的实现

5 画出一棵树吧

feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类','花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸'] 
  
 import graphviz 
 dot_data = tree.export_graphviz(clf 
 ,out_file=None 
 ,feature_names= feature_name 
 ,class_names=["琴酒","雪莉","贝尔摩德"] 
 ,filled=True 
 ,rounded=True 
 ) 
 graph = graphviz.Source(dot_data) 
 graph

机器学习之决策树在sklearn中的实现

6 探索决策树

#特征重要性 
 clf.feature_importances_ 
  
 [*zip(feature_name,clf.feature_importances_)]

机器学习之决策树在sklearn中的实现

到现在为止，我们已经学会建立一棵完整的决策树了。有兴趣的话，动手建立一棵属于自己的决策树吧~

更多内容可移步： https://www.cda.cn/?seo-jianshu

以上所述就是小编给大家介绍的《机器学习之决策树在sklearn中的实现》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

人工智能

S. Russell、P. Norvig / 清华大学出版社 / 2006-5-1 / 128.00元

本书被全世界89个国家的900多所大学用作教材。本书以详尽和丰富的资料，从理性智能体的角度，全面阐述了人工智能领域的核心内容，并深入介绍了各个主要的研究方向。全书分为8大部分：第一部分“人工智能”，第二部分“问题求解”，第三部分“知识与推理”，第四部分“规划”，第五部分“不确定知识与推理”，第六部分“学习”，第七部分“通信、感知与行动”，第八部分“结论”。本书既详细介绍了人工智能的基本概念......一起来看看《人工智能》这本书的介绍吧!

码农工具