Seaborn:一行代码生成酷炫狂拽的数据集可视化

栏目: IT技术 · 发布时间: 4年前

内容简介:之前看其他大佬的项目,只在意他们通过可视化的数据集,对数据特征挖掘的思路,但没有在意他们做可视化的工具。轮到自己做的时候就发现,wtf!matplotlib可以更难用一点嘛?别人酷炫狂拽,坐标轴上还有直方图的可视化究竟是怎么弄的?今天碰到了Seaborn的库,一行代码就出图,爱了!

之前看其他大佬的项目,只在意他们通过可视化的数据集,对数据特征挖掘的思路,但没有在意他们做可视化的工具。轮到自己做的时候就发现,wtf!matplotlib可以更难用一点嘛?别人酷炫狂拽,坐标轴上还有直方图的可视化究竟是怎么弄的?

今天碰到了Seaborn的库,一行代码就出图,爱了!

Seaborn介绍

Seaborn是 Python 的数据统计图形库。 它基于matplotlib构建,并与pandas数据结构紧密集成。

Seaborn功能简介

  • 面向数据集的API,便于观察多个变量之间的关系

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 支持分类变量可视化或汇总统计信息

Seaborn:一行代码生成酷炫狂拽的数据集可视化

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 可视化单变量或双变量分布,以及在数据子集之间进行比较

Seaborn:一行代码生成酷炫狂拽的数据集可视化

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 不同因变量的线性回归和展示

Seaborn:一行代码生成酷炫狂拽的数据集可视化

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 方便查看复杂数据集的整体结构

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 强大的函数,可让您轻松构建复杂的可视化

Seaborn:一行代码生成酷炫狂拽的数据集可视化

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 基于matplotlib的样式

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 包含调色板工具

flatui = ["#9b59b6", "#3498db", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]
sns.palplot(sns.color_palette(flatui))

Seaborn:一行代码生成酷炫狂拽的数据集可视化

seaborn功能初探

#导入库
import numpy as np
import pandas as pd
import seaborn as sns

单变量可视化

查看seaborn中的单变量分布的最便捷方法是distplot()函数。默认情况下,将绘制直方图并拟合核密度估计(KDE, kernel density estimate)。

# 生成数据
x = np.random.normal(size=100)
# 数据可视化
sns.distplot(x)

Seaborn:一行代码生成酷炫狂拽的数据集可视化

双变量分布可视化

在seaborn中可视化双变量的方法是jointplot()函数,该函数创建一个多面板图形,该图形同时显示两个变量之间的双变量(或联合)关系以及每个变量的单变量分布。

# 生成二维数据
mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
# 数据可视化
sns.jointplot(x="x", y="y", data=df)

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 二维直方图

sns.jointplot(x=x, y=y, kind="hex")

Seaborn:一行代码生成酷炫狂拽的数据集可视化

  • 核密度估计

sns.jointplot(x="x", y="y", data=df, kind="kde")

Seaborn:一行代码生成酷炫狂拽的数据集可视化

多变量数据可视化

要在多变量数据集中绘制成对的双变量分布,可以使用pairplot()函数。这将创建轴矩阵,并显示DataFrame中每列的关系。默认情况下,它还会在对角轴上绘制每个变量的单变量分布。

# 读入内置数据
iris = sns.load_dataset("iris")
# 数据可视化
sns.pairplot(iris)

Seaborn:一行代码生成酷炫狂拽的数据集可视化


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

爆发

爆发

[美] 艾伯特-拉斯洛·巴拉巴西 / 马慧 / 中国人民大学出版社 / 2012-6 / 59.90元

1. 本书是一本超越《黑天鹅》的惊世之作。如果说塔勒布认为人类行为是随机的,都是小概率事件,是不可以预测的;那么全球复杂网络权威Barabasi则认为,人类行为93%是可以预测的。 2. Barabasi的研究是在人类生活数字化的大数据时代基础上进行的,移动电话、网络以及电子邮件使人类 行为变得更加容易量化,将我们的社会变成了一个巨大的数据库。他认为,人类正处在一个聚合点上,在这里数据、科学......一起来看看 《爆发》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试