Python pandas模块21个常用操作可视化

栏目: IT技术 · 发布时间: 4年前

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas 离这个目标已经越来越近了。

本文对pandas常用的功能进行一个可视化的介绍,希望能让大家更容易理解和学习pandas。

Python pandas模块21个常用操作可视化

1. Series序列

系列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。

Python pandas模块21个常用操作可视化

2. 从ndarrary创建一个序列

如果数据是ndarray,则传递的索引必须具有相同的长度。如果没有传递索引值,那么默认的索引将是范围(n),其中n是数组长度,即[0,1,2,3…. range(len(array))-1] - 1]。

Python pandas模块21个常用操作可视化

3. 从字典中创建一个序列

字典(dict)可以作为输入传递,如果没有指定索引,则按 排序 顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应的数据中的值将被拉出。

Python pandas模块21个常用操作可视化

4. 序列数据的访问

通过各种方式访问Series数据,系列中的数据可以使用类似于访问numpy中的ndarray中的数据来访问。

Python pandas模块21个常用操作可视化

5. 序列的聚合统计

Series有很多的聚会函数,可以方便的统计最大值、求和、平均值等

Python pandas模块21个常用操作可视化

6. DataFrame

DataFrame是带有标签的二维数据结构,列的类型可能不同。你可以把它想象成一个电子表格或 SQL 表,或者 Series 对象的字典。它一般是最常用的pandas对象。

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

7. 从列表中创建DataFrame

从列表中很方便的创建一个DataFrame,默认行列索引从0开始。

Python pandas模块21个常用操作可视化

8. 从字典中创建DataFrame

从字典创建DataFrame,自动按照字典进行列索引,行索引从0开始。

Python pandas模块21个常用操作可视化

9. 列选择

在刚学Pandas时,行选择和列选择非常容易混淆,在这里进行一下整理常用的列选择。

Python pandas模块21个常用操作可视化

10. 行选择

整理多种行选择的方法,总有一种适合你的。

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

11. 返回指定行列

pandas的DataFrame非常方便的提取数据框内的数据。

Python pandas模块21个常用操作可视化

12. 条件查询

对各类数值型、文本型,单条件和多条件进行行选择

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

13. 聚合

可以按行、列进行聚合,也可以用pandas内置的describe对数据进行操作简单而又全面的数据聚合分析。

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

14. 聚合函数

data.function(axis=0)  按列计算

data.function(axis=1)  按行计算

Python pandas模块21个常用操作可视化

15. 分类汇总

可以按照指定的多列进行指定的多个运算进行汇总。

Python pandas模块21个常用操作可视化

15.  透视表

透视表是pandas的一个强大的操作,大量的参数完全能满足你个性化的需求。

Python pandas模块21个常用操作可视化

16. 处理缺失值

pandas对缺失值有多种处理办法,满足各类需求。

Python pandas模块21个常用操作可视化

17. 处理缺失值

pandas对缺失值有多种处理办法,满足各类需求。

Python pandas模块21个常用操作可视化

18. 查找替换

pandas提供简单的查找替换功能,如果要复杂的查找替换,可以使用map(), apply()和applymap() 

Python pandas模块21个常用操作可视化

19. 数据合并

两个DataFrame的合并,pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。

Python pandas模块21个常用操作可视化

20. 更改列名

更改列名我认为pandas并不是很方便,但我也没有想到一个好的方案。

Python pandas模块21个常用操作可视化

21. apply方法

这是pandas的一个强大的函数,可以针对每一个记录进行单值运算而不需要像其他语言一样循环处理。

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

阅读完上面的内容,再来看pandas的cheetsheet表,就会觉得很熟悉,没有那么难用了。这个表可以入门pandas后可以打印出来放在桌面附近,常做参考。

高清打印版资源请在 公众号后台回复关键词“ 20200310 ” 

Python pandas模块21个常用操作可视化

Python pandas模块21个常用操作可视化

近期文章

漂亮~pandas可以无缝衔接Bokeh

综述:文本分析在市场营销研究中的应用

Lazy Prices公司年报内容变动碰上股价偷懒

用python帮你生产指定内容的word文档

2020年B站跨年晚会弹幕内容分析

YelpDaset: 酒店管理类数据集10+G

NRC词语情绪词典和词语色彩词典

Loughran&McDonald金融文本情感分析库

股评师分析报告文本情感分析预测股价

使用分析师报告中含有的情感信息预测上市公司股价变动

代码不到40行的超燃动态排序图

高清打印版cheetsheet资源请在 公众号后台回复关键词“ 20200310 ” 

Python pandas模块21个常用操作可视化


以上所述就是小编给大家介绍的《Python pandas模块21个常用操作可视化》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Search User Interfaces

Search User Interfaces

Marti A. Hearst / Cambridge University Press / 2009-9-21 / USD 59.00

搜索引擎的本质是帮助用户更快、更方便、更有效地查找与获取所需信息。在不断改进搜索算法和提升性能(以技术为中心)的同时,关注用户的信息需求、搜寻行为、界面设计与交互模式是以用户为中心的一条并行发展思路。创新的搜索界面及其配套的交互机制对一项搜索服务的成功来说是至关重要的。Marti Hearst教授带来的这本新作《Search User Interfaces》即是后一条思路的研究成果,将信息检索与人......一起来看看 《Search User Interfaces》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试