内容简介:利用 Python 进行数据分析 第二版 中文精要
利用 Python 进行数据分析 2017 第二版 (Python for Data Analysis, 2nd Edition)中文翻译笔记
这本书的英文版github仓库: pydata-book
作者 Wes McKinney 是pandas的创作者,所以书中关于pandas的讲解也是最实用的部分。我也直接联系过了Wes本人,这个笔记不会有任何版权问题,当然,也不会用于任何商业用途。
这本书自2013年第一版发行后,就广受好评。第一版的时候作者用的是Python2,不过随着Python2的维护年限将近(2020),以及Python3的推广,整个社群向Python3转变已经成为不可扭转的趋势。所以在第二版里,作者使用了Python3.6。而我实际写的代码则是基于Python3.5,使用上没有任何差别。
2017第二版主要更新:
- 所有代码,包括Python教程,都升级到了Python3.6(第一版用的是Python2.7)
- 更新了Python的安装介绍。这次改用Anaconda Python发行版,以及其他一些需要的Python包
- 使用了最新的2017版pandas
- 新增了一章,用来介绍pandas的高级应用工具,和其他一些有用的小贴士
- 简单介绍了如何使用statsmodels和scikit-learn
本来很早就知道这本书了,直到最近才终于有时间,打算把这本书完整过一遍,顺便用jupyter做成笔记方便以后查阅。结果我在看第一版第三章的时,突然发现作者已经在2017年推出了第二版,不过暂时还没有中文版。想了想反正也要做成笔记,索性直接把英文翻译成中文,做一个简洁版的Notebook版本分享出来好了,也算是为开源世界做点小贡献。
在写笔记的时候,我尽量写中文,不过有一些专有名字我是直接写英文,然后配上中文翻译,毕竟有时候知道英文单词的话查找英文的文档也方便一些,而且我相信这样做对提升中文和英文专业名字的对照关系有帮助。毕竟在 程序员 的世界里,不懂英语会很艰难,即使是一些简单的单词,也是我们走向新世界的起点。
另外我并不是逐字逐句翻译,因为这样翻译出来的效果洋味十足,很难懂。我尽可能按方便理解的方式进行翻译,其他一些没有用的话我不进行翻译,就像上面说的,这是一个简洁版的笔记,只翻译书中有用的东西。不过因为是一个人在翻译整本书,工作量比较大,难免有错误和疏漏的地方,或者有读起来觉得奇怪的地方,如果有发现的话不要客气,请尽管说出来,欢迎任何改进和Pull Request。
Jupyter Notebooks:
-
Chapter 3: Built-in Data Structures, Functions, and Files (内建数据结构,函数和文件)
-
Chapter 4: NumPy Basics: Arrays and Vectorized Computation(NumPy基础:数组和向量化计算)
- 4.1 The NumPy ndarray: A Multidimensional Array Object(ndarray: 多维数组对象)
- 4.2 Universal Functions: Fast Element-Wise Array Functions(通用函数:快速点对点数组函数)
- 4.3 Array-Oriented Programming with Arrays(数组导向编程)
- 4.4 File Input and Output with Arrays(通过数组来进行文件的输入和输出)
- 4.5 Linear Algebra (线性代数)
- 4.6 Pseudorandom Number Generation(伪随机数生成)
- 4.7 Example Random Walks(例子:随机漫步)
-
Chapter 6: Data Loading, Storage, and File Formats(数据加载,存储,文件格式)
-
Chapter 8: Data Wrangling: Join, Combine, and Reshape(数据加工:加入, 结合, 变型)
-
- 11.1 Date and Time Data Types and Tools(日期和时间数据类型及其工具)
- 11.2 Time Series Basics(时间序列基础)
- 11.3 Date Ranges, Frequencies, and Shifting(日期范围,频度,和位移)
- 11.4 Time Zone Handling(时区处理)
- 11.5 Periods and Period Arithmetic(周期和周期运算)
- 11.6 Resampling and Frequency Conversion(重采样和频度转换)
- 11.7 Moving Window Functions(移动窗口函数)
-
Chapter 13: Introduction to Modeling Libraries in Python(Python中建模库的介绍)
License
The code in this repository, including all code samples in the notebooks listed above, is released under the MIT license . Read more at the Open Source Initiative .
Sponsor
如果觉得有帮助,可以赞个助,不论多少都是对我工作的肯定:)
- ETH: 0x0d9e310313a55cb8e48d69a2db27209db1b5a793
- EOS:0xb5f0a94f77e007b596a6e53a75f4ee04f0c72899
- NEO:ASCc7rEZ1SAg2hnLicwkaVBMF9MyqWFKMz
微信:
支付宝:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
设计模式
[美] Erich Gamma、Richard Helm、Ralph Johnson、John Vlissides / 李英军、马晓星、蔡敏、刘建中 等 / 机械工业出版社 / 2000-9 / 35.00元
这本书结合设计实作例从面向对象的设计中精选出23个设计模式,总结了面向对象设计中最有价值的经验,并且用简洁可复用的形式表达出来。书中分类描述了一组设计良好、表达清楚的软件设计模式,这些模式在实用环境下特别有用。此书适合大学计算机专业的学生、研究生及相关人员参考。 书中涉及的设计模式并不描述新的或未经证实的设计,只收录了那些在不同系统中多次使用过的成功设计。一起来看看 《设计模式》 这本书的介绍吧!