[译] 鲜为人知的数据科学 Python 库

栏目: Python · 发布时间: 7年前

内容简介：PC：Hitesh Choudhary 来自于UnsplashPython 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户（初学者和高级用户）的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合，这些库使它可以保持活力和高效。在本文中，我们会研究一些用于数据科学任务的 Python 库，而不是常见的比如

[译] 鲜为人知的数据科学 <a href='https://www.codercto.com/topics/20097.html'>Python</a> 库

PC：Hitesh Choudhary 来自于Unsplash

Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使它成为全世界用户（初学者和高级用户）的合适选择。它的成功和流行的原因之一是它强大的第三方库的集合，这些库使它可以保持活力和高效。

在本文中，我们会研究一些用于数据科学任务的 Python 库，而不是常见的比如 panda、scikit-learn 和 matplotlib 等 的库。尽管像 panda 和 scikit-learn 这样的库，是在机器学习任务中经常出现的，但是了解这个领域中的其它 Python 产品总是很有好处的。

Wget

从网络上提取数据是数据科学家的重要任务之一。 Wget 是一个免费的实用程序，可以用于从网络上下载非交互式的文件。它支持 HTTP、HTTPS 和 FTP 协议，以及通过 HTTP 的代理进行文件检索。由于它是非交互式的，即使用户没有登录，它也可以在后台工作。所以下次当你想要下载一个网站或者一个页面上的所有图片时， wget 可以帮助你。

安装：

$ pip install wget
复制代码

例子：

import wget
url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'

filename = wget.download(url)
100% [................................................] 3841532 / 3841532

filename
'razorback.mp3'
复制代码

Pendulum

对于那些在 python 中处理日期时间时会感到沮丧的人来说，Pendulum 很适合你。它是一个简化 日期时间 操作的 Python 包。它是 Python 原生类的简易替代。请参阅文档深入学习。

安装：

$ pip install pendulum
复制代码

例子：

import pendulum

dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto')
dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver')

print(dt_vancouver.diff(dt_toronto).in_hours())

3
复制代码

结果展示也是数据科学中的一个重要方面。能够将结果进行可视化将具有很大优势。IPyvolume 是一个可以在 Jupyter notebook 中可视化三维体和图形（例如三维散点图等）的 Python 库，并且只需要少量配置。但它目前还是 1.0 之前的版本阶段。用一个比较恰当的比喻来解释就是：IPyvolume 的 volshow 对于三维数组就像 matplotlib 的 imshow 对于二维数组一样好用。可以在这里获取更多。

使用 pip
$ pip install ipyvolume

使用 Conda/Anaconda
$ conda install -c conda-forge ipyvolume
复制代码

例子

动画

体绘制

Dash

Dash 是一个高效的用于构建 web 应用程序的 Python 框架。它是在 Flask、Plotly.js 和 React.js 基础上设计而成的，绑定了很多比如下拉框、滑动条和图表的现代 UI 元素，你可以直接使用 Python 代码来写相关分析，而无需再使用 javascript。Dash 非常适合构建数据可视化应用程序。然后，这些应用程序可以在 web 浏览器中呈现。用户指南可以在这里获取。

安装

pip install dash==0.29.0  # 核心 dash 后端
pip install dash-html-components==0.13.2  # HTML 组件
pip install dash-core-components==0.36.0  # 增强组件
pip install dash-table==3.1.3  # 交互式 DataTable 组件（最新！）
复制代码

例子

下面的例子展示了一个具有下拉功能的高度交互式图表。当用户在下拉菜单中选择一个值时，应用程序代码将动态地将数据从 Google Finance 导出到 panda DataFrame。源码在这里

Gym

OpenAI 的 Gym 是一款用于增强学习算法的开发和比较工具包。它兼容任何数值计算库，如 TensorFlow 或 Theano。Gym 库是测试问题集合的必备工具，这个集合也称为环境 —— 你可以用它来开发你的强化学习算法。这些环境有一个共享接口，允许你进行通用算法的编写。

安装

pip install gym
复制代码

例子

这个例子会运行 CartPole-v0 环境中的一个实例，它的时间步数为 1000，每一步都会渲染整个场景。

你可以在这里获取其它环境的相关资料。

以上所述就是小编给大家介绍的《[译] 鲜为人知的数据科学 Python 库》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Adobe Dreamweaver CS5中文版经典教程

Adobe公司 / 陈宗斌 / 人民邮电 / 2011-1 / 45.00元

《Adobe Dreamweaver CS5中文版经典教程》由Adobe公司的专家编写，是AdobeDreamweavelCS5软件的官方指定培训教材。全书共分为17课，每一课先介绍重要的知识点，然后借助具体的示例进行讲解，步骤详细、重点明确，手把手教你如何进行实际操作。全书是一个有机的整体，它涵盖了Dreamweavercs5的基础知识、HTML基础、CSS基础、创建页面布局、使用层叠样式表、使......一起来看看《Adobe Dreamweaver CS5中文版经典教程》这本书的介绍吧!

码农工具

[译] 鲜为人知的数据科学 Python 库

Wget

安装：

例子：

Pendulum

安装：

例子：

imbalanced-learn

安装：

例子：

FlashText

安装：

例子：

提取关键字

替换关键字

Fuzzywuzzy

安装：

例子：

PyFlux

安装

例子

Ipyvolume

例子

Dash

安装

例子

Gym

安装

例子

Adobe Dreamweaver CS5中文版经典教程

URL 编码/解码

Markdown 在线编辑器