内容简介:2019 年第原文地址:https://medium.mybridge.co/python-open-source-for-the-past-month-v-may-2019-473e9f60c73f5 月份刚刚过去,之前看到了一篇介绍 5 月份的最热机器学习项目,刚好看到 Mybridge AI 博客又发表了一篇 5 月份最热的 Python Github 开源项目,同样是在将近 230 个 Python 开源项目中选择最热门的前十个。
2019 年第 46 篇,总第 70 篇文章
原文地址:https://medium.mybridge.co/python-open-source-for-the-past-month-v-may-2019-473e9f60c73f
5 月份刚刚过去,之前看到了一篇介绍 5 月份的最热机器学习项目,刚好看到 Mybridge AI 博客又发表了一篇 5 月份最热的 Python Github 开源项目,同样是在将近 230 个 Python 开源项目中选择最热门的前十个。
选择的十个项目包含了 Debug 工具、删除 Facebook 文章、无限云盘存储空间、AI 水军、并发运算 工具 、量化交易系统等等。
那么就来看看这十个项目吧!
第一名:PySnooper
这是一款调试代码的工具,让你不需要再通过采用 print
来定位错误发生的地方和原因。目前有 11000+ 星。
PySnooper
可以让你不需要仔细选择哪些行需要打印信息,只需要对目标函数添加一行装饰器,就可以知道很仔细看到函数的运行状况,包括哪行运行、局部变量的变化等。
安装方法很简单,可以使用 pip
或 anaconda
两种安装方法:
$ pip install pysnooper
或者
$ conda install -c conda-forge pysnooper
一个使用例子如下,首先是需要导入 pysnooper
,然后想知道函数 number_to_bits()
的运行情况,只需要添加 @pysnooper.snoop()
即可。
import pysnooper
@pysnooper.snoop()
def number_to_bits(number):
if number:
bits = []
while number:
number, remainder = divmod(number, 2)
bits.insert(0, remainder)
return bits
else:
return [0]
number_to_bits(6)
得到的输出结果:
Starting var:.. number = 6
15:29:11.327032 call 4 def number_to_bits(number):
15:29:11.327032 line 5 if number:
15:29:11.327032 line 6 bits = []
New var:....... bits = []
15:29:11.327032 line 7 while number:
15:29:11.327032 line 8 number, remainder = divmod(number, 2)
New var:....... remainder = 0
Modified var:.. number = 3
15:29:11.327032 line 9 bits.insert(0, remainder)
Modified var:.. bits = [0]
15:29:11.327032 line 7 while number:
15:29:11.327032 line 8 number, remainder = divmod(number, 2)
Modified var:.. number = 1
Modified var:.. remainder = 1
15:29:11.327032 line 9 bits.insert(0, remainder)
Modified var:.. bits = [1, 0]
15:29:11.327032 line 7 while number:
15:29:11.327032 line 8 number, remainder = divmod(number, 2)
Modified var:.. number = 0
15:29:11.327032 line 9 bits.insert(0, remainder)
Modified var:.. bits = [1, 1, 0]
15:29:11.327032 line 7 while number:
15:29:11.327032 line 10 return bits
15:29:11.327032 return 10 return bits
Return value:.. [1, 1, 0]
当然,它还可以只监控函数中的一部分代码,还有其他的用法,具体可以到其 Github 上。
链接:
https://github.com/cool-RR/pysnooper?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第二名:DeleteFB
一款用于删除 Facebook 文章的工具,目前有 2224 星。
这款工具是基于 Selenium
实现的,因此作者认为它比一些第三方 app 更加可靠,并且也不容易遭到 Facebook 的阻拦。
几种安装方法:
# 1.Install from PyPI
pip install --user delete-facebook-posts
# 2.Clone repo and run
pip install --user .
# or
pip install --user git+https://github.com/weskerfoot/DeleteFB.git
# 3.Set up a Python virtualenv, activate it, and run
pip install -r requirements.txt
其他的详细介绍可以查看该 Github 项目。
链接:
https://github.com/weskerfoot/DeleteFB?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第三名:无限云盘存储空间(UDS : Unlimited Drive Storage)
第三名是一个可以实现不需要占据空间但能上传文件到谷歌云盘的一个工具,目前 3232 星。
根据它的介绍,实现这个功能主要是通过将二进制文件分解成 base64
的格式,其实现的功能:
-
将文件上传到谷歌云盘但不会占据存储空间;
-
下载任意存储的文件到本地电脑
具体实现的逻辑是:
-
谷歌文档在谷歌云盘中是不占空间的
-
将二进制文件采用
base64
编码文件分解为谷歌文档 -
编码后的文件大小总是会大于源文件,而经过
Base64
编码的二进制数据后的文件和源文件的比例大约是4:3
-
单个谷歌文档可以存储大约一百万字节,这大约是 710 KB 大小的
base64
编码数据 -
尝试采用多线程上传文件,但没有显著提升速度
具体的配置和使用方法可以查看它在 Github 上的介绍。
链接:
https://github.com/stewartmcgown/uds?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第四名: eht-imaging
这是一个应用在射电干涉测量方面的成像、分析、仿真软件。目前有 5000+ 星。
具体来说,就是可以仿真和操纵 VLBI 数据并利用正则化的最大似然方法生成图片的一个 Python 模块。
链接:
https://github.com/achael/eht-imaging?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
官方文档链接:
https://achael.github.io/eht-imaging/
第五名: YouTubeCommenter
应用于 Youtube,利用 AI 技术,基于视频标题生成评论的工具,目前有 159 星。
作者也说了目前该项目仅仅是作为一个参考,还不能真正应用。
感觉如果技术真正成熟,这就是一个 AI 水军,而且可以快速控制某些视频的评论。
此外,这里还有作者的一个视频介绍和演示,需要科学上网以及良好的英语听力,视频大约是 9 分钟左右,大致简单看了作者演示的效果,确实离真正可用还是有很大的距离。
https://youtu.be/tY6SvZEic9k
链接:
https://github.com/HackerPoet/YouTubeCommenter?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第六名: stackprinter
这也是一个调试工具,目前有 900+ 星。
它的一个使用结果如下图所示,会打印出错代码内容以及这段代码周围的变量数值,这非常符合一个友好的交互的调试器:出错的代码位置,附近变量数值,以及这个函数调用这些参数的原因。
安装方法很简单:
pip install stackprinter
更详细的介绍可以查看其 Github。
链接:
https://github.com/cknd/stackprinter?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第七名:Pykka
Pykka 是对并发运算中的角色模型(actor model)的 python 版实现库,目前有 763 星。
具体细节和使用例子可以查看官方文档:
https://www.pykka.org/en/latest/
安装方法如下:
pip install pykka
链接:
https://github.com/jodal/pykka?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第八名: QTSSTM4
一个数字货币的量化交易系统。目前有 244 星。
整个系统的结构如下图所示:
这个系统对于初学者可能比较复杂,作者建议先看看下面三份资料:
-
BakTst_Org
-
BakTst_Trd
-
scripts
详细的介绍查看 Github。
链接:
https://github.com/xiaoyao153379/QTSSTM4?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第九名:Maildown
一个简单的发送邮件的命令行接口,目前有 521 星。
Maildown
是基于亚马逊的 SES 服务,它每个月可以免费发送 62000 封邮件,可以满足大部分人的需求。
因此,在使用 Maildown
之前需要先一个亚马逊 AWS 的账号,注册地址:
https://aws.amazon.com/
然后也需要有一个 SES 账户:
https://docs.aws.amazon.com/ses/latest/DeveloperGuide/request-production-access.html
安装方法直接用
pip install maildown
更详细的介绍请查看 Github。
链接:
https://github.com/chris104957/maildown?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
第十名: modDetective
这是一个根据修改时间对文件进行 排序 操作的工具,目前有 119 星。
目前这个工具还在继续完善和优化中,根据作者的说法,目前查找速度还是线性的,需要继续优化。
Github 有一个简单演示的视频。
链接:
https://github.com/itsKindred/modDetective?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
这就是作者整理出来的 5 月份 Github 上最热的十个 Python 项目,往届其他 Python、机器学习等热门项目也可以查看一下 Github:
https://github.com/Mybridge/python-open-source
或者网站:
https://medium.mybridge.co/
原文地址:https://medium.mybridge.co/python-open-source-for-the-past-month-v-may-2019-473e9f60c73f
欢迎关注我的微信公众号--机器学习与计算机视觉,或者扫描下方的二维码,大家一起交流,学习和进步!
如果觉得不错,在看、转发就是对小编的一个支持!
往期精彩推荐
机器学习系列
Github项目 & 资源教程推荐
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 微博爬虫与水军识别(基于文本分析),超高准确率
- 评论区的AI水军,你已防不胜防 | Demo可玩
- 【邢不行|量化小讲堂系列05-Python量化入门】计算创业板平均市盈率
- 量化交易的尬舞
- 抄底的艺术:量化交易之路
- 用R语言开始量化投资
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
统计思维:程序员数学之概率统计
Allen B.Downey / 张建锋、陈钢 / 人民邮电出版社 / 2013-5 / 29.00元
代码跑出来的概率统计问题; 程序员的概率统计开心辞典; 开放数据集,全代码攻略。 现实工作中,人们常被要求用数据说话。可是,数据自己是不能说话的,只有对它进行可靠分析和深入挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。 站在时代浪尖上的程序员只有具备统计思维才能掌握数据分析的必杀技。本书正是一本概率统计方面的入门图书,但视角极为独特,折......一起来看看 《统计思维:程序员数学之概率统计》 这本书的介绍吧!