【磐创 AI 导读】: 本文为大家总结了五月份最热门的机器学习项目 top5 。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号: 磐创 AI 。
此外,如果你想了解更多优秀的 github 项目,请关注我们公众号的 github 系列文章。
热点 | 二月最佳Github项目库与最有趣Reddit热点讨论
No1: InterpretML by Microsoft——Machine Learning Interpretability
github 地址: https://github.com/microsoft/interpret
可解释性是目前机器学习中的一个重要问题。能够理解模型如何产生它所输出的内容,这是每个机器学习项目的关键。
Interpretml 是微软的一个开源软件包,用于训练可解释模型和解释黑盒系统。微软在解释解为什么解释性是必要的时候说得非常好:
模型调试 :为什么我的模型犯了这个错误?
检测偏差 :我的模型有区别吗?
人工智能合作 :我如何理解和信任模型的决策?
法规遵从性 :我的模型是否满足法律要求?
高风险应用 :医疗、金融、司法等。
从过去的经验看,最容易理解的模型不是很准确,而最准确的模型是不可理解的。随着复杂性的增加,解释机器学习模型的内部工作变得更加困难。于是, MicrosoftResearch 开发了一种称为可解释增强机( EBM ) * 的算法,该算法具有高精度和可理解性。 EBM 使用现代机器学习技术,如 bagging 和 boosting ,为传统的 GAM 模型注入新的活力。这使它们像随机森林和梯度提升树一样准确,并且还增强了它们的可理解性和可编辑性。
此外,该算法不仅限于使用 EBM ,它还支持 LIME 、线性模型、决策树等算法。比较模型并为我们的项目挑选最好的模型从未如此简单!
而 Interpretml 的安装也很简单,仅需要如下几行代码:
pip install numpy scipy pyscaffold
pip install -U interpret
No2:Tensor2Robot (T2R) by Google Research
github 地址: https://github.com/google-research/tensor2robot
Google Research 再次出现在我们推荐的 Github 系列项目中。因为他们拥有业务中最强大的计算能力,且他们正在将它用于机器学习。
Google 最新发布了名为 Tensor2Robot ( T2R )的开源项目。 T2R 是用于大规模深度神经网络训练、评估和推理的库。,此存储库包含分布式机器学习和强化学习基础结构。它在 Alphabet 内部使用,开源的目的是使 Robotics @ Google 的研究对于更广泛的机器人和计算机视觉社区更具可重复性。
以下是使用 Tensor2Robot 实现的几个项目:
-
QT-Opt ( https://arxiv.org/abs/1806.10293
-
Grasp2Vec ( https://github.com/google-research/tensor2robot/blob/master/research/grasp2vec )
No3:Generative Models in TensorFlow 2
Github 地址: https://github.com/timsainb/tensorflow2-generative-models
这是一个在 Tensorflow 2 中实现大量生成模型的小项目。( TensorFlow 2.0 是今年最受期待的 TensorFlow 版本,于不久前正式推出。)图层和优化器都是使用 Keras 。这些模型是针对两个数据集实现的: fashion MNIST 和 NSYNTH 。编写网络的目的是尽可能简单和一致,同时具有可读性。因为每个网络都是自包含在 notebook 中的,所以它们应该可以在 colab 会话中轻松运行。
该存储库包含多个生成模型的 TF 实现,包括:
-
生成对抗网络( GAN )
-
自动编码器
-
变分自动编码器( VAE )
-
VAE-GAN 等。
No4:STUMPY – Time Series Data Mining
github 地址: https://github.com/TDAmeritrade/stumpy
STUMPY 是一个功能强大且可扩展的库,可帮助我们执行时间序列数据挖掘任务。 STUMPY 旨在计算矩阵轮廓,矩阵轮廓是一个向量,它存储时间序列中任何子序列与其最近邻居之间的 z-normalized 欧几里德距离。
以下是此矩阵配置文件帮助我们执行的一些时间序列数据挖掘任务:
-
异常发现
-
语义分割
-
密度估计
-
时间序列链(时序有序的子序列模式集)
使用以下代码可以通过 pip 直接安装 STUMPY :
pip install stumpy
No5:MeshCNN in PyTorch
github 地址:https://github.com/ranahanocka/MeshCNN
MeshCNN 是用于 3D 三角网格的通用深度神经网络。这些网格可用于 3D 形状分类或分割等任务。 MeshCNN 框架包括直接应用于网格边缘的卷积,池化和解除层:
卷积神经网络( CNN )非常适合处理图像和视觉数据。 CNN 近年来风靡一时,随着图像相关应用的涌现而兴起:物体检测、图像分割、图像分类等,随着 CNN 的进步,这些都变成了可能。
而最近 3D 深度学习吸引了业界的兴趣,包括机器人和自动驾驶等领域。 3D 形状的问题在于它们本质上是不规则的。这使得像卷积这样的操作变得很困难。这也是 MeshCNN 发挥作用的地方。它是是用于 3D 三角网格的通用深度神经网络:网格是顶点,边和面的列表,它们共同定义 3D 对象的形状。
如果您热衷于计算机视觉,那么这对您来说是完美的存储库。 您可以通过我们的文章了解有关 CNN 的更多信息:
-
A Comprehensive Tutorial tolearn Convolutional Neural Networks from Scratch ( A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch )
-
Architecture of ConvolutionalNeural Networks (CNNs) Demystified ( A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch )
你也许还想 看 :
● 一文彻底搞懂BP算法:原理推导+数据演示+项目实战(上篇)
● TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程(文末有惊喜)
● 入门 | Tensorflow实战讲解神经网络搭建详细过程
欢迎扫码关注:
点击下方 | 阅 读 原 文 | 了解更多
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 干货 | 近期热点机器学习git项目
- 从 0 开始机器学习 - 机器学习算法诊断
- 浅谈机器学习原理及机器学习平台
- 机器学习基础概念和统计机器学习基本算法
- [机器学习]机器学习笔记整理09- 基于SVM图像识别
- 机器的“无限有趣空间”:人类将无法理解机器的崛起
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Designing Data-Intensive Applications
Martin Kleppmann / O'Reilly Media / 2017-4-2 / USD 44.99
Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliability, efficiency, and maintainability. In addition, w......一起来看看 《Designing Data-Intensive Applications》 这本书的介绍吧!
HTML 编码/解码
HTML 编码/解码
HEX CMYK 转换工具
HEX CMYK 互转工具