将机器学习可视化

栏目: 数据库 · 发布时间: 6年前

将机器学习可视化

如今的软件自动化可以取代人类的决定权,例如对个人信用风险的判定、建议雇主合适的人选、判断哪些人可能对公众产生危害。最近几年来各种报道都预示着未来社会将会是一个机器运行的社会,由各种无法验证的算法决定人类的生活。

以上的恐惧感一部分来自于人们不了解机器学习的运作方式,把它看作一个暗箱,输入的指令到最后的结果输出,有时连软件开发人员都无法理解。随着智能化程度范围越来越大,很多重要领域也开始应用机器学习,这就需要人类准确对机器学习的结果进行预测防止出现重大错误,也是为了让更多的人建立起对机器学习的信任。

目前,大部分机器学习使用事后技术或像是决策树模型来解释机器学习的原理。通过事后分析技术,研究人员通过对输入和输出结果的比较,调整算法,最终用于解释机器学习的过程。但是这种方法研究人员只能通过猜测机器学习的过程,最后的结果很可能是错误的。决策树技术则是通过选择后的结果分支绘制出一张树状图,该技术仅适用于有意义的分类数据,对于诸如计算机视觉或其他复杂数据问题不适用。

麻省理工林肯实验室的Jonathan Su联合杜克大学教授Cynthia Rudin以及学生Chaofan Chen,Oscar Li和Alina Barnett一起研究了一种更加可视化的暗箱预测方法,被称为弹性机器学习(AIM),致力于达到2个目的:能被读懂的神经网络和具有弹性的可理解的贝叶斯规则表(BRLs)。

神经网络是一个许多相互交织的处理单元组成的网络,主要用于图像分析和对象识别。例如使用算法识别出一堆狗的照片中的一张狗照片。研究人员表示这类神经识别问题具有非线性和递归性,对人类而言也具有一定的复杂性。最后神经网络对狗的定义也非常困难,需要根据说给图片的特征进行归纳总结。

为了表述这一问题,研究团队开发了“样本神经网络”,它们与传统神经网络的最大不同在于通过建立样本来对最后的结果进行解释。以照片识别为例,根据输入的图像进行样本定义,再通过定义后的样本来预测最后的输出结果。不管样本图片是一只狗、还是一只猫或是一匹马,该网络都会根据样本中的每种动物的重要特征进行结果判断。

研究团队的另一个研究方向是贝叶斯规则表,这是一个单向简单的决策树模型,适用于表列数据判断准确性非常高。贝叶斯规则表根据一定条件判断结果,最终形成一个判断模型。例如,当血压升高时,意味着患心脏病的几率也会提高。本次的研究团队试图利用贝叶斯规则表的特性判断出结果的重要特征。他们还开发了交互式贝叶斯规则表,可以随着数据的增长而做出对相应的改变,保证结果判断的准确性。

佛罗里达大学的学生Stephanie Carnell正在申请该项目在医学诊断方面的研究课题,未来可以用来帮助医学院学生更准确的判断病人的病情。目前的医学院学生只能通过与虚拟病人的面谈来判断病情并获得相应得分,但他们不知道获得这些分数的原因。

弹性机器学习项目属于类人机械工程学,通过研究人类的思维方式和行为来取代纯粹算法学习。目前已经使用 Python 语言开发了贝叶斯规则表和交互性贝叶斯规则表,并且在不同操作系统和硬件平台上进行可行性测试。人类在未来不仅能信任机器学习的算法,还可以了解它们的原理。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

The Creative Curve

The Creative Curve

Allen Gannett / Knopf Doubleday Publishing Group / 2018-6-12

Big data entrepreneur Allen Gannett overturns the mythology around creative genius, and reveals the science and secrets behind achieving breakout commercial success in any field. We have been s......一起来看看 《The Creative Curve》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

URL 编码/解码
URL 编码/解码

URL 编码/解码

html转js在线工具
html转js在线工具

html转js在线工具