在人工智能学习训练中,会遇到哪些问题?

栏目: 编程工具 · 发布时间: 6年前

内容简介:人工智能在过去两年被谷歌引爆,于是该领域的创业公司如雨后春笋般生长起来,有的做专用芯片,有的做算法,有的做机器人…人工智能到底是什么?是让机器代替人类完成重复的生产线劳动吗?这样理解为免太简单。人工智能绝对不只是让机器完成模仿,从而替代重复性工作,真正的人工智能需要机器经过训练和学习,接近或者超越人类的智能行为。人工智能训练模型的时候,数据是最重要的因素,只有通过大数据训练,才能让训练的模型更接近于实际需求。比如,自动驾驶的模型训练,现在基本是靠自动驾驶汽车上路测试收集数据训练模型,路上的汽车只有采集到更

人工智能在过去两年被谷歌引爆,于是该领域的创业公司如雨后春笋般生长起来,有的做专用芯片,有的做算法,有的做机器人…人工智能到底是什么?是让机器代替人类完成重复的生产线劳动吗?这样理解为免太简单。人工智能绝对不只是让机器完成模仿,从而替代重复性工作,真正的人工智能需要机器经过训练和学习,接近或者超越人类的智能行为。

在人工智能学习训练中,会遇到哪些问题?

人工智能训练模型的时候,数据是最重要的因素,只有通过大数据训练,才能让训练的模型更接近于实际需求。比如,自动驾驶的模型训练,现在基本是靠自动驾驶汽车上路测试收集数据训练模型,路上的汽车只有采集到更多可能的场景,才能确保训练出的模型更接近实际路况。在人工智能训练中一般会遇到两个问题:第一,数据量不够如何训练模型?第二,数据量太大如何快速进行标注?

迁移学习:通过模型产生数据训练神经网络

如果没有数据能做人工智能吗?这是很多初创公司的困惑。在笔者的概念里,正常的AI开发流程是,先采集数据,再训练模型。在最近的Matlab大会上,MathWorks产品市场经理赵志宏先生给出了一个不一样的答案,他表示,“数据、输出和模型是整个AI开发流程的一个步骤。如果开发者想做人工智能,又没有太多的数据,可以采用迁移学习的方法。” 迁移学习又是什么概念?不防从实际例子来理解。比如:通过人工智能的方式来预测风力发电机的故障,用户不能等到采集到大量故障数据以后再预测,这样不符合设备维护的目标,而是先用Simulink模型建立一个风里发电机的模型,通过校正让这个模型非常接近风力发电机,然后通过该模型产生故障数据,进而训练机器学习或者深度学习的神经网络。

基于模型设计的优势是,它是在真正做出产品之前建好一个模型,这个模型与实际产品非常的接近,不管是从数字计算、行为计算产生的结果与真正的结果都非常接近。很多工程师在设计产品的时候已经把这个模型建好了,在这个模型上加入故障情况就很容易产生故障数据,这比在实际设备上产生的故障要容易很多。因此,可以进行故障预测和维护。

通过深度学习对大数据进行标注

随着传感器的大量采用,数据量进入洪荒时代,给人工智能进行特征标记带来困难,这时候可以采用深度学习进行标记。深度学习的特点是不需要人工手动找出特征值,系统可以自动从数据里提取特征值。MATLAB里面有很多自动标记的 工具 和功能。LiDAR三维点云技术可以对每一点进行标注,把这个点聚类在一起聚成一个目标模型,然后再把目标具体代表的实物辨别出来。有些用户已经采用MATLAB的工具进行了开发,著名的汽车配件公司AUTOLIV就在用这种方式进行自动数据标注。

以膨化食品智能检测为例,研究人员可以在用户咬食品的时候提取特征,用咬合声音和咬合力度衡量食品的松脆度,有了这两个特征,还需要开发一个机器学习的分类器,而MATLAB提供了分类学习器。开发者通过这个工具不需要一个一个去试各种分类器的算法,使用MATLAB提供的APP去一次性尝试所有算法。开始运行APP后,用户选好数据和需要训练的分类器,然后进行训练。在训练过程中,用户可以看到每个分类器的整体结果,选择精确度最高的一个,然后进行更多的调查和研究。如果用户没有研究过AI,可以用MATLAB提供的APP进行学习,去尝试所有机器学习的算法。

在MATLAB里面做深度学习难吗?用赵志宏先生的话说,只需要写5行的MATLAB代码,用户就可以建出一个能够识别食品的网络。笔者已经多年没接触过MATLAB了,所以无从考证,工程师朋友们如果需要可以进行尝试。

和开源代码如何协作?

现在市面上的开源非常热,工程师们可以在开源社区快速获得需要的代码,在人工智能领域也有很多开源资源,作为封闭资源的MATLAB和开源代码相比更新速度可能会较慢,而且加上是收费模式,工程师们也担心两者的融合问题。当笔者问到这个问题的时候,赵志宏先生解释,“开源代码背后有很多的开发团队,他们自愿进行开发,我们也有自己的开发团队。我们并不把开源代码和MATLAB定义为竞争关系,实际上我们各有特点和长处,有时候我们是可以与开源代码共用。有一些开源代码可以在MATLAB里面运行或者直接调用,我们在共同为科技进步做贡献。我们虽然是付费软件,但是提供的不仅是工具,还有很多的服务。”

当用户使用MATLAB时遇到问题,我们后面有很强的技术支持团队帮用户解决这些问题。另外,我们的工具不仅是针对某一功能产生正确的结果,我们还考虑把这个功能做得非常的容易使用。比如针对AI应用,我们把界面做得非常适合该专业领域,而且兼顾让用户感觉在使用熟悉的MATLAB或者Simulink的界面。这是我们的优势,如果用户在MATLAB或者Simulink中增加新功能,学习门槛不会很高,容易上手设计。除了提供工具,我们还给用户提供了很多便利,这是从开源工具中所得不到的东西。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

大规模Web服务开发技术

大规模Web服务开发技术

伊藤直也、田中慎司 / 李剑 / 电子工业出版社 / 2011-7 / 59.00元

Hatena是日本最大的Web服务提供商之一,它提供的服务包括关键字(类似于维基百科)、博客、相册等。《大规模Web服务开发技术》由伊藤直也、田中慎司所著,内容主要来自Hatena为学生们举行的暑期实习的课程,内容涵盖广泛,介绍了性能优化、分布式、算法、系统架构等各个方面,甚至还介绍了硬件的经济成本,是运维工程师们必不可少的参考书。书中还包括几个算法实习课题,介绍了压缩算法、全文搜索等算法的实现方......一起来看看 《大规模Web服务开发技术》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具