穿越时空 AI代我告诉你:“爱你何止三千遍”

栏目: 编程工具 · 发布时间: 5年前

穿越时空 AI代我告诉你:“爱你何止三千遍”

铅笔道专栏作者丨顶商投资

“ I love you three thousand.” 《复仇者联盟》4的末尾播放了一段钢铁侠牺牲前的录像带,立体投影下的托尼·史塔克深情款款地说。 影片 工作室 ,酷炫的全息投影显示不仅可以多样化地展示图像,三维空间浮空操作的方式也有很好的操作体验。

立体投影、全息投影,AI交互,影片中的黑科技在现实中得以不断实现,贴近现实生活。

时间追溯,自从Alpha Go击败韩国棋手李世石之后,人工智能将成为未来科技发展的趋势这一点已经被世人所承认。在人工智能的热潮真正到来的今天,人工智能究竟怎样改变人们的生活成为了全世界需要思考的新问题。

目前的人工智能主要在语音、自然语言和视觉方向发展比较迅速,其中最成熟的就是视觉技术,国内外的市场占比都超过了40%。

穿越时空 AI代我告诉你:“爱你何止三千遍”

那么,视觉技术为什么会发展的比较快呢?这主要有两方面的原因:一方面是视觉技术本身针对的图像识别相对比较直观,图像的色彩、灰度、空间等都是可以量化的特征,对于人工智能的训练和推理所需要的mapping比较契合;另一方面是视觉技术属于感知和认知信息的首要方式。根据人类获取信息的途径来看,视觉占据了人类信息获取的80%。而计算机视觉技术不仅可以替代人眼,还能够做到很多人眼所不能做到的高速、高精度和高适应性的视觉识别。

那计算机视觉到底怎么改变了我们的生活呢?也许是支付宝的刷脸支付,也许是手机的脸部识别,也许是各种各样App里的美颜功能……

但是,事实上,在这些消费级的计算机视觉不断出现在我们身边时,工业领域早就已经大规模应用计算机视觉技术,并且帮助企业提高生产效率,较低人力成本,减少了生产过程中的错误,为企业创造了巨大的价值。

当计算机视觉被应用到工业领域时,最具优势的应用形式就是工业机器的3D视觉检测。在工业发展迅速的今天,依靠人工进行产品的缺陷检测,不仅人力成本巨大,而且对检测人员的重复劳动所带来的视觉疲劳问题也得不到解决,尤其是在汽车和消费类电子行业,出货量巨大,对产品精度的要求又很高。单纯依靠人工,效率和准确率都得不到保障。而3D计算机视觉的出现,很好地解决了这一痛点。

3D计算机视觉技术 路径

那么计算机视觉究竟是怎么做到比人眼更快更准确的呢?首先需要了解现有的3D计算机视觉技术。

穿越时空 AI代我告诉你:“爱你何止三千遍”

目前主流的3D计算机视觉有三种技术路径:双目法、结构光和TOF。

双目法是指采集图像中的特征点,构建物体的几何模型,这种方法诞生最早,应用最久也最广泛。因为双目法采集的是正常摄像头所拍摄到的画面,这对硬件的要求较小,成本也最低。不过双目法以2D图片为识别对象,特征较少,从精准度上来说,也是最低的。不过也正是它不需要专业设备即可识别图片的特性,决定了它具有极强的延展性和丰富的应用场景。

结构光目前已经应用在OPPO R11/R15、iPhone X中,这种技术采样准确,识别精度也相当高,在设备和算法的支持下,即对物体材料也能够识别。3D结构光检测技术利用空间位置编码技术结合三角测量法可实现3D形貌的精确检测,具有速度快、部署效率高、光学结构简单的优点。

TOF是飞行时间(Time of Flight)技术的缩写,即传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄物体的距离,以产生深度信息。简单来说就是,发出一道经过处理的光,碰到物体以后会反射回来,捕捉来回的时间,因为已知光速和调制光的波长,所以能快速准确计算出到物体的距离。TOF技术优势在于成本低,测量距离和抗干扰能力也强于结构光技术。但TOF分辨率低于结构光,其精准度不及结构光。

就目前工业生产检测所需的精度要求来看,产品的误差范围要求都是微米级,工作环境也要求所采用的技术适应性要强。不难发现,3D结构光是最适合工业级别的3D视觉检测的。也正因为3D计算机视觉在工业生产中的重要作用,目前已经开发出基于3D计算机视觉的专用AI芯片(FPGA),该技术利用FPGA实现动态视觉采集与分析处理,在成像过程中仅关注图像的变化部分,极大降低数据带宽消耗,从而大幅提升图像的处理速度。而计算机视觉技术的进一步提升将在工业生产中的定位、引导、检测和质量控制等领域发挥更强的提升和替代作用。

解锁多样化应用场景

安全支付、三维建模、游戏互动、数据采集,光学识别技术在拍照、美颜、视频、互娱、展览等领域落地应用。以下侧重从新零售、展览展示两个场景领域展开。

新零售。目前该领域与视觉相关的主要包括人脸识别支付、商家结算收银。而在结算这块,相关的还有RFID、重力感应等方式。RFID射频设别技术与AI视觉识别支付的区别,可以从有无RFID标签,摄像头等外部功能来辨别。但现有视觉识别结算技术在物品叠放、超越视觉区域等方面仍然存在局限。此时便需要其他技术如重力感应等来辅助确认。

展览展示。广告传媒、娱乐互动领域的应用可以分为两个层面:第一层面单向视觉传播;第二层面传感器互动感应,人工智能算法及时互动。技术难易度上,后者双向技术复杂综合,而目前双向技术应用较多的主要通过红外线、雷达感应互动,此外语音互动也是一大互动入口点。即用户最终看到的是AI视觉识别+传感器+手势互动+语音互动+……技术应用叠加,人工智能化。

不论是复联里出现的3D投影对话,还是现实中结构光与TOF技术在手机端的应用,可以发现的是3D计算机视觉正深入多个场景,解锁多样化应用场景。此外,5G技术趋势也在为视觉识别影像技术的应用提供技术环境沃土,人工智能项目百舸争流。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

只是为了好玩

只是为了好玩

Linus Torvalds、David Diamond / 陈少芸 / 人民邮电出版社 / 2014-7 / 49.00 元

本书是Linux之父Linus Torvalds的自传。 Linux之父Linus Torvalds的自传,也是Linus唯一一本书。Linus以调侃的语气讲述了自己的成长经历,在他看来,一切都是为了好玩儿,兴趣引发革命。书中内容共分为五章,一部分是Linus自己写的,一部分是合著者David Diamond的评论。 林纳斯•托瓦兹 当今世界最著名的程序员、黑客,开源操作系统Linux......一起来看看 《只是为了好玩》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具