穿越时空 AI代我告诉你:“爱你何止三千遍”

栏目: 编程工具 · 发布时间: 5年前

穿越时空 AI代我告诉你:“爱你何止三千遍”

铅笔道专栏作者丨顶商投资

“ I love you three thousand.” 《复仇者联盟》4的末尾播放了一段钢铁侠牺牲前的录像带,立体投影下的托尼·史塔克深情款款地说。 影片 工作室 ,酷炫的全息投影显示不仅可以多样化地展示图像,三维空间浮空操作的方式也有很好的操作体验。

立体投影、全息投影,AI交互,影片中的黑科技在现实中得以不断实现,贴近现实生活。

时间追溯,自从Alpha Go击败韩国棋手李世石之后,人工智能将成为未来科技发展的趋势这一点已经被世人所承认。在人工智能的热潮真正到来的今天,人工智能究竟怎样改变人们的生活成为了全世界需要思考的新问题。

目前的人工智能主要在语音、自然语言和视觉方向发展比较迅速,其中最成熟的就是视觉技术,国内外的市场占比都超过了40%。

穿越时空 AI代我告诉你:“爱你何止三千遍”

那么,视觉技术为什么会发展的比较快呢?这主要有两方面的原因:一方面是视觉技术本身针对的图像识别相对比较直观,图像的色彩、灰度、空间等都是可以量化的特征,对于人工智能的训练和推理所需要的mapping比较契合;另一方面是视觉技术属于感知和认知信息的首要方式。根据人类获取信息的途径来看,视觉占据了人类信息获取的80%。而计算机视觉技术不仅可以替代人眼,还能够做到很多人眼所不能做到的高速、高精度和高适应性的视觉识别。

那计算机视觉到底怎么改变了我们的生活呢?也许是支付宝的刷脸支付,也许是手机的脸部识别,也许是各种各样App里的美颜功能……

但是,事实上,在这些消费级的计算机视觉不断出现在我们身边时,工业领域早就已经大规模应用计算机视觉技术,并且帮助企业提高生产效率,较低人力成本,减少了生产过程中的错误,为企业创造了巨大的价值。

当计算机视觉被应用到工业领域时,最具优势的应用形式就是工业机器的3D视觉检测。在工业发展迅速的今天,依靠人工进行产品的缺陷检测,不仅人力成本巨大,而且对检测人员的重复劳动所带来的视觉疲劳问题也得不到解决,尤其是在汽车和消费类电子行业,出货量巨大,对产品精度的要求又很高。单纯依靠人工,效率和准确率都得不到保障。而3D计算机视觉的出现,很好地解决了这一痛点。

3D计算机视觉技术 路径

那么计算机视觉究竟是怎么做到比人眼更快更准确的呢?首先需要了解现有的3D计算机视觉技术。

穿越时空 AI代我告诉你:“爱你何止三千遍”

目前主流的3D计算机视觉有三种技术路径:双目法、结构光和TOF。

双目法是指采集图像中的特征点,构建物体的几何模型,这种方法诞生最早,应用最久也最广泛。因为双目法采集的是正常摄像头所拍摄到的画面,这对硬件的要求较小,成本也最低。不过双目法以2D图片为识别对象,特征较少,从精准度上来说,也是最低的。不过也正是它不需要专业设备即可识别图片的特性,决定了它具有极强的延展性和丰富的应用场景。

结构光目前已经应用在OPPO R11/R15、iPhone X中,这种技术采样准确,识别精度也相当高,在设备和算法的支持下,即对物体材料也能够识别。3D结构光检测技术利用空间位置编码技术结合三角测量法可实现3D形貌的精确检测,具有速度快、部署效率高、光学结构简单的优点。

TOF是飞行时间(Time of Flight)技术的缩写,即传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄物体的距离,以产生深度信息。简单来说就是,发出一道经过处理的光,碰到物体以后会反射回来,捕捉来回的时间,因为已知光速和调制光的波长,所以能快速准确计算出到物体的距离。TOF技术优势在于成本低,测量距离和抗干扰能力也强于结构光技术。但TOF分辨率低于结构光,其精准度不及结构光。

就目前工业生产检测所需的精度要求来看,产品的误差范围要求都是微米级,工作环境也要求所采用的技术适应性要强。不难发现,3D结构光是最适合工业级别的3D视觉检测的。也正因为3D计算机视觉在工业生产中的重要作用,目前已经开发出基于3D计算机视觉的专用AI芯片(FPGA),该技术利用FPGA实现动态视觉采集与分析处理,在成像过程中仅关注图像的变化部分,极大降低数据带宽消耗,从而大幅提升图像的处理速度。而计算机视觉技术的进一步提升将在工业生产中的定位、引导、检测和质量控制等领域发挥更强的提升和替代作用。

解锁多样化应用场景

安全支付、三维建模、游戏互动、数据采集,光学识别技术在拍照、美颜、视频、互娱、展览等领域落地应用。以下侧重从新零售、展览展示两个场景领域展开。

新零售。目前该领域与视觉相关的主要包括人脸识别支付、商家结算收银。而在结算这块,相关的还有RFID、重力感应等方式。RFID射频设别技术与AI视觉识别支付的区别,可以从有无RFID标签,摄像头等外部功能来辨别。但现有视觉识别结算技术在物品叠放、超越视觉区域等方面仍然存在局限。此时便需要其他技术如重力感应等来辅助确认。

展览展示。广告传媒、娱乐互动领域的应用可以分为两个层面:第一层面单向视觉传播;第二层面传感器互动感应,人工智能算法及时互动。技术难易度上,后者双向技术复杂综合,而目前双向技术应用较多的主要通过红外线、雷达感应互动,此外语音互动也是一大互动入口点。即用户最终看到的是AI视觉识别+传感器+手势互动+语音互动+……技术应用叠加,人工智能化。

不论是复联里出现的3D投影对话,还是现实中结构光与TOF技术在手机端的应用,可以发现的是3D计算机视觉正深入多个场景,解锁多样化应用场景。此外,5G技术趋势也在为视觉识别影像技术的应用提供技术环境沃土,人工智能项目百舸争流。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Google's PageRank and Beyond

Google's PageRank and Beyond

Amy N. Langville、Carl D. Meyer / Princeton University Press / 2006-7-23 / USD 57.50

Why doesn't your home page appear on the first page of search results, even when you query your own name? How do other web pages always appear at the top? What creates these powerful rankings? And how......一起来看看 《Google's PageRank and Beyond》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

SHA 加密
SHA 加密

SHA 加密工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具