铅笔道专栏作者丨顶商投资
“ I love you three thousand.” 《复仇者联盟》4的末尾播放了一段钢铁侠牺牲前的录像带,立体投影下的托尼·史塔克深情款款地说。 影片 工作室 中 ,酷炫的全息投影显示不仅可以多样化地展示图像,三维空间浮空操作的方式也有很好的操作体验。
立体投影、全息投影,AI交互,影片中的黑科技在现实中得以不断实现,贴近现实生活。
时间追溯,自从Alpha Go击败韩国棋手李世石之后,人工智能将成为未来科技发展的趋势这一点已经被世人所承认。在人工智能的热潮真正到来的今天,人工智能究竟怎样改变人们的生活成为了全世界需要思考的新问题。
目前的人工智能主要在语音、自然语言和视觉方向发展比较迅速,其中最成熟的就是视觉技术,国内外的市场占比都超过了40%。
那么,视觉技术为什么会发展的比较快呢?这主要有两方面的原因:一方面是视觉技术本身针对的图像识别相对比较直观,图像的色彩、灰度、空间等都是可以量化的特征,对于人工智能的训练和推理所需要的mapping比较契合;另一方面是视觉技术属于感知和认知信息的首要方式。根据人类获取信息的途径来看,视觉占据了人类信息获取的80%。而计算机视觉技术不仅可以替代人眼,还能够做到很多人眼所不能做到的高速、高精度和高适应性的视觉识别。
那计算机视觉到底怎么改变了我们的生活呢?也许是支付宝的刷脸支付,也许是手机的脸部识别,也许是各种各样App里的美颜功能……
但是,事实上,在这些消费级的计算机视觉不断出现在我们身边时,工业领域早就已经大规模应用计算机视觉技术,并且帮助企业提高生产效率,较低人力成本,减少了生产过程中的错误,为企业创造了巨大的价值。
当计算机视觉被应用到工业领域时,最具优势的应用形式就是工业机器的3D视觉检测。在工业发展迅速的今天,依靠人工进行产品的缺陷检测,不仅人力成本巨大,而且对检测人员的重复劳动所带来的视觉疲劳问题也得不到解决,尤其是在汽车和消费类电子行业,出货量巨大,对产品精度的要求又很高。单纯依靠人工,效率和准确率都得不到保障。而3D计算机视觉的出现,很好地解决了这一痛点。
3D计算机视觉技术 路径
那么计算机视觉究竟是怎么做到比人眼更快更准确的呢?首先需要了解现有的3D计算机视觉技术。
目前主流的3D计算机视觉有三种技术路径:双目法、结构光和TOF。
双目法是指采集图像中的特征点,构建物体的几何模型,这种方法诞生最早,应用最久也最广泛。因为双目法采集的是正常摄像头所拍摄到的画面,这对硬件的要求较小,成本也最低。不过双目法以2D图片为识别对象,特征较少,从精准度上来说,也是最低的。不过也正是它不需要专业设备即可识别图片的特性,决定了它具有极强的延展性和丰富的应用场景。
结构光目前已经应用在OPPO R11/R15、iPhone X中,这种技术采样准确,识别精度也相当高,在设备和算法的支持下,即对物体材料也能够识别。3D结构光检测技术利用空间位置编码技术结合三角测量法可实现3D形貌的精确检测,具有速度快、部署效率高、光学结构简单的优点。
TOF是飞行时间(Time of Flight)技术的缩写,即传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄物体的距离,以产生深度信息。简单来说就是,发出一道经过处理的光,碰到物体以后会反射回来,捕捉来回的时间,因为已知光速和调制光的波长,所以能快速准确计算出到物体的距离。TOF技术优势在于成本低,测量距离和抗干扰能力也强于结构光技术。但TOF分辨率低于结构光,其精准度不及结构光。
就目前工业生产检测所需的精度要求来看,产品的误差范围要求都是微米级,工作环境也要求所采用的技术适应性要强。不难发现,3D结构光是最适合工业级别的3D视觉检测的。也正因为3D计算机视觉在工业生产中的重要作用,目前已经开发出基于3D计算机视觉的专用AI芯片(FPGA),该技术利用FPGA实现动态视觉采集与分析处理,在成像过程中仅关注图像的变化部分,极大降低数据带宽消耗,从而大幅提升图像的处理速度。而计算机视觉技术的进一步提升将在工业生产中的定位、引导、检测和质量控制等领域发挥更强的提升和替代作用。
解锁多样化应用场景
安全支付、三维建模、游戏互动、数据采集,光学识别技术在拍照、美颜、视频、互娱、展览等领域落地应用。以下侧重从新零售、展览展示两个场景领域展开。
新零售。目前该领域与视觉相关的主要包括人脸识别支付、商家结算收银。而在结算这块,相关的还有RFID、重力感应等方式。RFID射频设别技术与AI视觉识别支付的区别,可以从有无RFID标签,摄像头等外部功能来辨别。但现有视觉识别结算技术在物品叠放、超越视觉区域等方面仍然存在局限。此时便需要其他技术如重力感应等来辅助确认。
展览展示。广告传媒、娱乐互动领域的应用可以分为两个层面:第一层面单向视觉传播;第二层面传感器互动感应,人工智能算法及时互动。技术难易度上,后者双向技术复杂综合,而目前双向技术应用较多的主要通过红外线、雷达感应互动,此外语音互动也是一大互动入口点。即用户最终看到的是AI视觉识别+传感器+手势互动+语音互动+……技术应用叠加,人工智能化。
不论是复联里出现的3D投影对话,还是现实中结构光与TOF技术在手机端的应用,可以发现的是3D计算机视觉正深入多个场景,解锁多样化应用场景。此外,5G技术趋势也在为视觉识别影像技术的应用提供技术环境沃土,人工智能项目百舸争流。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 何止伪装 全链路骗局让攻击者“两行泪”
- 穿越边界的姿势
- winrar 穿越目录漏洞分析
- 揭秘阿里测试技术最高奖项目——“时间穿越”
- 穿越:网络空间拟态防御这些年是怎么被“虐”的?
- AI 修复民国北京街景视频,火遍全网带你穿越
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。