内容简介:上周,联发科在深圳发布了主打AI性能的新一代Helio P90系统单芯片,搭载全新超强AI引擎APU2.0,在这款被称之为“全球首款AI识物芯片”的背后,站着一众人工智能视觉公司,包括商汤、旷视、码隆科技等。识“物”正在成为AI公司的新战场,尤其是一些从人脸识别起家的AI公司而言,在人脸识别陷入同质化阶段时,识“物”正在成为新的技术蓝海。“从数量来说,包括商品在内的物品,要远比人脸更多,想象空间也更大。”码隆科技副总裁刘念一语道破AI公司的识物“玄机”。计算机视觉领域的技术广泛,其中人脸图像识别是先行普及
上周,联发科在深圳发布了主打AI性能的新一代Helio P90系统单芯片,搭载全新超强AI引擎APU2.0,在这款被称之为“全球首款AI识物芯片”的背后,站着一众人工智能视觉公司,包括商汤、旷视、码隆科技等。
识“物”正在成为AI公司的新战场,尤其是一些从人脸识别起家的AI公司而言,在人脸识别陷入同质化阶段时,识“物”正在成为新的技术蓝海。“从数量来说,包括商品在内的物品,要远比人脸更多,想象空间也更大。”码隆科技副总裁刘念一语道破AI公司的识物“玄机”。
人脸识别领域同质化竞争加剧
计算机视觉领域的技术广泛,其中人脸图像识别是先行普及的方向,并先后涌现出云从、商汤、旷视、依图、云天励飞等人工智能创业公司,在AI热潮中受到追捧。
云从科技正是其中的典型。其以人脸识别为核心技术入口,乘着“AI的翅膀”,在银行、公安、民航等领域不断快速扩张,还通过参与公安部重大课题研发“火眼人脸大数据平台”等智能化系统,产品在全国大部分省(市、区)上线“实战”。
不过,在人工智能框架开源、算法越来越成熟的情况下,人脸识别领域的同质化竞争更加激烈,一些AI公司亟待拓宽“护城河”。
“人脸识别很难保持持久的领先优势。”云从科技高级副总裁伍楚芸在接受南方日报记者专访时表示,如果单纯在人脸识别上竞争,虽然一开始差距挺大的,但到最后,只是99.8%和98.9%准确率的差异,大部分应用场景上这点差异率影响并不大,而云从要做的是从感知、认知到决策的闭环,围绕“人”这个主题,不单单只是识别人脸,还要认识这个人,从他们的神态、步态、衣着等领域进行识别,从而更好地熟悉这个人。
AI识物成商业化新方向
对不少AI公司来说,人脸识别只是视觉AI领域中一项视觉认知技术,AI物体识别如今已广泛应用在智能零售的商品识别,智能冰箱的食材识别与智能汽车的道路标识、行人、车辆等识别。
有鉴于此,AI芯片尤其是AI识物芯片受到青睐,提供支持的技术力量也风起云涌。联发科无线通讯事业部产品总监李彦辑在发布会上介绍,“联发科P90此次搭载的NeuroPilot2.0平台是更加完整开放的EDGE AI平台,不论是和国外最前沿的谷歌、微软合作,还是和国内最领先的商汤、旷视、虹软、码隆深入共同探索,最终目的是一起实现更好的AI用户体验”。
作为深圳一家本土成长起来的AI视觉公司,码隆科技则为这款芯片提供了AI物体识别算法,在Helio P90高性能 APU下实现了30毫秒的实时识物,解决了高延迟的用户痛点。不仅如此,通过将AI算法在芯片中进行集成,可以最大限度地提高视觉识别的速度、稳定性、安全性和隐私性,并在应用场景上拥有很大的扩展空间,从而推动手机等智能终端,以及终端应用实现更好的用户体验。
目前,码隆科技嵌入Helio P90芯片的物体识别技术已经集成了针对服饰的识别,可以准确识别衣物的类别、款式、风格、元素等特征,将有力地支持Helio P90从本地端更好地服务于智能手机厂商以及视频和图像等应用领域。
物体识别技术,尤其是商品识别技术,正作为人工智能视觉领域的重要商业化方向,在零售、工业、芯片、智能终端等领域都有广阔的应用空间和发展前景。
自助结账、智能货柜、无人超市……在人工智能AI应用的诸多场景中,零售行业是人们感知最为真切的领域。在人工智能的展望场景中,零售是现阶段AI视觉技术运用较为成熟的领域,随着线上线下业务流程的结合,零售行业也是未来5-10年内智能升级发生的地方。
对图片视频分析将催生新巨头
AI识物技术,也让AI公司不满足于新兴初创公司的标签,而有了更大的挑战“野心”。
“我们知道在文本信息的时代,谷歌拥有最厉害的文本信息分析技术,因此它成为了巨头。而5G时代,图片、视频分析的庞大技术需求,也肯定会催生出大体量公司,地位不亚于现在的谷歌。”商汤科技联合创始人、副总裁杨帆告诉南方日报记者,目前计算机视觉产业从视频中提取的要素通常有人脸、人体、衣物、步态、车辆等,未来,视频将成为最重要的信息载体,因为它涵盖的有效信息量最多。
有鉴于此,近年来商汤已经开始在多方面进行探索,并提供了一系列解决方案。例如针对传媒行业,包括为长视频、影视剧或图片提供视频标签、明星识别、商标识别和服饰识别等功能,推动媒体资产精细化管理,助力客户在理解图像及视频内容业务上实现智能化;能够实现色情内容过滤、暴力识别、广告过滤、敏感文字过滤等全方位审核过滤,为视频图片内容审查提供高效的智能工具。
尽管市场非常广阔,但难点也非常大。“对于训练数据的收集是最大难点。”杨帆表示,个体识别不太可能,也没太大意义;品类识别的难点则在于品类太多,相当于每一个品类的物体识别做了一个独立的人脸检测模型。
刘念也表示,识别物也遭遇到品类繁多的挑战,即便是同一种物还会产生诸多变形,例如针对衣服这样的柔性物体,可以想象一个服装模型就是一个时尚专家,衣服变成什么样它都能识别出来,这就非常考验AI公司与产业相结合的精细化程度。“我们一般一个大分类的物品会单独建模,比如服装、家居、商超商品等,这个模型在不同场合可以复用。如果精确度要求特别高的还会再单独细分建模。AI技术一定要与产业化结合,不能玩虚的。”
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 5月书讯丨10本重磅新书加入战场
- 吐槽:Python 正在从简明转向臃肿,从实用转向媚俗
- 深度学习的未来战场:揭秘半定制芯片FPGA
- 秋招还有 1 个月到达战场,请做好准备 !
- GandCrab后继有人?Sodinoki勒索软件接管战场
- 终于来了!Istio 1.0 还有 5 天到达战场!
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
部落:一呼百应的力量
高汀 (Godin.S.) / 刘晖 / 中信出版社 / 2009-7 / 26.00元
部落指的是任何一群人,规模可大可小,他们因追随领导、志同道合而相互联系在一起。人类其实数百万年前就有部落的出现,随之还形成了宗教、种族、政治或甚至音乐。 互联网消除了地理隔离,降低了沟通成本并缩短了时间。博客和社交网站都有益于现有的部落扩张,并促进了网络部落的诞生——这些部落的人数从10个到1000万个不等,他们所关注的也许是iPhone,或一场政治运动,或阻止全球变暖的新方法。 那么......一起来看看 《部落:一呼百应的力量》 这本书的介绍吧!