内容简介:去年,Imagination失去最大客户苹果引发业界巨大的关注,最终Imagination被Canyon Bridge收购成为了一家中资公司。雷锋网消息,Imagination被收购之后财务非常稳健,并且越来越重视中国市场。12月4日,Imagination在深圳发布了最新的的神经网络加速器(NNA)架构PowerVR Series3NX和第九代GPU系列新品PowerVR 9XEP、 9XMP和9XTP。最新推出的PowerVR 3NX系列基于前代产品,Imagination Technologies视
去年,Imagination失去最大客户苹果引发业界巨大的关注,最终Imagination被Canyon Bridge收购成为了一家中资公司。雷锋网消息,Imagination被收购之后财务非常稳健,并且越来越重视中国市场。12月4日,Imagination在深圳发布了最新的的神经网络加速器(NNA)架构PowerVR Series3NX和第九代GPU系列新品PowerVR 9XEP、 9XMP和9XTP。
神经网络加速器提升PPA同时注重灵活性
最新推出的PowerVR 3NX系列基于前代产品,Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示:“PowerVR 3NX系列基于我们屡获殊荣的2NX系列产品,相比2NX系列,3NX系列实现了芯片面积40%、性能效率近60%的提升,同时降低了35%的带宽需求,可以满足汽车、移动设备、物联网等嵌入式设备市场的需求。”
Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse
Neal强调, 3NX系列在2NX系列之所以有明显的提升,是因为Imagination进行了多方面的改进和创新。但对于具体做了哪些改进和创新的问题,Neal对雷锋网表示更多细节不方便透露。
因此,我们只能从3NX系列提升了解Imagination的新品。相比2NX系列AX2145 1Tops和AX2185 4.1Tops的运算性能,3NX系列的两个同级别新核AX3145和AX3385的性能分别是1.2TOPS、 5TOPS,还有三个新核AX3125、AX3365、AX3595,对应的性能为0.6TOPS、2.4TOP、10TOPS。Imagination此次还推出了多核产品,性能从20TOPS到160TOPS不等。
还有值得一提的是,除了性能覆盖0.6TOPS到160TOPS满足应用的多样性需求,PowerVR 3NX-F(Flexible)可以提供更多的灵活性。之所以要推出这个架构,Neal表示有两方面的原因,一方面是可以让芯片设计公司在单核上做差异化,利用IP核构建神经网络加速器,而不需要把第三方GPU整合在一起,差异化对激烈的市场竞争而言非常关键;另一方面是神经网络行业正在快速发展,新技术、新框架需要可编程性和扩展性更强的SoC。
除此之外,3NX在安全性方面也有提升。同时,为迎合快速发展的市场,Imagination新的PowerVR工具也进行了多项扩展,为的是更好地映射新兴的网络模型、提供灵活性和性能优化的理想组合。
那么,满足AI需求硬件还是软件更加重要?Neal认为软件和硬件同等重要,硬件的异构可以实现更高效率,但缺少软件也没有意义。异构架构是Imagination拥抱AI的策略,软件方面Imagination的SDK里有Open API,塔建在Open CL之,C++语言就可以在异构的IP中运行,降低用户使用复杂性的同时最大化灵活性。
据雷锋网了解,Imagination的第一代神经网络加速器产品2NX系列已经授权的用户主要集中在移动设备和汽车市场,并且有两家中国的手机厂商也使用了2NX神经网络加速器。3NX除了移动和汽车两大市场之外,智能相机监控、消费电子(尤其是数字电视)、低功耗IoT智能设备都是关键市场。
另外,Imagination Technologies副总裁兼中国区总经理刘国军表示:“国内包括监控、手机、物联网领域的公司都在评估我们的神经网络加速器。我们也在发展中国的生态系统,与手机厂商、OEM厂商直接一起工作,了解他们要做的AI应用,我们设计出更合适的AI的处理器去满足,我们从早期就介入。”
Imagination Technologies副总裁兼中国区总经理刘国军
这就意味着,AI的发展需要软件和硬件更好地结合,Imagination与手机和OEM厂商的紧密协作AI应用已经开始影响AI芯片的架构设计,性能、功耗、芯片面积、灵活性都是AI芯片的关键特性。
第九代PowerVR GPU带宽和内存占用率至少节省50%
AI芯片市场的竞争格局未定,在移动GPU领域Imagination具备领先优势,PowerVR GPU的持续迭代是其保持竞争优势和拓展市场的关键。Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon指出,如今手机游戏市场的改变以及特殊的应用需求让GPU朝着成本更低,性能更高、更多灵活性以及更小芯片面积的方向发展。为了应对市场的趋势,Imagination的第九代PowerVR GPU新品包含 9XEP、 9XMP和9XTP,满足从低端到高端市场的需求。
Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon
据介绍,XEP主要关注GUI,也就是图像界面,包括休闲游戏、填充力密度,最小面积上提供最高的填充率。9XEP可以实现每个时钟周期1-8个像素,14-64个FP32 OPS的性能,主要面向数字电视和低端手机市场。9XMP可以在最低的面积有最佳的计算能力,性能为每个时钟周期4-8个像素,128-256 FP32 Ops,主要是瞄准中端手机市场和低端汽车市场。9XTP是旗舰型产品,在密度、功率、效率方面都有提升,并且架构也是可伸缩的,性能可以达到每时钟周期8个像素,192FP32 Ops,甚至超更高。
另据了解,9XEP和9XMP都基于Rogue架构,这个架构已经非常成熟,不过9XEP架构进行了微调,9XMP将每个集群的ALU扩展了2倍,位宽从16位扩展到32位,目的都是提高性能。9XTP则是基于Furian架构,该架构由Rogue演变而来。Graham Deacon表示,虽然Furian架构还不够成熟,但这也意味着我们还有很多机会进行改进,也能让这个架构更具灵活性。
虽然架构有所不同,但相同的是新GPU都采用PVRIC4技术,PVRIC4是Imagination图像压缩技术的最新一代,可实现随机访问视觉无损图像压缩,确保带宽和内存占用率至少节省50%,并使系统能够去克服性能带宽限制。与Imagination的上一代GPU相比,新的GPU系列还提供性能/功耗/面积和时序优化,以及包括可降低合成的工作负载带宽和成本的全新alpha缓冲/单元模块提示等在内的新功能。
从Graham Deacon展示的图中可以看到,借助9XMP可以提升图像的质量,让游戏中的图像细节更加真实,不过对比三款新GPU的显示效果,其显示的图像细节和效果也有着容易分辨的差别。
还需指出的是,PowerVR GPU利用了一项被称为分块延迟的渲染(TBDR)技术,TBDR保证了几乎所有的图形处理都在“芯片上”完成,并将存储带宽的需求降至最低。基于多方面的优势,过去的25年PowerVR GPU已经支持了最受欢迎的游戏和街机系统,并推动了移动设备的图像革命。如今PowerVR GPU已经在汽车虚拟仪表、娱乐系统中占有非常高的市场份额,手机、数字电视也将继续是PowerVR GPU的重要市场。
还有,新的GPU可以与PowerVR Series3NX神经网络加速器配对使用。刘国军也表示:“中国许多做汽车电子的公司以前在后装市场,现在他们想要进入前装市场,产品就需要满足车规的要求。因此,我们会与芯片设计公司和Tier1合作,把我们的GPU和神经网络加速器都放到车规的生态里,共同满足汽车市场的需求。”
雷锋网在采访中还了解到,Imagination可能会宣布推出面向AI训练的GPU。对于目前比较火热RISC-V架构的支持,Imagination的态度是作为GPU IP的提供商会支持不同的CPU架构,目前他们的客户有两家都在使用RISC-V。
雷锋网 (公众号:雷锋网) 小结
作为IP提供商,Imagination关注的是提供基础框架,并能够实现最优化的功耗和性能满足芯片设计公司和应用的需求。作为以技术见长的公司,Imagination并没有因为失去大客户而一直摇摆不定,在被中资收购后以及资本的支持下保持着产品的更新。如今PowerVR GPU已经在汽车市场取得了不错的成绩,手机市场也能让其客户与高通竞争。
至于神经网络加速器,正如刘国军所说,每家厂商的起点不一样,大家也是传承自己的技术推出神经网络加速器。虽然手机厂商也都纷纷自主研发NPU,有可能是在用第一代产品去市场试水发现优缺点,未来为更好满足AI应用的需求,具备更好性能和功耗指标的AI芯片必不可少,也可能使用第三方的IP。
相关文章:
Imagination推出神经网络加速芯片AX2185和AX2145
Imagination推出PowerVR Automotive计划,专为汽车行业打造GPU解决方案
雷锋网原创文章,未经授权禁止转载。详情见 转载须知 。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- Docker Hub 镜像加速器
- 矩阵乘法加速器的设计框架
- AI加速器的新选择
- CDN & 游戏加速器,两者是一个原理吗?
- Docker - 配置阿里云的Docker镜像加速器
- 基于FPGA的深度学习加速器综述:挑战与机遇
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Pattern Recognition and Machine Learning
Christopher Bishop / Springer / 2007-10-1 / USD 94.95
The dramatic growth in practical applications for machine learning over the last ten years has been accompanied by many important developments in the underlying algorithms and techniques. For example,......一起来看看 《Pattern Recognition and Machine Learning》 这本书的介绍吧!