内容简介:智东西(公众号:zhidxcom)文 | 心缘
智东西(公众号:zhidxcom)
文 | 心缘
智东西5月22日报道,今天,美国eFPGA IP企业Achronix半导体公司在京发布其全新Speedster7t FPGA系列产品,基于一种高度优化的全新架构,采用台积电7nm FinFET工艺制造,主要针对AI/ML、高带宽数据、网络处理等方面加速。
FPGA即现场可编程逻辑阵列,特点是通用性,可以按照设计者的需要进行灵活编程,比专用芯片(ASIC)更加灵活。在数据中心,FPGA作为替代GPU、ASIC的另一种方案正得到越来越多的应用。
和其他FPGA供应商不同的是,Achronix是唯一一家既提供独立FPGA芯片,又提供Speedcore嵌入式FPGA(eFPGA)IP的半导体公司。
Achronix公司董事长兼首席执行官Robert Blake、亚太区总经理罗炜亮及中国区同事来到现场,介绍该公司革新的FPGA产品以及在中国市场的最新进展和策略。
据Robert Blake介绍,该产品具有针对高带宽和AI/ML应用进行优化的全新机器学习处理器(MLP),以及革命性的新型二维片上网络2D NOC,将FPGA与ASIC的布线结构和计算引擎结合,能提供与ASIC如出一辙的性能、可简化设计的FPGA灵活性和增强功能,远超传统的FPGA解决方案。
此外,Achronix将在今年第四季度提供相应的评估器件和加速卡。
一、 Speedster7t FPGA+ 家族
Achronix着眼于解决高性能计算、网络存储加速、超高带宽网络处理、机器学习等应用面临的挑战,提供的产品包括可编程的FPGA结构、具有硬连线系统级模块的分立式高性能和高密度FPGA、数据中心和HPC硬件加速器板,以及支持所有Achronix产品的EDA软件。
该公司总部位于美国加利福尼亚州圣克拉拉市,在美国、欧洲和中国都设有销售办公室和代表处,在印度班加罗尔设有一间研发和设计办公室。
Archronix目前有三个产品系列:独立芯片,嵌入式FPGA内核,和客户的芯片进行组合封装。
新发布的Speedster7t FPGA系列产品专为高带宽数据加速和AI/ML而设计,具有一个革命性的全新二维片上网络(2D NoC),以及一个高密度全新机器学习处理器(MLP)模块阵列,高效提升运算能力。
Achronix公司董事长兼首席执行官Robert Blake表示,Speedster7t是Achronix史上最令人激动的发布,代表了建立在4个架构代系的硬件和软件开发基础上的创新和积淀。Speedster 7t是灵活的FPGA技术与ASIC核心效率的融合,提供了一个全新的“FPGA+”芯片品类,可将高性能技术的极限大大提升。
Achronix工程团队重新构想了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口(I/O),以实现数据密集型应用吞吐量最大化,应用场景包括高性能AI/ML应用、数据中心的边缘计算、网络处理、5G网络处理、存储、IP授权技术。
Speedster7t FPGA系列产品经历3年研发,采用台积电7nm FinFET工艺制造,以接收来自多个高速来源的大量数据而设计,同时还需将数据分发到可编程片上算法性和处理单元中,然后以均可能低的延迟来提供那些结果。
新一代FPGA产品还包括高带宽GDDR6接口、400G以太网端口和PCl Express Gen5等接口,所有单元互连已提供ASIC级带宽,同时保留FPGA的可编程性。
二、 Speedster7t FPGA 的六大优势
具体来看,Speedster7t FPGA有六大优势,包括创新的机器学习处理器(MLP)、高带宽片上网络(NOC)以及第一个支持GDDR6高带宽存储器等。
1、对计算性能高度优化
Speedster7t FPGA的核心是全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列,可提供业界最高的、基于FPGA的计算密度,每个乘累加单元支持最多32个乘法器。
MLP是高度可配置、计算密集型的单元模块,内嵌缓存,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。
MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750MHz的最高性能将数据传送到MLP。
这种高密度计算与高性能数据传输的结构使得处理器逻辑阵列能提供基于FPGA的最高可用计算能力以每秒万亿次运算量数量为单位(TOPS)。
2、世界级带宽
高性能计算和机器学习系统的另一关键是高片外存储器带宽,以为多个数据流提供存储源和缓冲。
Speedster7t FPGA是第一个也是当前唯一支持GDDR6高带宽存储器的FPGA,GDDR6是具有最高带宽的外部存储器件,每个GDDR6存储控制器能支持512Gbps的带宽。
相比基于HBM的FPGA,采用GDDR6的FPGA方案成本低了一半,并且更加灵活,允许客户选择不同容量和带宽。
另外,Robert Blake在接受采访时补充说,做这种高带宽存储FPGA方案,Achronix在业界的成本是最低的。
Speedster7t FPGA器件中含多达8个GDDR6控制器,可支持4 Tbps的GDDR6累加带宽,并以很小的成本可提供与基于FPGA等效存储带宽。
美光已携手Achronix去实现全球第一个面向高带宽存储需求而直接加载了GDDR6的FPGA产品。
美光计算与联网业务部营销副总裁Mal Humphrey认为,这种创新的可扩展解决方案,将推动AI领域的差异化,其中异构计算可选方案和高性能的存储是加速获得数据内涵的必需部分。
3、高速接口
此外,Speedster7t FPGA还包括业界最高性能的接口端口,以支持极高带宽的数据流,能支持极高带宽的数据流。
Speedster7t FPGA器件拥有72个业界最高性能的SerDes,可达到1到112 GBps的速度。其前向纠错(FEC)的硬件400G以太网MAC,支持4x100G和8x50G的配置,每个控制器有8或16个通道的硬件PCI Express Gen5控制器。
4、高带宽片上网络(NOC)
Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储接口,就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,可实现高效的数据移动。
Speedster7t的NOC支持片上处理引擎间所需的高带宽通信,其中每一行或每一列都可作为两个256位实现,单向的、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512Gbps的数据流量。
NOC使得Speedster极大简化了高速数据移动,确保数据流可以轻松定向到整个FPGA结构中的任何自定义处理引擎,同时不需要使用任何FPGA内部资源。
此外,NOC消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。该高性能网络不仅可以提高Speedster7t FPGA的总带宽总量,还能在降低功耗的同时提高有效LUT容量。
当被问及和竞争对手NOC的差异点时,Robert Blake表示,其NOC可能比竞争对手的速度快10倍。
5、安全防护功能
据悉,Speedster7t FPGA采用最先进的比特流安全保护功能,具有多层防御能力,可保护比特流的保密性和完整性,足以有效应对第三方攻击。
密钥基于防篡改物理不可克隆技术(PUF)进行加密,比特流由256位的AES-GCM加密算法进行加密和验证。
为防止来自旁侧信道的攻击,比特流被分段,每个数据段使用单独到处的密钥,且解密硬件采用差分功率分析(DPA)计数器措施。
除此之外,2084位RSA公钥认证协议被用来激活解密和认证硬件。用户可确信当他们加载安全比特流时,它是预期的配置,因为它已经通过RSA公钥、AES-GCM私钥和CRC校验进行了身份验证。
6、经验证的、可向低成本ASIC转换的途径
Speedcore eFPGA IP中采用了与Speedster 7t FPGA中使用同一种技术,可支持从Speedster7t FPGA到ASIC的无缝转换。
对ASIC的转换而言,固定功能可被固化到ASIC结构中,从而减小芯片面积、成本和功耗。
当使用Speedcor eFPGA IP将Speedster7t FPGA转换为ASIC,客户有望节省50%的功耗,并降低90%的成本。
三、提供 ACE 设计工具,开发板今年 Q4 面世
Speedster7t FPGA器件的大小范围为从363K至2.6M的6输入查找表(LUT),现已可提供支持所有Achronix产品的ACE设计工具,可支持包括Speedcore eFPGA和Speedchip FPGA多晶粒封装芯片(Chipset)。
第一批用于评估的器件和开发板将于2019年第四季度提供。
根据Robert Blake的说法,Achronix是家小公司,不会像竞争对手那样做很多不同品类的产品,而是会按照客户需求,在高端领域提供分立式FPGA,同时为需要低成本的客户提供高性能FPGA IP的授权。
另外,Achronix的FPGA采用单一架构而非异构,这样客户可以用自己的CPU和Achronix的FPGA分别实现部分性能。
结语: FPGA 市场未来几年有望高速增长
据研究机构Semico Research的预测,FPGA在AI应用方面的市场规模将呈现高速增长,在未来4年增长3倍,达到52亿美元。
FPGA市场长期由赛灵思和英特尔Altera两大巨头占据大部分市场,随着AI、大数据的快速爆发,以FPGA两大巨头为代表的FPGA供应商们均开始在新的应用场景找到市场空间。
相比传统FPGA,越来越多的ASIC技术正融合到FPGA中,比如Speedster7t FPGA器件中的MLP、NOC都是用ASIC技术来实现的。经过融合的FPGA比原来的FPGA能提供更高的性能和更低的功耗。
面对未来的增量市场,FPGA领域的玩家正在通过对工艺技术、架构设计、数据移动、安全防护等方向的创新,为AI、5G、物联网、自动驾驶等快速变化的新兴市场提供更多的硬件选择。
以上所述就是小编给大家介绍的《Achronix推全新7nm FPGA,首度支持GDDR6高带宽存储》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 带你白嫖程序带宽限制命令 Trickle
- 全球网络带宽告急:Netflix被迫在更多国家降低画质
- USB4 规范发布,双倍带宽,达到 40 Gbps
- 开源编解码器 SOLO 源码解读(一):带宽扩展
- Tor 0.4.0.1 alpha 发布,新增带宽保护功能
- Agileutil v0.0.10 发布,最高可减少 75% 的网络带宽占用!
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
追踪Linux TCP/IP代码运行
秦健 / 北京航空航天大学出版社 / 2010-4-1 / 69.00元
本书以应用程序为线索,详细描述了数据包在协议栈的分段、重组、发送、接收过程,同时分析了路由的初始化和设置过程,主要包括socket应用程序、 TCP/IP协议、路由、通知链、邻居子系统等内容。全书涵盖了协议栈的全部知识点,对于广大的读者来说这是一本极其难得的技术资料。同时,书中论述了网络设备的工作原理,解释了RTL8169和嵌入式CS8900、DM9000网卡设备的核心过程。一起来看看 《追踪Linux TCP/IP代码运行》 这本书的介绍吧!