在上月的 VISION 会议上,英特尔宣布了 Gaudi2 硬件。作为该公司旗下 Habana Labs 用于训练和推力的第二代加速器,它也同步迎来了开源 Linux 内核驱动 / 用户空间软件堆栈更新。英特尔宣称 Gaudi2 的 AI 训练性能是英伟达 A100 竞品方案的两倍,且芯片制造工艺也从初代 16nm 升级到了 7nm 。
(via Phoronix)
此外 Gaudi2 迎来了 3 倍的 TPC 改进,32GB HBM2 高带宽内存增加到了 96GB HBM2e、SRAM 缓存也翻倍到了 48MB,辅以 24×100 GbE 连接,但热设计功耗(TDP)也从 350W 提升到了 600W 。
在发布一个多月后,Habana Labs Gaudi2 的开源驱动程序工作也在有条不紊地推进中。而当前的 Gaudi2 支持,正好建立在现有的 Gaudi 和 Goya 加速器内核驱动程序(habanalabs)的基础上。
Habana.ai 白皮书揭示了与 Gaudi2 架构相关的更多信息
从驱动角度来看,Gaudi2 与初代非常接近,整体架构也是一个样。启用 Gaudi2 大约需要 15.8 万行新内核代码,但其中大部分属于“头文件”(AMDGPU 内核驱动程序也有大量头文件)。
截至目前,新的头文件主要代表了该主线驱动程序启用 Gaudi2 支持所需的大部分代码变动。除了内核驱动工作,英特尔今日还发布了 TPC_LLVM 1.1(针对 Habana Labs 加速器的新版开源编译器)。
TPC_LLVM 1.1 添加了对 Gaudi2 及新的 Greco ASIC 编译器的支持
与此同时,英特尔也在努力更新 SynapseAI Core for Gaudi2 开源组件,新补丁系列用于新的 Gaudi2 内核驱动程序代码。
鉴于新版是从相同的 Gaudi 架构演变而来,预计后续的代码审核工作也会相当顺利,那样我们就有望在 v5.20 内核周期内尽快添加对 Intel Gaudi2 的支持。
最后,英特尔还在 VISION 2022 会议上宣布了从 Goya 升级而来、针对深度学习应用而作出效率优化的 Greco 加速卡。
访问购买页面:
英特尔旗舰店
为您推荐与 英特尔 相关的帖子:
- 英特尔发布新固件修复卡死 BUG,恢复至强 Sapphire Rapids 处理器供货
- 英特尔发布微码更新以修复高危漏洞,10 代酷睿后续 CPU 几乎均受影响
- 英特尔 i9-14900KS 处理器曝光,睿频 6.2GHz
- 英伟达更新数据中心 GPU 路线图,新一代 GB200 / GX200 将于 2025 年发布
- 英特尔发布 4887 beta 显卡驱动:支持新款 A580 显卡
- 英特尔酷睿 i7-14700KF 处理器跑分曝光:单核提高 10%、多核提高 20%
- 消息称英特尔新款 i5-14400 处理器有 B0 和 C0 两版
- 英特尔酷睿 i9-14900K 现身 Geekbench,单核比 13900K 强约 6%
- 英特尔酷睿 i9-14900K 6 GHz CPU 跑分曝光,单核比 13900K 快 9%
- 英特尔宣布加入 PyTorch 基金会,共同助力 AI 发展
- 英特尔酷睿 14 代处理器非 K 型号曝光:i9-14900 可达 5.8GHz
- 英特尔酷睿 14 代桌面处理器非 K 型号曝光:i7 增加 4 个小核
- 英特尔酷睿 14 代桌面处理器 3 款 K 型号参数曝光,i9-14900K 可能只有 6.0GHz
- PC 出货量下滑,消息称英特尔今年连续两次降低 12 代酷睿价格
- 中国安全研究人员发现部分英特尔 CPU 存在严重漏洞, i7-6700/7700 可 100% 复现
- 英特尔发布 4311 显卡驱动:优化《边境》《我的世界:传奇》等游戏
- 英特尔调整数据中心 GPU 系列,砍掉 Max GPU 1350
- 英特尔为 Linux 6.4 引入对下一代 Arrow Lake 和 Lunar Lake 处理器的支持
- 英特尔确认 14 代酷睿处理器基于 Meteor Lake 架构,而非 Raptor Lake Refresh
- 英特尔 14 代移动酷睿处理器现身数据库:4+8 核,核显将迎提升
- 英特尔停产多款 11 代酷睿移动处理器:含 i5-11400H / i7-11800H
- 消息称英特尔计划 2024、2026 年推出的新 GPU 将由台积电代工
- 英特尔宣布 54 亿美元收购 Tower 半导体已过去 13 个月,官方称有信心在 6 月底之前完成收购
- 英特尔 Granite Rapids、Sierra Forest 至强 CPU 曝光:支持 12 通道 DDR5,TDP 高达 500W
- 英特尔更新 HPC GPU 路线图:Rialto Bridge 取消开发,Falcon Shores XPU 推迟至 2025 年
- 英特尔 i9 13980HX 性能确实比苹果 M2 Max 强,但代价是功耗、发热、噪音