IT资讯 谷歌最强 AI 平台:第七代 TPU 架构 Superpod 曝光,9216 个芯片 + 192GB HBM
8 月 26 日消息,科技媒体 WccfTech 昨日(8 月 25 日)发布博文,报道称在 Hot Chips 2025 大会上,谷歌详细披露第七代 TPU 架构“Ironwood”超级计算平台。
码农网援引博文介绍,谷歌于今年 4 月官宣第 7 代 TPU 架构,代号为 Ironwood,号称其性能是当前最强大超级 计算机 的 24 倍。
本次披露主要聚焦单个 Superpod 的 硬件 构成与架构设计。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心规格上大幅跃升。
单个 Ironwood Superpod 集成 9216 枚芯片,每片配备 192GB、带宽 7.4TB/s 的高带宽存储,峰值算力高达 4614 TFLOPs,意味着其单芯片性能较 TPU v4 提升超过 16 倍。
每四颗芯片组成一块 PCBA 主板,16 块 主板 构成一个机架,共 64 芯片节点,谷歌采用 InterChip Interconnect(ICI)技术,将多达 43 个 64 芯片模块互连,构建出拥有 1.8PB/s 网络带宽的集群。
在物理布局上,Ironwood 沿用过去三代的 3D Torus(立方环网)拓扑,每个逻辑单元为 4×4×4 节点阵列,即 64 芯片,封装于单个机架。
一个 Superpod 包含 144 个机架,还配备光学交换机机箱以实现跨模块互连,以及用于液冷的冷却分配单元(CBU)机架,互连方面为提高灵活性与可扩展性,采用 PCB 走线、铜缆和光纤的混合方式。
在机架设计上,顶部设有泄漏检测盘以监控液冷系统,下方是供电模块,具备两路电源域,将 416V 交流电经整流转换为直流电。整套系统支持液冷散热,满载运行功率可超过 100kW。
码农网简要介绍下上述专有名词:
TPU(Tensor Processing Unit)张量处理单元:谷歌专为机器学习任务设计的专用芯片,优化矩阵运算性能。
Superpod,就是一组连续的 TPU,通过专用网络组合在一起。
HBM(High Bandwidth Memory)高带宽存储:一种集成在芯片附近的高速显存,显著提升数据传输速率。
TFLOPs(Tera Floating Point Operations per Second)万亿次浮点运算 / 秒:衡量芯片浮点运算性能的指标。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,码农网所有文章均包含本声明。
猜你喜欢: