IT资讯 谷歌最强 AI 平台:第七代 TPU 架构 Superpod 曝光,9216 个芯片 + 192GB HBM

johnathan · 2025-08-26 10:00:14 · 热度: 26

8 月 26 日消息,科技媒体 WccfTech 昨日(8 月 25 日)发布博文,报道称在 Hot Chips 2025 大会上,谷歌详细披露第七代 TPU 架构“Ironwood”超级计算平台。

码农网援引博文介绍,谷歌于今年 4 月官宣第 7 代 TPU 架构,代号为 Ironwood,号称其性能是当前最强大超级 计算机 的 24 倍。

本次披露主要聚焦单个 Superpod 的 硬件 构成与架构设计。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心规格上大幅跃升。

单个 Ironwood Superpod 集成 9216 枚芯片,每片配备 192GB、带宽 7.4TB/s 的高带宽存储,峰值算力高达 4614 TFLOPs,意味着其单芯片性能较 TPU v4 提升超过 16 倍。

每四颗芯片组成一块 PCBA 主板,16 块 主板 构成一个机架,共 64 芯片节点,谷歌采用 InterChip Interconnect(ICI)技术,将多达 43 个 64 芯片模块互连,构建出拥有 1.8PB/s 网络带宽的集群。

在物理布局上,Ironwood 沿用过去三代的 3D Torus(立方环网)拓扑,每个逻辑单元为 4×4×4 节点阵列,即 64 芯片,封装于单个机架。

一个 Superpod 包含 144 个机架,还配备光学交换机机箱以实现跨模块互连,以及用于液冷的冷却分配单元(CBU)机架,互连方面为提高灵活性与可扩展性,采用 PCB 走线、铜缆和光纤的混合方式。

在机架设计上,顶部设有泄漏检测盘以监控液冷系统,下方是供电模块,具备两路电源域,将 416V 交流电经整流转换为直流电。整套系统支持液冷散热,满载运行功率可超过 100kW。

码农网简要介绍下上述专有名词:

  • TPU(Tensor Processing Unit)张量处理单元:谷歌专为机器学习任务设计的专用芯片,优化矩阵运算性能。

  • Superpod,就是一组连续的 TPU,通过专用网络组合在一起。

  • HBM(High Bandwidth Memory)高带宽存储:一种集成在芯片附近的高速显存,显著提升数据传输速率。

  • TFLOPs(Tera Floating Point Operations per Second)万亿次浮点运算 / 秒:衡量芯片浮点运算性能的指标。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,码农网所有文章均包含本声明。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册