IT资讯 英伟达 CUDA Tile IR 宣布开源:基于 MLIR 框架释放编程模型潜力,可惠及 AMD、Intel 等异构生态

elroy · 2025-12-26 10:40:05 · 热度: 10

12 月 26 日消息,英伟达 12 月 4 日发布了全新的 CUDA 13.1 并引入了一种名为 CUDA Tile 的全新 GPU 编程方式,这是自 2006 年 CUDA 平台问世以来规模最大、内容最全的一次功能扩展更新。

现在,英伟达取消其 CUDA Tile IR(Intermediate Representation)的专有许可,并宣布将其正式开源。该举措被视为 NVIDIA 近年来在 CUDA 生态中一次重要的开放动作。

码农网注意到,其相关代码已采用 Apache 2.0 许可证发布在 GitHub 上,这意味着开发者和研究人员可以在较为宽松的许可条件下使用、修改和分发相关代码。

从技术架构来看,CUDA Tile IR 基于 LLVM 项目中的 MLIR(Multi-Level Intermediate Representation,多层次中间表示)构建。这一点具有重要意义。

MLIR 已被多家厂商和项目用于 AI 与高性能计算领域:AMD 已在其计算与 AI 软件栈中使用 MLIR,谷歌 IREE 项目同样依赖 MLIR 支持多种 硬件 平台,英特尔也为自家硬件开发了 MLIR“方言”XeVM。此外,ONNX-MLIR、Torch-MLIR、MLIRE-AIE 等多种 IR 框架同样建立在 MLIR 体系之上。

由于 CUDA Tile IR 采用 MLIR 作为基础,其理论上具备“降级”或转换到其他后端的可能性,从而为未来在非 NVIDIA GPU 或加速器环境中支持相关计算模型提供技术基础。至少在短期内,CUDA Tile IR 的开源将有助于包括 ZLUDA 在内的相关兼容或移植项目的推进。

根据英伟达说明,此次开源的 CUDA Tile 项目包含多个组成部分,包括 Tile MLIR“方言”、本地 Python API 绑定、字节码表示形式以及一致性测试套件。

英伟达官方对 CUDA Tile IR 的描述是:“CUDA Tile IR 是一种基于 MLIR 的中间表示和编译器基础设施,用于 CUDA 内核优化,,重点支持基于 tile 的计算模式,并针对 NVIDIA Tensor Core 单元进行优化。该项目为表达和优化面向 NVIDIA GPU 的分块计算提供了一个完整的生态系统,通过为常见分块模式、 内存 层次管理和 GPU 特定优化提供抽象,旨在简化高性能 CUDA 内核的开发过程。”

相关阅读:

  • 《自 2006 年问世以来最大革新:英伟达 CUDA 13.1 发布,引入 Tile IR 为高层 GPU 编译器与 DSL 奠定基础》

  • 《破局英伟达 CUDA 护城河:ZLUDA 适配 ROCm 7,让 A 卡读懂 N 卡代码》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,码农网所有文章均包含本声明。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册