位于芬兰的 LUMI(Large Unified Modern Infrastructure)超级计算机目前仍在组装过程中。按照原计划,这台拥有 375+ PFLOPs 算力的超算应该在 2021 年底前上线。但受到供应链危机的影响,其当下的目标是在 2022 年年中实现普遍供应。
LUMI 基于 AMD EPYC 处理器和 Instinct 计算卡打造,一旦投入运行,其预计将超越目前最快的日本 Fugaku 超算系统。LUMI 共有 2560 个计算节点,每个节点由一枚 64 核 AMD Trento CPU 和 4 路 AMD Instinct MI250X GPU 加速卡组成。
科技网站 Phoronix 指出,虽然硬件在不断完善,但 LUMI 团队的 HPC 工程师仍一直在努力优化开源的 Linux 软件栈。LUMI 超级计算机的工程师、CSC 首席 HPC 科学家 Georgios Markomanolis 曾在去年 2 月发布过一个演讲,提到了彼时 Radeon Open eCosystem 的情况,以及他们为使传统上以 NVIDIA 为中心的 HPC 工作负载在当时的 AMD 测试硬件中运行而进行的所有移植工作 —— 其最初规划使用的是 MI100,但 LUMI 同时也在等待 MI250X 的成熟落地。
日前举行的 FOSDEM 2022 上,Georgios Markomanolis 分享了该团队在过去一年中所进行的相关开源工作的一些信息。现如今,HPC 工程师在对 AMD 用于 GPU 计算的 ROCm 开源软件栈方面已经积累了更多的经验;同时继续在 HIP 上将更多的 CUDA 代码库移植到 AMD GPU 支持的软件中,并努力微调代码,以便在 AMD 硬件上运行时获得最大性能。
此外,在过去的一年里,工具包中还新增了一个值得一提的软件组件:AMD 开源的 GPUFort,用于帮助将 OpenACC 和 CUDA Fortran 代码迁移到 AMD 的架构中。
尽管相关工作依然很复杂,但通过将复杂的代码库转移到 AMD ROCm 空间,可以获得最佳的 GPU 性能。
更多有关 CSC 为准备 LUMI 上线而进行的开源移植和调优工作详情可在 FOSDEM.org 上查看,其中包含有 Georgios Markomanolis 的演讲 PPT 和视频记录。想了解更多关于 LUMI 的信息可以查看 lumi-supercomputer.eu。
猜你喜欢: