Intel 发布了最新的 CPU 优化参考手册,并且在 GitHub 上上传了相关示例代码。
一直以来,Intel 都维护着一份冗长的 "优化参考手册",以帮助开发者了解如何为其最新的 CPU 微架构优化代码。最近,Intel 不仅更新了该手册,而且在 GitHub 上开源了很多相关的代码示例,以更好地帮助开发者学习 Intel 优化技术,从而充分利用其最新的处理器。
这些代码示例包括 Intel 64 位和 IA-32 架构,主要涉及 AVX/AVX2/FMA 优化、INT8 深度学习推理以及 AVX-512 的使用,以便针对最新的 Intel CPU(如Xeon Scalable Ice Lake、Tiger Lake 和 Rocket Lake)获得最佳性能。同时,这些示例使用 GCC、Clang 和 MSVC 提供汇编源代码,并且每个示例都提供了单元测试。
此外,这些代码示例需要在 Haswell 处理器或更高版本上运行,并且不对它们使用的 Haswell 中的指令(例如 FMA 或 AVX-2)执行运行时检查。因此如果在不支持这些指令的设备上运行某些代码示例,可能会发生崩溃。不过,这些代码示例会在运行前检查后 Haswell 指令集,因此其会在 CPU 不支持相关指令时跳过某些测试。 而构建单元测试则需要 GCC 8.1 或更高版本。
关于这些代码示例的详细情况,可以查看其 GitHub 仓库。
猜你喜欢:暂无回复。