CUDA 10.1 发布,NVDIA 推出的并行计算架构

栏目: 软件资讯 · 发布时间: 7年前

内容简介:CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 ...

CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。

CUAD 10.1 包含了一个新的 GEMM 轻量级库、一些实用和性能方面的提升、以及 CUDA Graphs APIs 的改进。

新版本的更新亮点有:

  • cuBLASLt,一个新的轻量级 GEMM 库,具有灵活的API和张量核心,支持 INT8 输入和 FP16 CGEMM split-complex 矩阵乘法

  • CuSOLVER 中新增了可选的 eigensolvers SYEVDX 和 SYGVDX,使 eigensolvers 全光谱(full spectrum)的性能提升高达1.5倍

  • nvJPEG 中新的编码和批量解码功能

  • cuRAND 中大量的随机数生成器性能提高了4倍

  • 改进 CUDA Graphs APIs 中 fork/join 内核的性能和支持

更新日志

下载地址:


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

ECMAScript6入门

ECMAScript6入门

阮一峰 / 电子工业出版社 / 2014-8 / 49.00元

《ECMAScript6入门》全面介绍了ECMAScript6新引入的语法特性,覆盖了ECMAScript6与ECMAScript5的所有不同之处,对涉及的语法知识给予了详细介绍,并给出了大量简洁易懂的示例代码。 《ECMAScript6入门》为中级难度,适合已有一定JavaScript语言基础的读者,用来了解这门语言的最新发展;也可当作参考手册,查寻新增的语法点。一起来看看 《ECMAScript6入门》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

MD5 加密
MD5 加密

MD5 加密工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具