内容简介:CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 ...
CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。
CUAD 10.1 包含了一个新的 GEMM 轻量级库、一些实用和性能方面的提升、以及 CUDA Graphs APIs 的改进。
新版本的更新亮点有:
-
cuBLASLt,一个新的轻量级 GEMM 库,具有灵活的API和张量核心,支持 INT8 输入和 FP16 CGEMM split-complex 矩阵乘法
-
CuSOLVER 中新增了可选的 eigensolvers SYEVDX 和 SYGVDX,使 eigensolvers 全光谱(full spectrum)的性能提升高达1.5倍
-
nvJPEG 中新的编码和批量解码功能
-
cuRAND 中大量的随机数生成器性能提高了4倍
-
改进 CUDA Graphs APIs 中 fork/join 内核的性能和支持
下载地址:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Kafka主题体系架构-复制、故障转移和并行处理
- CUDA 10.2 更新,NVIDIA 推出的并行计算架构
- sqltoy-orm-4.17.6 发版,支持 Greenplum、并行查询可设置并行数量
- PostgreSQL并行查询介绍
- nodejs“并行”处理尝试
- 并行python迭代
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
计算机程序设计艺术(第3卷)
Donald E.Knuth / 苏运霖 / 国防工业出版社 / 2002-9 / 98.00元
第3卷的头一次修订对经典计算机排序和查找技术做了最全面的考察。它扩充了第1卷对数据结构的处理,以将大小数据库和内外存储器一并考虑;遴选了精心核验的计算机方法,并对其效率做了定量分析。第3卷的突出特点是对“最优排序”一节的修订和对排列论与通用散列法的讨论。一起来看看 《计算机程序设计艺术(第3卷)》 这本书的介绍吧!