内容简介:CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 ...
CUDA 10.1 发布了。CUDA(Compute Unified Device Architecture),是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构,CUDA 使 GPU 能够解决复杂的计算问题。 它包含了 CUDA 指令集架构(ISA)以及 GPU 内部的并行计算引擎。
CUAD 10.1 包含了一个新的 GEMM 轻量级库、一些实用和性能方面的提升、以及 CUDA Graphs APIs 的改进。
新版本的更新亮点有:
-
cuBLASLt,一个新的轻量级 GEMM 库,具有灵活的API和张量核心,支持 INT8 输入和 FP16 CGEMM split-complex 矩阵乘法
-
CuSOLVER 中新增了可选的 eigensolvers SYEVDX 和 SYGVDX,使 eigensolvers 全光谱(full spectrum)的性能提升高达1.5倍
-
nvJPEG 中新的编码和批量解码功能
-
cuRAND 中大量的随机数生成器性能提高了4倍
-
改进 CUDA Graphs APIs 中 fork/join 内核的性能和支持
下载地址:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Kafka主题体系架构-复制、故障转移和并行处理
- CUDA 10.2 更新,NVIDIA 推出的并行计算架构
- sqltoy-orm-4.17.6 发版,支持 Greenplum、并行查询可设置并行数量
- PostgreSQL并行查询介绍
- nodejs“并行”处理尝试
- 并行python迭代
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Learn Python the Hard Way
Zed Shaw / Example Product Manufacturer / 2011
This is a very beginner book for people who want to learn to code. If you can already code then the book will probably drive you insane. It's intended for people who have no coding chops to build up t......一起来看看 《Learn Python the Hard Way》 这本书的介绍吧!