内容简介:今年的 GTC 系列大会已是第十届,也是连续第三次进入国内,和每次一样,英伟达首席执行官黄仁勋参加了本次大会,并在首日上午进行了主 Keynote 演讲。谈到深度学习机器,我们首先想到的就是以 GPU 为核心的计算机。不过,英伟达早已不满足于芯片,近几年开始了垂直方向的扩展,我们可以在很多地方看到英伟达的软件、服务器,甚至自动驾驶汽车。但一直以来就像在游戏和高性能计算中所做的那样,这家公司一直致力于为客户提供更多选择。「如有需要,你可以自行采用英伟达产品的任何一部分。」
今年的 GTC 系列大会已是第十届,也是连续第三次进入国内,和每次一样,英伟达首席执行官黄仁勋参加了本次大会,并在首日上午进行了主 Keynote 演讲。
谈到深度学习机器,我们首先想到的就是以 GPU 为核心的计算机。不过,英伟达早已不满足于芯片,近几年开始了垂直方向的扩展,我们可以在很多地方看到英伟达的软件、服务器,甚至自动驾驶汽车。但一直以来就像在游戏和高性能计算中所做的那样,这家公司一直致力于为客户提供更多选择。
「如有需要,你可以自行采用英伟达产品的任何一部分。」
重新定义图形计算
「我们今天首先要介绍的是,英伟达如何重新定义了图形计算。」黄仁勋以最新的 RTX 技术开始了自己的演讲。最近英伟达发布了新一代消费级显卡 RTX 20 系列。使用TensorCore、RT Core 和可编程着色器的架构,Turing 架构的 2080 Ti 峰值算力要比 Pascal 架构的最强芯片 Titan Xp 强 9 倍。
因为拥有算力达到 104TFLOPS 的TensorCore,通过实时的计算,RTX2080 可以通过输入低分辨率图像,输出高清图像。黄仁勋在会上展示了国产游戏《逆水寒》最新版本的图像水平。其模型和光源在水面和光滑物体上的反射栩栩如生。「即使是雨点落在水面上产生了波纹,效果也是和真实情况下一样」黄仁勋表示。「所有效果都是即时演算得出的,而对于开发者来说,需要额外做的工作也很少。」
在 Turing GPU 上,英伟达加入了全新的深度学习超级采样(DLSS)技术。基于 Turing 架构的 DLSS 由两个模型组成,其中一个模型经过训练后可根据原始图像生成超高画质图像,另一个经过训练后可实现超分辨率并以此作为输出。经由TensorCore 的计算,RTX 系列显卡可以同时实现高画质和高分辨率。
当然,这些算法看起来只对拥有TensorCore 和 RTX Core 的新产品有优化,和上一代产品相比,RTX 显卡在光线追踪和 DLSS 上的性能达到了 3.5 倍的提升。
AI 自动化的世界
英伟达 12 年前推出编程计算平台 CUDA 的时候,其应用范围仅限于高性能计算。随着 GPU 被广泛用于深度学习,这家公司已在在 CUDA 上加入了很多新的功能,比如适用于TensorCore 的相关 API。
AI 改变了英伟达的芯片、软件设计,也重塑了市场:2005 年的云服务器的算力输出基本全靠 CPU,而今天全球最强的两台超级计算机 Summit 和 Sierra 中,95% 的算力是由英伟达 GPU 提供的,其中在第一名 Summit 中有 27,648 块 Tesla V100。而在全球能效最强的 25 台超算中,有 22 台包含英伟达的芯片和技术。
与生活密切相关的网上购物、医疗、交通等方面都离不开 AI 应用。今年的双 11,阿里巴巴的销售量达到了 310 亿美元,其中基于大数据的智能推荐功不可没。
黄仁勋认为,AI 让高性能计算领域产生了变革,今天人们有两种扩大服务器算力的方式:第一种是传统 HPC 模式,在单个服务器上增加算力;另一种是 Hyperscale,通过扩大小模组的数量增加算力,超大规模节点必须作为一个计算集群,训练模型或分别为运行 AI 模型的数百万并发用户提供服务。
英伟达 GPU 在两种方向上都有自己的产品。HPC 模式对应的是「世界上最大的 AI 计算机」HGX-2 平台,其中一个模组可以支持 8 个 V100 GPU,实现 1PFLOPS 的算力。
HGX-2 的板卡很沉,习惯手举 GPU 摆造型的黄仁勋拿起来有点费劲,不禁自嘲:「I'm getting old.」
目前已经在制造 HGX-2 服务器的国内公司包括,华为、浪潮、联想、QCT、曙光和 Supermicro。很多公司为了构建云服务器购买了 HGX-2 平台,而百度和腾讯还将要开放基于 HGX-2 的云计算服务。
在 Hyperscale 的一边,英伟达为大规模计算集群准备了「第一块 Hyperscale GPU」Tesla T4 计算卡,以应对低延迟任务的需求。
30 天前,英伟达发布了 Tesla T4云计算GPU。这款计算卡包含 320 个 Turing 架构的TensorCore、2560 个 CUDA 核心,可输出 64TFLOPS 的 fp16 算力,而功耗仅为 70W。「它的功耗比 CPU 还要小,算力却比 CPU 要高 400 倍,」黄仁勋表示。
英伟达称,仅仅一个月的时间里,各大服务商已经推出了 50 种该型号的计算卡。在国内,科大讯飞等公司已宣布开始使用这种 GPU。
配合新一代的推理优化工具TensorRT 5.0,T4 支持 Tesnor Core 和丰富的模型类型,CNN、RNN、MLP 和很多其他模型。
机器学习软件
今天的深度学习软件正变得原来越复杂,对于开发者来说最重要问题的是如何进行部署。
英伟达的新版TensorRT 推理服务器现在是容器化的,可以在 Kubernetes 上运行。在大会上,英伟达宣布TensorRT Inference Server 已经开源,黄仁勋拿百度云上的 Tesla T4 GPU 为这一 工具 做了例子:在容器中,我们可以运行任何深度学习模型,并让不同模型同时运行在同一个计算卡上以提高效率。
英伟达近日在 GTC 欧洲大会上发布了 RAPID,可让端到端工作负载加速 50 倍。「很多时候人们谈到 GPU 时都在说深度学习,现在有了 RAPID 软件,我们更可以加速机器学习。」黄仁勋表示。
RAPID 是一个开源机器学习库,其中 CUDA 负责加速数据科学工作负载,另外几个组件的功能则使用了很直白的形容方式:cuDF「类似于 Pandas」,而 cuML「类似于 ScikitLearn」。
机器学习意味着英伟达的产品正在进入更多行业,在国内,RAPID 已被一些传统公司采用。华大基因、中国移动和平安科技已经在使用 RAPID 了。
「如果我们用常规架构的计算方式,可能要花 6 个月来预测流感,」黄仁勋说道,「等计算机『预测』出来,流感早就结束了。有了 RAPID,计算机处理速度提高了 50 倍,问题很快就解决了。」
2005 年,各家研究机构用在科学计算上的花费有 90 亿美元,今天如果把百度、腾讯、阿里等公司的高性能计算花费加在一起,市场可以达到 370 亿美元,这其中很大一部分是深度学习和机器学习的计算。英伟达的产品已经能够覆盖所有这些计算需求了。
开放系统
英伟达花费 20 亿美元研发的 Xaiver 是一块集中程度很高的芯片,它被黄仁勋称为目前全球效率最高、最复杂的处理器,其上集中了 90 亿个晶体管,集成了英伟达自动驾驶汽车的所有最新技术。在 Xavier 中有 5 种不同的处理器:CPU、GPU、图像处理器、深度学习加速器、信号处理器。在英伟达的眼里,这款芯片被设计用于「自主机器」,包括自动驾驶、机器人和各种智能设备,它最多可以输出 320TOPS TFLOPS FP32 算力。
英伟达将 Xavier 芯片和其他一些自动化相关业务归类在新品牌 Nvidia AGX 中。
在芯片之上,AGX 平台还包括 Clara 智能成像仪、Metropolis 视频流分析应用程序、Isaac 机器人技术,以及 DRIVE自动驾驶汽车平台。在这些平台中,每个加速堆栈都由三层组成:
-
内核操作系统和工程 API
-
算法和加速库
-
特定领域算法或应用
英伟达称,每个平台都是开放的,开发者和客户可以访问任何层,并选择使用每个层的所有部分。
平台的构建速度如何?黄仁勋在大会上公布了应用 Xavier 的首批国内厂商,京东、美团、菜鸟的无人递送车已经选用了 Jetson AGX Xavier,它们中的一些正在展开测试:「在国内,每天都有百万骑手负责递送 3000 万份外卖,想象一下如果他们都被无人车代替以后,效率会提高多少倍!」
英伟达同时宣布面向自动驾驶的 NVIDIA DRIVE 开发系统已经上市,其中包括用于监控驾驶员的 DRIVE IX,以及 DRIVE AGX Xavier 开发套件。这一软件堆栈支持完全自动驾驶所需的功能,从感知到定位,再到路径规划。
英伟达还在现场展示了在美国加州高速公路上 50 英里环线的 Level2 级自动驾驶。面对此前「Level 4 很难实现」的呼声,这家公司的高官们有着特别的看法。「对于消费者来说,他们不需要了解什么是 Level 几,」英伟达副总裁 Rob Csongor 表示。「他们只会选择当前最好的自动驾驶体验。虽然在 Level 2 中人还需要随时接管,Level 4 则意味着人可以在后座睡觉了。」
英伟达发现 level 2 和 level 4 的自动驾驶在功能上是完全一样的,使用的软件堆栈也是类似的。在美国目前卖得最好的车款 Tesla Model 3 上,我们可以找到自动驾驶功能,但我们仍然需要在驾驶时把手放在方向盘上。「这是一个有关认证的问题,英伟达在自动驾驶上的战略,你现在可以把它视为是面向 Level 2 的,但以后它可能会被认证为 Level 4。」Csongor 称。
英伟达在大会上宣布了与沃尔沃的合作:几个月后,拥有 Level2自动驾驶的新款沃尔沃 XC60 就会上线。除此之外,已有超过 370 家公司在自动驾驶系统中使用了 DRIVE 平台。
在 GTC 中国之前,英伟达最大的新闻就是 11 月 16 号刚刚公布的今年第三季度财报了。报告显示,英伟达第三季度营收为 31.81 亿美元,与上年同期 26.36 亿美元的数字相比增长了 21%;公司净利润为 12.30 亿美元,与上年同期的 8.38 亿美元相比增幅达到 47%。尽管如此,市场普遍认为此数字低于预期,其股市也经历了大幅震荡。
「股价的确很重要,(最近的下跌)一部分是由于加密货币的影响,一部分是因为经济大环境。但是这并不是我们所关注的全部。」英伟达全球副总裁 Jay Puri 在大会上表示。「英伟达的眼光放在未来的计算。我们关注游戏、高性能计算、机器学习、自动驾驶等等。」
面对有关股价的担忧,英伟达给出的回应是:我们还有更重要的事去做。就像黄仁勋所说的,「如果大家都在做同一件事,英伟达就不会占据优势,我们会去挑战最困难的问题。」这也是英伟达一直以来的生存之道。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 调查显示:开发者比起 CD 更喜欢使用 CI
- 比起设计和开发流程的选择,还有几个事情更重要
- 比起Win10升级率,微软更关心Azure云的成长
- 看好谷歌唱衰英伟达?股价不代表一切
- Cloudera 股价腰斩,Hadoop 将何去何从
- 重大事件后,股价将何去何从?(附代码)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
闪魂FLASH8网站建设实录
马谧铤 / 中国林业 / 2006-7 / 46.00元
《闪魂FLASH8网站建设实录》旨在提供以Flash(Flash 8.0为创作工具)为技术核心的整套互动网站的开发思路,其中包括了网站策划、平面设计、程序设计等实用的互联网应用技术。内容包括Photoshop CS2设计,FIash 8创作和ActionScript应用程序开发的操作流程。在技术学习的过程中.大家还将体会到顶级互动网站设计、网站建设的设计流程和思路。《闪魂FLASH8网站建设实录》......一起来看看 《闪魂FLASH8网站建设实录》 这本书的介绍吧!