内容简介:一个浅显的原因是,
为什么要用nvidia-docker2?
一个浅显的原因是, nvidia-docker 已经被官方废弃了。 最大的原因是, nvidia-docker 作为 Docker 的一个包装,需要运行一个独立的daemon,与Docker的生态不能很好地兼容。 比如, docker-compose 、 docker swarm 与Kubernetes,都不能很好的和 nvidia-docker 一起工作。
nvidia-docker2 解决了这些问题,甚至能在非官方CUDA镜像以外的镜像工作。 nvidia-docker 是一个Volume Plugin,而 nvidia-docker2 则是一个Docker Runtime,机制的差异,带来了巨大的改进。
安装nvidia-docker2
Debian-based distributions
以下是基于Debian系的安装方法:
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update
具体到Ubuntu 16.04来说, nvidia-docker.list 就是如下内容:
deb https://nvidia.github.io/libnvidia-container/ubuntu16.04/$(ARCH) / deb https://nvidia.github.io/nvidia-container-runtime/ubuntu16.04/$(ARCH) / deb https://nvidia.github.io/nvidia-docker/ubuntu16.04/$(ARCH) /
RHEL-based distributions
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | \ sudo tee /etc/yum.repos.d/nvidia-docker.repo
红帽系的,孤没用过,以上仅为官方样例。
配置nvidia-docker2
安装后,需要配置新的Docker Runtime。 同时,也需要把默认的Runtime设为 nvidia 。
{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
},
"default-runtime": "nvidia",
...
}
以上内容加入 /etc/docker/daemon.json 文件中,然后重启 dockerd 。
sudo systemctl restart docker
对不需要GPU资源的应用来说,这样设了也不会有问题,除非它依赖另一个Runtime。 如果没有 default-runtime 的配置,在运行时添加一个参数 --runtime ,也能使容器可以访问GPU资源。
docker run --runtime nvidia ...
APT证书验证问题
某些公司的内网,环境及其恶劣,证书验证不一定能通过。 把一下一行添加到 /etc/apt/apt.conf 中,可以确保 apt update 时不出问题。
Acquire::https::nvidia.github.io::Verify-Peer "false";
参考
- About version 2.0 · NVIDIA/nvidia-docker Wiki
- Repository configuration | nvidia-docker
- Installation (version 2.0) · NVIDIA/nvidia-docker Wiki
- Accessing GPUs from a Docker Swarm service
- Upgrading to the NVIDIA Container Runtime for Docker :: DGX Systems Documentation
- dockerd | Docker Documentation
- Getting "server certificate verification failed" during apt-get update - Ask Ubuntu
- ubuntu - Using a self-signed SSL cert for an HTTPS-based internal APT repository - Server Fault
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Golang入门:从安装、部署以及GoLand的安装开始
- Win2016上安装SFB2015先决条件安装失败:RewriteModule
- mac:Go安装和配置+GoLand安装和使用之完整教程
- Pulsar本地单机(伪)集群 (裸机安装与docker方式安装) 2.2.0
- 如何将Rancher 2.1.x 从单节点安装迁移到高可用安装
- (教科书式教程!)在VMware Workstation 14 上安装CentOS 7 【送安装包】
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
趣学Python编程
Jason Briggs / 尹哲 / 人民邮电出版社 / 2014-3 / 45.00元
python是一款解释型、面向对象、动态数据类型的高级程序设计语言。python语法简捷而清晰,具有丰富和强大的类库,因而在各种行业中得到广泛的应用。对于初学者来讲,python是一款既容易学又相当有用的编程语言,国内外很多大学开设这款语言课程,将python作为一门编程语言学习。 《趣学python编程》是一本轻松、快速掌握python编程的入门读物。全书分为3部分,共18章。第1部分是第......一起来看看 《趣学Python编程》 这本书的介绍吧!
HTML 压缩/解压工具
在线压缩/解压 HTML 代码
随机密码生成器
多种字符组合密码