内容简介:一个浅显的原因是,
为什么要用nvidia-docker2?
一个浅显的原因是, nvidia-docker
已经被官方废弃了。 最大的原因是, nvidia-docker
作为 Docker 的一个包装,需要运行一个独立的daemon,与Docker的生态不能很好地兼容。 比如, docker-compose
、 docker swarm
与Kubernetes,都不能很好的和 nvidia-docker
一起工作。
nvidia-docker2
解决了这些问题,甚至能在非官方CUDA镜像以外的镜像工作。 nvidia-docker
是一个Volume Plugin,而 nvidia-docker2
则是一个Docker Runtime,机制的差异,带来了巨大的改进。
安装nvidia-docker2
Debian-based distributions
以下是基于Debian系的安装方法:
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \ sudo apt-key add - distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \ sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update
具体到Ubuntu 16.04来说, nvidia-docker.list
就是如下内容:
deb https://nvidia.github.io/libnvidia-container/ubuntu16.04/$(ARCH) / deb https://nvidia.github.io/nvidia-container-runtime/ubuntu16.04/$(ARCH) / deb https://nvidia.github.io/nvidia-docker/ubuntu16.04/$(ARCH) /
RHEL-based distributions
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | \ sudo tee /etc/yum.repos.d/nvidia-docker.repo
红帽系的,孤没用过,以上仅为官方样例。
配置nvidia-docker2
安装后,需要配置新的Docker Runtime。 同时,也需要把默认的Runtime设为 nvidia
。
{ "runtimes": { "nvidia": { "path": "nvidia-container-runtime", "runtimeArgs": [] } }, "default-runtime": "nvidia", ... }
以上内容加入 /etc/docker/daemon.json
文件中,然后重启 dockerd
。
sudo systemctl restart docker
对不需要GPU资源的应用来说,这样设了也不会有问题,除非它依赖另一个Runtime。 如果没有 default-runtime
的配置,在运行时添加一个参数 --runtime
,也能使容器可以访问GPU资源。
docker run --runtime nvidia ...
APT证书验证问题
某些公司的内网,环境及其恶劣,证书验证不一定能通过。 把一下一行添加到 /etc/apt/apt.conf
中,可以确保 apt update
时不出问题。
Acquire::https::nvidia.github.io::Verify-Peer "false";
参考
- About version 2.0 · NVIDIA/nvidia-docker Wiki
- Repository configuration | nvidia-docker
- Installation (version 2.0) · NVIDIA/nvidia-docker Wiki
- Accessing GPUs from a Docker Swarm service
- Upgrading to the NVIDIA Container Runtime for Docker :: DGX Systems Documentation
- dockerd | Docker Documentation
- Getting "server certificate verification failed" during apt-get update - Ask Ubuntu
- ubuntu - Using a self-signed SSL cert for an HTTPS-based internal APT repository - Server Fault
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Golang入门:从安装、部署以及GoLand的安装开始
- Win2016上安装SFB2015先决条件安装失败:RewriteModule
- mac:Go安装和配置+GoLand安装和使用之完整教程
- Pulsar本地单机(伪)集群 (裸机安装与docker方式安装) 2.2.0
- 如何将Rancher 2.1.x 从单节点安装迁移到高可用安装
- (教科书式教程!)在VMware Workstation 14 上安装CentOS 7 【送安装包】
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Implementing Responsive Design
Tim Kadlec / New Riders / 2012-7-31 / GBP 27.99
New devices and platforms emerge daily. Browsers iterate at a remarkable pace. Faced with this volatile landscape we can either struggle for control or we can embrace the inherent flexibility of the w......一起来看看 《Implementing Responsive Design》 这本书的介绍吧!