服务器因系统故障重装,安装docker容器时发现几年前的在线安装步骤不好使了,只好尝试离线安装。为了下次不卡壳,记录一下安装步骤。
先确定自己的操作系统,并确保已经安装了nvidia driver。我的操作系统是Ubuntu 20.04。
1. 下载Docker安装包:
下载地址:https://download.docker.com/linux/ubuntu/dists/focal/pool/stable/amd64/
下载如下几个安装包(根据自己的系统和硬件情况下载相应的版本):
- containerd.io_1.7.27-1_amd64.deb
- docker-ce_28.1.1-1~ubuntu.20.04~focal_amd64.deb
- docker-ce-cli_28.1.1-1~ubuntu.20.04~focal_amd64.deb
- docker-ce-rootless-extras_28.1.1-1~ubuntu.20.04~focal_amd64.deb
2. 安装Docker
在以上安装包存放目录一键安装以上几个安装包:
sudo dpkg -i *.deb
安装完成后,启动docker:
sudo systemctl daemon-reload
sudo systemctl restart docker
验证docker是否启动成功:
docker --version
正常输出docker版本即表示docker安装成功了。
3. 下载NVIDIA Container Toolkit安装包
安装完docker,我们需要下载Nvidia container Toolkit安装包,下载地址如下:
https://mirror.cs.uchicago.edu/nvidia-docker/libnvidia-container/stable/
下载如下几个安装包(根据自己系统选择相应的版本):
- libnvidia-container1_1.13.5-1_amd64.deb
- libnvidia-container-tools_1.13.5-1_amd64.deb
- nvidia-container-runtime_3.13.0-1_all.deb
- nvidia-container-toolkit_1.13.5-1_amd64.deb
- nvidia-container-toolkit-base_1.13.5-1_amd64.deb
- nvidia-docker2_2.13.0-1_all.deb
4. 安装NVIDIA Container Toolkit
进入到存放这几个安装包的目录,一键安装:
sudo dpkg -i *.deb
重启docker容器:
sudo systemctl daemon-reloadsudo systemctl restart docker
检查是否安装成功,先检测一下版本:
nvidia-container-toolkit -version
输出如下:
NVIDIA Container Runtime Hook version 1.13.5
commit: 6b8589dcb4dead72ab64f14a5912886e6165c079
基本问题不大。
5. 测试CPU容器:
用一个已有的GPU容器镜像(freespeech:v1)测试一下:
docker run --rm --gpus all freespeech:v1 nvidia-smi
输出如下:
功能正常,可以干活儿了。