centos 7 安装NVIDIA Container Toolkit

要在 CentOS 7 上离线安装 NVIDIA Container Toolkit,需确保已安装 NVIDIA 驱动和 Docker 环境。以下是完整步骤及注意事项:


⚙️ 一、环境准备

  1. 验证 NVIDIA 驱动
    运行 nvidia-smi 确认驱动已正确安装,若未安装需先离线安装驱动:

    • 下载对应 GPU 型号的驱动包(如 NVIDIA-Linux-x86_64-xxx.run)。
    • 禁用系统自带 nouveau 驱动(修改 /etc/modprobe.d/blacklist.conf 并重建 initramfs)。
    • 通过 init 3 进入命令行模式安装驱动。
  2. 安装 Docker CE
    若未安装 Docker,需离线部署:

    • 下载 Docker 静态二进制包(如 docker-20.10.9.tgz)。
    • 解压并复制到 /usr/bin/
      tar xzvf docker-20.10.9.tgz
      sudo cp docker/* /usr/bin/
      
    • 配置 systemd 服务并启动(详见)。

📦 二、获取离线 RPM 包

在联网机器下载所需组件(需与 CentOS 7 架构一致):

sudo yum install -y --downloadonly --downloaddir=/path/to/download \nvidia-container-toolkit \nvidia-container-runtime \libnvidia-container1 \libnvidia-container-tools \nvidia-docker2

关键组件清单

包名作用来源
libnvidia-container*容器底层库支持
nvidia-container-runtime容器运行时接口
nvidia-container-toolkit核心工具包
nvidia-docker2Docker 集成配置

💡 注:将所有 RPM 包传输到目标服务器的离线环境(如 /opt/nvidia-rpms/)。


🔧 三、安装步骤

  1. 批量安装 RPM 包
    进入存放目录执行:

    cd /opt/nvidia-rpms
    sudo rpm -Uvh *.rpm --nodeps --force  # 忽略依赖强制安装
    

    ⚠️ 若遇依赖错误,需手动补充缺失包(如 dkms)。

  2. 配置 Docker 使用 NVIDIA Runtime
    生成默认配置并重启服务:

    sudo nvidia-ctk runtime configure --runtime=docker  # 生成 /etc/docker/daemon.json
    sudo systemctl restart docker
    

    确认 /etc/docker/daemon.json 包含:

    {"runtimes": {"nvidia": {"path": "nvidia-container-runtime","runtimeArgs": []}},"default-runtime": "nvidia"
    }
    

🧪 四、验证安装

  1. 检查工具包版本
    nvidia-ctk --version  # 应输出类似 1.14.1
    
  2. 运行测试容器
    docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
    
    成功则显示与宿主机一致的 GPU 信息。

⚠️ 关键注意事项

  1. 依赖冲突处理
    若强制安装(--nodeps)后 Docker 启动失败,检查日志 journalctl -u docker,常见问题为内核版本不匹配或缺失 libcuda.so

  2. 离线环境限制

    • CUDA 镜像需提前在联网环境下载(如 nvidia/cuda:11.0-base)。
    • 避免升级内核,否则需重新编译驱动。
  3. GPU 资源隔离
    多容器共享 GPU 时,可通过 docker run --gpus '"device=0"' 指定设备。


💎 额外建议

  • CUDA 版本兼容性:确保容器内 CUDA 版本 ≤ 宿主机驱动支持的版本(通过 nvidia-smi 顶部显示信息比对)。
  • 替代方案:若环境允许,优先通过代理设置在线安装(修改 /etc/yum.conf 添加 proxy=http://x.x.x.x:port)。

遇到问题可参考 NVIDIA 官方文档:Container Toolkit 离线指南。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89747.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++学习之STL学习:list的使用

本篇我们将学习STL中list的使用 目录 list的初始和官方文档 list的官方文档 list的构造与析构 构造函数 析构函数 运算符重载 迭代器 正向迭代器 反向迭代器 const正向迭代器 const反向迭代器 容量 empty size max_size 访问 访问第一个元素​编辑 访问最后一个元素 修…

USB服务器在证券公司虚拟化进程中的应用分析

在证券公司全面拥抱虚拟化、云化的技术浪潮中,一个看似微小却至关重要的环节曾长期阻碍进程:分散在各业务环节的银行前置机U盾、各种系统认证Ukey等物理USB安全设备的管理难题。这些承载着资金划拨、交易认证核心权限的“小钥匙”,在传统模式…

网闸内部架构设计:分层与微服务的生死博弈

引言 “物理隔离是网闸的命脉,而架构设计决定其生死。” 在数据安全领域,网闸(安全隔离与信息交换系统)是守护核心网络的钢铁长城。但当开发者试图将现代架构思想(如微服务)引入其内部时,却可能引发灾难性冲突。本文通过深度拆解分层架构与微服务在网闸中的适用性,揭示…

通过MaaS平台免费使用大模型API

文章目录 一、引言:MaaS平台——免费使用大模型API的新选择二、模型代码与限制术语详解(一)模型代码含义解析(二)模型使用限制术语缩写详解 三、5个MaaS平台详细介绍(一)OpenRouter(…

进程代理单窗口单IP技术:原理、应用与实现

“在当今数字化时代,网络隐私保护与多账号管理需求日益增长。单窗口单IP技术通过为每个进程分配独立网络身份,巧妙地解决了多账号管理中的IP关联难题。从游戏多开防封到数据采集优化,从隐私保护到测试验证,这项技术的应用场景不断…

Java教程——线程池和future

Future 详解 1. Future 是什么? Future 是 Java 中的一个接口(java.util.concurrent.Future),代表异步计算的未来结果。它允许你: 提交任务后立即返回在需要时检查任务是否完成获取任务结果(完成后)取消任务2. 怎么使用 Future? 通过线程池提交任务: ExecutorServ…

洛谷P1351 [NOIP 2014 提高组] 联合权值

洛谷P1351 [NOIP 2014 提高组] 联合权值 洛谷题目传送门 题目背景 NOIP2014 提高组 D1T2 题目描述 无向连通图 G G G 有 n n n 个点, n − 1 n-1 n−1 条边。点从 1 1 1 到 n n n 依次编号,编号为 i i i 的点的权值为 W i W_i Wi​,每条边的长…

Apache Doris Profile 深度解析:从获取到分析,解锁查询性能优化密码

在 Doris 数据库中,高效的查询性能是数据处理的关键。当我们遇到查询缓慢、资源消耗异常等问题时,Doris 提供的 Profile 工具就如同一位 “性能侦探”,能帮我们抽丝剥茧,找到问题根源。今天,我们就来深入聊聊如何分析 …

系统架构师

硬件: 运算器:1)算术运算 加减乘除 2)逻辑运算并进行逻辑测试:与或非 组件功能:算术逻辑单元ALU :处理数据 实现对数据的算术运算和逻辑运算 累加寄存器AC 通用寄存器,alu提供工作区 暂存运算结…

Unity HDRP + Azure IoT 工业设备监控系统实例

Unity HDRP Azure IoT 工业设备监控系统实例 下面是一个完整的工业设备监控解决方案,结合Unity HDRP(高清渲染管线)的高质量可视化与Azure IoT的实时数据处理能力。 系统架构 #mermaid-svg-XJnD6acrBbtbqYHW {font-family:"trebuchet…

(超详细)数据库项目初体验:使用C语言连接数据库完成短地址服务(本地运行版)

数据库项目初体验:使用C语言连接数据库完成短地址服务(本地运行版) 前言:初学者的思考 作为一个刚初学数据库的小白并且在之前我的博客中我有尝试使用C语言写过一个短地址服务,但是使用C语言编写的短地址服务只有短记…

mysql基础(一)快速上手篇

连接mysql 使用命令行窗口连接mysql数据库 语法:mysql –h主机名 –u用户名 –p密码 说明:-h参数指定数据库ip,本地服务器可以用localhost,-u参数指定用户名,-p参数指定用户密码。 注意:-p和密码值之间…

IntelliJ IDEA 2025- 下载安装教程图文版详细教程(附激活码)

目录 写在前面 一、介绍 二、下载 三、安装 🏁 写在最后 写在前面 > 🚀 初学 Java?或者刚开始写项目,不知道该选哪个 IDE? 本篇教程手把手教你安装 IntelliJ IDEA —— JetBrains 出品的顶级 Java 开发环境&a…

数学经济专业大学四年规划

数学经济专业结合了数学的逻辑严谨性和经济学的现实应用性,为学生提供了强大的数理分析能力和经济洞察力。该专业毕业生在金融科技、量化投资、商业分析等领域具有显著优势,尤其在数字经济时代,这类复合型人才的需求量持续增长。一、数学经济…

局域网打印机共享怎么设置?如何配置内网本地网络打印机给异地电脑远程连接使用打印?

打印机共享怎么设置?如何设置本地内网的网络打印机共享给其他网络下电脑连接打印?打印机设置使用以及异地使用打印都是大家比较关注的问题,下面详细教程中分二步,先讲局域网内的打印机共享,再进一步介绍内网打印机地址…

Rust异步爬虫实现与优化

Rust 语言在爬虫领域的应用相对较少,尽管 Rust 的 async/await 已稳定,但其与线程安全、Pin 等概念的结合仍较复杂,而爬虫高度依赖并发处理,进一步提高了开发成本。这就导致了使用Rust语言爬虫用的人很少。 下面是一个使用 Rust 编…

Electron 安全最佳实践:构建安全的桌面应用

Electron 是一个流行的框架,允许开发者使用 Web 技术(HTML、CSS、JavaScript)构建跨平台桌面应用。许多知名应用,如 VS Code、Slack 和 Discord,都基于 Electron 开发。然而,由于其结合了 Node.js&#xff…

MySQL 事务详解:从基础操作到隔离级别与 MVCC 原理

前言 首先从概念上进行理解什么是事务,以及事务的4大属性,知道是什么还要知道为什么? 事务是如何进行操作的,最后在谈事务的隔离性、隔离级别(最重要但是也很难理解),理解隔离级别体现在哪里 …

【Unity 编辑器工具开发:GUILayout 与 EditorGUILayout 对比分析】

Unity 编辑器工具开发:GUILayout 与 EditorGUILayout 对比分析 一、核心区别对比 方面GUILayoutEditorGUILayout区别命名空间UnityEngineUnityEditorEditorGUILayout 仅限编辑器环境适用范围游戏运行时 编辑器工具仅限编辑器工具运行时禁用 EditorGUILayout渲染管…

[附源码+数据库+毕业论文]基于Spring+MyBatis+MySQL+Maven+jsp实现的个人财务管理系统,推荐!

摘 要 随着软件信息技术的兴起,许多手工作业也升级为软件管理数据,本次针对个人财务数据的管理,开发一款个人财务管理系统,该系统可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及…