centos更新安装nvidia-container-toolkit
时间: 2025-01-22 09:05:23 浏览: 108
### 安装和更新 NVIDIA 容器工具包
对于 CentOS 上的 NVIDIA 容器工具包 (nvidia-container-toolkit),可以通过以下方法来完成安装或更新操作。
#### 使用 YUM 更新缓存并安装最新版本
为了确保获取最新的软件包列表,应当先清理过期的缓存数据。之后可以利用 `yum` 命令来进行 nvidia-container-toolkit 的安装:
```bash
sudo yum clean expire-cache
sudo yum install -y nvidia-container-toolkit [^2]
```
此命令会自动处理依赖关系,并按正确的顺序依次安装所需的组件:libnvidia-container1 -> libnvidia-container-tools -> nvidia-container-toolkit[^1]。
#### 手动下载 RPM 文件进行安装
如果希望手动指定特定版本,则可以从官方渠道下载对应的 .rpm 文件后执行如下指令:
```bash
dnf install ./nvidia-container-toolkit-<version>.x86_64.rpm [^3]
```
请注意将 `<version>` 替换成实际要安装的具体版本号字符串。
成功安装完成后建议重启 Docker 服务使更改生效:
```bash
systemctl restart docker.service
```
相关问题
centos 离线安装nvidia-container-toolkit
在 CentOS 上离线安装 NVIDIA Container Toolkit 的方法可以通过以下几个方面来实现。以下是详细的说明:
### 准备工作
为了能够在没有网络连接的情况下完成安装,需要提前下载所需的依赖包以及工具包。
#### 下载必要的 RPM 包
1. **获取 `nvidia-container-toolkit` 和其依赖项**
需要访问一个有互联网连接的机器,在该机器上运行以下命令以找到并下载所有必需的 RPM 文件及其依赖关系:
```bash
sudo yumdownloader --resolve nvidia-container-toolkit
```
2. 将这些文件复制到目标 CentOS 系统上的某个目录中(例如 `/root/offline-packages/`)。这一步可以使用 USB 或其他存储介质完成。
---
### 安装过程
#### 1. 创建本地 YUM 软件仓库
如果一次性下载了多个 RPM 包,则可以在目标系统上创建一个临时的本地软件仓库以便更方便地管理它们。
```bash
cd /path/to/downloaded/packages/
createrepo .
```
此操作会生成一个名为 `repodata` 的元数据文件夹,用于支持后续通过 YUM 进行批量安装[^3]。
#### 2. 修改 YUM 配置文件
编辑现有的 YUM 配置或者新增一个新的配置文件指向刚才建立好的本地库路径:
```ini
[local-repo]
name=Local Repository
baseurl=file:///path/to/downloaded/packages/
enabled=1
gpgcheck=0
```
保存更改后刷新缓存:
```bash
yum clean all && yum makecache fast
```
#### 3. 执行实际安装
利用刚刚设置完毕的自定义源执行如下指令即可完成核心组件部署:
```bash
yum install -y nvidia-container-toolkit
```
#### 4. 后续配置
成功安装之后还需要做一些额外的工作才能让 GPU 支持生效于容器环境当中。
- 添加默认策略规则集:
```bash
nvidia-ctk runtime configure --reset
```
- 更新 Docker Daemon 设置使其识别新的 Runtime 类型:
编辑 `/etc/docker/daemon.json` 并加入下面的内容片段:
```json
{
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
},
"default-runtime": "nvidia"
}
```
最后重启服务使改动立即生效:
```bash
systemctl restart docker
```
验证一切正常运作的方式之一就是尝试拉取任意含 CUDA 功能镜像再启动它看看是否能够探测得到物理显卡设备存在与否。
```python
docker run --rm --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark
```
以上便是整个流程概述[^4]。
---
### 注意事项
确保所使用的驱动版本与 toolkit 版本兼容非常重要;否则可能会遇到各种奇怪错误提示甚至完全无法加载模块的情况发生。建议查阅官方文档确认具体组合要求后再行动以免徒劳无功浪费时间精力资源等等不必要的麻烦事态发展下去的话就不好解决了哦!
centos离线安装nvidia-container-runtime
### CentOS 上 NVIDIA Container Runtime 的离线安装方法
要在 CentOS 系统上完成 NVIDIA Container Runtime 的离线安装,可以按照以下方式操作:
#### 准备工作
确保目标机器已具备必要的硬件支持(如兼容的 NVIDIA GPU),并确认主机已经安装了基础驱动程序以及 CUDA 工具链。如果尚未安装这些组件,则需先下载对应的 RPM 或 tar 文件,并手动部署。
#### 下载依赖项
由于是离线环境,因此需要提前准备好所有必需文件。这通常包括但不限于以下几个部分:
- **NVIDIA 驱动**:适用于您的显卡型号版本。
- **CUDA Toolkit**:提供核心库功能。
- **nvidia-container-runtime 和 nvidia-container-toolkit 软件包**:用于容器化环境中管理 GPU 访问权限[^3]。
可以通过访问官方仓库或者镜像站点获取上述资源,在联网设备上执行如下命令来收集相关 rpm 包及其依赖关系树:
```bash
yumdownloader --resolve nvidia-container-runtime
```
将得到的结果传输至无网络连接的目标服务器中。
#### 安装过程
一旦所有必要材料均已就绪,就可以开始实际配置流程了:
1. 解压所获得压缩文档;
2. 使用 `rpm` 命令逐个加载各个模块;注意遵循正确的顺序以避免冲突情况发生;
```bash
rpm -ivh *.rpm
```
3. 设置默认运行时选项以便后续能够正常使用GPU加速特性:
```bash
sudo nvidia-ctk runtime configure --runtime=docker
```
4. 更新 daemon.json 来启用新定义好的 runtime handler:
编辑位于 `/etc/docker/daemon.json` 中的内容,加入类似下面这样的字段结构:
```json
{
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
},
"default-runtime": "nvidia"
}
```
5. 重启服务使更改生效:
```bash
systemctl restart docker
```
最后验证整个链条是否搭建成功可通过启动一个简单的测试容器来进行检验[^2]:
```bash
docker run --rm --gpus all nvidia/cuda:12.4.0-base nvidia-smi
```
以上即完成了基于 CentOS 平台下的 NVIDIA container runtime 离线模式构建全过程概述。
###
阅读全文
相关推荐

















