rocky linux安装GPU
时间: 2025-05-12 08:36:40 浏览: 22
### 如何在 Rocky Linux 上安装和配置 GPU 驱动及相关支持
#### 1. 系统准备
在开始安装前,确保系统已更新至最新状态。可以通过以下命令完成系统的升级:
```bash
sudo dnf update -y && sudo dnf upgrade -y
```
为了确认硬件环境是否适合安装 NVIDIA 或 AMD 的 GPU 驱动程序,可以运行以下命令来检测是否存在对应的显卡设备[^2]:
```bash
lspci | grep -i nvidia
lspci | grep -i amd
```
如果未显示任何结果,则可能需要进一步排查 BIOS 设置或其他硬件问题。
---
#### 2. 安装 NVIDIA 驱动及 CUDA 支持
##### (a) 添加 NVIDIA Yum 存储库
下载并安装官方存储库文件:
```bash
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo rpm --import -
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
```
##### (b) 安装驱动程序及其依赖项
执行以下命令以安装最新的 NVIDIA 驱动以及必要的开发工具包:
```bash
sudo dnf install kernel-devel dkms-nvidia cuda-drivers -y
```
重启计算机使更改生效:
```bash
sudo reboot
```
##### (c) 测试安装成功与否
通过运行 `nvidia-smi` 命令验证驱动是否正常工作[^1]:
```bash
nvidia-smi
```
如果没有错误提示且返回详细的 GPU 使用情况表单,则说明安装已完成。
---
#### 3. 安装 AMD ROCm 及其组件
对于 AMD 显卡用户而言,需先启用 EPEL 和 PowerTools 库以便获取更多资源包:
```bash
sudo dnf config-manager --set-enabled powertools
sudo dnf install epel-release -y
```
接着导入 ROCm GPG 密钥并创建相应的 yum 源链接:
```bash
wget -qO- http://repo.radeon.com/rocm/rocm.gpg.key | sudo gpg --dearmor -o /usr/share/keyrings/rocm-archive-keyring.gpg
echo 'deb [signed-by=/usr/share/keyrings/rocm-archive-keyring.gpg] http://repo.radeon.com/rocm/apt/latest ./' | sudo tee /etc/apt/sources.list.d/rocm.sources.list
```
最后一步便是实际部署 ROCm 平台本身连同 miopen 开发套件一起加载进来:
```bash
dnf install rocm-opencl rocblas hipsparse hipfft miopen-hip -y
```
同样地,在操作完成后记得重新启动机器让改动立即反映出来。
---
#### 4. 安装 Docker 和 NVIDIA Container Toolkit
按照标准流程设置容器化解决方案——Docker 后面再额外引入专门针对图形处理单元优化过的插件模块:
###### a. 安装 Docker CE
```bash
sudo dnf remove docker docker-client docker-client-latest docker-common docker-latest docker-latest-logrotate docker-logrotate docker-engine
sudo dnf install dnf-plugins-core -y
sudo dnf config-manager --add-repo=https://download.docker.com/linux/fedora/docker-ce.repo
sudo dnf install docker-ce docker-ce-cli containerd.io -y
sudo systemctl start docker
```
###### b. 加入 NVIDIA 扩展功能集
参照先前建立好的仓库位置继续扩展能力范围:
```bash
sudo dnf install nvidia-container-toolkit -y
sudo nvidia-ctk runtime configure --reset -f
sudo systemctl restart docker
```
此时应该已经具备完整的端到端流水线结构用于加速计算密集型作业场景下的表现效果了!
---
#### 5. 编译 MPI 工具链适配不同架构需求
依据具体选用的是哪一类处理器品牌决定采取何种策略构建高性能通信协议栈实例;以下是几个典型组合方案示例供参考选择使用[^3]:
| **目标平台** | **推荐 OpenMPI 版本** | **最低 UCX 要求** |
|--------------------|-----------------------|-------------------|
| NVIDIA GPUs | >=4.1.0 | >=1.10 |
| AMD GPUs | >=4.1.4 | >=1.13 |
假设我们打算服务于基于 Radeon Pro Series 设备集群的话,那么就需要遵循上述表格中的指导方针逐一落实到位才行啊朋友们~ 下载源码压缩包解压之后依照常规套路逐步推进直至最终产物诞生为止咯~
---
阅读全文
相关推荐

















