maojunyan@pc-ubuntu-22:~$ nvidia-smi NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
时间: 2025-07-01 21:05:48 浏览: 4
NVIDIA-SMI 无法与 NVIDIA 驱动通信的问题通常表明系统未能正确加载或安装显卡驱动程序。以下是一些可能的解决方案,结合了常见问题排查和修复策略:
### 检查并重新安装 NVIDIA 驱动
确保你使用的是与内核兼容的最新版本驱动程序。可以通过以下命令卸载当前驱动并重新安装推荐版本:
```bash
sudo apt-get purge nvidia-*
sudo apt-get update
sudo apt-get install nvidia-driver-<version>
```
替换 `<version>` 为你希望安装的驱动版本号(如 `nvidia-driver-470`)[^3]。
### 确保驱动已加载
运行以下命令检查 `nvidia` 内核模块是否已加载:
```bash
lsmod | grep nvidia
```
如果未列出任何内容,则需要手动加载模块:
```bash
sudo modprobe nvidia
```
如果此步骤失败,请检查是否有冲突的驱动(例如 nouveau),可以通过禁用 nouveau 来解决这个问题。创建一个新的 grub 配置文件条目以启用 nvidia 驱动:
```bash
sudo nano /etc/default/grub
```
将 `GRUB_CMDLINE_LINUX_DEFAULT` 行修改为包含 `nvidia-drm.nvidia_constrainmodeset=0` 或 `nomodeset`,然后更新 GRUB 和 initramfs:
```bash
sudo update-grub
sudo update-initramfs -u
```
### 检查 X Server 是否正常运行
有时,X Server 的异常也可能导致 `nvidia-smi` 失败。可以尝试重启 X Server 或者整个系统来恢复服务:
```bash
sudo systemctl restart gdm
```
或者直接重启系统:
```bash
sudo reboot
```
### 使用 NVIDIA 官方工具进行诊断
NVIDIA 提供了一个名为 `nvidia-bug-report.sh` 的脚本用于收集系统信息以帮助诊断问题。运行以下命令生成报告:
```bash
sudo nvidia-bug-report.sh
```
该脚本会生成一个压缩文件,其中包含了详细的日志和配置信息,可用于进一步分析问题原因。
### 检查 Secure Boot 设置
如果你的系统启用了 Secure Boot 功能,这可能会阻止非签名的内核模块加载。进入 BIOS 设置中禁用 Secure Boot 可能有助于解决问题。
### 检查 DKMS 模块状态
动态内核模块支持 (DKMS) 是保持第三方内核模块在内核更新后仍然可用的关键组件。确认 `nvidia-dkms` 是否安装并处于活动状态:
```bash
sudo dkms status
```
如果没有看到 NVIDIA 相关条目,请安装它:
```bash
sudo apt-get install nvidia-dkms-<version>
```
---
阅读全文
相关推荐










