ubuntu 经常卡死,特别是训练的时候

本文介绍了在Ubuntu系统中遇到显卡驱动问题后的解决步骤,包括进入修复模式、卸载原有驱动、安装CUDA及NVIDIA驱动的过程,并解决了安装过程中的一些常见错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ubuntu 经常死机,表现为画面不动,鼠标无反应,键盘无反应。

理解为显卡驱动有问题。错误的卸载显卡驱动后,发现电脑开机无反应。

1、找不到参考网址了,大致是开机->按住shift->进入grub->选择ubuntu Advance-->选中第一个recovery mode->选择root可以参考ubuntu如何进入修复模式,单用户模式,在进入系统前调出root用户的终端进行修复_zmhzmhzm的博客-CSDN博客_ubuntu单用户模式修复系统

2、卸载驱动

参考 Ubuntu卸载nvidia驱动的方法 - 建站服务器 - 亿速云

sudo apt-get --purge remove nvidia*

sudo apt autoremove

reboot

3、进入后直接安装cuda,因为显卡驱动要选择好多,所以直接参照

从0开始搭建深度学习多GPU服务器 Ubuntu20.04 Sever + Docker-拜师资源博客

下载相应的cuda,然后自动安装对应的驱动。

sudo chmod a+x cuda。。。_linux.run

sudo sh cuda_。。。_linux.run

4、不知道什么原因一致安装不成功

install of driver component failed

ERROR: You appear to be running an X server

继续参考drivers - How to install NVIDIA.run? - Ask Ubuntu

a、Ctrl+Alt+F1(Ctrl+Alt+F7逆向操作)

b、sudo service lightdm stop

c、chmod +x ./your-nvidia-file.run(放在home目录下,省的找不到)

d、sudo ./your-nvidia-file.run

e、直接重启,否则出现(nvidia-smi unable to determine the device handle for gpu,重启就好)

<think>好的,我现在需要帮助用户解决在虚拟机中运行Ubuntu系统时遇到的卡死问题。首先,我要回顾用户提供的引用内容,从中提取可能的原因和解决方案。引用中有提到Ubuntu 24.04在VMware中由于图形驱动问题导致黑屏和卡死,还有编译时卡死可能与VMware版本有关,以及共享文件夹的问题需要安装open-vm-tools等。此外,还有关于Ubuntu频繁卡死的解决方案,比如调整CPU策略和内存管理。 首先,我需要整理这些引用中的关键点。用户的问题可能涉及图形驱动、虚拟机设置、VMware版本、资源分配以及系统优化等方面。接下来,我需要将这些信息组织成一个结构清晰的回答,分点说明原因和对应的解决方案。同时,要确保使用正确的中文表达,并遵循格式要求,比如行内数学公式用$...$,独立公式用$$...$$,不过这里可能用不上数学公式,但需要注意其他格式要求。 用户可能遇到的问题包括安装时的黑屏、进入桌面后卡死、编译过程中卡死、共享文件夹问题等。每个问题可能有不同的原因和解决方法。例如,引用[2]提到Ubuntu24的图形加速驱动问题,解决方案是关闭3D加速或更新驱动。引用[3]则指出升级VMware到17.0.0解决了编译卡死的问题。引用[4]建议使用open-vm-tools代替VM Tools。引用[5]提供了系统优化的方法,如调整CPU策略和内存管理。 需要将这些信息整合成用户容易理解的步骤,可能按常见原因分类,每个原因下给出具体解决方法。同时,要确保回答真实可靠,参考了提供的引用内容,并在适当位置添加引用标识。最后,生成相关问题,帮助用户进一步排查或优化他们的系统。 现在,我需要检查是否有遗漏的引用内容,并确保所有可能的解决方案都被涵盖。例如,引用[1]和[2]主要针对图形驱动问题,引用[3]涉及VMware版本,引用[4]关于共享文件夹工具,引用[5]关于系统资源优化。这些都需要在回答中提及。 最后,按照用户的要求,结构要清晰,分点说明原因和解决方案,使用中文,并添加相关问题。确保回答符合系统级指令中的格式要求,没有使用任何markdown,行内公式正确,独立公式单独成段(虽然这里可能不需要)。同时,正确添加引用标识,例如[^2]、[^3]等。</think>### 虚拟机中Ubuntu卡死的原因及解决方案 #### 一、常见原因分析 1. **图形驱动冲突** Ubuntu 24.04默认启用了3D图形加速功能,可能与VMware的虚拟显卡驱动不兼容,导致进入桌面时黑屏或卡死[^2]。 2. **虚拟机软件版本过低** 旧版VMware(如16.x)对Ubuntu新版本支持不足,编译程序或高负载任务时易触发卡死[^3]。 3. **资源分配不足** CPU核心数、内存或硬盘空间分配过小,系统资源耗尽导致无响应[^5]。 4. **虚拟化工具不兼容** 使用VMware Tools替代推荐的`open-vm-tools`可能引发共享文件夹、剪贴板等功能异常,间接导致卡顿[^4]。 5. **系统优化不足** Ubuntu默认的CPU频率策略(如`ondemand`)可能在高负载时响应延迟,需手动调整[^5]。 --- #### 二、分步解决方案 ##### 1. 图形驱动问题修复 - **关闭3D图形加速** 在VMware设置中取消勾选「加速3D图形」,重启虚拟机[^2]。 - **更新图形驱动** 若需保留3D加速功能,通过终端执行以下命令更新驱动后重启: ```bash sudo add-apt-repository ppa:oibaf/graphics-drivers sudo apt update && sudo apt upgrade ``` ##### 2. 升级虚拟机软件 - 将VMware升级至**17.0或更高版本**,修复已知的兼容性问题[^3]。 ##### 3. 资源分配调整 - **基础配置建议** - CPU核心:≥2核 - 内存:≥4GB - 硬盘:≥40GB(动态分配需预留足够物理空间) - 显存:≥2GB(若启用3D加速) - **编译卡死优化** 在VMware设置中启用「虚拟化Intel VT-x/EPT或AMD-V/RVI」,提升CPU性能。 ##### 4. 使用兼容的虚拟化工具 - 卸载VMware Tools,安装开源工具包: ```bash sudo apt install open-vm-tools open-vm-tools-desktop ``` ##### 5. 系统级优化 - **调整CPU策略** 安装`cpufrequtils`并设置为高性能模式: ```bash sudo apt install cpufrequtils sudo cpufreq-set -g performance ``` - **内存管理脚本** 创建定时任务释放缓存(每1分钟执行): ```bash echo "*/1 * * * * root sync && echo 3 > /proc/sys/vm/drop_caches" | sudo tee -a /etc/crontab ``` --- #### 三、紧急恢复方法 若系统已卡死,按以下步骤强制操作: 1. **进入终端** - 按`Ctrl+Alt+F2`切换到tty命令行[^2]。 2. **终止进程** - 使用`top`查找高占用进程并`kill -9 PID`。 3. **安全关机** - 执行`sudo shutdown -h now`。 ---
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值