Ubuntu Nvidia Docker单机多卡环境配置

ubuntu版本是22.04,现在最新版本是24.xx,截止当前,Nvidia的驱动最高还是22.04版本,不建议更新至最新版本。本部分是从0开始安装Nvidia docker的记录,若已安装Nvdia驱动,请直接跳至3。

1、更新软件软件列表

更新apt,安装gcc、g++等

apt-get update
apt-get install g++ gcc make

2、Nvidia显卡安装(建议方式2)

0)预备条件

  • 查看是否有物理显卡,执行命令出现显卡信息则有物理显卡,否则需要查看显卡是否安装或者插拔一下
    lspci | grep -i nvidia
    
  • 查看是否已有Nvidia显卡驱动,若存在与即将安装版本不一致,先卸载原有驱动
    nvidia-smi		# 查看是否有显卡驱动,无显卡信息输出则未安装
    sudo apt-get remove nvidia-*  		# 卸载原有的显卡驱动
    sudo apt purge *nvidia* *cuda* *libcudnn*	# 完全卸载NVIDIA驱动,包括配置文件
    sudo apt autoremove
    sudo rm -rf /etc/apt/sources.list.d/cuda*.list  # 如果安装了CUDA
    sudo rm -rf /etc/X11/xorg.conf*   # 删除残留配置文件
    sudo rm -rf ~/.config/nvidia-*
    nvidia-smi	# 确认卸载成功
    

1)安装方式1:

  • 查看显卡型号和支持的nvidia驱动版本
    lshw -c display
    ubuntu-drivers devices
    
  • 根据推荐的nvidia-driver下载对应的驱动
    • 选择推荐的版本:ubuntu-drivers autoinstall
    • 手动安装特定版本:apt install nvidia-driver-xxx
  • 安装完成后重启
    shutdown -r now  	# 关机后立即重启
    

2)安装方式2:

  • 英伟达官网,根据显卡、os等信息下载并安装显卡驱动,具体参考博文ubuntu下安装nvidia驱动。根据自身的实践经验,下载好驱动后只需要执行以下命令,博文中其他命令在基本上不影响安装:
    sudo ./NVIDIA-Linux-x86_64-435.21.run -no-opengl-files -no-x-check -no-nouveau-check
    

3)安装成功验证:

  • 执行命令nvidia-smi,界面呈现显卡详细信息即为安装成功

3、Nvidia docker安装

  • 安装nvidia-container-toolkit,下面提取了apt安装方式,其他比如yum、zypper等安装方式参考NVIDIA CONTAINER TOOLKIT ,apt安装方式根据下面命令复制安装即可。

    	curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
        sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
        sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
    
    apt-get install -y nvidia-container-toolkit
    
  • docker安装方式(可参考文章Ubuntu docker安装教程

    • 安装docker引擎
      apt install docker.io
      
    • (跳过) 加载docker镜像(国内加速镜像
      docker load -i nvdocker.tar # 其中nvdocker.tar是镜像名称压缩包,是docker pull后通过docker save命令保存的,或者采用docker pull命令拉取相关镜像
      
    • 验证docker是否可用
      docker run hello-world
      
      如果输出"Hello from Docker! xxx…",表明安装成功
  • 配置nvidia-docker

    nvidia-ctk runtime configure --runtime=docker
    systemctl restart docker
    
  • 验证nvidia docker是否可用

    docker run --gpu all hello-world
    

    如果输出"Hello from Docker! xxx…",表明安装成功

  • 使用GPU

    • docker run有个参数 --gpus,可指定分配几个GPU
    • all 表示使用所有的GPU, 数字 n 表示使用几个GPU
    • 还可指定具体使用哪个GPU,比如 --gpu device_0,表示使用第一个GPU

4、其他

  • 查看cpu架构
    • uname -m
    • lscpu
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值