在linux机器上安装NVIDIA vGPU license server
前言
GPU云服务器,如需使用OpenGL/DirectX/Vulkan等图形加速能力,需要安装GRID驱动并自行购买和配置使用GRID License(实测有的3D软件在机器安装Grid驱动后就不报错了,否则打开软件报错。)
关于GPU服务器使用grid驱动和license的问题,需要去官网申请。我这边是公司申请好后部署安装的。
收到nvidia官方发送的license邮件就可以进行部署了。
开始
邮件中第一页包含license信息第二页是相关技术连接。
通过邀请链接,进行注册(会自动生成一个PAK ID/Entitlement ID)。貌似不从NVIDIA给的链接进不去(大家可以试一试)。
填写个人信息。
注册完成验证邮箱,并设置密码
创建license server
创建完成可以看到
导出许可证 .bin文件
云服务器部署NVIDIA license server
官网下载相应版本的软件:这里使用linux版本legacy。(新的驱动版本可以直接使用新的cls模式的license,不用自己建license server,用NVIDIA云端license server就行。)
下载完成上传到云服务器上(尽量选择非显卡服务器部署,以免产生一些小bug)。
这里由于服务器数量有限部署在gpu2 上。
下载 得到 NVIDIA-ls-linux-2022.09.0.31771813.zip
tomcat 部署
这里使用ubuntu 18.04 系统
先在线安装java
apt install openjdk-8-jre-headless
root@gpu-0002:~# java -version
openjdk version "1.8.0_352"
OpenJDK Runtime Environment (build 1.8.0_352-8u352-ga-1~18.04-b08)
OpenJDK 64-Bit Server VM (build 25.352-b08, mixed mode)
tomcat 官网https://tomcat.apache.org/
下载
sudo groupadd tomcat
useradd -d /usr/share/tomcat -g tomcat -M -s /bin/false tomcat
sudo mkdir -p /usr/share/tomcat
tar zxf apache-tomcat-8.5.65.tar.gz 、
sudo mv apache-tomcat-8.5.65 /usr/share/tomcat
sudo chgrp -R tomcat /usr/share/tomcat
cd /usr/share/tomcat
sudo chmod -R g+r conf
sudo chmod g+x conf
sudo chown -R tomcat webapps work temp logs
配置systemd 管理tomcat
sudo vi /etc/systemd/system/tomcat.service service
[Unit]
Description=Apache Tomcat Server
After=network.target
[Service]
Type=forking
Environment=JAVA_HOME=jre-directory
Environment=CATALINA_PID=/usr/share/tomcat/temp/tomcat.pid
Environment=CATALINA_HOME=/usr/share/tomcat
Environment=CATALINA_BASE=/usr/share/tomcat
Environment='CATALINA_OPTS=-Xms512M -Xmx1024M -server -XX:+UseParallelGC'
Environment='JAVA_OPTS=-Djava.awt.headless=true -Djava.security.egd=file:/dev/./urandom'
ExecStart=/usr/share/tomcat/bin/startup.sh
ExecStop=/usr/share/tomcat/bin/shutdown.sh
User=tomcat
Group=tomcat
UMask=0007
RestartSec=15
Restart=always
[Install]
WantedBy=multi-user.target
启动tomcat
sudo systemctl daemon-reload
sudo systemctl enable tomcat.service
sudo systemctl start tomcat.service
访问http://ip:8080
注意云服务公网环境需要相关端口备案才能访问,并开启相关端口访问限制。
安装license server
图形化界面:
unzip NVIDIA-ls-linux-2022.09.0.31771813.zip(这个压缩包里有安装说明文档)
chmod +x setup.bin
sudo ./setup.bin
大多数我们都是命令行所以使用这个安装方式:
unzip NVIDIA-ls-linux-2022.09.0.31771813.zip
chmod +x setup.bin
sudo ./setup.bin -i silent
一直默认enter
安装完毕 enter 退出
The options for selecting ports to be opened in the firewall are presented as follows:
->1- License server (port 7070)
2- Management interface (port 8080)
‣ Press Enter to accept the default setting.
通过浏览器访问页面
HTTP: http://localhost:8080/licserver
HTTPS: https://localhost:https-port/licserver
部署完成
导入之前下载的.bin 文件
导入完成
修改所有GPU服务器的配置文件
sudo vi /etc/nvidia/gridd.conf
修改以下信息
ServerAddress=部署的license svr ip如192.168.100.1
ServerPort=7070
FeatureType=1
保存重启
service nvidia-gridd restart
可以在svr页面上看到已经分配到license的机器
over