Ubuntu单节点安装slurm
时间: 2025-06-07 07:48:31 浏览: 22
### 在Ubuntu单节点上安装和配置Slurm调度系统
在Ubuntu单节点上安装和配置SLURM调度系统,可以按照以下内容进行操作。SLURM(Simple Linux Utility for Resource Management)是一个开源的集群管理和作业调度系统,适用于Linux环境下的计算资源管理[^1]。
#### 1. 安装依赖包
首先需要确保系统中已安装必要的依赖包。执行以下命令以安装这些依赖项:
```bash
sudo apt update
sudo apt install -y wget gcc make munge libmunge-dev openssl libssl-dev
```
#### 2. 下载并编译SLURM源码
从官方源获取最新版本的SLURM源码,并进行编译安装:
```bash
wget https://download.schedmd.com/slurm/slurm-23.02.0.tar.bz2
tar -xjf slurm-23.02.0.tar.bz2
cd slurm-23.02.0
./configure --prefix=/usr/local/globle/softs/slurm/16.05.3
make
sudo make install
```
#### 3. 配置MUNGE服务
SLURM依赖于MUNGE进行身份验证。配置MUNGE服务以确保安全通信:
```bash
sudo mkdir -p /etc/munge /var/run/munge
sudo chown munge: /etc/munge /var/run/munge
sudo systemctl enable munge
sudo systemctl start munge
```
#### 4. 复制示例配置文件
将SLURM提供的示例配置文件复制到适当位置,并根据需求进行修改:
```bash
sudo cp etc/slurm.conf.example etc/cgroup.conf.example etc/slurmdbd.conf.example /usr/local/globle/softs/slurm/16.05.3/etc/
```
此步骤参考了相关文档中的说明[^2]。
#### 5. 编辑`slurm.conf`文件
编辑`/usr/local/globle/softs/slurm/16.05.3/etc/slurm.conf`文件,定义ClusterName、NodeName、Partition等参数。例如:
```bash
ClusterName=ubuntu-cluster
ControlMachine=localhost
NodeName=localhost NodeAddr=127.0.0.1 State=UNKNOWN
PartitionName=debug Nodes=localhost Default=YES MaxTime=INFINITE State=UP
```
#### 6. 启动SLURM服务
启动SLURM控制器和守护进程:
```bash
sudo scontrol ping
sudo slurmd
sudo slurmctld
```
#### 7. 测试SLURM功能
使用`sinfo`命令检查节点状态,确保SLURM正常运行:
```bash
sinfo
```
如果一切配置正确,您应该能够看到节点处于空闲状态。
```python
# 示例:提交一个简单的测试任务
echo "sleep 60" | sbatch
```
---
阅读全文
相关推荐


















