首页ubuntu系统通过vllm方式部署deepseek

ubuntu系统通过vllm方式部署deepseek

时间: 2025-03-05 15:47:42 浏览: 225

### Ubuntu系统中通过vLLM部署DeepSeek教程 #### 安装环境准备为了确保顺利部署，建议先准备好如下环境： - 系统版本：Ubuntu 20.04 或更高版本[^1]。 - Python 版本：Python 3.11 是推荐使用的版本。可以通过 Conda 创建虚拟环境来安装指定版本的 Python。创建并激活名为 `vllm` 的Conda环境： ```bash conda create -n vllm python=3.11 conda activate vllm ``` 接着，在该环境中安装必要的软件包： ```bash pip install vllm ``` 如果遇到CUDA版本不兼容的情况，可以考虑使用NVIDIA官方渠道提供的解决方案进行修复[^2]: ```bash conda install cuda -c nvidia ``` #### 下载模型文件对于想要部署的具体模型（例如 Deepseek-R1-8B 或者更大规模的 DeepSeek-R1-Distill-Llama-70B），需要提前完成下载操作[^1]。 #### 启动服务并将之置于后台运行为了让vLLM服务器能够持续稳定地提供API接口调用支持，应该采用适当的方法让其作为守护进程长期驻留在内存当中。这里给出了一种简单易行的做法——编写Shell脚本来实现这一点[^3]: 创建一个新的shell脚本文件 `start_vllm.sh` ，并向其中加入以下内容： ```bash #!/bin/bash # 启动 vllm 并将其放在后台执行 vllm serve DeepSeek-R1-Distill-Llama-70B --tensor-parallel-size 4 --gpu_memory_utilization 0.95 --port 6006 & # 输出后台进程的 PID echo "vllm server is running in the background with PID $!" ``` 给这个脚本添加可执行权限，并通过它启动服务： ```bash chmod +x start_vllm.sh ./start_vllm.sh ``` 这样设置之后，即使关闭终端窗口也不会影响到已经处于后台的服务程序继续正常运作。

阅读全文

大家在看

粒子群算法matlab编写代码

粒子群算法。采用matlab编程，里面代码每一行都有自己的注释，以前学习的时候，自己编写的，程序能顺利运行

PT650D称重显示器在配料秤中的应用

超实用zimo21取字模软件.7z

ipmitool v1.8.18 for windows

服务器BMC访问控制工具，windows版，自己编译的，用着还不错。基于github最新版1.8.18编译。

matlab开发-高斯系数模型中DoLoanPortfolio的累积分布函数

matlab开发-高斯系数模型中DoLoanPortfolio的累积分布函数。用高斯因子模型计算CDO贷款组合损失的累积分布函数

最新推荐

ubuntu系统通过vllm方式部署deepseek

相关推荐

ubuntu通过vllm部署deepseek

ubuntu通过vllm在服务器上部署deepseek

vllm docker部署deepseek r1

ubuntu vllm部署deepseek

ubuntu下部署vllm下载deepseek

linux vllm部署deepseek

linux 下使用vLLM 部署 deepseek

在服务器身上使用vllm部署deepseek

vllm部署deepseek满血版

在linux上使用vllm部署deepseek

如何在Ubuntu系统中安装和配置DeepSeek

ubuntu部署deepseek多GPU部署

UBUNTU本地部署deepseek

DeepSeek vllm多机部署

deepseek本地部署vllm

ubuntu服务器部署DeepSeek-R1-Distill-Qwen-1.5B

Ubuntu上可以部署本地deepseek吗，该怎么弄

deepseek本地部署 ubuntu

ubuntu24.04安装vllm

课程设计-jsp2100学生档案管理系统sqlserver-qkr.zip

大家在看

粒子群算法matlab编写代码

PT650D称重显示器在配料秤中的应用

超实用zimo21取字模软件.7z

ipmitool v1.8.18 for windows

matlab开发-高斯系数模型中DoLoanPortfolio的累积分布函数

最新推荐

课程设计-jsp2100学生档案管理系统sqlserver-qkr.zip

Java算法：二叉树的前中后序遍历实现

【性能测试基准】：为RK3588选择合适的NVMe性能测试工具指南

grant usage on ** to bcc@*%

Nokia手机通用密码计算器：解锁神器

【固态硬盘寿命延长】：RK3588平台NVMe维护技巧大公开

缺省参数是什么

jxl API实现Excel文件的读写操作

【故障恢复策略】：RK3588与NVMe固态硬盘的容灾方案指南

python 设置webview的浏览器版本