鲲鹏昇腾部署deepseek连接vscode

### 鲲鹏昇腾平台部署 DeepSeek 模型并通过 VSCode 进行连接和调试 #### 1. 环境准备在鲲鹏昇腾平台上部署 DeepSeek 模型之前，需完成以下环境准备工作： - 安装 openEuler 24.03 LTS 或更高版本的操作系统。 - 配置 Python 开发环境，推荐使用 `Python 3.8` 或以上版本。 - 安装 NVIDIA GPU 和昇腾 AI 处理器驱动程序以及相关依赖库。安装必要的工具包以支持模型加载与推理： ```bash pip install torch torchvision transformers accelerate safetensors vllm huggingface-hub export HF_ENDPOINT="https://hf-mirror.com" ``` #### 2. 下载 DeepSeek 模型为了提高下载效率，建议从 hf-mirror 获取预训练模型文件。执行以下命令下载指定的 DeepSeek-R1 蒸馏版本（8B 参数量）[^1]： ```bash huggingface-cli login huggingface-cli download deepseek-ai/DeepSeek-R1-Distill-Llama-8B --local-dir ./models/ ``` 确认模型已成功存储到本地路径 `/home/deepseek/models/DeepSeek-R1-Distill-Llama-8B` 中。 #### 3. 启动模型服务基于 vLLM 推理框架启动 DeepSeek 模型的服务端口，具体命令如下所示[^3]： ```bash python -m vllm.entrypoints.openai.api_server \ --served-model-name deepseek-r1-distilled-8b \ --model /home/deepseek/models/DeepSeek-R1-Distill-Llama-8B \ --trust-remote-code \ --host 0.0.0.0 \ --port 8000 \ --max-model-len 4096 \ --tensor-parallel-size 8 \ --gpu-memory-utilization 0.8 \ --enforce-eager \ --dtype float16 & ``` 此过程会绑定 HTTP API 到主机地址 `0.0.0.0` 的 `8000` 端口上供外部访问调用。 #### 4. 使用 VSCode 连接到远程服务器通过 SSH 插件实现 Visual Studio Code 对目标鲲鹏昇腾计算节点的安全连接： - 打开扩展市场搜索 “Remote – SSH”，点击安装插件； - 添加新的配置项输入类似形式字符串：`ssh username@your-server-ip-address`; - 输入密码或者密钥认证登录后即可进入远端开发模式；设置断点并利用集成终端发送请求验证功能正常运作情况。例如编写简单的客户端脚本测试接口响应时间及准确性: ```python import requests url = 'http://localhost:8000/v1/completions' payload = { "prompt": "Explain quantum computing.", "max_tokens": 50, } response = requests.post(url, json=payload).json() print(response['choices'][0]['text']) ``` 运行该代码片段应返回由 DeepSeek 提供的相关解释文字内容[^4]。 ---

阅读全文

鲲鹏昇腾部署deepseek连接vscode

相关推荐

华为云鲲鹏服务器部署文档-中电高科V5.12.pdf

鲲鹏开发套件 鲲鹏开发套件插件工具（VSCode）.pdf

第四章 鲲鹏应用部署和发布.pptx

鲲鹏920+deepseek

鲲鹏+昇腾部署DeepSeek-R1-Distill-Qwen-32B+webui

2021年鲲鹏代码迁移工具FAQ：VSCode与IntelliJ插件安装与问题解决方案

鲲鹏开发套件VSCode插件用户指南

鲲鹏+昇腾+deepseek部署

linux vllm部署deepseek

300I DUO部署deepseek

Windows使用lightllm本地部署deepseek

linux 下使用vLLM 部署 deepseek

vllm部署deepseek 思考过程bu

在linux上使用vllm部署deepseek

xinference部署DeepSeek R1 Distill Qwen 32B

部署deepseek 国产化GPU有哪些

现有鲲鹏920的48核处理器的服务器+昇腾的Atlas 300i duo卡一张部署deepseek大模型，有几种部署方式，给出详细的具体步骤，还有部署中的问题并给出解决方案

在华为800I A2服务器上用麒麟系统部署deepseek70B模型的具体操作

鲲鹏+Atlas300i duo推理卡物理机部署deepseek模型的具体详细教程和思维导图，并给出部署过程中常见的问题和解决的具体办法，操作系统为Ubuntu22.04，使用的是mindie的容器镜像

现有鲲鹏48核服务器一台+atlas300i duo卡一张，安装了Ubuntu22.04操作系统，并且安装完了NPU卡的驱动和固件，下面如何部署deepseek大模型，请结合华为的mindie给出具体的部署教程

大家在看

C语言流程图生成工具

GPRS网络信令实例详解

The GNU Toolchain for ARM targets HOWTO.pdf

高频双调谐谐振放大电路设计3MHz+电压200倍放大.zip

中国地级市地图shp

最新推荐

鲲鹏云大数据实验docx

鲲鹏练习题六套.docx

鲲鹏应用者开发HCIA题库及答案.pdf

netty-all-4.1.23.Final.jar中文文档.zip

实现Struts2+IBatis+Spring集成的快速教程

【数据融合技术】：甘肃土壤类型空间分析中的专业性应用

Waymo使用稀疏图卷积处理LiDAR点云，目标检测精度提升15%

Dwr实现无刷新分页功能的代码与数据库实例

【空间分布规律】：甘肃土壤类型与农业生产的关联性研究

缓存延迟双删的实际解决方案通常怎么实现

鲲鹏开发套件鲲鹏开发套件插件工具（VSCode）.pdf

第四章鲲鹏应用部署和发布.pptx