Ven%-CSDN博客

原创 3小时从0到1：快速打造专属大语言模型实战指南

在人工智能迅猛发展的今天，大语言模型(LLM)已成为技术领域的热点。许多人认为训练自己的语言模型需要大量时间和资源，但实际上，通过正确的方法和工具，你可以在短短3小时内从零开始构建一个属于自己的语言模型。本文将手把手教你如何使用MiniMind项目快速实现这一目标。通过MiniMind项目，我们可以在极短时间内构建和训练属于自己的语言模型。整个过程分为三个主要阶段：环境准备、预训练和微调。每个阶段都有明确的步骤和验证方法。先从测试现有模型开始，了解模型的基本能力。

2025-09-13 17:23:59 731

原创解决 MobaXterm 左侧文件列表（SCP/SFTP）不显示问题

MobaXterm 的左侧文件浏览器是其最实用的功能之一，通过确保正确启用 SCP 文件传输选项，大多数文件列表显示问题都可以解决。如果问题仍然存在，请检查服务器权限和网络设置，或尝试重新创建会话。希望本指南能帮助您顺利使用 MobaXterm 管理远程服务器文件。如有其他问题，欢迎在评论区留言讨论。

2025-09-13 17:23:13 206

原创 vLLM 和 SGLang开启工具调用能力的参数--tool-call-parser 不通用???

本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的配置差异。重点指出vLLM使用--tool-call-parser hermes参数，而SGLang需使用--tool-call-parser qwen25参数，两者不可混淆。文章提供了完整的部署示例和测试方法，并强调若项目已内置解析器则无需额外指定该参数。最后提示用户注意框架参数差异，避免配置错误导致部署失败。

2025-09-12 10:53:33 969

原创正确使用 SGLang 和 vLLM 中为 Qwen3 开启工具调用能力的完整指南

本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的方法。主要内容包括：vLLM中需配置--tool-call-parser hermes和--enable-auto-tool-choice参数，SGLang中使用--tool-call-parser qwen25参数；提供了完整的部署命令示例和测试工具调用的curl请求模板；对比了两个框架的关键参数差异；总结了常见问题解决方案和性能优化建议。正确配置后，Qwen3能够充分发挥其外部工具调用能力，为AI应用开发提供支持。

2025-09-12 10:51:53 1075

原创如何解决 SGLang 启动 Qwen3 模型时报错:unrecognized arguments: --enable-auto-tool-choice

在使用SGLang部署Qwen3大模型时，若遇到--enable-auto-tool-choice参数报错，需注意SGLang与vLLM框架的参数不兼容问题。解决方案是移除该参数，改用SGLang支持的专用参数：工具调用功能使用--tool-call-parser qwen25，推理功能使用--reasoning-parser qwen3。本文对比了两个框架的参数差异，提供了完整的部署示例和测试方法，并强调不要混合使用不同框架参数。最终建议开发者根据官方文档选择正确的参数配置，确保模型功能正常启用。

2025-09-12 10:49:35 760

原创解决NVIDIA-SMI报错：Failed to initialize NVML: Driver/library version mismatch

摘要：当Linux系统出现"NVIDIA驱动版本不匹配"（NVML错误）时，通常是由于内核模块与用户库版本不一致导致。解决方法包括：1）优先尝试重启系统；2）手动卸载并重载内核模块；3）确保安装匹配的驱动版本（如通过apt安装对应版本）；4）必要时使用官方.run文件手动安装。预防措施建议使用统一安装源、定期更新后重启系统。该问题本质是版本不一致，通过版本对齐即可解决。（149字）

2025-09-11 10:17:17 1195

原创如何查看GPU运行情况:使用 Conda 安装 nvitop 新手指南

A[安装Miniconda/Anaconda] --> B[创建Conda环境<br>conda create -n nvitop-env python=3.9]B --> C[激活环境<br>conda activate nvitop-env]C --> D[安装nvitop<br>pip install nvitop]D --> E[验证安装<br>nvitop]E --> F{运行是否正常?F -- 是 --> G[🎉 安装成功]F -- 否 --> H[排查_curses等问题]

2025-09-11 10:09:51 754

原创 Vue项目构建与部署指南：从yarn build到运行生产版本

如果你的Vue应用使用了Vue Router的history模式，需要确保服务器配置正确重定向所有路由到index.html，否则刷新页面会出现404错误。执行此命令后，终端会显示本地服务器地址（通常是http://localhost:3000），在浏览器中打开即可查看你的Vue应用。记得在部署前测试生产版本的功能是否正常，并确保服务器配置正确处理Vue Router的history模式（如果使用的话）。这个目录包含了优化后的静态资源文件，可以直接部署到任何Web服务器。你可以创建一个简单的部署脚本。

2025-09-10 17:06:13 352

原创第一章神经网络的复习

如上所示，可以使用 np.array() 方法生成向量或矩阵。该方法会生成NumPy 的多维数组类 np.ndarray。shape 表示多维数组的形状，ndim 表示维数。水平方向上排列称为行(row),垂直方向上的排列称为列(column);以下矩阵称为"3行2列的矩阵",记为"3x2的矩阵"对应多维数组中的元素（独立）进行的，这就是 NumPy 数组中的对应元素的运算。向量可以表示为排成一排的数字集合，在 Python 实现中可以处理为一维数组。会自动扩展成2X2的矩阵(),这种自动扩展的功能称为。

2025-09-09 15:51:38 243 1

原创使用nvidia-ml-py监控与管理GPU资源

（也称为pynvml）是NVIDIA提供的Python接口，用于访问和管理NVIDIA GPU设备的状态信息和工作状况。它是NVML（NVIDIA Management Library）的Python绑定，允许开发者直接从Python程序中查询GPU的显存使用、温度、功耗、利用率等关键指标。这个工具特别适用于深度学习框架（如PyTorch和TensorFlow）的GPU监控，可以帮助开发者优化资源分配、自动选择设备以及监控训练过程中的GPU状态。

2025-09-08 16:17:01 939

原创 cn2an：中文数字与阿拉伯数字的智能转换工具

cn2an 是一个高效、易用的 Python 工具库，专门用于实现中文数字和阿拉伯数字之间的相互转换。无论是处理财务金额、日期还是其他包含数字的文本，cn2an 都能提供便捷的处理方式。中文数字 → 阿拉伯数字（如“一百二十三” → 123）阿拉伯数字 → 中文数字（如 123 → “一百二十三”）句子中的数字转换（如“我捡了一百块钱” → “我捡了100块钱”）cn2an 还具备处理小数负数大写中文数字（如“壹佰贰拾叁”）以及人民币大写格式（如“壹佰贰拾叁元整”）的能力。

2025-09-08 16:10:21 613

原创在 Linux 系统下创建 RAR 压缩文件的完整指南

在跨平台文件交换和归档过程中，RAR 格式因其高效的压缩算法和对分卷、加密等功能的良好支持而备受青睐。然而，由于 RAR 是一种专有格式，绝大多数 Linux 发行版并未预装所需的工具。本文将详细介绍如何在 Linux 环境下安装必要的软件，并使用命令行和图形界面两种方式创建、管理 RAR 压缩文件。虽然 Linux 系统默认不支持 RAR 格式压缩，但通过安装rar工具包，用户可以轻松创建功能丰富的 RAR 压缩文件。无论是简单的文档打包，还是需要加密、分卷等高级功能，rar。

2025-08-28 11:36:02 948

原创解决VSCode中Cline插件的Git锁文件冲突问题

本文针对VSCode中Cline插件常见的Git锁文件冲突问题（index.lock文件冲突）提供了解决方案。问题表现为插件无法创建检查点，提示文件已存在。分析原因是Git进程冲突导致锁文件未被清理。提供了四种解决方法：手动删除锁文件、终止Git进程、重置检查点目录或完全重新初始化Git仓库。同时给出了预防措施，包括规范操作流程、定期维护、环境配置优化和监控设置。通过以上方法可有效解决该问题，保障开发环境的稳定运行。

2025-08-27 17:04:20 484

原创如何在 Linux 中解压 .tar 文件到指定目录

在 Linux 系统中，.tar文件是一种常见的归档格式，用于将多个文件组合成单个文件以便于存储或分发。虽然.tar文件本身不进行压缩，但它常与压缩工具结合使用，形成.tar.gz.tar.bz2等压缩格式。本文将重点介绍如何解压基本的.tar文件到指定目录。解压.tar文件到指定目录是一个简单但重要的 Linux 操作。记住使用-C参数指定目标目录，并结合-v参数查看详细输出，可以大大提高工作效率。在实际操作前，始终确保目标目录存在且您有适当的权限，这样可以避免不必要的错误。

2025-08-27 15:28:13 329

原创 Linux下解压RAR文件到指定目录的完整指南

在Linux中解压RAR文件到指定目录主要使用unrar x命令加上目标路径。使用x而非e来保留目录结构解压到指定位置目标路径以斜杠()结尾加密文件使用-p参数指定密码分卷压缩只需解压第一个分卷虽然RAR格式在Linux中可以得到很好支持，但考虑到RAR是专有格式，对于长期存储，建议使用ZIP或7Z等开源格式。希望本指南帮助你顺利在Linux系统下解压RAR文件到指定目录。如有其他问题，可以通过查看完整帮助信息。

2025-08-27 15:27:20 641

原创集合竞价全解析：揭秘开盘前的暗战与当天走势预判

集合竞价是每个交易日的序幕，虽然只有短短的10分钟，却包含了丰富的信息。掌握集合竞价的规则和看盘技巧，能够帮助投资者更好地把握开盘节奏，预判当天走势。但需要注意的是，集合竞价只是分析工具之一，不能作为唯一的决策依据，应该结合技术分析、基本面分析和市场环境综合判断。投资有风险，入市需谨慎。希望本文能帮助您更好地理解集合竞价，提升投资技能！

2025-08-25 18:32:49 830

原创如何解决MobaXterm会话数达到14个后无法新增会话???

MobaXterm免费版14个会话的限制是一个已知的“特性”而非缺陷。终极方案：购买专业版，支持开发者并获得完整体验。技术方案：手动编辑配置文件，适合喜欢动手的用户。实用技巧：充分利用文件夹功能来分类管理会话，这是免费用户最简单有效的扩容方法。希望这篇博客能帮助您顺利解决会话限制的问题，让您的MobaXterm再次高效起来！

2025-08-22 16:12:59 931

原创如何使用命令行将DOCX文档转换为PDF格式?

使用LibreOffice的命令行工具进行文档格式转换是一种高效、自动化的方法，特别适用于需要批量处理文档的场景。通过简单的命令，我们可以快速将DOCX文件转换为PDF格式，无需人工干预。这种方法可以集成到脚本中，实现文档处理的自动化流程。掌握了这一技术后，您可以轻松地处理大量文档转换任务，提高工作效率。无论是个人使用还是企业级应用，命令行文档转换都是一个值得掌握的实用技能。

2025-08-22 10:22:26 865

原创在 Linux 中全局搜索 Word 文档内容的完整指南

命令，我们可以在 Linux 系统中有效地搜索 Word 文档内容。这种方法不仅解决了二进制文档无法直接搜索的问题，还提供了灵活的参数化和优化选项。Pandoc 是一个强大的文档格式转换工具，它可以将 Word 文档转换为纯文本，然后我们就可以使用常规的文本搜索工具来处理了。无论是使用脚本还是单行命令，这种技术都能帮助你在大量 Word 文档中快速定位需要的内容，大大提高工作效率。提示：本文方法同样适用于搜索其他 Pandoc 支持的文档格式，只需调整输入格式参数即可。命令可以轻松胜任，但当我们需要搜索。

2025-08-21 18:06:34 433

原创解决Windows SSH连接失败：Permissions for private key are too open

步骤核心操作说明原因权限过于宽松NTFS ACL中存在诸如Users等组的读权限。解决修改ACL禁用继承，并删除所有非必要用户/组，只保留SYSTEM和当前用户。验证重新连接执行SSH命令，警告消失且连接成功。预防妥善保管密钥将密钥存放在权限可控的目录下，避免随意复制。这个看似棘手的权限问题，一旦理解了其背后的安全逻辑，解决起来就非常简单。希望这篇博客能帮助你彻底解决这个问题，并让你对Windows下的SSH密钥管理有更深的理解。

2025-08-21 15:04:18 778

原创解决 MobaXterm SSH 隧道端口转发失败的终极指南：从排查到解决

第一反应：遇到隧道失败，首先检查本地端口占用。配置原则Local port: 本地任意空闲端口。: 几乎总是127.0.0.1。: 永远是宿主机（远程服务器）上被映射的端口。测试方法：学会在远程服务器上使用curl或wget进行本地测试，这是判断服务是否可达的金标准。防火墙意识：部署服务后，放行相关端口应成为肌肉记忆。希望这篇详细的指南能帮你彻底征服 MobaXterm 的端口转发问题，让网络隧道真正成为你畅通无阻的捷径。

2025-08-20 16:48:33 864

原创本地也能跑自己专属的最新GPT！OpenAI开源新模型部署教程（附避坑指南）

两大模型震撼登场，个人电脑也能部署专属GPT。本文手把手教你从零部署，避开版本兼容“深坑”，20分钟跑通最新模型！：《如何用个人数据微调GPT-OSS？三步打造专属智能助手》：GPT-OSS系列需Ollama ≥ v0.11.3！时隔6年，OpenAI重磅开源！（部署问题欢迎提问，博主秒回！

2025-08-20 11:23:24 519

原创迁移 Xinference 服务：从 Docker 容器到新机器的完整指南

打包commit保存运行时状态传输save/scp跨机器移动恢复load/run快速重建服务采用本文介绍的最佳实践，您可以在 10 分钟内完成 Xinference 服务的迁移，服务中断时间不超过 1 分钟。对于生产环境，建议结合 Dockerfile 标准化构建和 Volume 数据持久化方案，实现服务的快速部署和弹性伸缩。迁移时间统计中型模型（2-3GB）：迁移过程约 5-8 分钟大型模型（10GB+）：建议结合模型仓库分离存储。

2025-08-19 14:27:33 1076

原创解决RAGFlow启动时Elasticsearch容器权限错误的技术指南

Elasticsearch因权限问题无法写入数据目录，最终以非正常状态退出（exit code 1）。：权限问题解决后，RAGFlow应能自动连接Elasticsearch。若仍存在组件通信问题，请检查。通过本方案，95%以上的ES启动权限错误可被彻底解决。Docker Compose中未显式声明数据目录权限配置。若宿主机启用SELinux，会阻止容器写入挂载目录。SELinux限制（仅限RHEL/CentOS）在启动RAGFlow项目时，执行。和所有者UID 1000）

2025-08-19 11:36:30 219

原创一键穿透内网！用 MobaXterm 隧道轻松本地访问远程 RagFlow 服务

零配置：无需修改服务器安全组/NAT 规则高安全：全程 SSH 加密传输低成本：无需额外部署内网穿透工具即时生效：3 分钟快速建立连接现在，打开你的 MobaXterm，开始享受无缝访问远程 RagFlow 的流畅体验吧！如果有其他隧道技巧或问题，欢迎在评论区交流讨论👇技术栈扩展：该方案同样适用于访问 Elasticsearch、MySQL、Redis 等任何绑定127.0.0.1的服务！

2025-08-18 19:36:37 170

原创 ComfyUI新手快速上手指南：5分钟完成首个AI绘画工作流(0基础都能看懂)

打开工作流后,会弹出提示模型缺失，复制模型名称 v1-5-pruned-emaonly。本文面向零基础用户，通过可视化流程+关键模型获取，助你快速生成第一张AI绘画作品。此模型为Stable Diffusion 1.5的精简版，适合新手快速测试。，探索文生图/图生图/ControlNet等高级功能。返回ComfyUI工作流界面,选择刚才上传的模型。5.点击ctrl+enter,重复生成。在右侧预览区查看结果。

2025-08-15 11:11:17 498

原创一键换装魔法：基于ComfyUI工作流的Stable Diffusion服装替换指南

本文介绍了Stable Diffusion 3 Medium和ComfyUI在图像生成领域的创新应用，重点解析了服装替换工作流的技术原理与实现方法。文章从Stable Diffusion的扩散模型原理出发，阐述了基于节点化的ComfyUI工作流架构，详细说明了服装替换涉及的语义分割、姿态控制和局部重绘三大关键技术。同时提供了从工作流获取、安装到具体执行的完整指南，包括关键参数配置、模型选择建议和常见问题解决方案。文章还展望了工作流在跨风格转换和3D生成等领域的进阶应用，展现了AI创作"工作流即服务

2025-08-15 09:18:46 434

空空如也

空空如也