- 博客(406)
- 收藏
- 关注
原创 3小时从0到1:快速打造专属大语言模型实战指南
在人工智能迅猛发展的今天,大语言模型(LLM)已成为技术领域的热点。许多人认为训练自己的语言模型需要大量时间和资源,但实际上,通过正确的方法和工具,你可以在短短3小时内从零开始构建一个属于自己的语言模型。本文将手把手教你如何使用MiniMind项目快速实现这一目标。通过MiniMind项目,我们可以在极短时间内构建和训练属于自己的语言模型。整个过程分为三个主要阶段:环境准备、预训练和微调。每个阶段都有明确的步骤和验证方法。先从测试现有模型开始,了解模型的基本能力。
2025-09-13 17:23:59
731
原创 解决 MobaXterm 左侧文件列表(SCP/SFTP)不显示问题
MobaXterm 的左侧文件浏览器是其最实用的功能之一,通过确保正确启用 SCP 文件传输选项,大多数文件列表显示问题都可以解决。如果问题仍然存在,请检查服务器权限和网络设置,或尝试重新创建会话。希望本指南能帮助您顺利使用 MobaXterm 管理远程服务器文件。如有其他问题,欢迎在评论区留言讨论。
2025-09-13 17:23:13
206
原创 vLLM 和 SGLang开启工具调用能力的参数--tool-call-parser 不通用???
本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的配置差异。重点指出vLLM使用--tool-call-parser hermes参数,而SGLang需使用--tool-call-parser qwen25参数,两者不可混淆。文章提供了完整的部署示例和测试方法,并强调若项目已内置解析器则无需额外指定该参数。最后提示用户注意框架参数差异,避免配置错误导致部署失败。
2025-09-12 10:53:33
969
原创 正确使用 SGLang 和 vLLM 中为 Qwen3 开启工具调用能力的完整指南
本文介绍了在vLLM和SGLang框架中部署Qwen3大模型并启用工具调用功能的方法。主要内容包括:vLLM中需配置--tool-call-parser hermes和--enable-auto-tool-choice参数,SGLang中使用--tool-call-parser qwen25参数;提供了完整的部署命令示例和测试工具调用的curl请求模板;对比了两个框架的关键参数差异;总结了常见问题解决方案和性能优化建议。正确配置后,Qwen3能够充分发挥其外部工具调用能力,为AI应用开发提供支持。
2025-09-12 10:51:53
1075
原创 如何解决 SGLang 启动 Qwen3 模型时报错:unrecognized arguments: --enable-auto-tool-choice
在使用SGLang部署Qwen3大模型时,若遇到--enable-auto-tool-choice参数报错,需注意SGLang与vLLM框架的参数不兼容问题。解决方案是移除该参数,改用SGLang支持的专用参数:工具调用功能使用--tool-call-parser qwen25,推理功能使用--reasoning-parser qwen3。本文对比了两个框架的参数差异,提供了完整的部署示例和测试方法,并强调不要混合使用不同框架参数。最终建议开发者根据官方文档选择正确的参数配置,确保模型功能正常启用。
2025-09-12 10:49:35
760
原创 解决NVIDIA-SMI报错:Failed to initialize NVML: Driver/library version mismatch
摘要:当Linux系统出现"NVIDIA驱动版本不匹配"(NVML错误)时,通常是由于内核模块与用户库版本不一致导致。解决方法包括:1)优先尝试重启系统;2)手动卸载并重载内核模块;3)确保安装匹配的驱动版本(如通过apt安装对应版本);4)必要时使用官方.run文件手动安装。预防措施建议使用统一安装源、定期更新后重启系统。该问题本质是版本不一致,通过版本对齐即可解决。(149字)
2025-09-11 10:17:17
1195
原创 如何查看GPU运行情况:使用 Conda 安装 nvitop 新手指南
A[安装Miniconda/Anaconda] --> B[创建Conda环境<br>conda create -n nvitop-env python=3.9]B --> C[激活环境<br>conda activate nvitop-env]C --> D[安装nvitop<br>pip install nvitop]D --> E[验证安装<br>nvitop]E --> F{运行是否正常?F -- 是 --> G[🎉 安装成功]F -- 否 --> H[排查_curses等问题]
2025-09-11 10:09:51
754
原创 Vue项目构建与部署指南:从yarn build到运行生产版本
如果你的Vue应用使用了Vue Router的history模式,需要确保服务器配置正确重定向所有路由到index.html,否则刷新页面会出现404错误。执行此命令后,终端会显示本地服务器地址(通常是http://localhost:3000),在浏览器中打开即可查看你的Vue应用。记得在部署前测试生产版本的功能是否正常,并确保服务器配置正确处理Vue Router的history模式(如果使用的话)。这个目录包含了优化后的静态资源文件,可以直接部署到任何Web服务器。你可以创建一个简单的部署脚本。
2025-09-10 17:06:13
352
原创 第一章 神经网络的复习
如上所示,可以使用 np.array() 方法生成向量或矩阵。该方法会生成NumPy 的多维数组类 np.ndarray。shape 表示多维数组的形状,ndim 表示维数。水平方向上排列称为行(row),垂直方向上的排列称为列(column);以下矩阵称为"3行2列的矩阵",记为"3x2的矩阵"对应多维数组中的元素(独立)进行的,这就是 NumPy 数组中的对应元素的运算。向量可以表示为排成一排的数字集合,在 Python 实现中可以处理为一维数组。会自动扩展成2X2的矩阵(),这种自动扩展的功能称为。
2025-09-09 15:51:38
243
1
原创 使用nvidia-ml-py监控与管理GPU资源
(也称为pynvml)是NVIDIA提供的Python接口,用于访问和管理NVIDIA GPU设备的状态信息和工作状况。它是NVML(NVIDIA Management Library)的Python绑定,允许开发者直接从Python程序中查询GPU的显存使用、温度、功耗、利用率等关键指标。这个工具特别适用于深度学习框架(如PyTorch和TensorFlow)的GPU监控,可以帮助开发者优化资源分配、自动选择设备以及监控训练过程中的GPU状态。
2025-09-08 16:17:01
939
原创 cn2an:中文数字与阿拉伯数字的智能转换工具
cn2an 是一个高效、易用的 Python 工具库,专门用于实现中文数字和阿拉伯数字之间的相互转换。无论是处理财务金额、日期还是其他包含数字的文本,cn2an 都能提供便捷的处理方式。中文数字 → 阿拉伯数字(如“一百二十三” → 123)阿拉伯数字 → 中文数字(如 123 → “一百二十三”)句子中的数字转换(如“我捡了一百块钱” → “我捡了100块钱”)cn2an 还具备处理小数负数大写中文数字(如“壹佰贰拾叁”)以及人民币大写格式(如“壹佰贰拾叁元整”)的能力。
2025-09-08 16:10:21
613
原创 在 Linux 系统下创建 RAR 压缩文件的完整指南
在跨平台文件交换和归档过程中,RAR 格式因其高效的压缩算法和对分卷、加密等功能的良好支持而备受青睐。然而,由于 RAR 是一种专有格式,绝大多数 Linux 发行版并未预装所需的工具。本文将详细介绍如何在 Linux 环境下安装必要的软件,并使用命令行和图形界面两种方式创建、管理 RAR 压缩文件。虽然 Linux 系统默认不支持 RAR 格式压缩,但通过安装rar工具包,用户可以轻松创建功能丰富的 RAR 压缩文件。无论是简单的文档打包,还是需要加密、分卷等高级功能,rar。
2025-08-28 11:36:02
948
原创 解决VSCode中Cline插件的Git锁文件冲突问题
本文针对VSCode中Cline插件常见的Git锁文件冲突问题(index.lock文件冲突)提供了解决方案。问题表现为插件无法创建检查点,提示文件已存在。分析原因是Git进程冲突导致锁文件未被清理。提供了四种解决方法:手动删除锁文件、终止Git进程、重置检查点目录或完全重新初始化Git仓库。同时给出了预防措施,包括规范操作流程、定期维护、环境配置优化和监控设置。通过以上方法可有效解决该问题,保障开发环境的稳定运行。
2025-08-27 17:04:20
484
原创 如何在 Linux 中解压 .tar 文件到指定目录
在 Linux 系统中,.tar文件是一种常见的归档格式,用于将多个文件组合成单个文件以便于存储或分发。虽然.tar文件本身不进行压缩,但它常与压缩工具结合使用,形成.tar.gz.tar.bz2等压缩格式。本文将重点介绍如何解压基本的.tar文件到指定目录。解压.tar文件到指定目录是一个简单但重要的 Linux 操作。记住使用-C参数指定目标目录,并结合-v参数查看详细输出,可以大大提高工作效率。在实际操作前,始终确保目标目录存在且您有适当的权限,这样可以避免不必要的错误。
2025-08-27 15:28:13
329
原创 Linux下解压RAR文件到指定目录的完整指南
在Linux中解压RAR文件到指定目录主要使用unrar x命令加上目标路径。使用x而非e来保留目录结构解压到指定位置目标路径以斜杠()结尾加密文件使用-p参数指定密码分卷压缩只需解压第一个分卷虽然RAR格式在Linux中可以得到很好支持,但考虑到RAR是专有格式,对于长期存储,建议使用ZIP或7Z等开源格式。希望本指南帮助你顺利在Linux系统下解压RAR文件到指定目录。如有其他问题,可以通过查看完整帮助信息。
2025-08-27 15:27:20
641
原创 集合竞价全解析:揭秘开盘前的暗战与当天走势预判
集合竞价是每个交易日的序幕,虽然只有短短的10分钟,却包含了丰富的信息。掌握集合竞价的规则和看盘技巧,能够帮助投资者更好地把握开盘节奏,预判当天走势。但需要注意的是,集合竞价只是分析工具之一,不能作为唯一的决策依据,应该结合技术分析、基本面分析和市场环境综合判断。投资有风险,入市需谨慎。希望本文能帮助您更好地理解集合竞价,提升投资技能!
2025-08-25 18:32:49
830
原创 如何解决MobaXterm会话数达到14个后无法新增会话???
MobaXterm免费版14个会话的限制是一个已知的“特性”而非缺陷。终极方案:购买专业版,支持开发者并获得完整体验。技术方案:手动编辑配置文件,适合喜欢动手的用户。实用技巧:充分利用文件夹功能来分类管理会话,这是免费用户最简单有效的扩容方法。希望这篇博客能帮助您顺利解决会话限制的问题,让您的MobaXterm再次高效起来!
2025-08-22 16:12:59
931
原创 如何使用命令行将DOCX文档转换为PDF格式?
使用LibreOffice的命令行工具进行文档格式转换是一种高效、自动化的方法,特别适用于需要批量处理文档的场景。通过简单的命令,我们可以快速将DOCX文件转换为PDF格式,无需人工干预。这种方法可以集成到脚本中,实现文档处理的自动化流程。掌握了这一技术后,您可以轻松地处理大量文档转换任务,提高工作效率。无论是个人使用还是企业级应用,命令行文档转换都是一个值得掌握的实用技能。
2025-08-22 10:22:26
865
原创 在 Linux 中全局搜索 Word 文档内容的完整指南
命令,我们可以在 Linux 系统中有效地搜索 Word 文档内容。这种方法不仅解决了二进制文档无法直接搜索的问题,还提供了灵活的参数化和优化选项。Pandoc 是一个强大的文档格式转换工具,它可以将 Word 文档转换为纯文本,然后我们就可以使用常规的文本搜索工具来处理了。无论是使用脚本还是单行命令,这种技术都能帮助你在大量 Word 文档中快速定位需要的内容,大大提高工作效率。提示:本文方法同样适用于搜索其他 Pandoc 支持的文档格式,只需调整输入格式参数即可。命令可以轻松胜任,但当我们需要搜索。
2025-08-21 18:06:34
433
原创 解决Windows SSH连接失败:Permissions for private key are too open
步骤核心操作说明原因权限过于宽松NTFS ACL中存在诸如Users等组的读权限。解决修改ACL禁用继承,并删除所有非必要用户/组,只保留SYSTEM和当前用户。验证重新连接执行SSH命令,警告消失且连接成功。预防妥善保管密钥将密钥存放在权限可控的目录下,避免随意复制。这个看似棘手的权限问题,一旦理解了其背后的安全逻辑,解决起来就非常简单。希望这篇博客能帮助你彻底解决这个问题,并让你对Windows下的SSH密钥管理有更深的理解。
2025-08-21 15:04:18
778
原创 解决 MobaXterm SSH 隧道端口转发失败的终极指南:从排查到解决
第一反应:遇到隧道失败,首先检查本地端口占用。配置原则Local port: 本地任意空闲端口。: 几乎总是127.0.0.1。: 永远是宿主机(远程服务器)上被映射的端口。测试方法:学会在远程服务器上使用curl或wget进行本地测试,这是判断服务是否可达的金标准。防火墙意识:部署服务后,放行相关端口应成为肌肉记忆。希望这篇详细的指南能帮你彻底征服 MobaXterm 的端口转发问题,让网络隧道真正成为你畅通无阻的捷径。
2025-08-20 16:48:33
864
原创 本地也能跑自己专属的最新GPT!OpenAI开源新模型部署教程(附避坑指南)
两大模型震撼登场,个人电脑也能部署专属GPT。本文手把手教你从零部署,避开版本兼容“深坑”,20分钟跑通最新模型!:《如何用个人数据微调GPT-OSS?三步打造专属智能助手》:GPT-OSS系列需Ollama ≥ v0.11.3!时隔6年,OpenAI重磅开源!(部署问题欢迎提问,博主秒回!
2025-08-20 11:23:24
519
原创 迁移 Xinference 服务:从 Docker 容器到新机器的完整指南
打包commit保存运行时状态传输save/scp跨机器移动恢复load/run快速重建服务采用本文介绍的最佳实践,您可以在 10 分钟内完成 Xinference 服务的迁移,服务中断时间不超过 1 分钟。对于生产环境,建议结合 Dockerfile 标准化构建和 Volume 数据持久化方案,实现服务的快速部署和弹性伸缩。迁移时间统计中型模型(2-3GB):迁移过程约 5-8 分钟大型模型(10GB+):建议结合模型仓库分离存储。
2025-08-19 14:27:33
1076
原创 解决RAGFlow启动时Elasticsearch容器权限错误的技术指南
Elasticsearch因权限问题无法写入数据目录,最终以非正常状态退出(exit code 1)。:权限问题解决后,RAGFlow应能自动连接Elasticsearch。若仍存在组件通信问题,请检查。通过本方案,95%以上的ES启动权限错误可被彻底解决。Docker Compose中未显式声明数据目录权限配置。若宿主机启用SELinux,会阻止容器写入挂载目录。SELinux限制(仅限RHEL/CentOS)在启动RAGFlow项目时,执行。和所有者UID 1000)
2025-08-19 11:36:30
219
原创 一键穿透内网!用 MobaXterm 隧道轻松本地访问远程 RagFlow 服务
零配置:无需修改服务器安全组/NAT 规则高安全:全程 SSH 加密传输低成本:无需额外部署内网穿透工具即时生效:3 分钟快速建立连接现在,打开你的 MobaXterm,开始享受无缝访问远程 RagFlow 的流畅体验吧!如果有其他隧道技巧或问题,欢迎在评论区交流讨论👇技术栈扩展:该方案同样适用于访问 Elasticsearch、MySQL、Redis 等任何绑定127.0.0.1的服务!
2025-08-18 19:36:37
170
原创 ComfyUI新手快速上手指南:5分钟完成首个AI绘画工作流(0基础都能看懂)
打开工作流后,会弹出提示模型缺失,复制模型名称 v1-5-pruned-emaonly。本文面向零基础用户,通过可视化流程+关键模型获取,助你快速生成第一张AI绘画作品。此模型为Stable Diffusion 1.5的精简版,适合新手快速测试。,探索文生图/图生图/ControlNet等高级功能。返回ComfyUI工作流界面,选择刚才上传的模型。5.点击ctrl+enter,重复生成。在右侧预览区查看结果。
2025-08-15 11:11:17
498
原创 一键换装魔法:基于ComfyUI工作流的Stable Diffusion服装替换指南
本文介绍了Stable Diffusion 3 Medium和ComfyUI在图像生成领域的创新应用,重点解析了服装替换工作流的技术原理与实现方法。文章从Stable Diffusion的扩散模型原理出发,阐述了基于节点化的ComfyUI工作流架构,详细说明了服装替换涉及的语义分割、姿态控制和局部重绘三大关键技术。同时提供了从工作流获取、安装到具体执行的完整指南,包括关键参数配置、模型选择建议和常见问题解决方案。文章还展望了工作流在跨风格转换和3D生成等领域的进阶应用,展现了AI创作"工作流即服务
2025-08-15 09:18:46
434
原创 ComfyUI-Manager终极指南:安装、使用与疑难排解
随着ComfyUI生态爆发式增长(现已有超过200+官方认证节点),掌握Manager的高效用法已成为AI图像工作者的核心技能。:过去安装一个插件需经历“搜索GitHub → 下载ZIP → 解压到custom_nodes → 处理依赖 → 重启”的链条。:使用Manager管理的插件环境,其加载速度比手动安装快40%(基于Python 3.10测试),且依赖冲突率下降70%。ComfyUI作为Stable Diffusion的高效工作流工具,其强大功能很大程度上依赖于丰富的自定义节点(插件)。
2025-08-15 09:16:55
853
原创 三步就教会你在linux部署ComfyUI
本文介绍了ComfyUI的基本安装与启动步骤:首先克隆GitHub仓库,进入项目目录后启动main.py文件(可选参数--listen 0.0.0.0允许外部访问)。启动后通过浏览器访问http://localhost:8188/即可使用UI界面。若遇到依赖报错,需执行pip install -r requirements安装所需依赖包。整个过程包含3个主要步骤,并提供了常见错误的解决方法。
2025-08-14 20:23:48
193
原创 GPT-OSS-20B 压力测试报告(全网首篇4070单卡实际部署压测)
摘要:测试评估了200亿参数GPT-OSS-20B模型在单卡RTX 4070 TI Super(16GB)上的性能表现。结果显示,输出吞吐量稳定在78.24-78.33 tok/s,总吞吐量85.22-85.91 tok/s。低并发(1-10)时响应迅速(延迟<0.26s),但高并发(≥50)时延迟激增(>440s),错误率显著上升(并发200时达49.75%)。测试表明该显卡最适合中低并发场景(≤50),超过100并发会导致显存不足和性能严重下降。建议通过模型量化或多卡部署来提升高并发能力。
2025-08-14 18:37:01
758
原创 GitHub 仓库代码上传指南
GitHub → Settings → Developer Settings → Personal Access Tokens →Tokens(classic)→ 勾选。通过合理使用分支、.gitignore 和清晰提交信息,可显著提升协作效率。,认证用 Token/SSH,冲突先 rebase。安装时路径避免中文/空格。显示成功信息即配置正确。类型(模块): 描述。
2025-08-14 18:16:06
867
原创 手把手教你如何在自己电脑上安装ComfyUI(新手入门必看系列)
本文简要介绍了ComfyUI的安装步骤:首先从官网下载安装程序,然后双击运行.exe文件,选择NVIDIA显卡并指定安装目录,接着按照向导点击下一步进行安装。安装过程中程序会自动设置Python环境并完成安装。整个流程简单直观,适合快速部署使用。
2025-08-14 16:08:42
116
原创 使用EvalScope对GPT-OSS-20B进行推理性能压测实战
EvalScope的perf多维度负载模拟:支持并发数、请求量、prompt长度等关键参数的灵活配置真实场景数据:内置openqa等真实数据集,支持自定义数据集全面性能指标:采集延迟、吞吐量、错误率等关键指标渐进式压力测试:支持阶梯式增加负载,精准定位性能瓶颈。
2025-08-14 10:29:00
941
原创 Ollama如何分别使用2张H100GPU和4张A100部署GPT-OSS-120B全指南:硬件配置与负载均衡实战
在大模型推理场景中,如何高效利用多GPU资源运行超大规模模型(如GPT-OSS-120B)是开发者面临的核心挑战。本文以Ollama为框架,深入解析多GPU部署的完整方案,涵盖。通过本文方案,开发者现在即可构建高性能GPT-OSS-120B推理平台,充分发挥多GPU硬件的计算潜力。若使用不同规格GPU(如A100 40G + A100 80G),系统将平等对待所有设备,可能导致小显存卡OOM。单台H100即可运行120B大模型,但高效利用多卡需解决负载分配与并发控制。Nginx负载均衡器。
2025-08-14 10:11:48
1312
原创 可视化调试LangChain SQLChatMessageHistory:SQLite数据库查看全攻略
在使用LangChain的SQLChatMessageHistory时,所有对话历史都存储在SQLite数据库中。本文将详细介绍如何可视化查看这些数据,帮助开发者调试和监控聊天历史记录。通过以上方法,您可以高效地监控和调试LangChain的聊天历史存储,确保对话数据按预期保存。无论是简单的数据查看还是复杂的性能分析,总有一种工具适合您的使用场景!默认位置为当前目录下的。
2025-08-13 18:03:34
94
原创 Docker部署RAGFlow:生产环境开启Kibana与ES安全集成指南
Kibana 8.x版本引入了注册令牌机制,要求Elasticsearch必须配置SSL/TLS才能完成安全注册。:生产环境必须使用受信任CA签发的证书,自签名证书仅适用于测试环境。建议使用Let’s Encrypt或企业级证书服务。在生产环境中使用Kibana查询ES数据时,
2025-08-13 16:51:37
182
原创 Docker部署RAGFlow:开启Kibana查询ES数据指南
在RAGFlow的Docker部署中,Elasticsearch(ES)用于存储和检索数据。通过合理配置,可在保障安全的前提下充分利用Kibana的数据分析能力,优化RAGFlow的检索效果。,生产环境请参考文末的安全配置方案。在ES服务配置中添加(
2025-08-13 16:50:48
236
原创 LangChain SQLChatMessageHistory:SQL数据库存储聊天历史详解
是 LangChain 社区版提供的核心组件,用于将会话消息历史持久化存储在 SQL 数据库中。它支持同步/异步操作,兼容多种 SQL 数据库(SQLite/PostgreSQL/MySQL等),是构建可追溯对话系统的理想工具。conversation_id = Column(Text) # 对应session_id_field_namemessage_data = Column(JSON) # 存储序列化消息# 使用时指定字段映射。
2025-08-12 18:49:06
312
原创 如何使用LangGraph构建可视化聊天智能体(企业级开发必备技能)
LangGraph是一个基于图的编程模型,用于构建复杂、有状态的AI应用。图结构工作流:将智能体行为建模为状态图,清晰定义决策流程状态管理:内置状态管理机制,支持多轮对话和复杂交互可扩展性:轻松集成工具、记忆系统和外部服务可视化调试:提供可视化界面实时监控智能体决策过程企业级支持:支持分布式部署和水平扩展对于企业级AI应用开发,LangGraph提供了构建复杂智能体系统的标准化框架,大幅提升开发效率和系统可靠性。# 数据库查询工具示例。
2025-08-08 19:07:07
1024
原创 解决Ollama外部服务器无法访问:配置 `OLLAMA_HOST=0.0.0.0` 指南
通过以上步骤,Ollama服务即可被外部服务器访问。此方法同样适用于其他需绑定公共网络接口的服务。通过修改systemd配置,强制Ollama监听所有网络接口(访问,会出现连接失败。这是因为服务未绑定到公共网络接口。若服务器启用了防火墙,需放行Ollama端口(默认。当部署Ollama服务后,默认监听地址为。),并重启服务生效。
2025-08-08 15:55:39
774
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人