chasemydreamidea-CSDN博客

原创 Ascend 微调 InternVL/Intern-S1-Mini 实践

本文详细介绍了在NPU平台上微调InternVL3.5-1B和Intern-S1-mini模型的全流程。主要内容包括：1) 环境配置，包括创建算力实例、安装依赖包和处理数据集；2) 模型微调，详细说明了两种模型的配置文件编写、启动训练和权重合并方法；3) 结果提交，包含模型上传步骤和提示词优化建议。实验使用LoRA方法进行微调，提供了关键参数调整建议，并验证了NPU使用情况。整个过程涵盖了从环境搭建到模型部署的完整流程，为视觉语言模型的微调实践提供了详细指导。

2026-01-12 19:05:31 460

原创 L2 书生大模型强化学习 RL 实践

本文介绍了使用XTuner工具在GSM8K数学推理数据集上训练InternLM模型的流程。重点讲解了GRPO强化学习算法在大模型训练中的应用，包括数据预处理、模型评估等关键环节。文章详细说明了环境配置、XTuner安装步骤，以及如何将GSM8K数据集转换为适合GRPO训练的格式。同时提供了基于vLLM的评估脚本，通过数学准确率评估器对模型输出进行验证。整个过程涵盖了从数据准备、模型训练到性能评估的完整流程，为研究者在大模型数学推理任务上的实践提供了实用指南。

2026-01-01 20:36:35 783

原创 L2 书生大模型 Browse Use 实践

本文介绍了书生Intern-S1 API的使用方法，包括环境搭建、API调用和多模态交互实现。详细讲解了如何获取API Token，并通过Python SDK和原生调用两种方式进行天气查询、小红书搜索等操作。同时介绍了Browser-Use工具的开发环境配置和Web-UI运行方法，展示了模型与浏览器的交互过程。文中还提供了三轮对话示例代码和API计费规则说明，并针对常见报错给出了解决方案。该技术目前仍存在交互不完善等问题，有待开发者进一步探索优化。

2025-12-31 17:12:27 903

原创 L2 LMDeploy 量化部署书生大模型实践

本文介绍了使用LMDeploy工具链部署和优化大语言模型的完整流程。首先通过Conda环境安装所需依赖，然后演示了如何配置PytorchEngineConfig参数（如max_batch_size、enable_prefix_caching等）来优化推理性能。文章详细展示了多模态推理服务的构建方法，包括批量请求处理对比实验。针对显存不足的情况，重点讲解了INT4模型量化和KV Cache量化技术，通过类比生动说明了量化原理，并提供了完整的量化模型部署流程和API调用示例。最后通过三种量化场景对比，展示了We

2025-12-31 14:23:21 1068

原创 L2 Intern-S1/InternVL 微调公式识别实践

intern-s1-mini 用swift 微调合并后，会有文件缺失，我们只需讲源权重目录下文件对应的补回来即可。选择镜像为Cuda12.8-conda，并选择 GPU 为 50% A100。节省算力小技巧,可以 10%gpu 情况安装环境,安装好后再改成 50%。等微调运行完成后，将 lora 微调产生的部分权重和源权重进行合并。注意：日志如果有错误，就得解决错误，直到出现进度条为k。提交完成，等待后台半小时左右评测，最终获得成绩🎉🎉。关闭开发机后，再修改配置开机激活环境。可以通过日志查看训练的进度。

2025-12-30 23:05:03 323

原创 L2 OpenCompass 评测书生大模型实践

OpenCompass 评测书生大模型实践

2025-12-27 18:42:11 794

原创书生大模型训练营6期L1 探索大模型能力边界

OpenCompass司南是由上海人工智能实验室推出的大模型评测平台，核心功能包括匿名对战、多模态评测和专项任务测试。平台采用双盲机制防止品牌偏见，通过用户投票动态更新排行榜，特别注重中文场景优化。支持普通用户直观比较模型表现，也为开发者提供选型参考。技术亮点包括开源框架、中文题目优化和实时数据反馈，被誉为中文社区最活跃的大模型"实战擂台"。访问官网即可参与模型对战评测。

2025-12-22 23:47:27 567

原创书生大模型训练营6期L1 Intern-S1-mini 本地部署实践

上海AI实验室推出轻量化多模态大模型Intern-S1-mini，该8B参数模型在保持通用能力（MMLU-Pro等基准测试领先）和专业科学能力（化学、材料等学科表现突出）的同时，更便于快速部署。模型支持文本和图像处理，提供vLLM部署方案，包括环境配置、端口转发等详细指南，可通过GitHub、HuggingFace等平台获取体验。

2025-12-22 12:30:01 601

原创书生大模型训练营6期L1 玩转书生大模型 API 与 MCP

本文介绍了Intern系列模型API的使用方法，主要包括：1）获取API密钥和开发机配置；2）文本生成、图像分析、工具调用等基本功能实现；3）MCP协议的安装与配置，支持天气查询和文件系统操作等扩展功能。详细说明了环境准备、代码示例和注意事项，帮助开发者快速接入和使用该AI服务。

2025-12-19 22:46:09 978

原创书生大模型训练营6期L1 书生大模型提示词实践以及Intern-S1 技术报告阅后总结

本文系统探讨了大模型语言的发展原理与关键技术应用。首先将大模型发展划分为五个阶段：基础认知构建、知识获取、专业定向、深度学习和实际应用。重点介绍了提示词工程的设计原则和框架，以及工具调用与MCP协议的技术实现。特别深入分析了Intern-S1这一科学领域多模态基础模型，包括其280B参数的MoE架构、动态分词器创新、混合奖励训练方法等核心技术突破。该模型在科学推理任务上超越闭源模型，展现了开源模型在专业领域的潜力。文章还讨论了科学数据工程面临的挑战与解决方案，最后展望了大模型在科研领域的应用前景和发展方向。

2025-12-16 13:22:25 809

原创 ENSP的简单动态路由rip协议配置

本文记录了动态路由RIP协议的配置实验过程。实验通过三台路由器（AR1、AR2、AR3）搭建网络拓扑，详细展示了各设备的接口IP地址配置、RIP协议启用及网络通告过程。配置完成后，通过display命令验证了路由表的正确性，成功实现了192.168.10.0/24与192.168.20.0/24两个网段间的互通。文章最后总结了动态路由的优点（简化大型网络管理）和缺点（网络故障恢复时间较长）。实验结果表明RIP协议能有效实现网络自动学习与路由更新。

2025-08-16 19:00:37 501

原创 Docker安装mitproxy

mitmproxy 是一组工具，可为 HTTP/1、HTTP/2 和 WebSockets 提供支持 SSL/TLS 的交互式拦截代理。

2025-06-01 22:50:09 535

原创 Goreplay最新版本的安装和简单使用

Gor 是一个开源工具，用于捕获实时 HTTP 流量并将其重放到测试环境中，以便使用真实数据持续测试您的系统。它可用于提高对代码部署、配置更改和基础设施更改的信心。简单易用。项目地址：GoReplay 提供了一种独特的阴影方法。GoReplay 不是代理，而是在后台侦听网络接口上的流量，无需更改生产基础设施，只需在与服务相同的计算机上运行 GoReplay 守护程序即可。

2025-06-01 17:59:45 1318

原创 2025年最新Linux的Redis主从集群搭建

Redis（Remote Dictionary Server）是一个开源的、高性能的，通常被用作数据库、缓存或消息中间件。它以内存存储为主，支持多种数据结构，并具备持久化、高可用、分布式等特性，广泛应用于互联网、游戏、金融等场景。在开发应用时我们经常使用的是单节点的Redis，但是在实际企业应用中，为了提高Redis的并发性能，就需要搭建Redis主从集群。下面我就来简单的说明一下利用Docker搭建一个简单的主从集群。

2025-05-05 20:08:26 475

原创书生实战营之沐曦专场

D.run平台注册和登录环节就跳过了。

2025-05-02 23:00:01 1401 2

原创 DataWhale AI春训营之AI+新能源

这个赛道的训练营主要就是结合第三届世界科学智能大赛新能源赛道：新能源发电功率预测这个比赛来实施的。下来会带领针对这个训练营的一系列详细操作，实现这个需求功能。

2025-04-19 22:31:42 858 1

原创 Kali-Linux2025最新安装

进入到以上官网的连接去下载这个系统镜像。

2025-04-09 17:42:30 2498

原创 SpringS ecurity测试登录接口报错

Spring Security 是一个功能强大且高度可定制的 Java 安全框架，用于保护基于 Spring 的应用程序。它提供了认证（Authentication）、授权（Authorization）、防止常见的安全攻击等功能，是现代 Spring 应用程序中实现安全机制的首选框架。在测试登录校验账号认证时，出现了错误。在这篇文章里，将针对这个问题，给出解决方案和说明。

2025-03-13 17:02:36 905

原创 Spring Security报错nested exception is java.lang.IllegalArgumentException: user should not exist

使用SpringSecurity报错，是一个很简单的错误。

2025-03-12 20:46:50 849

原创 SpringBoot项目运行报错误ANTLR Tool version 4.7.1 used for code generation does not match the current runtim

在最近几天里，运行这个项目，运行成功或者错误与否，都会出现如下的错误。虽然它并不影响运行的结果，但是有错误经常出现，就感决很碍眼。下面就给出这个出现问题的原因以及这个解决方案。

2025-03-09 17:29:20 699

原创 Hadoop最新版本hadoop-3.4.1搭建伪分布式集群以及相关报错解决

一：概述一：概述Hadoop 是一个开源的分布式计算框架，广泛应用于大数据处理。伪分布式集群是 Hadoop 的一种部署模式，它可以在单台机器上模拟集群环境，适合初学者进行学习和实验。本文将详细介绍如何在单台机器上搭建 Hadoop 3.4.1 的伪分布式集群。二：具体说明。

2025-02-27 23:41:59 2358

原创 DataWhale之工作流

需要新建工作流模式的应用这里和创建其他应用一致，点击新建应用就可以创建一个工作流。点击查看界面介绍左上角是题目区域，大家可以随时修改旁边是设置任务类型的地方，目前有任务模式、对话模式两种。但是设置了对话模式就切不回来咯请大家注意。这里任务模式是指完成某项任务，不会重复对话。对话模式指用户可以多轮对话与 Agent做交互。左侧这个区域是节点区域，将工作流需要的功能模块化列在这里。下面我们会对节点一一介绍。

2024-12-29 18:40:51 762

原创 DataWhale Ai-agent之虚拟聊天助手

基于Ai-Agent初步地一款虚拟聊天助手

2024-12-28 09:44:49 980

原创书生大模型训练第4期之玩转HF/魔搭/魔乐社区

书生大模型训练第4期之玩转HF/魔搭/魔乐社区

2024-10-24 14:50:29 1179

原创一款强劲工具---茴香豆：企业级知识问答工具

一：概述一：概述茴香豆是一款由书生·浦语团队开发的企业级知识问答工具，它专门针对国内企业级使用场景进行了设计和优化。

2024-10-02 21:03:00 1404

原创 MindSearch 部署到Github Codespace 和 Hugging Face Space

一：概述。

2024-10-01 22:02:00 1286 4

原创 InternVL 微调

一：概述一：概述InternVL是一个开源的多模态视觉语言模型系列，它在视觉与语言交叉领域展现出了强大的能力和广泛的应用前景。以下是对InternVL的详细介绍：1. 背景与定位InternVL被定位为GPT-4V的开创性开源替代品，旨在通过开源套件缩小与商业多模态模型的差距。它结合了视觉和语言模型，能够同时处理图片和文本信息，执行复杂的跨模态任务。2. 规模与性能多语言支持InternVL不仅支持英语，还支持中文等其他语言，在多语言零画识别、翻译等任务上表现出色。

2024-09-30 21:03:24 1252

原创 LMDeploy 量化部署实践闯关任务---基于书生·浦语大模型

一：概述一：概述什么是部署呢？在软件工程中，部署通常指的是将开发完毕的软件投入使用的过程。在人工智能领域，模型部署是实现深度学习算法落地应用的关键步骤。简单来说，模型部署就是将训练好的深度学习模型在特定环境中运行的过程。它的应用场景有：服务器端：CPU部署、单GPU/TPU/NPU部署，多卡/集群部署......移动端/边缘端：移动机器人，手机等。LMDeploy是一个由MMRazor和MMDeploy团队联合开发的工具包，专为大型语言模型（LLM）提供全面的轻量化、部署和服务解决方案。

2024-09-29 07:23:33 1065

原创 Lagent 自定义你的 Agent 智能体--书生·浦语实战系列

一：概述一：概述Lagent是一个轻量级开源智能体框架，旨在让用户可以高效地构建基于大语言模型的智能体。Lagent不仅允许开发者使用Python语言编写智能体逻辑，还提供了一些典型工具来增强大语言模型的能力。通过Lagent，用户可以构建出功能强大的智能代理，应用于智能客服、智能办公、行业智能应用等多个场景。它具有轻量级、高效推理引擎、多代理支持、易扩展性、可视化编辑的特点。

2024-09-28 15:36:27 1250

原创 AI驱动TDSQL-C Serverless数据库技术实战营--- 操作与电商可视分析

本文将基于腾讯云的高性能应用服务HAI和TDSQL-C MYSQL Serverless版构建AI电商数据分析系统。HAI作为一个面向AI和科学计算的GPU应用服务产品，它具有强大的计算能力，让复杂的AI模型的快速部署和运行的可行性加大，进而支持自然语言处理和图形生成等高级任务。TDSQL-C MYSQL版是一款云原生关系型数据库，其100%的MySQL兼容性，以及极致的弹性、高性能和高可用性，是电商业务中处理海量数据存储和查询的理想选择。本文实践除了使用TDSQL-C MYSQL外，通过python语言和

2024-09-27 21:51:42 110709

L2 gsm8k数据集里筛选出来的2000条数据：书生大模型强化学习 RL 实践

空空如也