- 博客(45)
- 收藏
- 关注
原创 Ascend 微调 InternVL/Intern-S1-Mini 实践
本文详细介绍了在NPU平台上微调InternVL3.5-1B和Intern-S1-mini模型的全流程。主要内容包括:1) 环境配置,包括创建算力实例、安装依赖包和处理数据集;2) 模型微调,详细说明了两种模型的配置文件编写、启动训练和权重合并方法;3) 结果提交,包含模型上传步骤和提示词优化建议。实验使用LoRA方法进行微调,提供了关键参数调整建议,并验证了NPU使用情况。整个过程涵盖了从环境搭建到模型部署的完整流程,为视觉语言模型的微调实践提供了详细指导。
2026-01-12 19:05:31
460
原创 L2 书生大模型强化学习 RL 实践
本文介绍了使用XTuner工具在GSM8K数学推理数据集上训练InternLM模型的流程。重点讲解了GRPO强化学习算法在大模型训练中的应用,包括数据预处理、模型评估等关键环节。文章详细说明了环境配置、XTuner安装步骤,以及如何将GSM8K数据集转换为适合GRPO训练的格式。同时提供了基于vLLM的评估脚本,通过数学准确率评估器对模型输出进行验证。整个过程涵盖了从数据准备、模型训练到性能评估的完整流程,为研究者在大模型数学推理任务上的实践提供了实用指南。
2026-01-01 20:36:35
783
原创 L2 书生大模型 Browse Use 实践
本文介绍了书生Intern-S1 API的使用方法,包括环境搭建、API调用和多模态交互实现。详细讲解了如何获取API Token,并通过Python SDK和原生调用两种方式进行天气查询、小红书搜索等操作。同时介绍了Browser-Use工具的开发环境配置和Web-UI运行方法,展示了模型与浏览器的交互过程。文中还提供了三轮对话示例代码和API计费规则说明,并针对常见报错给出了解决方案。该技术目前仍存在交互不完善等问题,有待开发者进一步探索优化。
2025-12-31 17:12:27
903
原创 L2 LMDeploy 量化部署书生大模型实践
本文介绍了使用LMDeploy工具链部署和优化大语言模型的完整流程。首先通过Conda环境安装所需依赖,然后演示了如何配置PytorchEngineConfig参数(如max_batch_size、enable_prefix_caching等)来优化推理性能。文章详细展示了多模态推理服务的构建方法,包括批量请求处理对比实验。针对显存不足的情况,重点讲解了INT4模型量化和KV Cache量化技术,通过类比生动说明了量化原理,并提供了完整的量化模型部署流程和API调用示例。最后通过三种量化场景对比,展示了We
2025-12-31 14:23:21
1068
原创 L2 Intern-S1/InternVL 微调公式识别实践
intern-s1-mini 用swift 微调合并后,会有文件缺失,我们只需讲源权重目录下文件对应的补回来即可。选择镜像为Cuda12.8-conda,并选择 GPU 为 50% A100。节省算力小技巧,可以 10%gpu 情况安装环境,安装好后再改成 50%。等微调运行完成后,将 lora 微调产生的部分权重和源权重进行合并。注意:日志如果有错误,就得解决错误,直到出现进度条为k。提交完成,等待后台半小时左右评测,最终获得成绩🎉🎉。关闭开发机后,再修改配置开机激活环境。可以通过日志查看训练的进度。
2025-12-30 23:05:03
323
原创 书生大模型训练营6期L1 探索大模型能力边界
OpenCompass司南是由上海人工智能实验室推出的大模型评测平台,核心功能包括匿名对战、多模态评测和专项任务测试。平台采用双盲机制防止品牌偏见,通过用户投票动态更新排行榜,特别注重中文场景优化。支持普通用户直观比较模型表现,也为开发者提供选型参考。技术亮点包括开源框架、中文题目优化和实时数据反馈,被誉为中文社区最活跃的大模型"实战擂台"。访问官网即可参与模型对战评测。
2025-12-22 23:47:27
567
原创 书生大模型训练营6期L1 Intern-S1-mini 本地部署实践
上海AI实验室推出轻量化多模态大模型Intern-S1-mini,该8B参数模型在保持通用能力(MMLU-Pro等基准测试领先)和专业科学能力(化学、材料等学科表现突出)的同时,更便于快速部署。模型支持文本和图像处理,提供vLLM部署方案,包括环境配置、端口转发等详细指南,可通过GitHub、HuggingFace等平台获取体验。
2025-12-22 12:30:01
601
原创 书生大模型训练营6期L1 玩转书生大模型 API 与 MCP
本文介绍了Intern系列模型API的使用方法,主要包括:1)获取API密钥和开发机配置;2)文本生成、图像分析、工具调用等基本功能实现;3)MCP协议的安装与配置,支持天气查询和文件系统操作等扩展功能。详细说明了环境准备、代码示例和注意事项,帮助开发者快速接入和使用该AI服务。
2025-12-19 22:46:09
978
原创 书生大模型训练营6期L1 书生大模型提示词实践以及Intern-S1 技术报告阅后总结
本文系统探讨了大模型语言的发展原理与关键技术应用。首先将大模型发展划分为五个阶段:基础认知构建、知识获取、专业定向、深度学习和实际应用。重点介绍了提示词工程的设计原则和框架,以及工具调用与MCP协议的技术实现。特别深入分析了Intern-S1这一科学领域多模态基础模型,包括其280B参数的MoE架构、动态分词器创新、混合奖励训练方法等核心技术突破。该模型在科学推理任务上超越闭源模型,展现了开源模型在专业领域的潜力。文章还讨论了科学数据工程面临的挑战与解决方案,最后展望了大模型在科研领域的应用前景和发展方向。
2025-12-16 13:22:25
809
原创 ENSP的简单动态路由rip协议配置
本文记录了动态路由RIP协议的配置实验过程。实验通过三台路由器(AR1、AR2、AR3)搭建网络拓扑,详细展示了各设备的接口IP地址配置、RIP协议启用及网络通告过程。配置完成后,通过display命令验证了路由表的正确性,成功实现了192.168.10.0/24与192.168.20.0/24两个网段间的互通。文章最后总结了动态路由的优点(简化大型网络管理)和缺点(网络故障恢复时间较长)。实验结果表明RIP协议能有效实现网络自动学习与路由更新。
2025-08-16 19:00:37
501
原创 Docker安装mitproxy
mitmproxy 是一组工具,可为 HTTP/1、HTTP/2 和 WebSockets 提供支持 SSL/TLS 的交互式拦截代理。
2025-06-01 22:50:09
535
原创 Goreplay最新版本的安装和简单使用
Gor 是一个开源工具,用于捕获实时 HTTP 流量并将其重放到测试环境中,以便使用真实数据持续测试您的系统。它可用于提高对代码部署、配置更改和基础设施更改的信心。简单易用。项目地址:GoReplay 提供了一种独特的阴影方法。GoReplay 不是代理,而是在后台侦听网络接口上的流量,无需更改生产基础设施,只需在与服务相同的计算机上运行 GoReplay 守护程序即可。
2025-06-01 17:59:45
1318
原创 2025年最新Linux的Redis主从集群搭建
Redis(Remote Dictionary Server)是一个开源的、高性能的,通常被用作数据库、缓存或消息中间件。它以内存存储为主,支持多种数据结构,并具备持久化、高可用、分布式等特性,广泛应用于互联网、游戏、金融等场景。在开发应用时我们经常使用的是单节点的Redis,但是在实际企业应用中,为了提高Redis的并发性能,就需要搭建Redis主从集群。下面我就来简单的说明一下利用Docker搭建一个简单的主从集群。
2025-05-05 20:08:26
475
原创 DataWhale AI春训营之AI+新能源
这个赛道的训练营主要就是结合第三届世界科学智能大赛新能源赛道:新能源发电功率预测这个比赛来实施的。下来会带领针对这个训练营的一系列详细操作,实现这个需求功能。
2025-04-19 22:31:42
858
1
原创 SpringS ecurity测试登录接口报错
Spring Security 是一个功能强大且高度可定制的 Java 安全框架,用于保护基于 Spring 的应用程序。它提供了认证(Authentication)、授权(Authorization)、防止常见的安全攻击等功能,是现代 Spring 应用程序中实现安全机制的首选框架。在测试登录校验账号认证时,出现了错误。在这篇文章里,将针对这个问题,给出解决方案和说明。
2025-03-13 17:02:36
905
原创 Spring Security报错nested exception is java.lang.IllegalArgumentException: user should not exist
使用SpringSecurity报错,是一个很简单的错误。
2025-03-12 20:46:50
849
原创 SpringBoot项目运行报错误ANTLR Tool version 4.7.1 used for code generation does not match the current runtim
在最近几天里,运行这个项目,运行成功或者错误与否,都会出现如下的错误。虽然它并不影响运行的结果,但是有错误经常出现,就感决很碍眼。下面就给出这个出现问题的原因以及这个解决方案。
2025-03-09 17:29:20
699
原创 Hadoop最新版本hadoop-3.4.1搭建伪分布式集群以及相关报错解决
一:概述一:概述Hadoop 是一个开源的分布式计算框架,广泛应用于大数据处理。伪分布式集群是 Hadoop 的一种部署模式,它可以在单台机器上模拟集群环境,适合初学者进行学习和实验。本文将详细介绍如何在单台机器上搭建 Hadoop 3.4.1 的伪分布式集群。二:具体说明。
2025-02-27 23:41:59
2358
原创 DataWhale之工作流
需要新建工作流模式的应用这里和创建其他应用一致,点击新建应用就可以创建一个工作流。点击查看界面介绍左上角是题目区域,大家可以随时修改旁边是设置任务类型的地方,目前有任务模式、对话模式两种。但是设置了对话模式就切不回来咯请大家注意。这里任务模式是指完成某项任务,不会重复对话。对话模式指用户可以多轮对话与 Agent做交互。左侧这个区域是节点区域,将工作流需要的功能模块化列在这里。下面我们会对节点一一介绍。
2024-12-29 18:40:51
762
原创 一款强劲工具---茴香豆:企业级知识问答工具
一:概述一:概述茴香豆是一款由书生·浦语团队开发的企业级知识问答工具,它专门针对国内企业级使用场景进行了设计和优化。
2024-10-02 21:03:00
1404
原创 InternVL 微调
一:概述一:概述InternVL是一个开源的多模态视觉语言模型系列,它在视觉与语言交叉领域展现出了强大的能力和广泛的应用前景。以下是对InternVL的详细介绍:1. 背景与定位InternVL被定位为GPT-4V的开创性开源替代品,旨在通过开源套件缩小与商业多模态模型的差距。它结合了视觉和语言模型,能够同时处理图片和文本信息,执行复杂的跨模态任务。2. 规模与性能多语言支持InternVL不仅支持英语,还支持中文等其他语言,在多语言零画识别、翻译等任务上表现出色。
2024-09-30 21:03:24
1252
原创 LMDeploy 量化部署实践闯关任务---基于书生·浦语大模型
一:概述一:概述什么是部署呢?在软件工程中,部署通常指的是将开发完毕的软件投入使用的过程。在人工智能领域,模型部署是实现深度学习算法落地应用的关键步骤。简单来说,模型部署就是将训练好的深度学习模型在特定环境中运行的过程。它的应用场景有:服务器端:CPU部署、单GPU/TPU/NPU部署,多卡/集群部署......移动端/边缘端:移动机器人,手机等。LMDeploy是一个由MMRazor和MMDeploy团队联合开发的工具包,专为大型语言模型(LLM)提供全面的轻量化、部署和服务解决方案。
2024-09-29 07:23:33
1065
原创 Lagent 自定义你的 Agent 智能体--书生·浦语实战系列
一:概述一:概述Lagent是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。Lagent不仅允许开发者使用Python语言编写智能体逻辑,还提供了一些典型工具来增强大语言模型的能力。通过Lagent,用户可以构建出功能强大的智能代理,应用于智能客服、智能办公、行业智能应用等多个场景。它具有轻量级、高效推理引擎、多代理支持、易扩展性、可视化编辑的特点。
2024-09-28 15:36:27
1250
原创 AI驱动TDSQL-C Serverless数据库技术实战营--- 操作与电商可视分析
本文将基于腾讯云的高性能应用服务HAI和TDSQL-C MYSQL Serverless版构建AI电商数据分析系统。HAI作为一个面向AI和科学计算的GPU应用服务产品,它具有强大的计算能力,让复杂的AI模型的快速部署和运行的可行性加大,进而支持自然语言处理和图形生成等高级任务。TDSQL-C MYSQL版是一款云原生关系型数据库,其100%的MySQL兼容性,以及极致的弹性、高性能和高可用性,是电商业务中处理海量数据存储和查询的理想选择。本文实践除了使用TDSQL-C MYSQL外,通过python语言和
2024-09-27 21:51:42
110709
原创 OpenCompass 评测 InternLM-1.8B 实践
一:概述在很多时候,部署完大模型之后,并不是直接去使用的,通常都会要先进行评测。评测对于模型的好坏具有很重要的指标。当然它也有很多的挑战。它的重要性和挑战如下图所示:二:具体说明。
2024-09-25 21:22:47
1184
原创 XTuner 微调个人小助手认知任务
XTuner是全链条开源开放的一个高效微调的框架,它适配多种生态,即就是多种微调算法:多种微调&偏好对齐算法,覆盖各类应用场景。适配多种开源生态,支持加载HuggingFace、ModelScope模型或者数据集。自动优化加速即就是开发者无需关注复杂的显存优化与计算加速细节,支持千亿参数+百万上下文训练。适配多种硬件,训练方案覆盖NVIDIA20系列以上所有显卡,最低只需8GB显存即可微调7B模型。二:XTuner个人小助手微调实践。
2024-09-24 13:30:48
1347
原创 Llamaindex RAG实践
一:概述一:概述它可以解决LLMs在处理知识密集型任务时可能遇到的挑战。提供更准确的回答、降低推理成本、实现外部记忆。生成幻觉(hallucination)、过时知识、缺乏透明和可追溯的推理过程。它的应用包括问答系统、文本生成、信息检索、图片描述。二:具体说明<1>RAG的原理将所要处理的文档或者网页即知识源分割成小块,编码成向量,并存储在向量数据库(Vector-DB)当中。
2024-09-23 17:36:05
1690
原创 LangGPT结构化提示词编写实践
一:概述一:概述LangGPT结构化提示词是进行文生图的必备知识库。Prompt(提示)是一个多义词,在不同的领域和语境中具有不同的含义和用法。二:具体说明。
2024-09-22 21:56:46
1399
原创 书生训练大模型之使用 Cli Demo 完成 InternLM2-Chat-1.8B 模型的部署
二:具体说明一:概述这篇文章主要介绍的如何利用8G显存玩转书生大模型Demo,首先先来介绍一下这个模型的特点,书生·浦语Cli*Web Demo这个主要是1.8B但性能不俗性的InternLm2端侧模型,浦语·灵笔LMDeployGradio Demo主要是自由形式的文本,图像组合的视觉语言大模型InternLM-XComposer2,书生·万象LMDeployGradio Demo主要是首个综合性能媲美美国国际闭源商业模型的开源多态模型大模型InternVL2。二:具体说明。
2024-09-22 16:21:20
421
原创 wordcount函数,统计英文字符串中每个单词出现的次数并利用debug进行调试---利用Vscode安装python插件完成
一:概述在这里,将实现以及统计英文字符串中每个单词出现的次数的函数。!!此实为书生训练模型的一个小任务。二:具体说明<1>在Vscode里面安装Python插件安装的详细步骤截图如下所示:即就是找到Vscode的插件搜索框界面,然后搜索python,下载如上图所示的python插件。用以完成统计英文字符串中每个单词出现的次数。
2024-09-18 09:15:09
674
原创 书生训练大模型之Linux基础入门
一:概述在这里,我将介绍Linux基础入门的几个学习内容。将包括完成利用VScode插件Romote-ssh完成SSH连接与端口映射并运行将Linux基础命令在开发机上完成一遍。二:具体说明。
2024-09-16 11:04:47
295
原创 Java使用JDBC连接Mysql数据库下载JDBC版本问题以及如何去下载
Java使用JDBC连接Mysql数据库下载JDBC版本问题以及如何去下载
2024-03-28 13:18:45
2243
1
原创 CentOS安装搜狗输入法详细步骤以及排错
概述在刚安装CentOS时,为了方便使用。常会安装输入法。在这里已安装搜狗输入法为例。其他输入法相似。在安装过程中会出现错误。
2023-12-28 18:19:06
2340
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅