
大模型微调部署实战及类GPT工具的高效使用

文章平均质量分 92
对大模型微调、部署、调优和DeepSeek等GPT工具使用进行详尽的介绍。本专栏持续更新中。原价99,限时69.9🔥火爆订阅中(五日后恢复原价)。近期更新频率为一周至少3篇,希望能对同学们有所帮助。
优惠券已抵扣
余额抵扣
还需支付
¥69.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
herosunly
985院校硕士毕业,现担任算法工程师一职,获得CSDN博客之星第一名,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得多项AI顶级比赛的Top名次,其中包括阿里云天池比赛第一名,科大讯飞分类挑战赛第一名,CCF信息分类比赛比赛第二名,开放原子分类比赛二等奖,CCF家族分类第四名,科大讯飞阿尔茨海默症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名。在技术创新领域拥有多项授权发明。曾辅导多位非科班出身的同学成功进入算法行业就业。希望和大家一起成长进步。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型微调部署实战及类GPT工具的高效使用
本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 专栏亮点3. 你的收获4. 详细目录原创 2024-07-24 07:00:00 · 213115 阅读 · 103 评论 -
详解大模型微调数据集构建方法(持续更新)
本文详细介绍了大模型微调数据集构建方法,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四原创 2024-06-05 07:30:00 · 273105 阅读 · 62 评论 -
大模型LoRA微调调参的实战技巧(持续更新)
本文主要介绍了大模型LoRA微调调参的实战技巧,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧原创 2024-05-01 12:08:15 · 206651 阅读 · 68 评论 -
LLaMA Factory单机微调的实战教程
本文主要介绍了使用LLaMA Factory对大模型进行单机微调的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调原创 2024-04-24 22:28:51 · 215651 阅读 · 36 评论 -
huggingface高速下载模型的实战代码
本文主要介绍了huggingface高速下载模型的实战代码,尤其是无法通过国内源进行下载的huggingface模型,希望能对学习大模型的同学们有所帮助。需要特别说明的是,本文的代码是完全原创的,即能够最大限度利用宽度的速度,而且还能实现断点续传。文章目录1. 背景2. 实战代码原创 2024-01-27 11:15:05 · 287256 阅读 · 52 评论 -
使用cursor出现Model not available. This model provider doesn‘t serve your region解决方案
今天给大家带来的是使用cursor出现Model not available. This model provider doesn’t serve your region解决方案,希望能对使用cursor的同学有所帮助。文章目录1. 问题描述2. 解决方案原创 2025-07-19 18:46:20 · 14357 阅读 · 18 评论 -
轻松上手:借助谷歌Gemini打造你的第一个实用的智能体
今天给大家带来的是轻松上手:借助谷歌Gemini打造你的第一个实用的智能体,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-07-04 07:30:00 · 27394 阅读 · 9 评论 -
huggingface高速下载数据集的解决方案
今天给大家带来的是huggingface高速下载数据集的解决方案,希望能对使用huggingface数据集的同学们有所帮助。1. 前言2. 解决方案原创 2025-07-03 07:15:00 · 8005 阅读 · 5 评论 -
巧用云平台API实现开源模型免费调用的实战教程
今天给大家带来的是巧用云平台API实现开源模型调用,希望能对同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-06-20 16:01:18 · 11018 阅读 · 14 评论 -
基于Cline和OpenRouter模型进行MCP实战
本文主要介绍了基于Cline和OpenRouter模型进行MCP实战,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. MCP实战 2.1 模型选型 2.2 安装环境 2.3 安装MCP服务 2.4 MCP实战3. Bug解决方案原创 2025-04-13 17:24:37 · 155846 阅读 · 12 评论 -
Text2SQL推理类大模型本地部署的解决方案
本文主要介绍了Text2SQL推理类大模型本地部署的解决方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-27 07:30:00 · 76139 阅读 · 21 评论 -
DeepSeek-R1 满血版和蒸馏版鉴别方法
本文主要介绍了DeepSeek-R1 满血版和蒸馏版鉴别方法,希望对使用DeepSeek模型的同学们有所帮助。文章目录1. 前言2. 实战教程 2.1 满血版实验结果 2.2 DeepSeek-R1-Distill-Qwen-7B实验结果 2.3 DeepSeek-R1-Distill-Qwen-32B实验结果 2.4 DeepSeek-R1-Distill-Qwen-70B实验结果3. 总结原创 2025-02-25 14:11:10 · 96226 阅读 · 15 评论 -
DeepSeek R1最强平替模型的实战教程
本文主要介绍了DeepSeek R1最强平替模型的实战教程,希望对使用DeepSeek R1出现服务器繁忙,请稍后再试的同学们有所帮助。文章目录1. 前言2. 实战教程原创 2025-02-11 13:08:13 · 77795 阅读 · 5 评论 -
DeepSeek提示词实战教程(持续更新)
本文主要介绍了deepseek提示词实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 推理模型 vs 通用模型3. 提示词实战 3.1 优质提示词库 3.2 提示词优化原创 2025-02-10 17:29:07 · 79258 阅读 · 5 评论 -
DeepSeek R1蒸馏版模型部署的实战教程
本文主要介绍了DeepSeek R1蒸馏版模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 模型调用原创 2025-02-09 17:55:46 · 81168 阅读 · 9 评论 -
AI时代的高效工作法:打造AI专属助理之路
今天给大家带来的是AI时代的高效工作法:打造AI专属助理之路,希望能对同学们有所帮助。文章目录1. 你离“丘吉尔式”的工作方式,只差一个思维转变2. AI使用内功心法 2.1 思维奠基——别把“它”当工具,当成你的“助理实习生” 2.2 思维进阶——反客为主,让AI更加了解实际情况 2.3 持续迭代——从“平庸回复”到“卓越方案”的蜕变**3. 持续积累亦为AI时代的不二法则原创 2025-06-18 10:57:40 · 11347 阅读 · 4 评论 -
语音转文本SOTA模型部署的实战教程
本文主要介绍了语音转文本SOTA模型部署的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 实战代码原创 2025-03-14 16:47:05 · 83460 阅读 · 6 评论 -
本地部署Embedding模型API服务的实战教程
本文主要介绍了本地部署Embedding模型API服务的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 调用代码原创 2025-02-28 17:54:32 · 92991 阅读 · 10 评论 -
Windows环境下Ollama的本地部署方案
本文主要介绍了Windows环境下Ollama的本地部署方案,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. Windows环境安装3. API调用示例代码原创 2024-12-09 13:04:01 · 109484 阅读 · 42 评论 -
LLaMA Factory 核心原理讲解
本文主要介绍了LLaMA Factory 核心原理讲解,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 核心模块讲解3. SFT流程讲解原创 2024-10-30 18:09:06 · 139767 阅读 · 55 评论 -
基于RAG构建Text2SQL的实战教程
本文主要介绍了基于RAG构建Text2SQL的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境2.1 安装虚拟环境2.2 安装依赖库2.3 下载模型3. 运行代码 3.1 启动模型服务 3.2 实战代码原创 2025-01-22 14:44:14 · 85473 阅读 · 3 评论 -
使用langchain和大模型API提取QA的实战教程
本文主要介绍了使用langchain和大模型API提取QA的实战教程,希望能对学习大模型的同学们有所帮助。提取后的json部分内容如下所示。文章目录1. 前言2. 实战教程 2.1 搭建环境 2.2 实战代码 2.3 实战案例原创 2024-10-21 07:15:00 · 137169 阅读 · 41 评论 -
Qwen2.5 本地部署的实战教程
本文主要介绍了Qwen2.5 本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行Qwen2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-23 07:30:00 · 156189 阅读 · 37 评论 -
调用Claude 3.5 API的实战代码
本文主要介绍了调用Claude 3.5 API的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-09-04 18:30:37 · 164230 阅读 · 24 评论 -
基于华为昇腾910B和LLaMA Factory多卡微调的实战教程
本文主要介绍了基于华为昇腾910B和LLaMA Factory多卡微调的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 继续预训练(CPT) 3.4 SFT原创 2024-08-23 22:26:47 · 175226 阅读 · 39 评论 -
详解大模型多轮对话的输入和输出token序列
本文主要介绍了大模型多轮对话的输入和输出token序列,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 内容详解和代码验证原创 2024-12-23 07:30:00 · 103867 阅读 · 36 评论 -
预训练PDF数据格式转换
本文主要介绍了预训练PDF数据格式转换,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. PDF数据格式转换原创 2024-08-12 20:58:48 · 185321 阅读 · 48 评论 -
DeepSeek 2.5本地部署的实战教程
本文主要介绍了DeepSeek 2.5本地部署的实战教程,希望对学习大语言模型的同学们有所帮助。文章目录1. 介绍2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 下载模型文件3. 运行DeepSeek 2.5 3.1 简单测试 3.2 启动API服务原创 2024-09-22 13:19:19 · 189895 阅读 · 24 评论 -
大模型后处理之提取Json结构数据的实战代码
本文主要介绍了大模型后处理之提取Json结构数据的实战代码,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码原创 2024-12-20 21:15:21 · 106076 阅读 · 17 评论 -
详解大模型多轮对话的数据组织形式
本文主要介绍了详解大模型多轮对话的数据组织形式,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. LLaMA Factory适配的多轮对话数据形式3. SWIFT适配的多轮对话数据形式原创 2024-09-06 07:30:00 · 156520 阅读 · 43 评论 -
LLaMA Factory多卡微调的实战教程(持续更新)
本文主要介绍了LLaMA Factory多卡微调的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调 3.3.1 zero3微调 3.3.2 启动API 3.3.3 模型测试原创 2024-06-12 21:30:30 · 254438 阅读 · 19 评论 -
大模型微调和RAG的应用场景
本文主要介绍了大模型微调和RAG的应用场景,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 大模型微调 vs. RAG原创 2024-06-19 22:56:48 · 240766 阅读 · 29 评论 -
使用工作流产生高质量翻译内容的实战教程
本文主要介绍了使用工作流产生高质量翻译内容的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 思路分析3. 实战教程原创 2024-07-22 07:00:00 · 200488 阅读 · 22 评论 -
Langchain-Chatchat本地部署的解决方案
本文主要介绍了Langchain-Chatchat本地部署的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库3. 启动xinference4. 启动Langchain-Chatchat原创 2024-08-28 10:21:15 · 170129 阅读 · 23 评论 -
通过命令行工作流提升工作效率的实战教程(持续更新)
本文主要介绍了通过命令行工作流提升工作效率的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 可选步骤一 2.2 步骤二 2.3 步骤三3. 实战案例原创 2024-07-16 23:17:19 · 205188 阅读 · 34 评论 -
预训练网页数据爬取与预处理
本文主要介绍了预训练网页数据爬取与预处理,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 数据爬取与预处理原创 2024-08-04 22:40:37 · 202689 阅读 · 45 评论 -
大模型提问中包括时间的实战方案
本文主要介绍了大模型提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案原创 2024-07-04 23:02:15 · 217700 阅读 · 19 评论 -
大模型微调出错的解决方案(持续更新)
本文主要介绍了大模型微调出错的解决方案(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动原创 2024-06-13 20:00:00 · 209083 阅读 · 32 评论 -
Text2SQL中不同数据库SQL之间转换的实战代码
本文主要介绍了Text2SQL中不同数据库SQL之间转换的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. SQL转换实战代码原创 2024-06-27 18:08:19 · 227150 阅读 · 23 评论 -
Text2SQL基座模型选择的实战教程(持续更新)
本文主要介绍了Text2SQL基座模型选择的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. Text2SQL基座模型的发展史3. 模型选择实战 3.1 prompt模板 3.2 下载模型与部署API 3.3 实战代码4. 补充说明原创 2024-06-21 17:54:11 · 236729 阅读 · 34 评论