一文搞懂大模型知识增强：知识注入（Prompt + Finetune + RAG）

大模型研究院

于 2025-06-03 09:57:38 发布

阅读量1.1k

点赞数 17

CC 4.0 BY-SA版权

文章标签： prompt 人工智能大数据大模型数据库 transformer 大模型学习

本文链接：https://blog.csdn.net/l01011_/article/details/148395183

通用大模型（如DeepSeek、Qwen）虽具备广泛的知识覆盖和基础推理能力，但仍存在以下局限性：

（1）知识短板：难以覆盖细粒度、动态更新的事实（如罕见病治疗方案、最新指南）；

（2）逻辑薄弱：在复杂推理链、反常识逻辑或伦理判断中表现不足；

（3）领域偏科：在医疗、金融等专业领域，需垂直模型辅助才能满足高精度需求。

通过大模型的知识注入——数据层注入（Prompt）、模型层注入（Finetune）、推理层注入（RAG），可显著提升模型在特定场景下的表现。

Rohan Paul on X: ""Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs" Using external datasets to incorporate new information or refine the capabilities of LLMs on previously seen information poses a significant

一、数据层注入（Prompt）

数据层注入——知识“拌饭法”

通过将领域知识或任务指令“拌入”输入提示中，使模型在无需修改结构的情况下吸收新知识，以极简方式引导模型生成精准响应。

（1）核心目标

以数据为载体，让模型在训练或推理时‘吃’到知识”，类似将调味料拌入米饭（数据）中。

（2）实现思路

数据层注入（知识“拌饭法”）就是我们常提到的提示词工程，使模型在无需结构修改的情况下吸收新知识。

就像你请朋友帮忙时需要说清楚“要做什么、怎么做、要什么结果”，提示词工程就是教大语言模型（LLM）如何理解你的需求，就是你给LLM的“任务说明书”。

（3）提示词工程（Prompt Engineering）

提示词工程大家再熟悉不过，每天都在使用。通过设计输入提示（Prompt），引导模型利用外部知识回答问题。

它就像“用对话技巧提升效率”——日常工作中，无论是让AI查资料时加限定条件，还是写报告时调整提问方式，本质上都是通过“优化输入”（数据层注入）来引导输出。

例如：设计包含领域知识的提示模板（如“根据《民法典》第XX条，该合同条款应______”)。

Prompt crafting for AI writing tools | Recording - Writer

二、模型层注入（Finetune）

模型层注入——知识“硬件升级”

通过直接修改模型底层的知识库或参数结构，让模型从“出厂设置”进化为“领域专家”，实现更高效、更精准的知识调用。

（1）核心目标

修改模型参数或结构，将知识固化到神经网络中，相当于给模型进行“硬件升级”。

（2）实现思路

模型层注入（知识“硬件升级”）就是我们常提到的模型微调（Fine-tuning），本质上是给预训练模型“定制化升级”——通过在特定领域数据上进一步训练，让模型从“通才”变成“专家”。

Finetuning LLMs Efficiently with Adapters

（3）PEFT（参数高效微调）

模型微调常用的方法是PEFT（参数高效微调），通过仅优化模型的部分参数（如低秩矩阵、适配器）而非全量参数，以极低成本实现模型在特定任务上的高效适配。

方法一：LoRA（Low-Rank Adaptation）

在预训练模型的权重矩阵中引入低秩矩阵（参数减少90%以上），通过优化这些低秩矩阵来实现微调，而无需对整个模型进行大幅度修改。

方法二：QLoRA（Quantized Low-Rank Adaptation）

结合LoRA与量化技术，将预训练模型量化为低精度（如4位），同时保持模型精度的最小损失。

三、推理层注入（RAG）

推理层注入——知识“实时外挂”

通过动态检索外部知识库，实时将最新信息拼接到输入提示中，大语言模型就从“死记硬背答案”进化成“边查资料边写作文”。输出内容既专业精准，又自然流畅，彻底告别“一本正经胡说八道”（已读乱回）。

（1）核心目标

在模型生成答案时，动态检索外部知识库，并将检索结果实时拼接至输入提示中，相当于给模型安装“实时外挂”。

（2）实现思路

推理层注入（知识“实时外挂”）就是我们常提到的RAG（检索增强生成），通过将用户提问向量化→检索知识库→返回相关片段，然后将“问题+检索结果”输入大模型生成答案。

（3）RAG（检索增强生成）

RAG（检索增强生成，Retrieval-Augmented Generation）通过结合信息检索和生成技术，使得大语言模型能够实时从外部知识库中检索相关信息，并将这些信息拼接到输入提示中，从而生成更加准确和有用的回答或文本。

Retrieval Augmented Generation (RAG) for LLMs | Prompt Engineering Guide

检索（Retrieval）：从外部知识库中精准抓取与问题高度相关的信息片段，为生成提供实时知识依据。
增强（Augmented）：将检索到的信息拼接到输入提示中，为生成模型注入外部知识，增强回答的专业性和准确性。
生成（Generation）：结合检索到的信息和原始问题，通过生成模型输出连贯、自然且准确的回答或文本。

What is Retrieval Augmented Generation (RAG)? | A Complete Guide

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】