使用LangSmith LLM运行数据进行模型微调的实战教程

最新推荐文章于 2025-05-12 12:59:28 发布

mmlihaio

最新推荐文章于 2025-05-12 12:59:28 发布

阅读量463

点赞数 7

CC 4.0 BY-SA版权

文章标签： python 人工智能开发语言

本文链接：https://blog.csdn.net/mmlihaio/article/details/144681063

使用LangSmith LLM运行数据进行模型微调的实战教程

老铁们，今天我带大家一起来看看如何直接从LangSmith的LLM运行数据中加载数据，并基于这些数据微调一个模型。整个过程其实相当简单，只需要三个步骤：

选择要训练的LLM运行数据。
使用LangSmithRunChatLoader将这些运行加载为聊天会话。
微调你的模型。

完成后，就可以在你的LangChain应用中使用这个微调后的模型啦。

开始之前的准备工作

确保你已经安装了langchain >= 0.0.311，并配置好了你的LangSmith API密钥。

%pip install --upgrade --quiet langchain langchain-openai

同时，设置环境变量：

import os
import uuid

uid = uuid.uuid4().hex[:6]
project_name = f"Run Fine-tuning Walkthrough {
     uid}"
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = "YOUR API KEY"
os.environ["LANGCHAIN_PROJECT"] = project_name

1. 选择运行数据

第一步是选择哪一部分的运行数据用于微调。通常，我们会选择那些获得用户好评的LLM运行。为了这次教程，我将生成一些运行示例供大家使用。

from enum import Enum
from langchain_core.pydantic_v1 import BaseModel, Field

class Operation(Enum):
    add = "+"
    subtract = "-"
    multiply = "*"
    divide = "/"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mmlihaio

关注关注

7
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LangSmith 的使用

cheese_burger_的博客

06-19

2593

您使用 LangChain 构建的许多应用程序将包含多个步骤，并多次调用 LLM 调用。随着这些应用程序变得越来越复杂，能够检查链或代理内部究竟发生了什么变得至关重要。最好的方法是使用LangSmith。LangSmith 是一个用于构建生产级 LLM 应用程序的平台。它允许您密切监控和评估您的应用程序，以便您可以快速而自信地交付。无需使用 LangChain，即单独使用 LangSmith 可以独立运行！初始化并包装OpenAI客户端以支持自动跟踪。

大模型应用开发技术：LangChain+LangGraph+LangSmith接入Ernie Speed 大模型 Multi-Agent框架案例实战（三）实战代码

大模型与Agent智能体

06-19

717

LangGraph LangChain Multi Agent

参与评论您还未登录，请先登录后发表或查看评论

如何使用LangSmith跟踪deepseek模型

qq_74929891的博客

01-08

875

因为国外gpt的价格有点贵，如何调用国内的模型，成为了性价比最高的方法。这里作者以国内最新的模型为例。

【LangSmith】如何使用 LangSmith

热门推荐

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

05-19

1万+

探索如何使用LangSmith实现更高效地进行模型相关的开发、调试和管理

大模型应用开发技术：LangChain+LangGraph+LangSmith接入Ernie Speed 大模型 Multi-Agent框架案例实战（二）

大模型与Agent智能体

06-19

590

LangChain+LangGraph+LangSmith接入Ernie Speed 大模型 Multi-Agent框架案例实战（二）代码实战

大模型应用之路：从提示词到通用人工智能（AGI）

2401_85377976的博客

07-31

727

对于企业而言，构建一个符合自身业务需求的知识库是至关重要的。通过RAG、微调等技术手段，我们可以将通用的大模型转变为对特定行业有着深度理解的“行业专家”，从而更好地服务于企业的具体业务需求。这样的知识库基本上适用于每个公司各行各业，包括：市场调研知识库、人力资源知识库、项目管理知识库、技术文档知识库、项目流程知识库、招标投标知识库等等。第一、离线的知识数据向量化•加载：通过文档加载器（Document Loaders）加载数据/知识库。•拆分：文本拆分器将大型文档拆分为较小的块。便于向量或和后续检索。

LangChain开发LLM应用【入门指南】

xiangyiran的博客

05-23

1525

通过将自然语言处理管道分解为单独的组件，开发人员可以轻松混合和匹配这些构建块，以创建满足其特定需求的自定义工作流程，从而使得 LangChain 成为一个高度适应性的框架，可用于为广泛的用例和行业构建对话式人工智能应用程序。简化LLM的集成：LangChain 支持广泛的 LLM（OpenAI 的 ChatGPT、Google 的 BERT等），并抽象了与特定模型或提供商交互的细节，使您可以轻松地在不同的LLM之间切换，而无需大量修改应用程序代码。根据用户的输入，代理可以决定是否调用这些工具中的任何一个。

微波技术与天线-Smith圆图软件及使用方法

07-23

Smith Chart软件使用方法以Smith V2.00软件为例，通过几个例子，讲解该软件的使用方法。例1-6(书)：Z0=50Ω，Zl=25+j25Ω。求z=0.2λ处Zin 解：打开Smith V2.00软件。 (1) 选择起始点。点击下图中Toolbox中的DATAPOINT，选择Keyboard，分别设置实部虚部均为25。(如果有频率要求，必须先设定工作频率) (2) 向电源旋转0.2λ。首先，向电源旋转相当于串联传输线，因此选择Toolbox的SERIES中的LINE，在弹出的对话框中设定特征阻抗为50，如下图。点击OK。由于向电源旋转是顺时针，所以顺时针旋转0.2λ后，点击鼠标左键。通过Schematic中的读数来确定0.2λ的长度。 (3) 读出2点的数值：在Data Points中读出98-j51。例：Z0=50Ω，Zl=50+j50Ω。求zmax 解：(1) 设定起始点。流程见上例。 (2) 串联line并顺时针旋转与正横轴交点的旋转的点长度即为zmax，因为此处为实值大电阻(Rmax)。读数为0.088λ。例1-5：Z

LangChain 77 LangSmith 从入门到精通二

AI架构师易筋

02-02

2209

除了记录运行情况外，LangSmith还允许您测试和评估LLM应用程序。在本节中，您将利用LangSmith创建一个基准数据集，并在代理上运行AI辅助评估器。

【Agent】LangSmith的配置及使用

酒酿小圆子呀～

03-21

1772

LangChain 使得原型设计大型语言模型（LLM）应用程序和代理变得容易。然而，将 LLM 应用程序交付到生产环境可能会异常困难。可能需要大量定制和迭代prompt、chain和其他组件，以创建高质量的产品。为了帮助这个过程，推出了LangSmith，一个统一的平台，用于调试、测试和监控LLM 应用程序。

【LLM大模型】LangChain框架：Hub和LangSmith入门

瓦罗兰特顶级C位的博客

07-30

2462

最开始的`LangChainHub`，类似于github一样，可以理解为`LangChain` 工具包或者说组件中心，里面提供了高质量的组件方便开发者使用。确确实实是一个分享和探索Prompt、链和Agent的地方。

【橘子大模型】使用langsmith来监控你的大模型

liuwenqiang1314的博客

03-31

330

我们在上一篇文章中提到了我们可以使用langsmith来监控我们自己的模型。那么我们本文就来操作一把。

LangChain.js 实战系列：搭配 LangSmith 实现调试、监控、测试

YopenLang的博客

01-02

2120

LangSmith是 LangChain 推出的 AI 应用调试、监控和测试平台

【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能，让你的程序运行过程一目了然

同学小张的博客

02-17

2228

今天介绍一个AI生产力工具：LangSmith。本篇文章主要在Tracing部分的实操，包括环境准备、如何将你的LangChain程序和LangSimth平台打通，如何使用LangSimth调试Prompt，以及如何进行在线数据标注和收集，为后面的自动化评估作准备。

LLM大模型进行预训练微调实战

03-23

### LLM大模型预训练与微调的实际操作方法 #### 预训练阶段预训练是指在一个大规模的数据集上训练一个基础模型，以便该模型能够学习到通用的语言表示能力。这一过程通常依赖于无监督学习技术，例如掩码语言建模（Masked Language Modeling, MLM）、自回归预测（Autoregressive Prediction）或其他类似的策略。在实际操作中，预训练可以通过以下框架完成： - **Hugging Face Transformers** 是一种广泛使用的库，支持多种主流的大规模预训练模型，如 BERT、GPT 和 T5。开发者可以加载这些模型并继续在其基础上进行进一步的训练或微调[^1]。 ```python from transformers import AutoTokenizer, AutoModelForPreTraining tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") model = AutoModelForPreTraining.from_pretrained("bert-base-uncased") # 假设有一个大型语料库 dataset for batch in dataset: inputs = tokenizer(batch["text"], padding=True, truncation=True, return_tensors="pt") outputs = model(**inputs) ``` 上述代码展示了如何使用 Hugging Face 的 `AutoModelForPreTraining` 来加载预训练模型，并对其进行进一步的训练处理。 #### 微调阶段微调是在预训练的基础上，针对具体任务对模型进行优化的过程。这一步骤的目标是使模型适应特定领域或任务的需求，比如情感分析、命名实体识别等。以下是基于 Hugging Face 库的一个简单的情感分类任务微调示例： ```python import torch from datasets import load_dataset from transformers import AutoTokenizer, AutoModelForSequenceClassification, Trainer, TrainingArguments dataset = load_dataset('imdb') # 使用 IMDb 数据集作为例子 tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased") model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased", num_labels=2) def tokenize_function(examples): return tokenizer(examples['text'], padding='max_length', truncation=True) tokenized_datasets = dataset.map(tokenize_function, batched=True) training_args = TrainingArguments( output_dir="./results", evaluation_strategy="epoch", learning_rate=2e-5, per_device_train_batch_size=16, per_device_eval_batch_size=16, num_train_epochs=3, weight_decay=0.01, ) trainer = Trainer( model=model, args=training_args, train_dataset=tokenized_datasets["train"], eval_dataset=tokenized_datasets["test"] ) trainer.train() ``` 此代码片段说明了如何加载数据集、定义模型架构以及设置超参数来进行微调。通过这种方式，模型可以在目标任务上获得更高的精度和更好的泛化能力。 #### 参数高效微调 (PEFT) 为了减少计算资源消耗，研究者开发了 PEFT 方法，这种方法允许只更新部分参数而不是整个网络中的所有参数。其中，“增加式方法”是一种常见的 PEFT 技术，它通过向现有模型添加额外的小型模块来扩展功能，而无需重新训练原始模型的所有权重[^3]。例如，在 LoRA（Low-Rank Adaptation）方案下，只需引入低秩分解矩阵以修改选定层的行为即可达到良好的效果。这种做法显著降低了存储需求和推理时间开销。 --- ### 总结通过对 LLM 大模型实施有效的预训练和针对性强的微调流程，可以使模型具备解决复杂自然语言处理问题的能力。同时采用先进的 PEFT 技巧有助于缓解高昂的成本压力，促进更广泛应用场景下的部署可行性。