【深度学习新浪潮】什么是上下文长度？

最新推荐文章于 2025-08-17 10:55:54 发布

智能守恒_HengAI

最新推荐文章于 2025-08-17 10:55:54 发布

阅读量324

点赞数 6

CC 4.0 BY-SA版权

分类专栏：深度学习新浪潮文章标签：深度学习人工智能 LLM 语言模型大模型模型优化上下文长度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/agito_cheung/article/details/149207195

深度学习新浪潮专栏收录该内容

155 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

在这里插入图片描述

大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128K token的上下文，而Llama 4 Scout甚至达到了10M token的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。

一、上下文长度的合理范围

上下文长度的选择需结合具体应用场景：

日常对话：通常需要8K–32K token，例如ChatGPT的默认设置，既能维持对话连贯性，又避免冗余信息干扰。
专业领域：法律合同审查（如Claude 3支持10万token）、科研论文分析（如GLM-4支持百万级token）等场景需要更大的上下文窗口。
多模态任务：处理视频脚本、图文混合内容时，需平衡文本与视觉信息的关联，例如Gemini Ultra通过动态NTK技术实现多模态隐式对齐，支持1M token的跨模态输入。

当前主流模型普遍支持64K–128K token，而企业级应用正逐步向百万级过渡。例如，Llama 4 Maverick的100万上下文窗口可处理约2000万字文本或20小时视频，显著提升长序列任务的处理效率。

二、扩展上下文长

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

智能守恒_HengAI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。