
LLM
文章平均质量分 95
硅星纯牛码
这个作者很懒,什么都没留下…
展开
-
llama4模型原理速览
2025年4月5日,meta发布了llama系列模型的第四代,包括Scout、Maverick和Behemoth。llama4支持多模态理解,工具调用,编程,多语种任务(暂不支持中文),知识截止到24年8月。多模态支持上,可输入文本和最多5张图片,输出文本;主要亮点:Maverick和 Scout模型此次也是首次采用了MoE混合专家结构,并且主打的亮点是原生的多模态能力、1千万上下文窗口,目前已经发布权重可用。原创 2025-04-06 12:51:59 · 1449 阅读 · 0 评论 -
deepseek GRPO算法保姆级讲解(数学原理+源码解析+案例实战)
GRPO(Groupwise relative policy optimization)群组相对策略优化是deepseek提出的一种RLHF(基于人类反馈的强化学习)技术。首次提出是在DeepSeekMath中,RL被证明在SFT阶段后能有效提升LLM的数学推理能力。在GRPO提出之前,有两种流行的RLHF技术被广泛用于大模型的对齐过程中,分别是PPO和DPO。原创 2025-03-16 23:06:33 · 3477 阅读 · 2 评论 -
大模型安全问题详解(攻击技术、红队测试与安全漏洞)
提示注入攻击(Prompt Injection)数据投毒攻击(Data Poisoning)模型克隆攻击(Model Cloning)拒绝服务攻击(DoS)和拒绝钱包攻击(DoW)插件安全漏洞(Insecure Plug-in Design)敏感信息泄露(Sensitive Information Disclosure)模型篡改 (Model Tampering)对抗性攻击 (Evasion Attacks)软件供应链攻击什么是LLM红队测试?如何进行LLM红队测试?原创 2025-02-22 21:25:17 · 1669 阅读 · 0 评论 -
openai swarm agent框架源码详解及应用案例实战
swarm是一个轻量级、高效、可控的agent协作和执行框架,Agent和handoffs是其中的两种原语抽象(primitive abstractions)。一个Agent包含和tools,并且可以在任何节点选择将对话任务移交给另一个Agent. Swarm类整体代码非常简洁,用不到五百行代码实现了智能体的基本功能。此外,为agent定义业务规则的结构化prompt也值得参考。数据类型。原创 2025-01-05 20:02:35 · 1982 阅读 · 0 评论 -
LLM提示词编写技巧-prompt必知必会
GPT提示词编写技巧原创 2024-05-23 16:21:56 · 3213 阅读 · 0 评论