在生产环境中构建 LLM 应用程序

AI天才研究院

于 2023-06-09 03:03:45 发布

阅读量1.3w

点赞数 6

CC 4.0 BY-SA版权

分类专栏： ChatGPT AI人工智能与大数据架构师必知必会系列文章标签：人工智能 LLM 语言模型深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/universsky2015/article/details/131119094

AI人工智能与大数据同时被 3 个专栏收录

37968 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

7579 篇文章 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

架构师必知必会系列

1086 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

文章探讨了将大型语言模型（LLMs）应用于生产环境中的关键挑战，包括自然语言的歧义、成本和延迟、提示与微调的权衡等。作者提出，LLM在任务可组合性方面的潜力，可以用于构建多任务应用程序，并讨论了有前途的用例，如AI助手、聊天机器人和搜索推荐。同时，文章强调了LLM在生产化过程中需要解决的歧义性和一致性问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

Part I. Challenges of productionizing prompt engineering第 I 部分生产提示工程的挑战

The ambiguity of natural languages自然语言的歧义

Cost and latency 成本和延迟

Prompting vs. finetuning vs. alternatives提示与微调对比备择方案

Embeddings + vector databases 嵌入+矢量数据库

Backward and forward compatibility向后和向前兼容性

Part 2. Task composability 第 2 部分。任务可组合性

Applications that consist of multiple tasks包含多个任务的应用程序

Agents, tools, and control flows代理、工具和控制流

Part 3. Promising use cases第 3 部分。有前途的用例

Programming and gaming 编程和游戏

Talk-to-your-data

Search and recommendation 搜索和推荐

A question that I’ve been asked a lot recently is how large language models (LLMs) will change machine learning workflows. After working with several companies who are working with LLM applications and personally going down a rabbit hole building my applications, I realized two things:
最近我经常被问到的一个问题是大型语言模型 (LLM) 将如何改变机器学习工作流程。在与几家使用 LLM 应用程序的公司合作并亲自深入构建我的应用程序之后，我意识到两件事：

It’s easy to make something cool with LLMs, but very hard to make something production-ready with them.
使用 LLM 很容易做出很酷的东西，但很难用它们做出适合生产的东西。
LLM limitations are exacerbate

了解本专栏

超级会员免费看

AI天才研究院

博客等级

码龄10年

人工智能领域优质创作者

博客专家认证

12万+
原创

138万+
点赞

139万+
收藏

6万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 面向开发者的 LLM 入门课程

下一篇：: 构建 LLM 支持的应用程序 Building LLM-powered Applications

最新评论

前沿技术领域论文阅读：开启科研之旅
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
边缘计算+数据库：深度解析边缘数据库的底层原理
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619754061。
人生的意义是什么？
AI天才研究院: 你是否愿意真诚地面对自己：你内心真正渴望什么？什么让你感到“活着真好”？什么让你觉得“即使辛苦，也值得”？
人生的意义是什么？
AI天才研究院: 有人在养育孩子中找到意义，有人在攻克科学难题中找到意义，有人在流浪与体验世界中找到意义，也有人在平凡的日常（比如每天为家人做一顿饭、坚持一个爱好）中找到意义。
程序人生的学习成长秘籍，助力职业生涯，履行社会责任
AI天才研究院: Q：工作太忙，没时间学习怎么办？ A：每天固定30分钟“学习时间”（如早起或睡前），优先学“能直接解决工作问题”的内容（如当前项目用的Spring框架原理）。 Q：技术更新太快，学不过来怎么办？ A：抓住“不变的底层”（如操作系统、算法），新技术大多是底层原理的“应用包装”。例如，学懂TCP/IP后，HTTP、WebSocket等协议都容易理解。 Q：如何判断自己是否适合技术管理？ A：问自己：“我更享受‘解决技术难题’，还是‘帮助团队成员成长’？”技术管理者的核心是“通过他人完成任务”，需要更强的沟通和激励能力。

大家在看

最新文章

2025

2024年61501篇

2023年48310篇

目录

展开全部

收起

评论 54

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI天才研究院 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。