快乐小天使哈哈哈-CSDN博客

原创基于 RAG 实现大模型商品智能检索

传统商品检索需要依赖人工解析和构建商品的描述字段，将商品信息存入 ElasticSearch 或数据库，然后通过分词查询结合多重条件（类别或其他属性）检索到匹配的商品。但是在传统检索中，因为分词本身的特点，经常会遇到误匹配的问题，例如：我们检索 "苹果耳机"的时候，往往会出现苹果和耳机的相关商品，导致客户体验效果不佳。为了让检索更人性化，我们可以借助 RAG 技术，在传统分词搜索的基础上融入向量检索的能力，从而获得更贴近人类需求的检索效果。

2024-09-27 22:19:21 718

原创云上部署文生图大模型Stable Diffusion 3

随着人工智能技术的不断进步，越来越多的人开始关注和使用AI艺术生成工具。而Stable Diffusion 3作为最新一代的文生图大模型，于2024年6月12日正式开源，以其高质量的图像生成受到了广泛欢迎。那么，如何快速部署Stable Diffusion 3，让它成为您的专属AI艺术家呢？请跟随本文，在百度智能云GPU服务器上部署Stable Diffusion 3。

2024-09-27 22:18:15 762

原创用ModelArts制作一张AIGC音乐专辑

选择在ModelArts中运行，进入到ModelArts CodeLab环境，然后切换资源规格，依次运行代码，并在下图的画框处填写诗句的第一个字，3秒钟就能生成相关的诗句。同时，ModelArts还支持可视化的Gradio界面展示，可以将生成的页面地址分享给其他人，让他们直接填入提示词，自定义旋律的时长，快速创作一首独一无二的歌曲。同之前的两个案例，依次运行代码，在Prompt的划线处填写与音乐旋律相匹配的提示词，建议先用中文描述，再用翻译软件转换为英文，这样生成的图片会更加精准。最后是专辑封面环节，👉。

2024-09-26 21:14:27 772

原创基于Ascend C的FlashAttention算子性能优化最佳实践

在主流大模型网络模型中，大量使用典型的Multi-Head Attention结构，带来了巨大的计算和内存开销。其运行过程中，矩阵乘和softmax结果存放在片上内存会带来巨大的内存消耗，访存性能严重下降，甚至会导致模型无法正常运行，同时网络中的矩阵和向量计算串行执行，也会导致硬件算力发挥受限。

2024-09-26 21:10:03 1004

原创悠星运维团队的 GenAI 技术实践：Claude 3-Powered Code Reviewer

Claude 3 使用 Constitutional AI 和无害训练等技术创建，在思考对话、内容创建、复杂推理、代码审查、代码生成、代码分析和优化、错误检测和调试、文档生成、代码重构和维护等方面表现卓越。Amazon Bedrock 是一个完全托管的服务，通过单一 API 为头部 AI 公司如 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 提供高性能的基础模型选择，以及构建具有安全性、隐私性和负责任 AI 的生成式 AI 应用程序所需的广泛功能。

2024-09-25 19:58:19 853

原创为生成式 AI 工作负载设计弹性

在需要使用 RAG 模式为基础模型提供上下文数据的情况下，你需要一个数据管道，可以摄取源数据，将其转换为 embedding vectors，并将 embedding vectors 存储在向量数据库中。在更高的技术栈中，你还需要跟踪系统中的调用流，捕获 agent 和工具之间的交互。如果这些随时间变化，可能表明用户正在以新的方式使用系统，参考数据没有以相同的方式覆盖问题空间，或者模型的输出突然不同。这将在意外丢失的情况下保护你的 prompts，或作为整体灾难恢复策略的一部分。

2024-09-25 19:56:34 418

原创 Bedrock 知识库加速客服团队应用 GenAI 能力

在客服工作台方面，如果您正在使用 Zendesk，那么本文提到的定制的 Zendesk App 结合 Amazon Bedrock 知识库可以让您的团队在半天内拥有一个基于您自己的知识库的解决方案，并帮助提供基于工单的自动回复内容。下载 Zendesk App 包，下载链接：https://github.com/nimysan/amazon-bedrock-zendesk-app/releases/tag/1.0.0。对于售后座席，确保回复内容的语气更具人文关怀，符合当地语言的表达方式。

2024-09-24 20:40:21 357

原创 RoboMaker 构建和捆绑 ROS 应用程序

很多时候，构建环境已经因为另一个软件包而安装了依赖项，并且所有内容都可以正常构建，但是在该软件包捆绑之后，却出现缺少依赖项的问题。使用colcon，我们的工具收集此信息，调用各种软件包安装程序（当前为 pip 和 apt ）以下拉依赖项，将这些依赖项安装到本地临时区域，然后将它们与本地构建的工作区一起打包成一个 bundle 供 AWS RoboMaker 使用。在最精细的程度上，每个库可以存在于单独的覆盖中，并且如果单个库发生更改，那么这是机器人必须下载的唯一更改（如果它是最新的）。

2024-09-24 20:38:23 836

原创 Connect、Lex 和 Bedrock 打造智能客户问答方案

Amazon Connect 是一种基于云的联络中心服务，旨在帮助企业提供更灵活、更高效的客户支持。通过集成多种通信渠道和自动化工具，Amazon Connect 能够显著提升客户体验和业务效率。某客户前期已经使用 Amazon Connect 在工作时间为其终端用户提供人工电话咨询服务。为了在非工作时间为终端用户提供自动化问答服务，我们将 Amazon Lex 和 Amazon Bedrock 与现有知识库结合起来，借助大型语言模型，为客户构建一个自动化的问答方案。

2024-09-23 13:32:16 839

原创 Bedrock 知识库加速客服团队应用 GenAI 能力

在客服工作台方面，如果您正在使用 Zendesk，那么本文提到的定制的 Zendesk App 结合 Amazon Bedrock 知识库可以让您的团队在半天内拥有一个基于您自己的知识库的解决方案，并帮助提供基于工单的自动回复内容。下载 Zendesk App 包，下载链接：https://github.com/nimysan/amazon-bedrock-zendesk-app/releases/tag/1.0.0。对于售后座席，确保回复内容的语气更具人文关怀，符合当地语言的表达方式。

2024-09-23 13:29:55 595

原创神经网络生成全球碳储量潜力图

在未来，我们希望扩大我们在全球范围内绘制生物量以及时间变化的方法，” EcoVision 实验室的主要作者 Nico Lang 说， ETH Z ü rich 摄影测量和遥感小组成员。通过这个项目，我们的目标是在深度学习的帮助下，通过合并来自两次太空任务的数据来填补缺失的数据空白，”土木工程、环境与工程系教授康拉德·辛德勒说，以及苏黎世 ETH 的地理信息工程。通过对数据中的不确定性进行建模，并使用由五个单独训练的 CNN 组成的集合，这些模型具有深度学习算法中不常见的透明度。

2024-09-22 17:31:20 882

原创实时人工智能模型旨在帮助保护大堡礁

作者 Megha Malpani 是谷歌的 AI / ML 产品经理， Ard Oerlemans 是谷歌的软件工程师，他们是 CSIRO 研究团队的一员，致力于构建最精确、性能最好的模型。健康的珊瑚礁需要 10 到 20 年的时间才能从 COTS 爆发中恢复， COTS 爆发的定义是每 10000 平方米有 30 个或更多的成年人，或者密度消耗珊瑚的速度快于珊瑚的生长速度。研究人员利用 CSIRO 提供的一个带注释的数据集，开发了一个精确的目标检测模型，该模型使用实时摄像头而不是浮潜器来检测海星。

2024-09-22 17:29:03 552

原创 AI大模型开发工程师之路：从零到一的进阶指南

虽然它的应用前景广阔，但真正精通大模型技术的人还不多。笔者也是充满疑虑，然后直到我看到这本书籍，感觉受益匪浅，给与了很多指导和引路，先分享给大家，也希望可以帮助更多的小伙伴。首先，在第1章，书里介绍了AI大模型的基础知识，包括自然语言处理的发展历史和大模型的基本概念。这部分内容让你掌握了大模型的核心技术，理解了模型是怎么一步步处理数据并生成结果的，这对于想深入学习大模型的人非常有帮助。对于那些想转型AI大模型开发的人来说，书中的每一个章节都是帮助你建立技能和经验的实用工具，让你从理论到实际操作都有所掌握。

2024-09-21 08:51:10 5151

原创 re:Invent ? 的五项发布内容

要将您的应用部署到 5G，只需将 Amazon Virtual Private Cloud (VPC) 扩展到 Wavelength Zone，然后创建 AWS 资源即可，比如 Amazon Elastic Compute Cloud (EC2) 实例和 Amazon Elastic Block Storage (EBS) 卷。开发人员现在可以使用这些新的 iOS 和 Android Amplify 库，在自己的移动应用中添加分析、AI/ML、API（GraphQL 和 REST）、数据存储和存储功能。

2024-09-21 08:38:24 641

原创弧光量子 & Braket 实现全流程对接打造量子应用生态

基于以上独特的优势，isQ 已完成与 Amazon Braket 全流程的对接，用户可以通过 isQ 设计和编程量子算法，并且能够方便地调用 Amazon Braket 后台提供的多种量子硬件资源，包括 Rigetti、OQC 的超导量子硬件、IonQ 的离子阱量子硬件、QuEra 的中性原子硬件以及 Xanadu 的光量子硬件等。我们基于 isQ 实现了与 Amazon Braket 的对接，并基于对接之后的框架调用了 Amazon Braket 的量子硬件资源，实现了一个量子机器学习任务。

2024-09-20 20:17:55 560

原创 Braket Hybrid Jobs 的介绍 – 设置、监控并高效运行混合量子经典工作负载

量子计算中一个快速发展的研究领域使用 QPU，即量子计算机使用的处理器，就像在机器学习中使用 GPU 一样：将量子电路参数化，用一些值进行初始化，然后在 QPU 上运行。要运行混合算法，您需要手动设置经典基础设施，安装所需的软件，并在混合算法期间管理量子和经典计算流程之间的交互。为了帮助解决此问题，我们可以从机器学习中汲取灵感：我们不使用固定量子电路，即实现算法的逻辑，而是通过调整调节电路的参数来“学习”算法，从而更有可能通过适应特定设备中的噪声来解决给定问题（将它们视为“自学习量子算法”）。

2024-09-20 20:16:35 387

原创使用 Co-Visitation 矩阵和 RAPIDS cuDF 构建高效的推荐系统

虽然您可以尝试各种方法，但目前，共访问矩阵会针对每个同时出现的商品给出一个权重，该演示为时间更近的商品提供了更多权重，因为此类交互似乎更相关。另一种想法是考虑交互的类型，一起购买的商品或一起添加到购物车的商品似乎比简单查看的商品更适合推荐。构建有效的推荐系统需要理解和利用庞大、复杂的数据集，这些数据集可捕获用户和商品之间的交互。例如，在图 1 所示的会话中，如果商品 2834 经常与商品 6543 一起购买，则使用此矩阵提出建议是非常合适的。这是通过聚合会话中所有项目的共访问矩阵的权重来完成的。

2024-09-19 09:30:14 1737

原创借助小语言模型 (SLM) 降低延迟：NVIDIA 首款设备端小语言模型如何让数字人栩栩如生

与较大的 Nemotron-4 LLM 相比，Nemotron-4 4B 的参数更少，精度更低，显存占用率更低，并且生成第一个Token的时间 (即响应开始的速度) 更快，同时基于模型精炼仍然能够保持高准确性。Gamescom 2024，西山居游戏推出的“解限机 (Mecha BREAK)”首次展示了采用设备端小语言模型 NVIDIA Nemotron-4 4B 的 ACE 技术，它使游戏角色提供更快、更准确的响应。大语言模型使用大量数据进行训练，但通常是通用型的，包含的信息对于大多数用途来说都是多余的。

2024-09-19 09:29:11 584

原创轻量级冠军：NVIDIA 发布具有领先准确率的小语言模型

Mistral-NeMo-Minitron 8B 是 Mistral AI 与 NVIDIA 上个月发布的 Mistral NeMo 12B 开放模型的微型版本，其尺寸小到足以在 NVIDIA RTX 驱动的工作站上运行，但却在针对 AI 驱动的聊天机器人、虚拟助手、内容生成器和教育工具的多项基准测试中取得了出色的成绩。这种技术意味着只需要原始数据集的一小部分，来训练相关模型系列中的每个附加模型，与从头开始训练较小的模型相比，在剪枝和蒸馏较大模型时最多可将计算成本降为原本的四十分之一。

2024-09-18 19:16:19 910

原创每个人都将拥有 AI 助手

几乎每个行业都将受到这项技术的影响，无论是科学计算以更少的能源更好地预测天气，还是与创作者合作生成图像，或为工业可视化创建虚拟场景，”黄仁勋表示。全球最大的广告公司 WPP 还正在为可口可乐公司使用 Omniverse 驱动的生成式 AI，进而提升品牌真实性，同时展现了 NVIDIA 的 AI 技术进步在各行各业的实际应用。“加速计算可以节省 20 倍甚至 50 倍的能耗，而且能完成同样的处理工作，”黄仁勋表示。“每个人都将拥有 AI 助手，”黄仁勋表示，“每家企业，每个岗位，都将拥有 AI 助手。

2024-09-18 19:14:26 740

youshimeihaoyi的博客

原创基于 RAG 实现大模型商品智能检索

原创云上部署文生图大模型Stable Diffusion 3

原创用ModelArts制作一张AIGC音乐专辑

原创基于Ascend C的FlashAttention算子性能优化最佳实践

原创悠星运维团队的 GenAI 技术实践：Claude 3-Powered Code Reviewer

原创为生成式 AI 工作负载设计弹性

原创 Bedrock 知识库加速客服团队应用 GenAI 能力

原创 RoboMaker 构建和捆绑 ROS 应用程序

原创 Connect、Lex 和 Bedrock 打造智能客户问答方案

原创 Bedrock 知识库加速客服团队应用 GenAI 能力

原创神经网络生成全球碳储量潜力图

原创实时人工智能模型旨在帮助保护大堡礁

原创 AI大模型开发工程师之路：从零到一的进阶指南

原创 re:Invent ? 的五项发布内容

原创弧光量子 & Braket 实现全流程对接打造量子应用生态

原创 Braket Hybrid Jobs 的介绍 – 设置、监控并高效运行混合量子经典工作负载

原创使用 Co-Visitation 矩阵和 RAPIDS cuDF 构建高效的推荐系统

原创借助小语言模型 (SLM) 降低延迟：NVIDIA 首款设备端小语言模型如何让数字人栩栩如生

原创轻量级冠军：NVIDIA 发布具有领先准确率的小语言模型

原创每个人都将拥有 AI 助手

原创深入了解使用 NVIDIA NIM 优化的新 AI 模型

原创轻松解决难题：RTX 和 AI 技术为 STEM 学习增添动力

原创使用 Co-Visitation 矩阵和 RAPIDS cuDF 构建高效的推荐系统

原创轻松解决难题：RTX 和 AI 技术为 STEM 学习增添动力

原创聚焦：xpander AI 为 NIM 应用程序配备 Agentic 工具

空空如也

空空如也