qq_37836323-CSDN博客

原创 Identity-enabled Retrieval Augmented Generation (RAG) with PebbloRetrievalQA

load()

2025-07-11 13:08:25 149

原创使用Facebook Messenger数据进行模型微调

微调后的模型可以在LangChain环境中应用，提供更符合具体需求的对话体验。这对于个性化客服、教育助手等场景特别有效。如果遇到问题欢迎在评论区交流。

2025-07-10 15:25:14 356

原创利用UpTrain提升大语言模型应用的性能与质量

Upstash是一种云端Redis服务，专为高性能和弹性设计。它提供了一种高效的限流库，通过与Redis数据库的集成，确保限流规则的实施。限流通常用于控制用户请求频率，防止滥用资源，同时优化系统性能。

2025-07-10 15:23:53 397

原创使用Upstash Ratelimit实现请求与令牌限流

Upstash是一种云端Redis服务，专为高性能和弹性设计。它提供了一种高效的限流库，通过与Redis数据库的集成，确保限流规则的实施。限流通常用于控制用户请求频率，防止滥用资源，同时优化系统性能。

2025-07-10 15:22:55 307

原创使用 TrubricsCallbackHandler 进行用户分析和反馈管理的实践指南

随着人工智能技术的普及，用户与模型的互动频率增高，记录、分析这些互动能够帮助开发者理解模型的表现与用户期望之间的差距。Trubrics 提供了一个简便的平台来管理这些信息，并优化模型。

2025-07-10 15:22:17 273

原创使用 RDFLib 和 LLMs 实现语义网图数据库的自然语言查询接口

RDFLib 是一个纯 Python 库，专门用于操作 RDF 数据。它提供了丰富的功能，包括多种格式的解析和序列化（如 RDF/XML, N3, Turtle 等）、图接口、多种存储实现（如内存存储、持久化磁盘存储、SPARQL 端点存储）以及 SPARQL 1.1 的支持。LLMs 在此场景中被用作自然语言接口，能够自动生成 SPARQL 查询。

2025-07-10 15:04:27 290

原创如何使用 Robocorp Action Server 与 LangChain 拓展 AI 能力

Robocorp 提供了一套工具，用于快速创建可以与人工智能模型交互的自定义 API 动作。通过集成 LangChain 应用，可以构建复杂的 AI 应用程序，增强 AI 的定制与执行能力。

2025-07-10 10:26:29 216

原创使用OpenAPI工具包构建智能API代理

现代软件开发中，OpenAPI（又称Swagger）因其对RESTful APIs的规范化描述而备受欢迎。其强大的描述能力使得自动化生成客户端、服务端代码以及文档成为可能。在AI技术的驱动下，尤其是结合大语言模型（LLM），可以构建自动化的智能代理来消费这些API。这样的代理能够处理复杂的用户请求，并生成相应的API调用。

2025-07-10 10:19:58 385

原创使用GraphQL在Python中查询数据

接下来，我们初始化一个实例并创建一个Agent在上面的代码中，我们通过创建一个Agent，并结合GraphQL查询来获取所有Star Wars电影的标题。

2025-07-10 10:10:43 308

原创使用DataForSEO API获取搜索引擎结果的数据分析

DataForSEO API是一款专为SEO专业人士设计的数据工具，帮助他们从各大搜索引擎获取结构化的数据。这些数据包括自然搜索结果、有机结果、特色片段、知识图谱等。这使得用户能够分析竞争对手、跟踪SEO策略效果，并在国际化语言和地点设置方面有更高的灵活性。你可以控制返回的JSON结果类型和字段，指定要返回的结果数量。# 创建自定义API包装器实例# 获取比尔盖茨的搜索结果print(json_results) # 输出JSON结果。

2025-07-09 15:17:30 531

原创 Azure Cognitive Services Toolkit 深入解析与实战示例

Azure Cognitive Services 是微软推出的一系列云服务，旨在为开发者提供强大的人工智能和机器学习功能。这些功能涵盖了计算机视觉、语音识别、文本分析等多个领域，帮助开发者快速构建智能应用。本文将详细解析 Azure Cognitive Services Toolkit 中的几个重要工具，并通过代码示例展示其实际应用。

2025-07-09 15:12:52 219

原创使用 Alpha Vantage API 获取实时金融数据

Alpha Vantage 提供了一系列强大且易于使用的数据 API，用于获取实时和历史金融市场数据。这些 API 能够帮助开发者轻松获取外汇汇率、股票时间序列数据、市场新闻情绪等信息，非常适合开发金融应用。

2025-07-09 15:10:42 286

原创使用 Zep 开源项目实现聊天历史检索

通过 Zep 检索可以提高 AI 助手的交互质量，尤其适用于需要长期记住用户上下文的情境，比如客服机器人、教育应用等。借助 Zep 的过滤和重排序功能，还能根据特定搜索条件精确锁定目标信息。如果遇到问题欢迎在评论区交流。

2025-07-09 15:09:09 401

原创使用SVM构建文本检索器

在这里，我们通过从OpenAI获取文本嵌入，并使用这些嵌入创建了一个SVM检索器。可以在给定的文本集上进行有效查询。

2025-07-09 15:05:52 394

原创利用DocArray实现多模态数据检索

DocArray支持五种不同的文档索引后端，每种后端都有其独特的特性和使用场景。通过适当的设置，您可以轻松地索引数据，并使用DocArrayRetriever检索相关文档。

2025-07-02 16:35:31 338

原创使用USearch进行高效向量搜索

FAISS和USearch都使用相同的HNSW算法进行近似最近邻搜索。HNSW（Hierarchical Navigable Small World）是一种用于高性能向量搜索的常用算法。USearch的优势在于其小巧的设计和广泛的兼容性，使得它在多种环境中都能发挥较好的效果。

2025-07-02 16:24:04 251

原创使用 SQLite-VSS 进行高效的向量搜索

随着机器学习和人工智能的快速发展，基于向量的检索技术在搜索引擎、推荐系统等领域展现出了显著优势。SQLite-VSS 扩展结合了 SQLite 的稳定性和 Faiss 的性能，为开发者提供了强大的本地向量搜索能力。

2025-07-02 16:19:00 265

原创使用Marqo进行多模态数据向量存储和查询

随着人工智能的发展，处理复杂信息的能力需求不断增加。传统的全文搜索引擎在处理非结构化数据时表现有限，而向量搜索引擎则利用数值向量表示数据内容，可以实现高效的语义搜索。Marqo 专注于多模态数据的向量化及搜索，广泛用于图像识别、文本分析等领域。

2025-07-02 14:28:01 159

原创使用KDB.AI进行语义搜索的实战指南

KDB.AI非常适合用于法律文档、研究论文等非结构化文本的高效语义搜索。这种技术可以为法律行业、学术研究以及商业领域中的数据分析提供支持。如果遇到问题欢迎在评论区交流。

2025-07-02 14:24:32 161

原创使用Faiss进行异步相似度搜索和向量存储管理

如果遇到问题欢迎在评论区交流。

2025-07-02 13:57:04 205

原创使用Elasticsearch进行向量存储与检索详解

Elasticsearch是一种分布式、RESTful风格的搜索和分析引擎，基于Apache Lucene库构建，支持向量和词汇搜索。其强大的搜索能力使其在大数据分析、日志监控等领域得到了广泛应用。为了使其与现代AI技术相结合，Elasticsearch被用作向量存储来进行高效的向量相似性搜索。

2025-07-02 13:55:59 261

原创使用RSS Feed从新闻源加载并解析文档

RSS（简单聚合）的重要性在于，它允许我们从各个网站自动地聚合并提取最新的更新信息。在AI应用中，将RSS源中的新闻文章转化为文档格式是实现文本分析、情感分析等下游任务的前提。

2025-07-01 17:12:01 318

原创使用IPEX-LLM在Intel GPU上进行语言链嵌入任务

这种技术配置特别适用于需要快速响应的应用，如实时查询和交互式问答系统。它可以显著提升在Intel GPU上的嵌入速度，适合包括数据处理和自然语言理解等场景。如果遇到问题欢迎在评论区交流。

2025-07-01 16:07:45 194

原创如何使用 LangChain 与 IBM Watsonx.ai 进行文本嵌入

IBM Watsonx.ai 是 IBM 提供的 AI 基础设施，支持各种 AI 模型的部署和使用。WatsonxEmbeddings 是一个用于处理文本嵌入的封装器，利用 LangChain 可以轻松与这些模型进行交互，助力于文本处理和理解任务。

2025-07-01 16:05:04 354

原创使用LangChain进行假嵌入测试

嵌入技术在自然语言处理（NLP）领域的广泛应用，为文本数据的表示和分析提供了强大的支持。通常，嵌入模型将文本转换为数值向量，以便可以使用这些向量在机器学习模型中进行运算。LangChain中的假嵌入类允许开发者在测试阶段使用一个假的嵌入类来验证这些文本到向量的转换是否正常工作，而不需要依赖真实的嵌入模型。

2025-07-01 16:02:39 317

原创使用LangChain与Clova Embeddings进行文本嵌入

如果遇到问题欢迎在评论区交流。

2025-07-01 16:01:32 227

原创使用 Streamlit 快速构建和共享数据应用

Streamlit 是一个开源的 Python 库，其旨在帮助开发者快速创建数据应用。无论是展示复杂的数据集，还是构建交互式的机器学习模型展示，Streamlit 都能在短短几分钟内实现。尤其是在生成式 AI 及数据分析应用领域，Streamlit 提供了极大的便利。

2025-07-01 14:06:18 334

原创使用Remembrall平台扩展语言模型的长期记忆功能

如果遇到问题欢迎在评论区交流。

2025-07-01 13:36:55 284

原创使用MLflow跟踪LangChain实验

MLflow是一个功能强大的开源平台，用于管理机器学习生命周期中的工作流和工件。它提供了与许多流行的机器学习库的内置集成，也可以与任何库、算法或部署工具配合使用。在LangChain集成的背景下，MLflow提供以下功能：本文将演示如何使用MLflow跟踪LangChain实验。环境设置创建MLflow实验为了组织我们的运行和工件，我们建议创建一个专属的MLflow实验，而不是使用默认实验。集成方法方法1: 自动记录 (Autologging)自动记录是利用MLflow提供的无缝追踪功能，推荐

2025-07-01 11:03:28 253

原创使用 Meilisearch 构建高效搜索系统

随着数据量的爆炸式增长，搜索引擎的功能和性能变得尤为重要。传统的搜索引擎由于使用简单的关键字匹配，无法满足复杂查询和海量数据的需求。Meilisearch 是一个新兴的解决方案，它提供了极快的搜索速度和高度相关的结果，并且支持向量搜索，使得语义查询成为可能。

2025-07-01 11:02:04 296

原创使用EverNoteLoader实现笔记内容提取与管理

接下来是如何使用。

2025-06-30 17:21:01 333

原创使用Dropbox进行文件托管与管理的完整指南

安装完成后，我们可以通过来加载 Dropbox 内的文档。在代码中，我们使用来加载指定路径下的文件。封装了与 Dropbox API 的交互，使得文档加载过程简单且高效。

2025-06-30 17:17:55 263

原创使用Dataherald API进行自然语言到SQL转换

Dataherald提供了一种将自然语言查询转换为SQL语句的便捷方法。这对需要从数据库中提取信息的业务分析和数据科学团队来说非常重要，尤其是在需要以自然语言形式进行查询时。结合LangChain框架，Dataherald可以简单集成到现有的AI系统中。

2025-06-30 17:12:20 374

原创使用Browserbase实现可靠的AI数据检索

Browserbase提供了一系列功能以支持复杂UI的数据提取，其中包括无服务器基础设施、隐秘模式和会话调试器。这些功能使开发者能够轻松、有效地获取并处理网络数据。无服务器基础设施：提供可靠的浏览器环境以提取复杂的UI数据。隐秘模式：包括指纹伪装策略和自动验证码解决。会话调试器：能够通过网络时间线和日志检查您的浏览器会话。实时调试：快速调试自动化流程。

2025-06-30 15:24:21 304

原创使用Baseten平台进行ML模型推理——快速入门教程

Baseten不仅支持开源模型（如Llama 2或Mistral），还允许您在专用GPU上运行专有或微调模型。与OpenAI等提供商不同，Baseten收费是基于GPU使用的分钟数，而不是每个token。这种定价方式对那些需要长时间推理的复杂模型尤为有利。

2025-06-30 15:20:59 367

原创使用Arthur平台监测和记录聊天LLM推理过程

通过将模型推理过程记录到Arthur平台，开发者可以轻松监控模型在实际使用中的表现，识别潜在问题，并进行性能优化。这对于需要频繁更新和调试的生产系统尤为重要。如果遇到问题欢迎在评论区交流。

2025-06-30 15:17:20 135

原创利用AINetwork构建去中心化AI模型

AINetwork是一个创新的区块链技术，专注于为AI应用提供高效的计算资源。通过去中心化的GPU网络，AINetwork能够以较低的成本提供大规模计算能力。这种架构非常适合需要高性能计算的AI模型，如大型深度学习模型和图像生成网络。

2025-06-30 15:08:27 228

原创使用WikipediaRetriever集成实现高效的百科信息检索

Wikipedia是一个多语言的免费在线百科全书，由志愿者通过开放协作的方式编写和维护。它使用基于wiki的编辑系统MediaWiki，是历史上最大、阅读量最高的参考作品。使用WikipediaRetriever，开发者可以轻松获取Wikipedia页面，并将它们转换为下游工具可以处理的文档格式。

2025-06-30 13:04:10 232

原创使用LangChain与GPT4All模型进行交互

GPT4All是由nomic-ai团队维护的开源项目，旨在提供高质量的聊天机器人模型。其训练数据集包括代码、故事和对话，使其能够在各种场景中提供出色的文本生成能力。LangChain是一个强大的库，能够帮助我们轻松地与这些大型语言模型进行交互。

2025-06-30 12:57:00 371

99块买的最新打赏视频源码,亲测可用，域名防红

空空如也