- 博客(8)
- 收藏
- 关注
原创 利用多索引融合实现高效问答系统
在现代信息检索领域,如何从海量数据中快速获取相关信息是一个重要的挑战。本文将介绍一种基于多索引融合(RAG with Multiple Indexes)的问答应用程序,该应用程序能够查询多个特定领域的检索器,并从所有检索结果中选择最相关的文档。
2024-12-29 18:54:02
267
原创 使用Polygon IO Toolkit进行股票市场数据交互
Polygon IO提供了一个强大的股票市场数据API,可以帮助开发者实时获取市场数据,无论是日内交易数据还是历史数据。为了利用这些数据,我们可以使用Polygon IO Toolkit,这个工具包可以通过简单的API调用获取数据,简化了数据处理的复杂性。使用Polygon IO Toolkit进行股票市场数据请求确实是个不错的选择。老铁们,我个人一直在用这个工具包,特别是在需要快速获取实时数据的场景下,它的表现可以说是相当丝滑。对于有类似需求的开发者,强烈建议尝试一下。
2024-12-28 02:36:18
375
原创 深入解析Nuclia Understanding API与实战示例
随着我们接触到的数据越来越复杂,很多企业数据的形式也从传统的结构化表格转变为多种多样的非结构化数据。而这些数据,往往蕴含了大量的业务价值亟待挖掘。Nuclia Understanding自动索引这些数据,并提供优化的搜索结果和生成性的答案,成了处理这类数据的利器。简单来说,这个API不仅能做视频和音频的转录,还能提取图片内容、解析文档等等,甚至最后还能给你来个内容的总结。是不是听上去就已经很厉害了?Nuclia Understanding API不仅功能强大,而且还提供了灵活的接口供开发者使用。
2024-12-28 02:12:27
401
原创 深入探索GitHub Toolkit:从安装配置到工具使用
老铁们,今天咱们来聊聊GitHub Toolkit。这是一个能够让LLM(大语言模型)智能体与GitHub库互动的利器。这个工具包利用了PyGitHub库的强大功能,帮助开发者更轻松地处理GitHub相关操作。下面我会详细讲解它的安装步骤、配置方法以及如何使用这些工具。我个人一直在使用这个工具包进行GitHub操作,特别是在需要批量处理issues、pull requests时,它极大地提高了我的开发效率。今天的技术分享就到这里,希望对大家有帮助。开发过程中遇到问题也可以在评论区交流~—END—
2024-12-28 01:28:19
415
原创 使用 Supabase 和 pgvector 实现高效的向量存储与查询
Supabase 中的向量存储基于 pgvector 扩展,这使得我们能够处理高维度的嵌入向量。为了增强向量存储的功能,我们需要安装库,它提供了与 Supabase 和 OpenAI 嵌入模型的集成。说白了,使用 Supabase 和 pgvector 进行向量存储和查询无非就是利用 PostgreSQL 的强大功能结合现代的嵌入技术。整个过程相当丝滑,对现有文档存储和检索的效率提升非常明显。今天的技术分享就到这里,希望对大家有帮助。开发过程中遇到问题也可以在评论区交流~—END—
2024-12-27 21:44:36
307
原创 使用Pathway和Langchain实现实时数据索引和检索
Pathway的核心是通过构建实时更新的向量索引来处理数据变化。这意味着我们可以在数据源发生变化的情况下,始终获取最新的查询结果。本文中我们使用一个公共的文档处理管道示例,来展示如何通过Langchain查询这个实时更新的索引。Pathway不仅支持文档的向量化处理,还允许自定义解析、拆分和嵌入文档的组件。而Langchain的组件可以与Pathway无缝集成,提供更大的灵活性和扩展性。更多关于向量存储的概念和使用指南可以参考Vector store概念指南。今天的技术分享就到这里,希望对大家有帮助。
2024-12-27 21:08:11
450
原创 使用 Apache Cassandra 作为向量存储的快速入门
注意:根据你的 LangChain 设置,你可能还需要安装/升级其他依赖库,比如datasetsopenaipypdf, 和tiktoken都是需要的。
2024-12-27 19:42:11
371
原创 用Apache Doris实现实时向量存储与查询
在语言模型中,编码器和解码器都是由一个个的 Transformer 组件拼接在一起形成的。openAI 的 GPT 大模型的发展历程。提供先进的推理,复杂的指令,更多的创造力。
2024-12-27 19:20:19
583
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人