系统设计
为了构建本地生成搜索引擎或助手,我们需要几个组件:
包含本地文件内容的索引,使用信息检索引擎检索与给定查询/问题最相关的文档。
一种语言模型,使用从本地文档中选择的内容并生成总结性的答案
用户界面
下图显示了组件如何交互。
首先,我们需要将本地文件编入索引,以便查询本地文件的内容。然后,当用户提出问题时,我们将使用创建的索引以及一些不对称段落或文档嵌入来检索可能包含答案的最相关文档。这些文档的内容和问题被传递给已部署的大型语言模型,该模型将使用给定文档的内容来生成答案。在指令提示中,我们将要求大型语言模型也返回对所用文档的引用。最终,所有内容都将在用户界面上向用户可视化。
现在,让我们更详细地了解每个组件。
语义索引
我们正在构建一个语义索引,该索引将根据文