Vertex AI RAG 引擎簡介

本頁面說明 Vertex AI RAG Engine 的功能和運作方式。

說明 主控台
如要瞭解如何使用 Vertex AI SDK 執行 Vertex AI RAG Engine 工作,請參閱 Python 適用的 RAG 快速入門

試用 Vertex AI RAG 引擎

總覽

Vertex AI RAG 引擎是 Vertex AI 平台的元件,可協助執行檢索增強生成 (RAG) 作業。Vertex AI RAG Engine 也是一種資料架構,可用於開發具備脈絡資料增強功能的大型語言模型 (LLM) 應用程式。將 LLM 套用至資料時,系統會增強脈絡資料,並實作檢索增強生成 (RAG)。

LLM 的常見問題是無法瞭解私人知識,也就是貴機構的資料。Vertex AI RAG Engine 可讓您為 LLM 脈絡資料增添私人資訊,藉此減少幻覺並提供更準確的回覆。

結合其他知識來源與 LLM 現有的知識,可提供更完善的脈絡。經過改善的查詢脈絡可提升 LLM 回覆品質。

下圖說明 Vertex AI RAG Engine 的關鍵概念。

Vertex AI RAG 重要概念

這些概念依檢索增強生成 (RAG) 程序的順序列出。

  1. 資料擷取:從不同資料來源擷取資料。例如本機檔案、Cloud Storage 和 Google 雲端硬碟。

  2. 資料轉換:轉換資料以便進行索引。例如,資料會分割成多個區塊。

  3. 嵌入:字詞或文字片段的數值表示法。這些數字擷取文字的語意意義和背景資訊。相似或相關的字詞或文字通常會具有相似的嵌入值,也就是說,在高維向量空間中會彼此靠近。

  4. 資料索引:Vertex AI RAG Engine 會建立名為「語料庫」的索引。索引會為知識庫建構結構,以便進行搜尋。舉例來說,索引就像是大型參考書籍的詳細目錄。

  5. 擷取:當使用者提出問題或提供提示時,Vertex AI RAG Engine 中的擷取元件會搜尋知識庫,找出與查詢相關的資訊。

  6. 產生:擷取的資訊會成為新增至原始使用者查詢的脈絡,做為生成式 AI 模型產生具事實根據的基準和相關回覆的指南。

支援的地區

Vertex AI RAG 引擎支援下列地區:

地區 位置 說明 推出階段
europe-west3 德國法蘭克福 支援 v1v1beta1 版本。 正式發布版
us-central1 愛荷華州 支援 v1v1beta1 版本。 正式發布版
us-east4 維吉尼亞州 支援 v1beta1 版本。 預覽
europe-west4 荷蘭埃姆斯港 支援 v1beta1 版本。 預覽

提交意見回饋

如要與 Google 支援團隊進行即時通訊,請前往 Vertex AI RAG Engine 支援團隊

如要傳送電子郵件,請使用電子郵件地址 [email protected]

後續步驟