Opciones de base de datos de vectores en el motor de RAG de Vertex AI

En esta página, se presentan las bases de datos de vectores compatibles con el motor de RAG de Vertex AI. También puedes ver cómo conectar una base de datos de vectores (tienda de vectores) a tu corpus de RAG.

Las bases de datos vectoriales desempeñan un papel fundamental en la recuperación de aplicaciones de RAG. Las bases de datos vectoriales ofrecen una forma especializada de almacenar y consultar incorporaciones vectoriales, que son representaciones matemáticas de texto o de otros datos que capturan el significado y las relaciones semánticas. Las incorporaciones de vectores permiten que los sistemas de RAG encuentren con rapidez y precisión la información más relevante dentro de una amplia base de conocimiento, incluso cuando se trata de consultas complejas o con matices. Cuando se combinan con un modelo de incorporación, las bases de datos vectoriales pueden ayudar a superar las limitaciones de los LLM y proporcionar respuestas más precisas, relevantes y completas.

Bases de datos vectoriales compatibles

Cuando creas un corpus de RAG, el motor de RAG de Vertex AI ofrece el RagManagedDb listo para empresas como la base de datos de vectores predeterminada, que no requiere aprovisionamiento ni administración adicionales. RagManagedDb ofrece opciones de búsqueda de KNN y ANN, y permite cambiar a un nivel básico para realizar prototipado y experimentación rápidos. Para obtener más información sobre cómo elegir una estrategia de recuperación en RagManagedDb o para actualizar el nivel, consulta Cómo usar RagManagedDb con RAG. Para que Vertex AI RAG Engine cree y administre automáticamente la base de datos de vectores, consulta Cómo crear un corpus de RAG.

Además del RagManagedDb predeterminado, el motor de RAG de Vertex AI te permite aprovisionar y usar tu base de datos de vectores dentro de tu corpus de RAG. En este caso, eres responsable del ciclo de vida y la escalabilidad de tu base de datos de vectores.

Compara las opciones de bases de datos de vectores

En esta tabla, se enumeran las opciones de bases de datos de vectores que se admiten en el motor de RAG de Vertex AI y se proporcionan vínculos a páginas que explican cómo usar las bases de datos de vectores en tu corpus de RAG.

Base de datos de vectores   Beneficios   Usos recomendados   Desventajas Métricas de distancia admitidas Tipo de búsqueda Etapa de lanzamiento
RagManagedDb (predeterminado) es un servicio de base de datos escalable distribuido regionalmente que ofrece una coherencia y una alta disponibilidad muy altas, y se puede usar para una búsqueda vectorial. fácil, simple, rápido
  • No requiere configuración.
  • Es adecuada para casos de uso a gran escala y a pequeña escala.
  • Coherencia muy alta.
  • Alta disponibilidad.
  • Latencia baja.
  • Excelente para cargas de trabajo transaccionales.
  • Genera documentos de alto volumen.
  • Creación de RAG a escala empresarial
  • Desarrollar una prueba de concepto rápida
  • Proporciona una sobrecarga de aprovisionamiento y mantenimiento baja.
  • Uso con bots de chat
  • Compila aplicaciones de RAG.
  • Para obtener una recuperación óptima, la función de ANN requiere que el índice se reconstruya después de cambios importantes en tus datos.
cosine KNN (predeterminado) y ANN Vista previa
Vector Search es el servicio de base de datos de vectores de Vertex AI que está optimizado para tareas de aprendizaje automático.
  • Se integra a otros Google Cloud servicios.
  • La escalabilidad y la confiabilidad son compatibles con la infraestructura de Google Cloud .
  • Usa precios prepagos.
  • Genera documentos de alto volumen.
  • Creación de RAG a escala empresarial
  • Administrar la infraestructura de la base de datos vectorial
  • Clientes Google Cloud existentes o cualquier persona que desee usar varios Google Cloud servicios.
  • Las actualizaciones no se reflejan de inmediato.
  • Compromiso con un solo proveedor con Google Cloud.
  • Según tus casos de uso, podría ser más costoso.
cosine

dot-product
ANN Disponible de manera general
Vertex AI Feature Store es un servicio administrado para organizar, almacenar y entregar atributos de aprendizaje automático.
  • Se integra en Vertex AI y otros servicios Google Cloud .
  • La escalabilidad y la confiabilidad son compatibles con la infraestructura de Google Cloud .
  • Aprovecha la infraestructura existente de BigQuery.
  • Genera documentos de alto volumen.
  • Creación de RAG a escala empresarial
  • Administrar la infraestructura de la base de datos vectorial
  • Clientes Google Cloud existentes o clientes que desean usar varios Google Cloud servicios.
  • Los cambios solo estarán disponibles en la tienda en línea después de que se realice una sincronización manual.
  • Compromiso con un solo proveedor con Google Cloud.
cosine

dot-product

L2 squared
ANN Vista previa
Weaviate es una base de datos de vectores de código abierto que es flexible y modular.
  • Admite varios tipos de datos y ofrece funciones de gráficos integradas.
  • Proporciona código abierto y una comunidad vibrante.
  • Son muy flexibles y personalizables.
  • Admite diversos tipos y módulos de datos para diferentes modalidades, como texto e imágenes.
  • Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Genera documentos de alto volumen.
  • Creación de RAG a escala empresarial
  • Administrar la infraestructura de la base de datos vectorial
  • Clientes existentes de Weaviate
  • Las actualizaciones no se reflejan de inmediato.
  • Puede ser más complejo de configurar y administrar.
  • El rendimiento puede variar según la configuración.
cosine

dot-product

L2 squared

hamming

manhattan
Compatibilidad con ANN y búsqueda híbrida Vista previa
Pinecone es una base de datos de vectores nativa de la nube completamente administrada diseñada para una búsqueda de similitud de alto rendimiento.
  • Comienza a usarla rápidamente.
  • Excelente escalabilidad y rendimiento.
  • Enfócate en la búsqueda de vectores con funciones avanzadas, como el filtrado y la búsqueda de metadatos.
  • Puedes elegir entre proveedores de servicios en la nube, como Google Cloud, AWS y Azure.
  • Genera documentos de alto volumen.
  • Creación de RAG a escala empresarial
  • Administrar la infraestructura de la base de datos vectorial
  • Clientes existentes de Pinecone
  • Las actualizaciones no se reflejan de inmediato.
  • Puede ser más costosa que las otras opciones.
  • Las cuotas y los límites restringen el escalamiento y el rendimiento.
  • Control limitado sobre la infraestructura subyacente.
cosine

euclidean

dot-product
ANN Disponible de manera general

¿Qué sigue?