Crea un lakehouse de Iceberg abierto, administrado y de alto rendimiento para permitir realizar análisis avanzados y tareas de ciencia de datos, con administración de datos automatizada y gestión integrada.
Funciones
BigLake Metastore es un metastore sin servidores para todas tus tablas de Iceberg. Los motores como Apache Spark, BigQuery y las plataformas de terceros pueden usarlo para crear y administrar tablas, lo que te brinda una vista coherente de tus datos y controles de acceso unificados. BigLake Metastore ahora admite el catálogo REST de Apache Iceberg para facilitar la integración con OSS y motores externos. Las tablas de Iceberg también son datos accesibles en AlloyDB (versión preliminar), para obtener interoperabilidad entre plataformas transaccionales y analíticas.
BigLake extiende las capacidades de administración de Google Cloud Storage, lo que te permite usar la clase automática de almacenamiento para una organización eficiente de datos fríos en niveles y aplicar claves de encriptación administradas por el cliente (CMEK) a tus buckets de almacenamiento. BigLake Metastore se integra de forma nativa en Dataplex Universal Catalog, lo que garantiza que las políticas de administración definidas de forma centralizada se apliquen de manera coherente en varios motores, al tiempo que permite la búsqueda semántica, el linaje de datos, la creación de perfiles y las verificaciones de calidad.
Las tablas de BigLake para Apache Iceberg ofrecen una experiencia de Iceberg completamente administrada y lista para la empresa cuando se usan con BigQuery. Al almacenar datos de Apache Iceberg en tus propios buckets de Google Cloud Storage y aprovechar las capacidades de administración de metadatos en tiempo real y altamente escalables de BigQuery, obtienes lo mejor de ambos mundos: la apertura y la propiedad de los datos asociadas con GCS, así como el acceso a las capacidades completamente administradas de BigQuery con datos de Iceberg para transmisión, análisis avanzado y casos de uso de IA.
Cómo funciona
BigLake ofrece una implementación nativa para Apache Iceberg en Cloud Storage, donde puedes aprovechar BigQuery o el motor de código abierto que elijas directamente en los datos de Iceberg. BigLake Metastore ayuda a simplificar la administración de datos y se integra en Dataplex Universal Catalog para una administración unificada.
Usos comunes
Comprender los componentes de Google Cloud de un data lakehouse abierto
Para crear un lakehouse de Iceberg con BigLake, primero almacena tus datos en Cloud Storage. Luego, define estos datos con tablas de BigLake para Apache Iceberg. El metastore de BigLake funciona como tu catálogo centralizado y sin servidores para estas tablas de Iceberg, lo que elimina la necesidad de administrar una infraestructura compleja. Esta configuración permite que cualquier motor compatible con Iceberg acceda a tus datos y los administre de manera coherente, lo que crea un entorno de lakehouse unificado, abierto y escalable con facilidad.
Comprender los componentes de Google Cloud de un data lakehouse abierto
Para crear un lakehouse de Iceberg con BigLake, primero almacena tus datos en Cloud Storage. Luego, define estos datos con tablas de BigLake para Apache Iceberg. El metastore de BigLake funciona como tu catálogo centralizado y sin servidores para estas tablas de Iceberg, lo que elimina la necesidad de administrar una infraestructura compleja. Esta configuración permite que cualquier motor compatible con Iceberg acceda a tus datos y los administre de manera coherente, lo que crea un entorno de lakehouse unificado, abierto y escalable con facilidad.
Proporciona estadísticas y predicciones en tiempo real para servicios financieros
Puedes usar Apache Iceberg para evolucionar conjuntos de datos de data lake, como transacciones o feeds de mercado. BigLake permite que BigQuery consulte las tablas de Iceberg junto con el almacenamiento nativo sin mover los datos. Puedes transferir transmisiones en tiempo real a BigQuery y combinarlas con datos históricos de Iceberg a través de BigLake para realizar un análisis inmediato y completo. Luego, BigQuery ML genera estadísticas en tiempo real, como la volatilidad del mercado y la detección de fraudes, así como modelos predictivos, como el riesgo crediticio y el comportamiento del cliente.
Proporciona estadísticas y predicciones en tiempo real para servicios financieros
Puedes usar Apache Iceberg para evolucionar conjuntos de datos de data lake, como transacciones o feeds de mercado. BigLake permite que BigQuery consulte las tablas de Iceberg junto con el almacenamiento nativo sin mover los datos. Puedes transferir transmisiones en tiempo real a BigQuery y combinarlas con datos históricos de Iceberg a través de BigLake para realizar un análisis inmediato y completo. Luego, BigQuery ML genera estadísticas en tiempo real, como la volatilidad del mercado y la detección de fraudes, así como modelos predictivos, como el riesgo crediticio y el comportamiento del cliente.
BigLake proporciona acceso seguro y coherente a una sola copia de los datos en Cloud Storage. Luego, Dataplex Universal Catalog cataloga automáticamente estos datos para que todos los usuarios y motores de datos puedan acceder a ellos. Esto garantiza definiciones de datos coherentes, un descubrimiento sencillo y una administración unificada, lo que elimina los silos y fomenta la colaboración en una única fuente de información.
BigLake proporciona acceso seguro y coherente a una sola copia de los datos en Cloud Storage. Luego, Dataplex Universal Catalog cataloga automáticamente estos datos para que todos los usuarios y motores de datos puedan acceder a ellos. Esto garantiza definiciones de datos coherentes, un descubrimiento sencillo y una administración unificada, lo que elimina los silos y fomenta la colaboración en una única fuente de información.
Precios
| Cómo funcionan los precios de BigLake | Los precios de BigLake se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos. | |
|---|---|---|
| Servicios y uso | Descripción | Precio (USD) |
Administración de tablas de BigLake | Recursos de procesamiento para administrar tablas de BigLake que se usan para la optimización automática del almacenamiento de tablas. | A partir de $0.12 por hora de DCU |
Almacenamiento de metadatos de BigLake | BigLake Metastore cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes. | A partir de $0.04 por GiB al mes |
Acceso a metadatos de BigLake | Operaciones de clase A: Los cargos de acceso a los metadatos de BigLake incluyen operaciones de escritura, actualización, creación, listado y configuración con un nivel gratuito de 5,000 operaciones por mes. | A partir de $6.00 por millón de operaciones |
Operaciones de clase B: Los cargos de acceso a los metadatos de BigLake se aplican a las operaciones de lectura, obtención y eliminación con un nivel gratuito de 50,000 operaciones por mes incluidas. | A partir de $0.90 por millón de operaciones | |
Cómo funcionan los precios de BigLake
Los precios de BigLake se basan en la administración de tablas, el almacenamiento de metadatos y el acceso a metadatos.
Administración de tablas de BigLake
Recursos de procesamiento para administrar tablas de BigLake que se usan para la optimización automática del almacenamiento de tablas.
Starting at
$0.12
por hora de DCU
Almacenamiento de metadatos de BigLake
BigLake Metastore cobra por los metadatos almacenados. El nivel gratuito incluye 1 GiB de almacenamiento de metadatos por mes.
Starting at
$0.04
por GiB al mes
Acceso a metadatos de BigLake
Operaciones de clase A: Los cargos de acceso a los metadatos de BigLake incluyen operaciones de escritura, actualización, creación, listado y configuración con un nivel gratuito de 5,000 operaciones por mes.
Starting at
$6.00
por millón de operaciones
Operaciones de clase B: Los cargos de acceso a los metadatos de BigLake se aplican a las operaciones de lectura, obtención y eliminación con un nivel gratuito de 50,000 operaciones por mes incluidas.
Starting at
$0.90
por millón de operaciones