Gravitino Playground 教程

最新推荐文章于 2025-05-16 08:31:30 发布

原创最新推荐文章于 2025-05-16 08:31:30 发布

· 405 阅读

版权

Gravitino Playground 教程

gravitino-playgroundA playground to experience Gravitino项目地址:https://gitcode.com/gh_mirrors/gr/gravitino-playground

1. 项目介绍

Apache Gravitino 是一个正在Apache软件基金会孵化的项目，它旨在提供一种统一的方式来管理和查询不同的数据源。Gravitino Playground 是一个实验平台，用于体验Gravitino的功能，包括使用Trino SQL执行查询，通过Jupyter Notebook进行交互式分析，以及结合LlamaIndex实现自然语言查询。

2. 项目快速启动

安装Docker

确保你的系统已经安装了Docker。

下载并启动Playground

在终端中，克隆Gravitino Playground仓库：

git clone https://github.com/apache/gravitino-playground.git
cd gravitino-playground

然后运行以下脚本来启动所有组件：

./launch-playground.sh

这将会启动包括Hive、MySQL、PostgreSQL、Trino、Spark和Jupyter Notebook在内的多个服务。

访问Jupyter Notebook

打开浏览器，访问 http://localhost:8888 ，你可以在这里找到示例笔记本文件。

连接Trino CLI

在终端中进入Trino容器：

docker exec -it playground-trino bash

然后启动Trino命令行工具：

trino@container_id:/$

现在你可以输入SQL查询，例如：

SHOW CATALOGS;
CREATE SCHEMA catalog_hive.company ...

3. 应用案例和最佳实践

与LlamaIndex集成：创建一个跨表（如MySQL）和非结构化（PDF文件）数据源的索引，并通过自然语言查询获取信息。在gravitino_llama_index_demo.ipynb Jupyter Notebook中查看详细步骤。
RAG演示：展示如何使用Gravitino处理不同数据类型，并通过LlamaIndex查询结构化和非结构化数据。在Jupyter Notebook中打开此示例以了解详情。