YugabyteDB实战教程：从单机PostgreSQL到分布式集群的平滑扩展-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01159/article/details/148419169

YugabyteDB实战教程：从单机PostgreSQL到分布式集群的平滑扩展

yugabyte-db yugabyte/yugabyte-db: 是 YugaByte DB 的官方仓库，一个高性能、高可扩展、分布式的 SQL 数据库，支持 PostgreSQL 兼容性。适合对分布式数据库、SQL 数据库和云原生应用的开发者。项目地址: https://gitcode.com/gh_mirrors/yu/yugabyte-db

前言

在数据库技术领域，从单机数据库迁移到分布式架构是一个常见的演进路径。本文将带您深入了解如何使用YugabyteDB实现这一平滑过渡，通过实际案例展示如何将YugabytePlus流媒体服务从单机PostgreSQL迁移到分布式YugabyteDB集群。

为什么选择YugabyteDB？

YugabyteDB是一个高性能、云原生的分布式SQL数据库，具有以下核心优势：

PostgreSQL兼容性：完全兼容PostgreSQL协议和语法，现有应用无需修改代码即可迁移
水平扩展能力：可轻松添加节点实现计算和存储能力的线性扩展
高可用性：基于Raft共识协议实现数据自动复制，支持故障自动恢复
全局数据分布：支持跨区域部署，满足低延迟访问需求

环境准备

在开始之前，请确保已完成以下准备工作：

已安装Docker环境
已完成基础教程的第一章节（单机PostgreSQL部署）
系统资源充足（建议至少4GB可用内存）

部署单节点YugabyteDB集群

1. 创建数据存储目录

mkdir -p ~/yugabyte-volume/node1

2. 拉取最新YugabyteDB镜像

docker pull yugabytedb/yugabyte:latest

3. 启动第一个数据库节点

docker run -d --name yugabytedb-node1 \
    -p 15433:15433 -p 5433:5433 \
    -v ~/yugabyte-volume/node1:/home/yugabyte/yb_data \
    yugabytedb/yugabyte:latest \
    bin/yugabyted start --base_dir=/home/yugabyte/yb_data --background=false

关键参数说明：

15433端口：YugabyteDB监控UI端口
5433端口：PostgreSQL兼容的数据库服务端口
--base_dir：指定数据存储目录

4. 验证节点状态

等待节点初始化完成后，连接数据库验证状态：

docker exec -it yugabytedb-node1 bin/ysqlsh -h yugabytedb-node1

执行系统函数查看集群状态：

SELECT * FROM yb_servers();

预期输出应显示单个节点的状态信息。

探索YugabyteDB管理界面

通过浏览器访问 http://localhost:15433 可以打开YugabyteDB的管理界面，这里您可以：

查看集群整体健康状况
监控性能指标
检查节点资源使用情况
观察查询执行情况

扩展集群规模

YugabyteDB真正的优势在于其分布式能力，下面我们将集群扩展到3个节点。

1. 启动第二个节点

docker run -d --name yugabytedb-node2 \
    -p 15434:15433 -p 5434:5433 \
    -v ~/yugabyte-volume/node2:/home/yugabyte/yb_data \
    yugabytedb/yugabyte:latest \
    bin/yugabyted start --join=yugabytedb-node1 --base_dir=/home/yugabyte/yb_data --background=false

2. 启动第三个节点

docker run -d --name yugabytedb-node3 \
    -p 15435:15433 -p 5435:5433 \
    -v ~/yugabyte-volume/node3:/home/yugabyte/yb_data \
    yugabytedb/yugabyte:latest \
    bin/yugabyted start --join=yugabytedb-node1 --base_dir=/home/yugabyte/yb_data --background=false

关键参数说明：

--join：指定要加入的现有集群节点
每个节点使用独立的数据目录和端口

3. 验证集群状态

再次查询yb_servers()函数，现在应该能看到3个节点的信息：

SELECT * FROM yb_servers();

数据分布原理

YugabyteDB通过以下机制实现数据分布：

Tablet分片：表数据被自动划分为多个tablet
Raft共识组：每个tablet有1个leader和多个follower（数量由复制因子决定）
负载均衡：tablet leaders均匀分布在所有节点上

在3节点、复制因子为3的集群中：

系统表默认被分为9个tablet
每个tablet有1个leader和2个follower
每个节点承载约3个leader和6个follower

这种架构确保了：

数据高可用（可容忍1个节点故障）
读写负载均衡
线性扩展能力

应用迁移实战

将YugaPlus应用从PostgreSQL迁移到YugabyteDB只需修改连接配置：

停止原有应用容器
修改docker-compose.yaml中的数据库连接配置：

environment:
  - DB_URL=jdbc:postgresql://yugabytedb-node1:5433/yugabyte
  - DB_USER=yugabyte
  - DB_PASSWORD=yugabyte
  - DB_CONN_INIT_SQL=SET yb_silence_advisory_locks_not_supported_error=true