Flink CDC (Mysql为例)

最新推荐文章于 2025-07-04 12:45:49 发布

sebeefe

最新推荐文章于 2025-07-04 12:45:49 发布

阅读量1.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：面试学习路线阿里巴巴文章标签： mysql flink 数据库 java 容器

本文链接：https://blog.csdn.net/sebeefe/article/details/126790076

本文介绍了如何使用Flink CDC从MySQL数据库实时同步数据，重点在于通过阅读binlog并二次封装，简化用户配置和业务代码实现。提供了一个SpringBoot项目的测试demo，包括依赖引入、配置文件设置和消费者实现，展示了数据变更时的处理流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景

业务中经常出现一些千万乃至亿级别的大表，此时可能考虑分库分表（Sharding-JDBC、MyCat等方案），也常同步数据进入ES中；同步数据这一业务场景中，Flink CDC是一个很不错的解决方案。

方案

如mysql、postgresql、sqlserver等，flink cdc通过读取binlog日志（注意：请先开启binlog日志），进行数据同步，实时性较好。

对数据的解析和消费进行了二次封装，使用者只需增加简单的配置，实现FlinkConsumerListener接口，关注编写业务代码即可。

代码

show coding

flink: flink cdc 暂时支持mysql

测试demo

创建一个springboot项目

依赖引入（引入上述工程打包后的依赖）

        <dependency>
            <groupId>com.kwin</groupId>
            <artifactId>flink</artifactId>
            <version>0.0.1-SNAPSHOT</version>
        </dependency>

配置文件

flink:
pipeline-name: flinkCDCTest

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sebeefe

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【大数据】Flink CDC 实时同步mysql数据

congge

10-07

1万+

Flink CDC 实时同步mysql数据

flink cdc mysql整理与总结

努力工作学习的程序员

05-26

1853

1、FlinkCDC 提供了对 Debezium 连接器的封装和集成，简化了配置和使用的过程，并提供了更高级的 API 和功能，例如数据格式转换、事件时间处理等。Flink CDC 使用 Debezium 连接器作为底层的实现，将其与 Flink 的数据处理能力结合起来。通过配置和使用 Flink CDC，您可以轻松地将数据库中的变化数据流转化为 Flink 的 DataStream 或 Table，并进行实时的数据处理、转换和分析。2、Flink的DataStream和SQL比较成熟和易用。

参与评论您还未登录，请先登录后发表或查看评论

Flinkcdc监测mysql数据库，自定义反序列化，利用flinkApi和flinkSql两种方式

2301_79197199的博客

04-05

2148

CDC (Flink Change Data Capture)（Flink中改变数据捕获）是基于数据库的日志 CDC 技术，实现了全增量一体化读取的数据集成框架。搭配Flink计算框架，Flink CDC 可以高效实现海量数据的实时集成。改变你们的一个误区，cdc只有检测功能，不能对数据库中的数据进行修改删除添加。

SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动

cici15874的博客

06-17

364

Flink CDC 是一个基于 Apache Flink 的数据捕获工具，能够实时捕获和处理数据库的变动事件。通过集成 Flink CDC，可以实时追踪 MySQL 数据库中的数据变动，构建高效的数据处理和分析应用。本文将介绍如何在 SpringBoot 项目中集成 Flink CDC，并实现对 MySQL 数据变动的实时追踪。

Flink 使用之 MySQL CDC

chbxw

08-21

4557

一、CDC 简介 CDC 即 Change Data Capture 变更数据捕获，为Flink 1.11中一个新增功能。我们可以通过 CDC 得知数据源表的更新内容（包含Insert Update 和 Delete），并将这些更新内容作为数据流发送到下游系统。捕获到的数据操作具有一个标识符，分别对应数据的增加，修改和删除。 +I：新增数据。 -U：一条数据的修改会产生两个U标识符数据。其中-U含义为修改前数据。 +U：修改之后的数据。 -D：删除的数据。在我的文章 Flink CDC 中可以更详细的

Flink CDC读取Mysql数据

penngo的专栏

05-22

4224

Flink Mysql CDC的核心原理都是通过监控mysql的binlog的日志变化，从而进行日志解析，得到变化的数据。 Flink CDC官网：https://github.com/ververica/flink-cdc-connectors MySql CDC：https://github.com/ververica/flink-cdc-connectors/blob/master/docs/content/con

flinkCDC mysql

zhangyupeng0528的博客

10-29

555

1.首先必须在要同步到源端和目标端创建好表。以上就是flink_CDC的全部过程。3.目标端flinksql模板。4.把源端数据插入到目标端。

Flink CDC MySQL同步MySQL（一）

07-06

jdbc

flink mysql cdc 2.3 编译版本兼容flink1.4.x

09-01

只兼容mysql

基于Flink CDC使用datastream方式全量增量同步mysql to mysql

03-04

基于Flink CDC使用datastream方式全量增量同步mysql to mysql 使用的是java语言，只需配置完源数据库和目标数据库信息，运行MysqlCDC中的main函数，即可实现多库多表同步。

flink-sql-connector-mysql-cdc-1.2.0.jar

03-05

flink cdc mysql jar包，2021年最新版

Flink示例——Flink-CDC

蒋含竹的博客

09-18

1万+

Flink示例——Flink-CDC 版本信息 Mavan依赖主从同步配置、数据准备使用Flink-CDC 简单的测试 Flink示例——Flink-CDC 版本信息产品版本 Flink 1.11.1 flink-cdc-connectors 1.1.0 Java 1.8.0_231 MySQL 5.7.16 注意：官方说目前支持MySQL-5.7和8，但笔者还简单测试过mariadb-10.0.38（对应MySQL-5.6）。包括增加、删除、更新、聚合，目前皆可用，但不排除未知问题。 Mavan

Flink CDC生产实践-转载

qq_31866793的博客

12-29

1340

MySQL CDC连接器允许从MySQL数据库读取快照数据和增量数据。本文档根据官网翻译了如何设置MySQL CDC连接器以对MySQL数据库运行SQL查询。依赖关系为了设置MySQL CDC连接器，下表提供了使用构建自动化工具（例如Maven或SBT）和带有SQL JAR捆绑包的SQL Client的两个项目的依赖项信息。 1、Maven依赖 <dependency> <groupId>com.alibaba.ververica</groupId>

Flink CDC 最佳实践（以 MySQL 为例）

lhyandlwl的博客

04-06

6330

可以看到，当有数据变更时，Flink CDC Job 会输出变更的表名、记录的主键以及变更的数据。例如，在这个示例中，有一行记录的年龄字段从25变成了27。在 MySQL 中，首先需要创建需要进行 CDC 的表和 CDC 表。CDC 表是一个系统表，它存储了需要捕获的更改数据。接下来，需要编写一个 Flink CDC 应用程序，以将 MySQL 表更改推送到 Kafka 主题中。首先，需要在本地或云端创建 MySQL 数据库，并添加一个具有读写权限的用户。为需要进行同步的 MySQL 表的名称。

Flink cdc3.0同步实例（动态变更表结构、分库分表同步）

最新发布

qq_42773076的博客

07-04

800

MySQL与Flink CDC集成配置指南本文详细介绍了MySQL服务器与Flink CDC的集成配置步骤： MySQL服务器配置：启用二进制日志(Binlog)并设为ROW模式创建专用用户并授权REPLICATION权限配置唯一Server ID Flink环境准备：添加Maven依赖或部署JAR包配置checkpoint间隔 Flink CDC表定义：提供完整建表示例详解核心参数如connector、hostname、scan模式等验证测试：包括测试数据准备和集成验证该配置可实现M

Flink CDC监听Mysql及SQLserver

TYM112的博客

07-17

898

flink cdc监听mysql、sqlserver

Flink CDC 同步 Mysql 数据

小强签名设计的博客

10-30

1495

Flink CDC 基于数据库日志的技术，实现了全量和增量的一体化读取能力，并借助 Flink 优秀的管道能力和丰富的上下游生态，支持捕获多种数据库的变更，并将这些变更实时同步到下游存储。

flink cdc mysql initial

06-06

### Flink CDC MySQL 初始加载配置在使用 Flink CDC 读取 MySQL 数据时，可以通过 `StartupOptions` 配置初始加载的方式。Flink CDC 提供了多种启动选项，包括从头开始（initial）、仅消费增量数据（latest-offset）或从特定的时间点（timestamp）开始等[^2]。以下是配置 MySQL 初始加载设置的详细说明： #### 1. 使用 `StartupOptions.initial()` 配置初始加载通过 `StartupOptions.initial()` 方法，可以确保 Flink CDC 在任务启动时首先读取 MySQL 表中的全量数据，然后继续消费后续的增量变更数据。以下是一个完整的代码示例[^2]： ```java import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import com.ververica.cdc.connectors.mysql.MySqlSource; import com.ververica.cdc.connectors.mysql.table.StartupOptions; public class FlinkCDCInitialLoadExample { public static void main(String[] args) throws Exception { // 获取执行环境 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); env.setParallelism(1); // 构建 MySQL SourceFunction 并配置初始加载 MySqlSource<String> mysqlSource = MySqlSource.<String>builder() .hostname("127.0.0.1") // MySQL 主机地址 .port(3306) // MySQL 端口 .username("root") // MySQL 用户名 .password("123456") // MySQL 密码 .databaseList("gmall-210325-flink") // 指定数据库 .tableList("gmall-210325-flink.base_trademark") // 指定表 .deserializer(new CustomerDeserialization()) // 自定义反序列化器 .startupOptions(StartupOptions.initial()) // 配置初始加载 .build(); // 添加 Source env.addSource(mysqlSource) .print(); // 打印输出数据 // 启动任务 env.execute("Flink CDC Initial Load Example"); } } ``` #### 2. 其他可用的 `StartupOptions` 除了 `initial()`，还有其他几种常用的启动选项： - **`latest-offset`**：仅消费增量数据，忽略历史数据。 - **`specific-offset`**：从指定的 Binlog 偏移量开始消费。 - **`timestamp`**：从指定的时间戳开始消费。例如，如果需要从某个时间点开始消费数据，可以使用以下配置[^2]： ```java // 从指定时间戳开始消费数据 MySqlSource<String> mysqlSource = MySqlSource.<String>builder() .hostname("127.0.0.1") .port(3306) .username("root") .password("123456") .databaseList("gmall-210325-flink") .tableList("gmall-210325-flink.base_trademark") .deserializer(new CustomerDeserialization()) .startupOptions(StartupOptions.timestamp("2023-01-01T00:00:00Z")) // 指定时间戳 .build(); ``` #### 3. 注意事项 - 确保 MySQL 的 Binlog 功能已启用，并且模式为 `ROW`[^1]。 - 如果使用的是 `initial` 模式，Flink CDC 会在任务启动时首先进行全量扫描，因此可能会对 MySQL 数据库造成一定的性能压力。 - 在生产环境中，建议根据实际需求选择合适的启动选项，以平衡性能和数据一致性。 #### 4. 示例连接字符串在实际应用中，MySQL 的连接字符串可能需要额外的参数以确保兼容性和稳定性。以下是一个典型的连接字符串示例： ```java String jdbcUrl = "jdbc:mysql://rm-ufxxxlt6q.mysql.rds.aliyuncs.com:3306/z_flinkcdc_test?useSSL=false&autoReconnect=true"; ``` ---