Flink CDC MySQL 表字段定义为 decimal 输出乱码问题优雅解决方式

Flink CDC MySQL 表字段定义为 decimal 输出乱码问题解析

代码运行环境

Flink 1.15 + FlinkCDC 2.4.0 + jdk1.8 +springboot 2.3

1、原因分析

Flink CDC 底层使用 Debezium 连接器来捕获 MySQL 的数据变更。当 MySQL 表中的字段类型为 decimal 时,Debezium 默认会将 decimal 类型的数据转换为二进制格式(java.math.BigDecimal)进行传输。然而,在 Flink 中,如果直接使用默认的反序列化方式,可能会导致 decimal 数据无法正确解析,从而出现乱码问题。这是由于 Flink 和 Debezium 在处理 decimal 类型数据时的格式不完全兼容所导致的。

2、解决方案

使用 JsonDebeziumDeserializationSchema 自定义转换规则参数 Map<String, Object> customConverterConfigs configs.put("decimal.format",

### Flink CDC MySQL 初始加载配置 在使用 Flink CDC 读取 MySQL 数据时,可以通过 `StartupOptions` 配置初始加载的方式Flink CDC 提供了多种启动选项,包括从头开始(initial)、仅消费增量数据(latest-offset)或从特定的时间点(timestamp)开始等[^2]。 以下是配置 MySQL 初始加载设置的详细说明: #### 1. 使用 `StartupOptions.initial()` 配置初始加载 通过 `StartupOptions.initial()` 方法,可以确保 Flink CDC 在任务启动时首先读取 MySQL 表中的全量数据,然后继续消费后续的增量变更数据。以下是一个完整的代码示例[^2]: ```java import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import com.ververica.cdc.connectors.mysql.MySqlSource; import com.ververica.cdc.connectors.mysql.table.StartupOptions; public class FlinkCDCInitialLoadExample { public static void main(String[] args) throws Exception { // 获取执行环境 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); env.setParallelism(1); // 构建 MySQL SourceFunction 并配置初始加载 MySqlSource<String> mysqlSource = MySqlSource.<String>builder() .hostname("127.0.0.1") // MySQL 主机地址 .port(3306) // MySQL 端口 .username("root") // MySQL 用户名 .password("123456") // MySQL 密码 .databaseList("gmall-210325-flink") // 指定数据库 .tableList("gmall-210325-flink.base_trademark") // 指定表 .deserializer(new CustomerDeserialization()) // 自定义反序列化器 .startupOptions(StartupOptions.initial()) // 配置初始加载 .build(); // 添加 Source env.addSource(mysqlSource) .print(); // 打印输出数据 // 启动任务 env.execute("Flink CDC Initial Load Example"); } } ``` #### 2. 其他可用的 `StartupOptions` 除了 `initial()`,还有其他几种常用的启动选项: - **`latest-offset`**:仅消费增量数据,忽略历史数据。 - **`specific-offset`**:从指定的 Binlog 偏移量开始消费。 - **`timestamp`**:从指定的时间戳开始消费。 例如,如果需要从某个时间点开始消费数据,可以使用以下配置[^2]: ```java // 从指定时间戳开始消费数据 MySqlSource<String> mysqlSource = MySqlSource.<String>builder() .hostname("127.0.0.1") .port(3306) .username("root") .password("123456") .databaseList("gmall-210325-flink") .tableList("gmall-210325-flink.base_trademark") .deserializer(new CustomerDeserialization()) .startupOptions(StartupOptions.timestamp("2023-01-01T00:00:00Z")) // 指定时间戳 .build(); ``` #### 3. 注意事项 - 确保 MySQL 的 Binlog 功能已启用,并且模式为 `ROW`[^1]。 - 如果使用的是 `initial` 模式,Flink CDC 会在任务启动时首先进行全量扫描,因此可能会对 MySQL 数据库造成一定的性能压力。 - 在生产环境中,建议根据实际需求选择合适的启动选项,以平衡性能和数据一致性。 #### 4. 示例连接字符串 在实际应用中,MySQL 的连接字符串可能需要额外的参数以确保兼容性和稳定性。以下是一个典型的连接字符串示例: ```java String jdbcUrl = "jdbc:mysql://rm-ufxxxlt6q.mysql.rds.aliyuncs.com:3306/z_flinkcdc_test?useSSL=false&autoReconnect=true"; ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

半部论语

如果觉得有帮助,打赏鼓励一下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值