
SeaTunnel
文章平均质量分 91
SeaTunnel使用,源码学习
kk小源
菜鸟java开发,啥啥都想学一点儿
https://blog.xksource.cn
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SeaTunnel 增强对csv读取时分割字段的能力
在产品的业务里面,需要一个通过 csv 来同步数据的功能,但 seatunnel 的 csv 读取功能,并没有根据 csv 规则来分隔字符串,而是简单的用换行符来分隔行,用 String.split 方法来分隔列,一旦列的值里面包含有换行符或者分隔符,结果就会错误所以在这里,我们对 seatunnel 原来的 csv 读取功能进行改造,让它真正能够处理 csvcsv 的处理在 connector-file-base 模块,在 这个枚举可以看到,对于读取 csv 类型,用的是 跟踪进 的 read 方法原创 2024-12-04 17:08:17 · 988 阅读 · 0 评论 -
SeaTunnel 增强对excel读取能力,支持xlsx、xls、公式单元格
本次修改基于 seatunnel-2.3.4 版本修改完之后,增强对 excel 的读取能力,自动识别 xlsx、xls,支持读取公式单元格的值本次对 excel 的支持都在 connector-file-base 模块seatunnel 对 excel 的读取,都在 类中,原版对 excel 的读取是根据文件名后缀来判断当前文件是 xlsx 还是 xls,一旦遇到文件名随机生成的情况就无能为力了,原版如下我们把它改成使用 poi 的 方法来创建 workbook,让 poi 自己判断当前是什么文件类原创 2024-12-03 11:52:46 · 837 阅读 · 0 评论 -
SeaTunnel Zeta 引擎启动流程分析(一)
本次源码解读基于 v2.3.4 版本,SeaTunnel 支持 Flink、Spark 引擎启动,也支持自身的 Zeta 引擎启动。自身的 Zeta 引擎基于 hazelcast 作为分布式集群控制,支持单机、集群运行,支持自治集群(去中心化),省去了用户为 SeaTunnel Engine 集群指定 Master 节点的麻烦,因为它在运行过程中可以自行选择一个 Master 节点,当 Master 节点发生故障时,会自动选择新的 Master 节点。原创 2024-11-21 16:22:15 · 1216 阅读 · 0 评论