dataX整合dataX-Web经验总结:
近日公司由于框架升级而涉及到数据的迁移,使用到了dataX的ETL框架,其中遇到了一些坑在此总结一下方便后人使用。
1.环境准备
1.java8
2.python 2.7.18 (官方推荐是2.7.X,具体可自行选择)
3.maven
4.dataX源码 https://github.com/alibaba/DataX
5.dataXWeb 源码 https://github.com/WeiYe-Jing/datax-web
6.数据库是从oracle -> mysql
dataXWeb开发环境部署:https://github.com/WeiYe-Jing/datax-web/blob/master/userGuid.md
dataX建议下载已经发布的包,解压即可使用,下载地址可自行搜索这里就不放了。
遇到的小坑:
1.python的环境变量配置名字要精确为PYTHON_HOME,否则程序执行任务会报找不到python环境。
2.开始迁移
I 准备工作:mysql8的兼容(如果不是mysql8可忽略)
1.dataX由于本身不支持mysql8所以需要我们重新编译源码来更换驱动和添加时区(mysql8连接需要设置时区)
clone dataX源码并用maven构建导入需要的jar包,项目导包完成之后我们找到com.alibaba.datax.plugin.