Contents
- 1. 概述
- 2. 软件安装
- 3. 典型场景:Oracle-2-SqlServer
- 4. 定期自动同步数据
1. 概述
Kettle是一个久负盛名的ETL数据传输工具,在我们接触过的许多IT企业中,几乎都有不同的开发或运维团队在使用这个工具。
Azure DevOps Server中存储着大量的开发过程数据,如果对于开发过程数据进行度量分析,为了避免大量读取实时库(AzureDevOps_DefaultCollection)导致性能问题,我们通常需要将实时数据库或清洗后数据仓库中的数据传输给第三方平台,实现数据分析和挖掘;为了完成这个数据传输功能,经过多方验证后,发现Kettle是一个比较理想的数据传输工具。本文主要介绍Kettle的基本使用场景。
2. 软件安装
- 配置Java环境:
Kettle是一个开源软件,并且运行在Java环境中,如果需要在Windows系统中运行Kettle,一般需要安装JDK;在配置JDK的过程中,我们发现如果使用绿色版本的JDK配置环境变量后,Kettle是不能正常运行的,系统会提示找不到javaw的错误,因此建议用户下载JDK的Windows安装程序完成Java环境的配置。 - 下载Kettle程序包
可以从官方完整http://www.kettle.be/中下载程序包,解压缩后就可以直接运行,无需安装