描述
Kettle是一款开源的 ETL 工具,采用 JAVA 语言编写。
特性
高效稳定,支持多种类型的数据格式,如:MySQL,Oracle,PostGreSQL,CSV 等。
可视化设计。
概念
Transformation(转换):数据抽取/迁移主要设计的对象,负责定义数据从数据源到目标地流动。各步骤并发执行。
Job(作业):支持组合多个转换,即流程控制,支持定时任务执行。各步骤按一定规则顺序执行,可定义为并行执行。
Step(步骤):最核心的概念,转换和作业都是由步骤组成,数据转换和数据清洗都是在步骤中完成,步骤是 Kettle 具体做事情的对象。
hop(跳):即连接,步骤与步骤之间的连接称之为跳。代表数据流量。
安装
Kettle 无需安装,下载压缩包后解压即可使用。
9.0.0版本下载链接:https://pan.baidu.com/s/1gnAhLiLtOyYDNbPIA7k9XQ
提取码:ey0c
产品
Kettle 主要包含4类产品,Spoon,Carte,Pan,Kitchen。
Spoon:可视化开发工具。可视化运行,监控等。
Carte:轻量级 Web 服务器,支持远程执行 Kettle 脚本。
Pan:命令行执行 Kettle Transformation 脚本。如:pan.sh file=xxx.ktr 。
Kitchen:命令行形式执行 Kettle Job 脚本工具。如:kitchen.sh file=xxx.kjb 。