对于Kettle工具中的转换管理和作业管理,其中转换管理中使用数据库连接来获取数据库数据,而Kettle中的数据库连接实际上是数据库连接的描述,也就是实际建立数据库连接需要的参数,实际数据库连接只在运行时才会创建,因此定义一个Kettle的数据库连接,并不会真正打开一个数据库连接。
由于数据库的种类有很多,因此在Kettle工具的数据库连接窗口包含多种数据库类型。
左侧面板显示的是“一般”、“高级”、“选项”、“连接池”以及“集群”的标签,右侧面板显示的是与左侧面板标签相对应的参数设置,具体如图所示。
1.一般标签
“一般”标签,需要设置的内容有“连接名称”、“连接类型”以及“连接方式”等的数据库参数,具体设置规则如下:
- 连接名称:指定一个在转换或作业范围内唯一的名称;
- 连接类型:从数据库列表中选择要连接的数据库类型。
- 连接方式:在连接方式列表中,可以选择与所选数据库类型对应的连接方式。
- 主机名称:数据库服务器的主机名或者IP地址。
- 数据库名称:将要访问数据库的名称。
- 端口号:默认是选择的数据库服务器的默认端口号。
- 用户名和密码:数据库服务器的用户名和密码。
2.“高级”标签
“高级”标签,需要设置的内容有“数据库连接的标识符”和“默认模式的名称”以及“数据库连接成功后要执行的SQL语句”,具体如图所示
设置“数据库连接的标识符”和“默认模式的名称”以及“数据库连接成功后要执行的SQL语句”的具体含义如下:
- 支持布尔数据类型:对于Boolean数据类型的数据,大多数数据库的处理方式都不同,即使使用一个数据库的不同版本也会有所不同。一般的数据库都不会支持Boolean类型,默认情况下,Kettle使用一个字符的字段(即char(1))的不同值(Y或N)来代替Boolean字段。若是勾选“支持布尔数据类型”的复选框,Kettle就会为支持布尔类型的数据库生成正确的SQL语法。
- Supports the timestamp data type:即支持时间戳数据类型,若是勾选该选项的复选框,Kettle就会为支持时间戳的数据库生成正确的时间类型。
- 标识符使用引号括起来:强制性的为SQL语句中的所有标识符(列名、表名)加双引号。一般地,该选项主要用于区分大小写的数据库。
- 强制标识符使用小写字母:将所有的标识符(列名和表名)转为小写。
- 强制标识符使用大写字母:将所有的标识符(列名和表名)转为大写。
- Preserve case of reserved words:即保存保留字的大小写格式。
- Strict NUMBER(38) interpretation:即严格限制Oracle中NUMBER数据类型取值范围(1-38)
- 默认模式名称:若不明确指定模式名称(有些数据库中称为目录)时,使用默认的模式名称。
- 连接成功后要执行的SQL语句:一般用于创建数据库连接后,对某些参数进行修改,例如Session级的变量或者调试信息等。
3.“选项”标签
“选项”标签,设置数据库的特定参数,例如数据库连接的参数。“选项”标签界面具体如图所示。
4.“连接池”标签
“连接池”标签,设置连接池相关参数,该标签的设置用于解决有很多小的转换(或作业)需要单独处理和数据库连接延迟问题,连接池不会限制并发的数据库连接数量。“连接池”标签界面如图所示。
5.“集群”标签
“集群”标签,设置集群的分区数。当一个数据库不能满足需求时,我们可以使用多个数据库来处理数据,即采用数据库分区技术来分散数据的加载,这样可以将一个大的数据集分为多个小数据组(即分区),每个分区都保存在独立的数据库中,因此采用数据库分区技术,可以减少每个数据表或数据库的行数。“集群”标签界面如图所示。
来源地址:https://blog.csdn.net/m0_68381568/article/details/128014938