这篇文章主要介绍了kettle spoon如何连接hbase,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
spoon下载安装地址:http://www.pentaho.com/download
选择 Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。
spoon是纯java编写的,所以使用前必需安装java的jdk包
下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html
连接HBase需要配置(实际连接HBase是通过zookeeper服务)
进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件
修改 active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。
进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录
里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件
如在cdh62目录 lib 下:
那么 cdh62 就驱动集可以使用。
HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。
在HBase机器上输入命令:
hostname
如:
root@ubuntu:~# hostname
ubuntu
然后修改spoon机器上的hosts
打开 C:\Windows\System32\drivers\etc\hosts 文件
如HBase服务器的IP是 192.168.0.10
则在 hosts 文件中新加一行,并保存。
192.168.0.10 ubuntu
打开spoon,进入spoon解压目录双击 Spoon.bat 文件
注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可
新建转换,并且点击 Big Data > HBase Input
双击 HBase Input 图标 > 点击New 弹出编辑 Hadoop cluster窗口
修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182
确定,然后在 Hadoop Cluster 选中 hbase-test
进入Create/Edit mappings选择卡,按以下步骤操作
然后返回 Configure query 选项卡,按步骤操作
然后鼠标右键HBase Input > 选择Preview > 快速启动
即可查看数据。
感谢你能够认真阅读完这篇文章,希望小编分享的“kettle spoon如何连接hbase”这篇文章对大家有帮助,同时也希望大家多多支持亿速云,关注亿速云行业资讯频道,更多相关知识等着你来学习!