文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

sqoop怎么指定pg库的模式

2023-06-28 23:00

关注

这篇“sqoop怎么指定pg库的模式”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“sqoop怎么指定pg库的模式”文章吧。

sqoop是一款用于hadoop和关系型数据库之间数据导入导出的工具。你可以通过sqoop把数据从数据库(比如mysql,oracle)导入到hdfs中;也可以把数据从hdfs中导出到关系型数据库中。sqoop通过Hadoop的MapReduce导入导出,因此提供了很高的并行性能以及良好的容错性。

sqoop怎么指定pg库的模式

sqoop适合以下的人群使用:

说明

使用sqoop导出导入数据非常的方便,但是对于postgresql(简称PG库)时就碰到了一个问题,pg库是三层结构的database——schema——table。如果想导入到某一个模式下,那就需要指定模式才可以。但是sqoop如何指定pg库的模式?

解决办法

碰到问题首先要看文档才对的。文档这里已经指出如何指定pg库的schema了。官方文档地址
文档已经说了,如果向指定schema需要添加-- --schema <name> 但是要注意的是必须在命令行的!!!!最后!!!添加才会生效。

sqoop怎么指定pg库的模式

但是,这是命令行的解决办法,如果我们使用的是java呢?在没解决之前,我的java代码是这样写的:

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

结果当然是不成功。那我哦添加-- --schema 参数试一下

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            list.add("-- --schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

结果也是不成功,显示报错不识别-- --schema 。。。为了能够使schema参数生效,废了我不少劲。。。也查了不少资料,但是查到的资料都没有关于java的schema的设置。所以。。。最终正确的解决办法是:

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始sqoop将oracle的数据导出到HDFS目录",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            // 注意这里是--是分开的,源码这里是通过--做判断的            list.add("--");            list.add("--schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

当然你也可能会使用字符串数组,数组方式就要这样写了

// 这里只是举个示例String[] string = new String[]{"--","--schema","HERO"}

以上就是关于“sqoop怎么指定pg库的模式”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网行业资讯频道。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯