文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

关系型数据库导入导出绝招出炉

2024-04-02 19:55

关注

Sqoop作为数据传输的工具,对于Hadoop与传统数据库之间数据的传输起着桥梁作用,那么到底如何导入导出数据呢?

第一:使用MapReduce作业来执行导入:

1Sqoop首先检查将要导入的表

1、确定主键(如果有的话),调用mapreduce,根据主键分割map

2、没有主键,运行边界查询确定导入的记录数(找到一个min和一个max,确定边界进行划分)

3、通过任务数来划分边界查询的结果,使得他们有相同的负载

2Sqoop为每个将导入的表生成Java源文件

1、在导入过程中编译和使用文件

2、导入后依然保留,可以被安全删除

第二:使用sqoop导入整个数据库:

(1)import-all-tables工具导入整个数据库

1、存储为逗号间隔的文件

2、默认导入到HDFS的home目录

3、数据将放在每个表的子目录中

关系型数据库导入导出绝招出炉

2)使用--warehouse-dir选项指定不同的基础目录关系型数据库导入导出绝招出炉

第三:使用Sqoop导入单个表:

1import工具导入单个表

1、示例:导入accounts表

以逗号分隔的方式存储数据到HDFS

关系型数据库导入导出绝招出炉

2、指定tab分隔字段

关系型数据库导入导出绝招出炉

第四:增量导入

(1)  如果上次记录导入后发生了变更怎么办?

1、可以重新导入所有记录,但是效率低

(2)  Sqooplastmodified增量模式导入新的和修改的记录

1、基于指定的timestamp列

2、确保当记录更新或者被添加时timestamp也更新

关系型数据库导入导出绝招出炉

(3)append增量模式只导入新纪录

1、基于指定列的最后一条记录

关系型数据库导入导出绝招出炉

第五:使用SqoopHadoop导出数据到RDBMS

(1)Sqoop的import工具把数据从RDBMS拉入到HDFS

(2)有时候也需要把HDFS的数据推回到RDBMS,当需要对大数据集进行批处理,并导出结果到RDBMS供其它系统访问

(3)Sqoop使用export工具,RDBMS表在导出前必须已存在

关系型数据库导入导出绝招出炉

掌握了以上方式,对于关系型数据库的导入和导出基本有一个明确的认知和了解,其实我们在日常的学习和实践过程中要多去看看别人的分享,毕竟做技术每个人的经历与经验不一样,有时候说不准会有意向不到的收获。我自己平时喜欢关注“大数据cn”、“大数据时代学习中心”这些微信服务号,对于我个人而言,起到了很大的促进作用,也期待每一个学习大数据的人都能够有所收获!


阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯