这篇文章主要介绍“Hive数据导出的方法是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Hive数据导出的方法是什么”文章能帮助大家解决问题。
一、数据导出是什么
hive是一个依赖Hadoop集群的数据处理平台,我们不仅需要对数据进行筛选处理,更需要进行导出,供我们多次重复使用。
二、六大帮派
1.insert
insert有两种形式,加local上传到本地路径,不加local上传到集群
代码如下(示例):
insert加localinsert overwrite local directory '/root/export/data/student' select * from student;insert不加local(并将数据格式化)insert overwrite directory '/student' row format delimited fields terminated by ',' select * from student;
2.Hadoop命令导出到本地
代码如下(示例):
hadoop dfs -get /user/hive/warehouse/hive.db/student/student.txt /root/export/data/student/
3.Hive shell命令导出
一个 > 是覆盖,两个>是追加
代码如下(示例):
bin/hive -e 'select * from hive.student' >> /root/export/data/student/student.txt
4.export导出到HDFS上
当该hdfs路径下有文件时或表存在,都不可导,与import连用。
代码如下(示例):
export table hive.student to '/user/hive/warehouse/hive.db/student';
5.Sqoop导出
将数据导出到window系统的mysql,并进行可视化操作
6.清除表中的数据(Truncate)——删库跑路
Truncate只能删除管理表,不能删除外部表的数据(但可以将外部表转为内部表哦,嘿嘿嘿)只是删除内部表的hdfs数据,元数据还在
内部转为外部表alter table student set tblproperties('EXTERNAL'='TRUE')一定大写截断表Truncate table student;
关于“Hive数据导出的方法是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网行业资讯频道,小编每天都会为大家更新不同的知识点。