该python脚本是用于执行hive脚本的,需要设置hive的可执行环境变量,其实质转化为shell下命令 hive -e 'sql语句’ 的方式执行,然后把结果重定向到控制台显示。注:由于该脚本是直接调用shell中的hive命令,所以需要在安装hive的服务器上执行。
使用前置条件:(1)安装hadoop和hive,并启动完hadoop;(2)已配置好hive的环境变量,确保在shell中能正常执行hive。
#!/usr/bin/python
#-*-coding:utf-8 -*-
import subprocess
import traceback
sql = """
# 书写hql脚本
;
"""
cmd = 'hive -e """'+sql.replace('"', "\'")+'"""'
print cmd
try:
p = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE)
while True:
buff = p.stdout.readline()
print buff
if buff == '' and p.poll() != None:
break
except Exception,re:
print "message is:%s" %(str(re))
traceback.print_exc();
脚本举例
#!/usr/bin/python
#-*-coding:utf-8 -*-
import subprocess
import traceback
sql = """
select * from app_tianhe_zym_item_reason_dtl_da where order_dt = '2016-01-26' limit 10;
"""
cmd = 'hive -e """'+sql.replace('"', "\'")+'"""'
print cmd
try:
p = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE)
while True:
buff = p.stdout.readline()
print buff
if buff == '' and p.poll() != None:
break
except Exception,re:
print "message is:%s" %(str(re))
traceback.print_exc();