Python 连接 Hive ,查询数据后,导出到csv文件

本文介绍了如何使用Python连接到Hive数据库,执行SQL查询并将结果保存为CSV文件。通过impala.dbapi模块建立连接,执行查询后,逐条获取结果并存储,每10000条数据生成一个CSV文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python 连接 Hive ,查询数据后,导出到csv文件

导包

from impala.dbapi import connect
import os
import re
import csv
import time,datetime
import pandas as pd

开始时间

start = datetime.datetime.now()
print(“开始时间:” + time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time())))

连接Hive

conn = connect(host=‘196.128.50.202’,port = 1000,auth_mechanism=‘PLAIN’)
cur=conn.cursor()

执行查询

cur.execute("SELECT * FROM table ")
i = 0
result = []

从结果中查出一条,然后循环下移cursor

row = cur.fetchone()
while row is not None:
i = i + 1
result.append(row)
row = cur.fetchone()
if i %10000==0:
df = pd.DataFrame(result)
df.to_csv(“D://gongshang_”+time.strftime("%Y%m%d%H%M%S", time.localtime(time.time()))+".csv",sep=’,’,header=False,index=False)
i=0
result = [

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值