Google Dataproc Presto是一种云原生的分布式SQL查询引擎,它可以在Google Cloud上快速、高效地处理大规模数据。使用Python运行查询可以通过以下步骤完成:
pip install pyhive
。from pyhive import presto
# 连接到Google Dataproc集群
conn = presto.connect(
host='your_cluster_hostname',
port=your_cluster_port,
username='your_username',
catalog='hive',
schema='default',
)
# 创建一个游标对象
cursor = conn.cursor()
# 运行查询
query = 'SELECT * FROM your_table'
cursor.execute(query)
# 获取查询结果
results = cursor.fetchall()
# 处理查询结果
for row in results:
print(row)
# 关闭连接
cursor.close()
conn.close()
领取专属 10元无门槛券
手把手带您无忧上云