可以通过以下几种方式实现:
result = df.collect()
for row in result:
print(row)
result = df.toPandas()
for index, row in result.iterrows():
print(row)
def process_row(row):
print(row)
df.foreach(process_row)
new_df = df.select("column_name")
result = new_df.collect()
for row in result:
print(row)
result = df.head(5)
for row in result:
print(row)
以上是获取pyspark dataframe中的值的几种常用方法。根据具体的需求和数据规模,选择合适的方法进行操作。
云+社区沙龙online第5期[架构演进]
“中小企业”在线学堂
小程序·云开发官方直播课(数据库方向)
小程序云开发官方直播课(应用开发实战)
云+社区开发者大会 长沙站
云+社区技术沙龙[第6期]
腾讯云GAME-TECH沙龙
Elastic 中国开发者大会
领取专属 10元无门槛券
手把手带您无忧上云