我第一次使用Databriks社区,我有一个问题。我有一个简单的CSV文件,显示7个领域:医院,社区等。
我使用以下方法加载该文件:
然后,我需要计算数据集中的行数和不同医院的数量。当我试图检查不同医院的数量时,我得到了一个错误:无法解决给定的“Hospital
”输入列:医院;Barrio;ingreso;input;Edad;Sexo;
(该命令似乎不承认“医院”为列名。)有什么想法吗?
所用代码:
print("Número de hospitales distintos: " + str(df.select("Hospital").distinct().count()))
发布于 2020-12-13 23:55:55
您在代码中使用了错误的分隔符(最好将其作为文本,而不是图像!)您使用,
作为分隔符,但数据是由;
分隔的。因此,将行delimiter = ','
改为delimiter = ';'
,它应该可以工作。
https://stackoverflow.com/questions/65263711
复制相似问题