执行sum()时，Pyspark 'column‘对象不可调用

执行sum()时，Pyspark 'column'对象不可调用是因为在Pyspark中，'column'对象代表一个列，而sum()函数是用于计算某一列的总和的。但是需要注意的是，'column'对象本身并不能直接调用sum()函数，因为它只是一个代表列的对象，不具备执行计算的功能。

要使用sum()函数计算列的总和，需要将'column'对象传递给DataFrame的select()函数，并使用sum()函数作为参数。例如：

from pyspark.sql import SparkSession
from pyspark.sql.functions import sum

# 创建SparkSession对象
spark = SparkSession.builder.appName("example").getOrCreate()

# 创建一个DataFrame
data = [(1, 10), (2, 20), (3, 30)]
df = spark.createDataFrame(data, ["id", "value"])

# 计算'value'列的总和
total_sum = df.select(sum(df.value)).collect()[0][0]
print("总和:", total_sum)

在上述示例中，首先创建了一个包含'id'和'value'两列的DataFrame。然后使用select()函数选择'value'列，并将其传递给sum()函数。最后，通过collect()函数将结果收集并取出总和值。

推荐的腾讯云相关产品：腾讯云分析数据库CDW，是腾讯云提供的一种高性能、高可靠的数据分析型数据库产品。CDW基于分布式存储和计算技术，支持PB级的数据存储和秒级的数据分析能力，适用于数据仓库、BI、OLAP等场景。了解更多详情，请访问腾讯云CDW产品介绍页面：腾讯云CDW

请注意，以上答案仅供参考，具体的实现方式和腾讯云产品推荐应根据实际情况和需求进行选择。