在Julia DataFrames中,可以使用by
函数来实现类似于Pandas中value_counts
的功能。by
函数可以按照指定的列对DataFrame进行分组,并计算每个组中唯一值的频率。
下面是一个示例代码:
using DataFrames
# 创建一个示例DataFrame
df = DataFrame(col1 = [1, 2, 2, 3, 3, 3], col2 = ['a', 'b', 'b', 'c', 'c', 'c'])
# 使用by函数计算每个组中唯一值的频率
counts = by(df, :col1, :col2 => length)
# 打印结果
println(counts)
输出结果如下:
3×2 DataFrame
│ Row │ col1 │ col2_length │
│ │ Int64 │ Int64 │
├─────┼───────┼─────────────┤
│ 1 │ 1 │ 1 │
│ 2 │ 2 │ 2 │
│ 3 │ 3 │ 3 │
上述代码中,我们首先创建了一个示例DataFrame df
,然后使用by
函数按照col1
列对DataFrame进行分组,并计算每个组中col2
列的唯一值的频率。最后,将结果存储在counts
变量中,并打印输出。
需要注意的是,Julia DataFrames中的by
函数返回的结果是一个新的DataFrame,其中包含分组列和计算结果列。
领取专属 10元无门槛券
手把手带您无忧上云