我有一个数据框,如下:
structure(list(X1 = c(1, 0, 1, 0), X2 = c(0, 1, 1, 1), X3 = c(0,
0, 0, 1), Val = c(2, 3, 4, 5)), class = "data.frame", row.names = c(NA,
-4L))我想创建一个输出数据框,其列与上面的数据框相同(列‘Val’除外)
现在,对于每一列(X1、X2和X3),
a)当X1 =1和X1=0时,列X1 =>发现'Val‘sum中的差异。例如,当X1=1和'Val‘sum = 2+4 =6时有2行类似地,当X1=0和'Val’sum = 3+5=8时也有2行输出数据帧在列'X1‘下的值= 6-8 = -2
b)列X2 => 'Val‘sum when X2=1 => 3+4+5=12和'Val’sum when X2=0 => 2.输出数据框在列'X2‘下将有12-2=10
类似地,对于列'X3‘
输出数据框如下所示
structure(list(X1 = -2, X2 = 10, X3 = -4), class = "data.frame", row.names = c(NA,
-1L)) 我们可以在这里寻找一些数据表解决方案吗?
发布于 2020-11-29 22:44:56
您只需将0替换为负1,然后将这些列与val列相乘,并使用apply对每一列求和。
df = as.data.table(df)
df[df == 0] = -1
df = df[, !"Val"] * df$Val
apply(df,2, sum)
# X1 X2 X3
# -2 10 -4发布于 2020-11-30 02:53:06
以下是dplyr的一个选项
library(dplyr)
df1 %>%
summarise(across(starts_with('X'), ~ sum(Val[. == 1]) - sum(Val[!.])))
# X1 X2 X3
#1 -2 10 -4或使用data.table
library(data.table)
setDT(df1)[, lapply(.SD, function(x) sum(Val[x == 1]) -
sum(Val[!x])), .SDcols = patterns('^X\\d+$')]
# X1 X2 X3
#1: -2 10 -4https://stackoverflow.com/questions/65060866
复制相似问题