所以我.我试着找出这个很明显的问题的答案。我有多个预测变量,需要循环通过,以便为每个预测器获得另一列的摘要。这个数据框架将随着每次迭代而改变,所以我需要为多个不同的数据帧工作的代码。以下是我到目前为止看过的地方:
使用mtcar包,这是我尝试过的:
#get mtcars data from graphics package
install.packages("graphics")
library(graphics)
data <- mtcars
#loop through names
variable <- list(colnames(data))
for
当使用简单的R boxplot函数时,我可以很容易地将数据帧直接放到括号中,然后就会出现一个完美的盒子图,例如: baseline <- c(0,0,0,0,1)
post_cap <- c(1,5,5,6,11)
qx314 <- c(0,0,0,3,7)
naive_capqx <- data.frame(baseline, post_cap, qx314)
boxplot(naive_capqx) this is an image of the boxplot made with the simple R boxplot function 但是,我需要使这个bo
现在,我有一个数据帧,格式如下:
year blue red yellow orange pink white
2012 1 2 3 4 5 6
2013 12 14 28 11 0 5
如果我想要找到每一行的前2位,并获得此数据帧的结果:
year color n
2012 white 6
2012 pink 5
2013 yellow 28
2013 red 14
我如何在base R或dplyr中做到这一点
具有包含244个数据帧的列表。这个列表名为d,d[[1]]如下所示。
d[[1]]
year pos days sal
1 2009 A 31 2000
2 2009 B 60 4000
3 2009 C 10 600
4 2010 B 10 1000
5 2010 D 90 7000
我想按年分组数据,添加天数和sal,并选择在组中天数最大的pos。
其结果是:
year pos days sal
1 2009 B 101 6600
2 2010 D 10
在r数据帧上又遇到了一个问题。
#starting position
from <- c("A","B","A","C")
to <- c("D","F","D","F")
number <- c(3,4,6,7)
data.frame(from,to,number)
如何计算两个相同的"from- to“关系(从A到D)的个数?结果应该看起来像我的“结果”数据帧。
#result
from <- c("A","
我正在运行一个循环,根据条件检索R中列的模式。一旦计算了模式,我想将其附加到一个矩阵(或数据帧)中,并附上附加条件的名称。
然而,在我的尝试中,它将' label‘一词指定为由此产生的模式,即label = 9。我如何纠正这种情况,使它不再说,例如,标签= 9,它说的是“blue”= 9,在这种情况下,“blue”是标签的名称?
clusters <- NULL
# Loop over each genre label, return mode for each
for (label in unique(music$label)) {
mode <- getmode(m
总的来说,我对R和编程/脚本非常陌生(因此也是如此)。所以请原谅我,如果这个问题不是完美的风格。我可能也缺少一些更高级的R-人的“词汇”:)
我想要做的是,从数据帧中共享公共标识符的数据帧中的所有其他数据中减去数据帧中一行中的值。我在R中找到了内置的Theoph数据集,用它我可以进一步解释我想要做什么(这对这个特定的数据集没有任何生物学意义,但是比发布我的实际数据更容易)。
我想从所有其他conc值中减去属于时间0.00的conc值。每个科目都应该这样做。我第一次尝试的方法是只提取其中一个被试的数据。这使用了下面的代码:
# using a part (only one subject) of
新手R问题:
假设我有一个包含3列的数据帧: id、date和value。
对于每个id,如果它们具有不同的值,但仅当日期不同,我该如何捕获它们。
例如(如下所示),id 1在这里可能是未命中的(值不同,但日期相同),但id 2可能是成功的(不同日期的值不同)。Id 3可能会丢失,因为它们的值并没有不同。
id date value
1 1/1/2000 A
1 1/1/2000 B
2 1/1/2000 A
2 1/1/1999 B
3 1/1/2000 A
3 1/1/1999
在R中,我有一个数据帧: df <- read_delim("Visit_ID | Visit_Count | Cluster
A | 2 | orange
A | 2 | green
B | 2 | green
B | 2 | green
C | 3 | orange
C | 3 | orange
C | 3 | green
D | 3 | orange
D | 3 | green
D | 3 | orange", delim = "|", trim_ws = TRUE)
我想知道在R数据帧中for循环是如何工作的。这不是一个可重复的例子,但我想知道这个概念是否可行。如果df有一个日期、ID、数量和4个变量,我可以循环这些列吗?我需要从Var1列中删除NA行到Var4中,根据Amount列创建一个“权重向量”,然后计算加权平均值。
a<- names(df)
a<- a[4:7]
a
[1] "Var1" "Var2" "Var3" "Var4"
#df has Date, ID, Amount ,Var1, Var2, Var3, Var4
for(i in a) {
N
假设我有一个数据帧
x y val
A B 5
A C 3
B A 7
B C 9
C A 1
如您所见,x和y有两个匹配对
配对1:A B 5和B A 7
配对2:A C 3和C A 1
我想将它们合并到A B 12和A C 4中,并保留B C 9,因为它没有对(C B)。
最终的数据帧应如下所示:
x y val
A B 12
A C 4
B C 9
我如何在R中实现这一点?
如何过滤R中的以下数据帧:
NR <- c("AW1","AW1","AW2","AW3","AW3","AW4","AW4")
TYPE <- c("KA","MA","KA2","KA","KA","MA","KA")
df <- data.frame(NR,TYPE)
所以我接收并创建了一个新的数据帧:
NR TYPE
AW1 KA
A
我有一些代码:
test<-therapyDF %>% group_by(therapyDF$prodcode) %>% summarize(count=n_distinct(therapyDF$patid))
这是为了对所有prodcode条目(药物)进行分组,然后计算有多少患者(patid)拥有每种药物的一个实例。例如,原始数据保存在类似于以下内容的数据帧中:
patid prodcode
1 A
1 B
2 C
3 A
3 A
3 B
因此,输出将是:
A 2
B 2
C 1
有没有办法将这段代码
我是一个R newby,想知道人们是否可以给我一点建议,关于我如何处理我拥有的一些数据。
我有一个数据框,其中包含观察到基因变化的样本列表(示例如下)
Dataframe1:
Sample Gene Alteration
1 A -1
1 B -1
1 C -1
1 D 1
2 B 1
2 E -1 ...
我还有一个数据框,其中包含我感兴趣的基因列表(示例如下)
Dataframe2:
Gene
B
D
E
我想计算dataframe2中每个基因有多少个-1改变的样
我有从一项调查中收集的数据。csv文件如下所示。
1c x x 1e x x 2c x x 2e x x
D x x D x x R x x R x x
R x x R x x D x x D x x
D x x D x x R x x R x x
R x x R x x R x x R x x
等等,等等。
X表示此分析中未使用的其他数据。
来自1c和1e (或任何成对的列)的响应应该相同。这是作为一种操作检查来测试参与者是否注意到了。我想要计算“D”的数量和“R”的数量,但是如果成对的列不匹配,它们就不会被计数。
现在我正在做这样的事情:
我将用Python清理一个4*4数据帧中的数据,其中包含元素'a‘和'?’。在里面。我想要替换“?”通过NA。
在R中,我写道:
for (i in 1:4){
DATA[DATA[,i]=='?',i]=NA}
当我尝试用Python编写代码时:
for i in range(3):
DATA[DATA.iloc[:,i]=='?'].iloc[:,i]=np.nan
当我使用Python时,我不能改变任何东西。我应该如何编写命令?谢谢。
我在R中有一个数据帧x ID Name Code
1 John aa1
1 Sue aa2
1 Mike aa2
1 Karl aa3
1 Lucy aa1 我想在此数据帧中添加一个额外的列,用于计算每个Code值出现的次数: ID Name Code Code_frequency
1 John aa1 1
1 Sue aa2 2
1 Mike aa2 2
1 Karl aa3 1
1 Lucy aa4 1 我尝试过使用mutate和count的各种组合,但收到的错误消息表明我使用了错误的数据类型:no applicable method for '
我想在R中编写一个for循环来替换数据帧中某一列的NA值,并在两个条件为真时将它们替换为同一列的值的平均值。当条件满足时,我想使用来自同一年和同一组的观察结果将平均值分配给NAs。我写了以下代码,但我正在努力编写条件。 missing <- which(is.na(df$price))
for (i in 1:36){
x <- df[missing,]group
y <- df[missing,]year
selection <- df[conditions??,]$price
df[missing,]$price <- mean(selection,