我有用函数lapply列出的数据
例如:
library(data.table)
# example data
data <- data.frame(D = rep(c("111"), 8),
I = c(rep("2012", 5), "2014", "2013", "2013"),
S = rep(c("1000", "2000"), 4))
list=lapply(X=colnames(da
我有一个包含两个列的data.frame : Name和Index以及200万行。
我确信所有索引都写得正确,但我需要验证'Name‘列。
如何根据索引值更改所有名称值。
让我举一个例子。假设我们有以下data.frame 'db':
db
Index Name
1 Carlos
2 John
3 Bill
4 Mary
1 Cerlas
如图所示,对于每个索引值,“Name”应该相等,但是有人写错了。
我该怎么纠正呢?是否有使用“dplyr”或“tidyr”的解决方案?
我尝试了下面的代码,但它没有工作。
for (i
我将列名放在列表中,然后要从数据帧中选择这些列。我使用以下代码
features <- list(c("Weeks"), c("Weeks","Age"))
X = train_linear[,as.character(features[1])] # working fine
X = train_linear[,as.character(features[2])]
最后一行是给出以下错误。
Error in `[.data.frame`(train_linear, , as.character(features[2])): undefin
我有一个数据帧(D)和一个数据帧(L)列表,我想将它们组合成一个新的数据框架。对于L中的每个数据帧,D中有一行,我希望将这些数据连接在一起,以便D中的每一行与L中的相应数据帧匹配,并在每一行中复制。L中的数据帧有不同的行号,但它们都有相同的列,可以很容易地组合成单个数据帧(例如,使用plyr::rbind.fill)。D和L中的数据帧之间没有共同的变量--我唯一知道哪些行在一起的方法就是它们在D和L中的出现顺序。
下面是与我的数据具有相同结构的玩具数据:
# the data frame
D <- data.frame(name = c("john","sally
我在读TwitteR包的。对于searchTwitter,它表示R返回A list of status objects。status-class文档列出了几个字段和方法。
但是如下所示,class(x)返回list,为什么?它不应该返回一个状态对象吗?还有最后两个命令不起作用,为什么?
文档上说
toDataFrame: Converts this into a one row data.frame, with each field
representing a column.
This can also be accomplished by the S4 style as.data.fra
嗨,我想把列表的对象写到不同的csv文件中,我如何做到这一点,就像我希望dataFrame "a“的元素被写入不同的csv文件,dataFrame的元素"b”被写入不同的csv文件等等。任何帮助都将不胜感激,这就是我所尝试过的。
a = data.frame(1:5)
b = data.frame(c(11,22,33,44,55))
d = data.frame(c("aa","bb","cc","dd","ee"))
e = data.frame(c(TRUE,FALSE,TRUE,TRUE,F
为了从输入句子中创建所有可能的字符串组合,我编写了下面的代码行。
library(stringr)
text = c('I like you', 'I love you so much', 'she like it so much', 'she hate you', 'he hate you so much','I like him')
tex = data.frame(text)
library(splitstackshape)
pattern = data.frame(cSplit(tex,
怎么可能有这样的数据文件:
df_words <- data.frame(words = c("4 Google", "5Amazon", "4sec"))
在下面的dataframe行中替换:
df <- data.frame(id = c(1,2,4), text = "Increase for 4 Google", "There is a slight decrease for 5Amazon", "I will need 4sec more"), stringAsFactor
我试图使用lapply (并希望使用lapply的解决方案)重命名位于列表中的data.frame的列,但它返回的是名称,而不是重命名的data.frames:
# define list
li <- list(u_n = data.frame(x = 1:3), r_l = data.frame(y = 4:6))
# trying to rename columns after the element of the list they're located in
li_2 <- lapply(1:length(li),
function
我有一个如下所示的data.frame (DF):
Col_names1 Col_values1 Col_names2 Col_values2 a 98 f 1 b 12 h 0.8 d 0 mn 0 e0.12p0..。………………
我必须在每个Col_names列中逐行列出Col_names的频率。要做到这一点,首先我只提取名称,以具有以下new_DF
Col_names1 Col_names2 a f b h d mn e p.……
然后,我使用apply函数逐行地表名称的频率:
apl = apply(new_DF, 1, table)
问题是它给了我名字的频率,即使当(