R-如何使用整数索引来子集数据帧的行？

使用整数索引来子集数据帧的行可以通过以下方式实现：

使用iloc方法：iloc方法允许使用整数索引来访问数据帧的行。它接受两个参数，第一个参数表示行的位置，第二个参数表示列的位置（可选）。例如，要获取数据帧df的第3行，可以使用df.iloc[2]。
使用切片操作：切片操作也可以用于子集数据帧的行。可以使用[start:end]的形式来指定要获取的行的范围。例如，要获取数据帧df的第2到第5行，可以使用df[1:5]。
使用布尔索引：布尔索引允许根据条件来选择数据帧的行。可以使用布尔表达式来创建一个布尔索引，然后将其应用于数据帧。例如，要获取数据帧df中满足条件的行，可以使用df[df['column'] > value]，其中'column'是要比较的列名，value是要比较的值。
使用query方法：query方法允许使用类似SQL的语法来查询数据帧。可以使用整数索引来子集数据帧的行。例如，要获取数据帧df的第3行，可以使用df.query('index == 2')。

这些方法可以根据具体的需求选择使用。在实际应用中，可以根据数据的结构和要求来选择最合适的方法来子集数据帧的行。

腾讯云相关产品和产品介绍链接地址：

腾讯云数据库（TencentDB）：https://cloud.tencent.com/product/cdb
腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云移动开发（Mobile）：https://cloud.tencent.com/product/mobile
腾讯云区块链（Blockchain）：https://cloud.tencent.com/product/baas
腾讯云元宇宙（Metaverse）：https://cloud.tencent.com/product/metaverse

请注意，以上链接仅供参考，具体产品选择应根据实际需求和情况进行评估。

选择矩阵/数据帧的第n列和第m行，其中n和m基于另一个向量

我一直在摸索这一点，还没有完全破解它--任何帮助都将不胜感激。假设我有一个数据帧，如下所示 data = data.frame((matrix(1:40, ncol = 10))) X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 1 1 5 9 13 17 21 25 29 33 37 2 2 6 10 14 18 22 26 30 34 38 3 3 7 11 15 19 23 27 31 35 39 4 4 8 12 16 20 24 28 32 36 40 现在，对于我的新数据集的行1，我只想要来自数据的行2和列4:6的

浏览 5提问于2014-09-26得票数 1

3回答

在数据帧中获取部分行？

我有个数据框。我想选择第3行(id 3)的第3-6列(variable2 - variable5)，并将其设置为自己的数据帧。举个我的例子。 rowId variable1 variable2 variable3 variable4 variable5 1 x x2 x3 x4 x5 2 x x2 x3 x4 x5 3 x x2 x3 x4 x5

浏览 0提问于2017-07-01得票数 0

2回答

pandas、split或divide(减去)数据帧

、、、、

我有一个数据帧"moment_f“。我必须从moment_f中删除一些包含名称"AH“的行。但是，我不会删除每个"AH“行，所以我创建了一个包含要删除的"AH”的新数据帧。 ah1 = moment_f[moment_f["TextGridLabel"] == "AH"] ah_d = ah1.iloc[::2] # got the odd rows of "AH" which is what I need to get rid of from the original dataframe "moment

浏览 0提问于2018-10-16得票数 1

1回答

在R中按列选择元素

我需要使用存储在向量中的行索引来选择数据帧的元素。换句话说，我有一个向量或长度等于数据帧中的列数，该向量包含我需要提取的元素的行号(按顺序，每列一个元素)。我该怎么做呢？示例： vec <- c(1,2,1) df <- data.frame(matrix(1:6, ncol = 3, nrow = 2)) 它看起来像这样： X1 X2 X3 1 1 3 5 2 2 4 6 我需要使用来自vec = 1,2,1的索引来获取元素(1，4，5

浏览 8提问于2020-05-20得票数 1

回答已采纳

1回答

如何显示线段的坡度

、、、

基本上，我有一个数据集，其中我只想找到我绘制的线段的斜率。我看到的每一个答案都只是解释了如何创建一个最佳拟合的一般行，然而这与我的需求无关。我使用的是Python3中的Jupyter Notebook，带有pandas，matplotlib.pyplot，numpy，并且已经从scipy.stats导入了linregress (根据另一篇解释如何计算斜率的帖子的说明)。下面是我使用两个数据帧绘制的图，我将这两个数据帧定义为df和df2。 plt.figure(figsize=(20,10)) line1 = plt.plot(df['Time (s)'],df['O

浏览 0提问于2019-06-06得票数 0

1回答

数据帧和子集数据帧之间的Cosine_similarity

、、、

基本上，我有一个以电影为行的数据帧，一个列“标题”和一个列“汤”。最后一列以字符串的形式包含电影和合作者的概述。我有一个包含电影子集的第二个数据帧。(因此“汤”也是完整DF的一个子集) 现在使用以下代码： from sklearn.feature_extraction.text import CountVectorizer from sklearn.metrics.pairwise import cosine_similarity df_all = spark.createDataFrame( [ ('The terminator', '

浏览 11提问于2020-08-27得票数 1

回答已采纳

1回答

美元符号与for循环

、、、

假设我有一个包含16个变量的数据帧，名为: Amount_day_1，Amount_day_2 ..我想取每种方法的平均值我想要做的是： for (i in 1:16){ !!as.name(paste0("Mean_Amount_Day_", i) <- mean(df$!!as.name(paste0("Amount_Day_", i))) } 但它真的不起作用。事实上，如果变量在for循环中，我真的不知道如何选择带有美元符号的变量？

浏览 0提问于2021-05-25得票数 0

1回答

R数据帧提取非连续列并创建新的子数据帧

、、

我有一个由25列和30,000行组成的数据帧。我想创建子数据帧，它包含所有行，但只包含非连续顺序的某些列。例如，包含列1、12、15和25的子数据帧。我一直在使用lapply，但我不知道如何创建子数据帧，其中的列是非连续顺序的。谢谢。

浏览 0提问于2013-11-04得票数 1

1回答

R:按系数设置数据帧子集

、、

假设我们有以下数据帧 foo k h=1 h=2 h=3 1 3 3 6 9 2 2 2 5 8 3 1 1 4 7 使用 str(check) 'data.frame': 3 obs. of 4 variables: $ k : Factor w/ 3 levels "3","2","1": 1 2 3 $ h=1: int 3 2 1 $ h=2: int 6 5 4 $ h=3: int 9 8 7 如何根据k因子对我的数据帧进行子集？例如，为了只获取k=3的行或

浏览 0提问于2018-03-29得票数 0

1回答

R:如何在不同的列中找到重复值的三元组？

我想知道是否有可能根据行中重复的单词对数据帧进行子集，而与它们位于哪列无关。因此，在这样的数据框中： doc A B C D 1 DOC1 apple coconut berry pear 2 DOC2 prune apple banana berry 3 DOC3 coconut cherry a

浏览 0提问于2020-11-06得票数 1

回答已采纳

1回答

从R中的dataframe中提取具有条件的特定行和所有列

、、

我有一个包含三列(A、月、年)的数据框，我想从其中提取特定的行(例如，包含从第10月和第92年到第4个月和第93年的期间)和所有列。 A<-c(15:34) Month<-c(9,9,10,10,11,12,1,2,2,2,3,3,4,4,5,6,7,8,10,10) Year<-rep(c(92, 93), times = c(6,14)) mydata<- data.frame(A, Month, Year) 我试过了，但不起作用。 newdata<-mydata[mydata$Month==10 & mydata$Year== 92 : mydat

浏览 644提问于2019-09-07得票数 0

回答已采纳

1回答

返回值不匹配

、

我正在比较数据帧中的两列(col1，col2)。我需要逐行(或并排)比较它们，以确定哪些值不匹配。如果它们不匹配，那么我需要返回不匹配的col1值。这对我不起作用，我得到了一个值错误: ValueError:序列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()。我做错什么了？ if df1['col1'] != df1['col2']: print(df1['col1'])

浏览 3提问于2021-06-18得票数 0

1回答

数据帧中等号行组的线性回归

我有一个由2列组成的数据框架:y和x。数据帧的尺寸是10000行和2列。这10000行指的是500个样本，每个样本有20y和20x。如何对每个样本(每组20行)进行线性回归，以便将估计系数存储在单独的500行数据结构中？我知道我可以执行summary(lm(y ~ x))$coefficients[2, 1]来获得数据帧中每一行的估计系数。然而，我的目标是估计每个样本的系数，而不是每一行。

浏览 2提问于2015-04-19得票数 0

回答已采纳

2回答

dplyr: How to slice row1 of group1，row2 of group2，row3 of group3，…groupN的rowN

、、

这个问题的灵感来自于这个问题：如何在尝试保留两列中的非重复值时对R中的数据框进行条件过滤我们如何在后续的组(1,2,3,4...n)中对相应的行(1，2，3，4...n)进行切片。在这个简化的示例中，第一个数据帧应该导致第二个数据帧： library(tidyverse) # tibble df <- tibble( group = c(1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5), value = c(1, 2, 3, 4, 1, 2, 3, 4, 5, 1, 2, 3, 4, 1, 2

浏览 36提问于2021-03-02得票数 1

回答已采纳

1回答

通过考虑两列并忽略顺序来删除重复行

、

我有一个有三列的数据帧。第1列、第2列和第三列是Value。根据值(desc)对数据帧进行排序。在下面的例子中，我想删除第三行，因为A>B已经在那里了，所以我不想考虑B>A。如何删除第三列(这样的实例)。这适用于所有对象，例如，A>C已经存在，因此应该删除C>A。 Column1 Column2 Value A B 10 A C 8 B A 6

浏览 0提问于2017-03-30得票数 1

3回答

R:如何在foreach%dopa%中拆分dataframe

、、、、

这是一个非常简单的例子。 df = c("already ","miss you","haters","she's cool") df = data.frame(df) library(doParallel) cl = makeCluster(4) registerDoParallel(cl) foreach(i = df[1:4,1], .combine = rbind, .packages='tm') %dopar% classification(i) stopCluster(cl) 在实际

浏览 1提问于2016-09-29得票数 4

1回答

打印仅包含最后一个附加值的Pandas DataFrame

、、

我正在使用Python从web上收集数据，并将数据添加到pandas数据框中。我想在每次附加数据帧时，在dos命令提示符上查看更新后的数据帧。这就是我目前正在做的事情： for i in range(0,len(Record_files)): os.system('cls') with pd.option_context('display.max_rows', None, 'display.max_columns', None,'expand_frame_repr', False): print(

浏览 0提问于2018-04-03得票数 0

1回答

使用窗口大小和滑动来划分数据框并将其保存到多个数据框中

我是R语言的新手。我想划分一个具有窗口大小的数据帧，然后slide.and将所有这些数据帧保存为单独的数据帧。例如，我的“数据帧有20行”。然后我想用window size=5和slide=3来划分这些行。所需的输出应为..前5行应该在一个数据帧中，然后第二数据帧应该包含5行，将数据帧的前3行保留为slide =3。这意味着第二数据帧应该包含LAS2行的第一数据帧和剩余的3行数据帧。我的数据框..期望的输出应该是：

浏览 0提问于2017-05-09得票数 1

1回答

在DataFrame的特定行上运行函数

、

我有一个函数，它将dataframe作为其输入之一，该数据帧按日期进行索引。我如何才能只在数据帧的一个子集上运行函数(比如，从2005-2010)？我认为我不能简单地从数据帧中删除其余的行，因为函数的一部分会跟踪滚动平均值，因此前几行将取决于我没有考虑的日期。

浏览 9提问于2020-05-22得票数 1

3回答

通过列id字符的子集从df中提取列

我正在处理一个包含数百个样本的基因表达数据集。数据框中的每个样本都有唯一的列ID (例如:IHC_123的OHC_112 )。我想创建一个只包含包含"OHC“的列的新数据帧。我该怎么做呢？我正在努力制作可行的示例数据帧...但这是我能做的最好的了。数据帧"DF“ OHC_1 OHC_2 OHC_3 IHC_4 IHC_5 OHC_6 Gene1 1 1 0 1 1 0 Gene2 0 0 0 1 1 0 Gene3 1 1 1 0 0 1 Gene4 1 1

浏览 0提问于2017-02-10得票数 0

回答已采纳

1回答

如何根据行名删除r中的行

、

如果我有一个dataframe，并且行名是单词而不是数字，我如何根据它的名称删除特定的行？例如，如果行名为“细菌”，我如何才能只删除名为“细菌”的行呢？

浏览 16提问于2020-03-04得票数 3

回答已采纳

3回答

当我的dates列不是Python中的索引时，如何根据日期对数据框架进行子集？

、、

我有一个具有日期列(不是索引)的大型数据集，其格式为%Y-%m-%d %H:%M:%S。我想要创建这个数据框架的季度子集，即数据框架dfQ1将包含所有日期在第一个月到第四个月之间的行，dfQ2将包含所有日期在第五个月到第八个月之间的行，等等。子集的标头与主数据帧的标头相同。我该怎么做？谢谢!

浏览 3提问于2014-10-13得票数 0

回答已采纳

1回答

R-子集数据帧-检查值是否在范围内

、、

我有以下两个数据帧 d1 <- data.frame(chr = c("chr1","chr2","chr2"), pos = c(11, 15,21), type = c("type1","type2","type1")) > d1 chr pos type 1 chr1 11 type1 2 chr2 15 type2 3 chr2 21 type1 d2 <- data.frame(chr = c("chr1","c

浏览 0提问于2019-07-30得票数 0

2回答

如何按列值在数据帧列表中选择行

我有一个包含四个数据帧的列表(Lfs01)，每个数据帧都有不同数量的列和行。我想通过一列中的值(如果是== 1)过滤所有数据帧中的行。变量在前两个数据帧中称为"a“，在最后两个数据帧中称为"A”。我以前看过类似的问题，但不幸的是，我没有找到解决办法。以下是我尝试过的一些事情： data<-lapply(lfs01, function(x) filter(x ,'a'==1)) data<-lapply(lfs01, function(x) filter(x ,'a'==1|'A' ==1)) 结果:列出4个0行

浏览 3提问于2019-12-01得票数 1

回答已采纳

2回答

如何更改Pandas数据帧中的特定行标签？

、、、、

我有一个数据帧，例如： 0 1 2 3 4 5 0 41.0 22.0 9.0 4.0 2.0 1.0 1 6.0 1.0 2.0 1.0 1.0 1.0 2 4.0 2.0 4.0 1.0 0.0 1.0 3 1.0 2.0 1.0 1.0 1.0 1.0 4 5.0 1.0 0.0 1.0 0.0 1.0 5 11.4 5.6 3.2 1.6 0.8 1.0 其中最后一行包含平均值。我想将最后一行标签重命名为"A"，这样数据帧将如下所示：

浏览 20提问于2017-02-10得票数 14

回答已采纳

2回答

R-只保留列名与字符串匹配的列。

、、

我对R相对来说是个新手，我很幸运地在这里找到了答案，但这一次让我在经历了两天的尝试后陷入了困境。我有一个列名如下的dataframe： TargetID样本1.β样本2.错误样本2.错误样本2.错误样本2.错误样本2.错误样本这重复了数千个样本。我需要为每个数据创建多个单独的数据帧:一个用于beta，一个用于avg，一个用于错误，一个用于pval。我还需要在所有数据帧中保留带有TargetID的第一列。生成的数据帧将有列名，如下所示： TargetID sample1.beta sample2.beta sample3.beta TargetID样本1.样本2.样本3 等。我已经找到了设

浏览 4提问于2016-03-25得票数 1

回答已采纳

2回答

函数在R中的数据帧列表中的应用

、、、

我有一个数据帧列表，每个数据帧都有一个三维向量(3列)的行。我想计算每个数据帧(例如，第1行和第2行、第2行和第3行、第3行、第3行和第4行等)的每一对后续行的余弦相似性(lsa:: cosine )。我如何循环遍历列表中的每个数据帧，以计算后续行的余弦相似性，从而使每个数据帧的余弦值保持分离？以下是一些可复制的容易伪造的数据： df1 = data.frame(y1 = c(1,2,3,4,5), y2 = c(2,3,4,5,6), y3 = c(5,4,3,2,1)) df2 = data.frame(y1 = c(6,7,8,9,10), y2 = c(6,5,4,3,2), y3

浏览 3提问于2022-08-17得票数 2

回答已采纳

1回答

Python Pandas DataFrame数据标识

、、、

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

2回答

R只将数据帧保存在列表中。

、、

我从R开始，所以我不太擅长为我的问题寻找相关的答案。如果有人提出类似的问题，我很抱歉。我有一个由数据帧和列表组成的列表。我想知道如何只保留数据帧，以便将它们绑定在一起以在巨大的数据框架上生成。这里我举一个例子： L1 <- list(c(1, "abc", 3)) L2 <- list(c("b","d")) L3 <- list(L1,L2) brand <- c("A","B","C","D") price <- c(1,1,3,7

浏览 0提问于2018-02-28得票数 0

回答已采纳

1回答

R选择一行加上接下来的5行

在我的数据帧中，我想根据一些逻辑选择一行，然后返回一个包含所选行和下一个'N‘行的数据帧。所以，我有这个：(一个通用的例子) workingRows <- myData[which(myData$Column1 >= myData$Column2 & myData$Column3 <= myData$Column4), ] 它返回给我正确的“起始值”。如何根据每个起始值获得“下一个”5个值？

浏览 0提问于2016-07-17得票数 1

回答已采纳

1回答

何时使用pandas‘loc’进行数据帧切片

、

在pandas中，如果我有一个数据帧，我可以像这样设置它的子集： df[df.col == some_condition] 此外，我还可以： df.loc[df.col == some_condition] 两者之间的区别是什么？“loc”方法似乎更冗长？

浏览 0提问于2021-05-11得票数 0

1回答

使用R中第二列中的匹配值将列值写入文件

我在R中有一个数据帧df，它有几列，其中columnA和columnB在这里很重要： columnA columnB ab1 'This is a string' ts4 'This is another string' pq9 'This is yet another string' 我想将字符串写入一个文件，并在文件名中包含匹配的columnA值。 sapply(df$columnB, function(x){ write.table(x, file = paste(&#

浏览 5提问于2016-08-14得票数 1

回答已采纳

2回答

R-日期格式的行子集

、

我有一个DF，上面有这样的ETF的每日价格： TICKER OPEN HIGH CLOSE 2017-01-01 BOVA11 55.30 55.50 55.20 我的行名被指定为日期(YYMMDD)，我如何使用基本的R命令来子集这个从2017-01-01到2017-01-31行的数据帧？谢谢

浏览 2提问于2017-08-08得票数 0

回答已采纳

1回答

检查列是否全部为空

、、

我有一个列名和一个数据帧。我想检查该列中的所有值是否都为空，如果为空，则从数据帧中删除该列。我所做的是检查具有非空值的列的计数，如果count等于0，则删除该列，但在pyspark中这似乎是一个开销很大的操作

浏览 0提问于2019-08-09得票数 0

1回答

有没有办法在R中的数据帧中只保留重复的行？

我有一个包含91个变量的数据帧。我试图只提取行中每个单个值都与另一个值重复的行。我可以使用unique函数或distinct函数来查看有233行是重复的。我想用这233条记录创建一个数据帧。我看到的关于类似问题的大多数答案都集中在通过某种ID变量查找重复值，但是我的数据中没有这样的变量。我希望将整个行作为一个整体来看待，而不仅仅是其中的一个变量。如何创建只包含那些重复行的数据帧？

浏览 16提问于2021-10-25得票数 1

回答已采纳

1回答

将Pandas数据帧的行映射到numpy数组

、、、

对不起，我知道有这么多关于索引的问题，这可能是我的问题，但我在这方面有点小麻烦。我对.loc、.iloc和.index方法以及切片非常熟悉。.reset_index方法可能没有(也可能不能)在我们的数据帧上被调用，因此索引标签可能不是有序的。dataframe和numpy数组实际上是dataframe的不同长度子集，但对于本例，我将使它们保持相同的大小(一旦有了示例，我就可以处理偏移量)。这是一张我正在寻找的图片：我可以根据一些搜索条件从数据框中拉出多个行。 idxlbls = df.index[df['timestamp'] == dt] stuff = df.lo

浏览 16提问于2018-07-23得票数 1

回答已采纳

3回答

对R中列表中的数据帧进行排序

假设我的数据帧名为df1 to df20。这些数据帧在列表中。列表中数据名气的顺序是"df1“、"df10”、"df11“、"df12"，如何才能使其成为"df1”、"df2“、"df3”、"df4“？

浏览 5提问于2021-02-10得票数 2

回答已采纳

2回答

为fata帧中的特定列中的每个唯一值选择随机行

、

我有一个非常简单的请求，但是，我不能使用一个代码行来处理。我想要的只是子集一个输入数据帧，就像在输出数据帧中，对于一个特定数据帧的列的每个唯一值(因子级别)只有一个随机选择的行。埃克斯。我有(v2是特定数据帧的列) v1 v2 1 A 1 2 B 1 3 C 2 4 A 1 5 B 2 6 B 1 7 B 1 8 C 2 9 D 1 10 E 1 并希望有一个输出数据框架： v1 v2 1 B 1 2 C 2

浏览 1提问于2013-09-04得票数 2

回答已采纳

2回答

从列条目与另一个数据框重叠的数据框中删除行

、、

我有两个具有基因组数据的数据帧，并且我需要删除数据帧1中的所有行，这些行的“feature”列中的条目等于数据帧2的一行中的“feature”列中的条目。 df1 <- data.frame(feature=c("ENSG419","ENSG1617","ENSG1629","ENSG16230"),distance=c(9833,2460,50538,51162),origin=c("e2","e2","e2","e2")) df2 <- data.fr

浏览 2提问于2013-04-04得票数 0

回答已采纳

2回答

R:如何使dataframe中的列不被识别为变量

、、

我在R中有一个5列的数据帧。第一列包含行名，但R将其识别为变量，因此这将在后续步骤中抛出错误。关于如何让R识别这些是行名而不是变量，有什么想法吗？非常感谢大家的帮助！ **我正在做一些基因测序分析，数据框包含临床信息。因此，我更喜欢保持数据帧的完整性，因为行名包含用于跟踪单个样本的标识符。

浏览 40提问于2017-01-26得票数 0

1回答

如何在防火墙中设置非对象的嵌套数据值？

、、

我目前正在制作一个应用程序，存储一年中每一天的数据。我在想，这种格式将类似于： [ 2022: { january: { week1: [ { tasksCompleted: 5, }, ... other weeks ], ... other months }, }, ... other years ] 我不太确定如何将这种格式的数据存储到防火墙中。我完全愿意使用实现这一目标的任何其他结构。我如何才能直接将一天的tasksCompleted属性更新到dataRef.updat

浏览 1提问于2022-07-24得票数 0

回答已采纳

2回答

包含范围列的数据帧。给定数字，选择出现数字的行

、

我有一个数据帧，其中包含一列数字，然后是更多的数据列 [1, 2, 3, ..., 10] | a | b [11, 12, 13, 14, ...] | c | d 给定一个数字，如10，14等，我该如何选择该数字在该范围内的行，即对于10，我希望返回[1, 2, 3, ..., 10] | a | b行。到目前为止，我已经尝试过dfs['A'].ix[10 in dfs['A']['B']]，其中dfs是一个数据帧字典，'A'是一个数据帧，'B'是带有范围的列。我该怎么做呢？

浏览 36提问于2016-07-29得票数 0

回答已采纳

3回答

按多个因子水平子集数据帧

、

如何避免使用循环来基于多个因子级别来子集数据帧？在下面的示例中，我想要的输出是一个数据帧。dataframe应该包含原始dataframe的行，其中"Code“中的值等于"selected”中的一个值。工作示例： #sample data Code<-c("A","B","C","D","C","D","A","A") Value<-c(1, 2, 3, 4, 1, 2, 3, 4) data<-data.frame(cbind(

浏览 0提问于2013-10-21得票数 23

回答已采纳

6回答

在R控制台中编辑或查看数据帧

我可以在控制台中看到整个数据帧。有没有任何可能的方式或任何功能来查看R-控制台中的数据帧(编辑类似于Excel)，以便我应该能够手动编辑数据？

浏览 9提问于2015-12-14得票数 2

回答已采纳

1回答

基于行和列条件跨多个CSV文件计算平均值，并删除NA数据

、、、、

我正在处理300多个csv文件中的数据。每个csv文件中的变量列名都是相同的。我使用rbind和loop将列堆叠到一个空的数据框中。我想计算一列的平均值，但在此之前，我需要(1)根据另一列中的值对数据框进行子集或隔离。示例：考虑名为dfABC( )的以下数据帧 A B C 1 5 7 1 4 6 4 5 8 2 5 7 2 1 7 3 2 3 我需要根据列中的值缩小数据框。假设我想要根据B列缩小数据帧。假设我想返回B= 5的所有行。然后我会得到这个数据帧： A B

浏览 0提问于2015-02-14得票数 1

1回答

过滤R中的数据帧:将GREP与变量名相结合？

我希望根据两个标准过滤数据帧: 1.几个关键变量和2.具有特定模式的其他几个变量。我通常使用以下代码： mydata <- rawData[,c("scenario","period","farmID",grep("planting_*",names(rawData), value = TRUE))] 在我将R更新到新版本(3.5.3)之后，问题就出现了。在此之前，它运行良好，我得到了我想要的:一个新的数据框过滤变量。但是，现在R只返回一个带有变量名的向量(没有观察值)。有人能帮我解决这个问题吗？非常感谢！

浏览 1提问于2019-04-29得票数 0

1回答

如何拆分dataframe -数据文件列表(同时删除分组列)

、

有人问过类似的问题，但我想不出最后一步。如何将大型数据帧拆分为data.frames列表，并删除将行分组为特定数据帧的列？示例： #Load large dataframe data <- mtcars # split into a list based on "cyl" column data_list <- split(data, f=data$cyl, drop = TRUE) 然后，我想从列表中的所有数据文件中删除"cyl“列。如果没有查看列表中的每个数据，是否有办法删除该列？谢谢!

浏览 2提问于2020-06-12得票数 1

回答已采纳

4回答

编辑pandas数据框中的特定单元格？

、、

我正在尝试编写一个函数，使用户能够轻松地选择pandas数据帧中的特定单元格并更改其值。例如，在下面的数据框中，我希望用户能够按日期和操作选择一个单元格，即"2018-03-02“和"Manure"，并将值更改为"1”。我在2018-03-02已经做到了这一点，通过使用这个代码“剪切”(数据帧被命名为q)： q.iat[1,1]=1 但是，我希望能够使用像q.iat["2018-03-02", "Cutting"]=1这样的东西来更改单元格，但不确定如何做到这一点，因为它说.iat只能识别整数位置。除了.iat之外，还有什么我

浏览 0提问于2019-01-14得票数 2

4回答

是否有使用列中的定性需求对数据进行子集的功能？

、

我在为大型数据帧创建子集时遇到了问题。我需要提取与其中一列中两个正确城市之一匹配的所有行，但是我创建的任何子集最终都是空的。给定主要数据帧，我尝试： New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")] 但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

1回答

如何在使用scikit-learn运行k-fold后访问数据集？

、、

我正在尝试应用kfold方法，但我不知道如何访问生成的训练和测试集。在浏览了几个博客和scikitlearn用户指南之后，人们所做的唯一一件事就是打印训练和测试集。这对于较小的数据帧可能有效，但对于较大的数据帧则没有用处。有谁可以帮我？我使用的数据：https://github.com/ageron/handson-ml/tree/master/datasets/housing 我现在所在的位置： X = housing[['total_rooms', 'total_bedrooms']] y = housing['median_house_valu

浏览 7提问于2020-03-29得票数 2

回答已采纳