我有一个数据帧"moment_f“。我必须从moment_f中删除一些包含名称"AH“的行。但是,我不会删除每个"AH“行,所以我创建了一个包含要删除的"AH”的新数据帧。
ah1 = moment_f[moment_f["TextGridLabel"] == "AH"]
ah_d = ah1.iloc[::2]
# got the odd rows of "AH" which is what I need to get rid of from the original dataframe "moment
假设我有一个包含16个变量的数据帧,名为: Amount_day_1,Amount_day_2 ..我想取每种方法的平均值
我想要做的是:
for (i in 1:16){
!!as.name(paste0("Mean_Amount_Day_", i) <-
mean(df$!!as.name(paste0("Amount_Day_", i)))
}
但它真的不起作用。事实上,如果变量在for循环中,我真的不知道如何选择带有美元符号的变量?
我有一个有三列的数据帧。第1列、第2列和第三列是Value。根据值(desc)对数据帧进行排序。在下面的例子中,我想删除第三行,因为A>B已经在那里了,所以我不想考虑B>A。如何删除第三列(这样的实例)。这适用于所有对象,例如,A>C已经存在,因此应该删除C>A。
Column1 Column2 Value
A B 10
A C 8
B A 6
我正在使用Python从web上收集数据,并将数据添加到pandas数据框中。
我想在每次附加数据帧时,在dos命令提示符上查看更新后的数据帧。这就是我目前正在做的事情:
for i in range(0,len(Record_files)):
os.system('cls')
with pd.option_context('display.max_rows', None, 'display.max_columns', None,'expand_frame_repr', False):
print(
我在R中有一个数据帧df,它有几列,其中columnA和columnB在这里很重要:
columnA columnB
ab1 'This is a string'
ts4 'This is another string'
pq9 'This is yet another string'
我想将字符串写入一个文件,并在文件名中包含匹配的columnA值。
sapply(df$columnB, function(x){
write.table(x,
file = paste(
我有一个非常简单的请求,但是,我不能使用一个代码行来处理。
我想要的只是子集一个输入数据帧,就像在输出数据帧中,对于一个特定数据帧的列的每个唯一值(因子级别)只有一个随机选择的行。
埃克斯。我有(v2是特定数据帧的列)
v1 v2
1 A 1
2 B 1
3 C 2
4 A 1
5 B 2
6 B 1
7 B 1
8 C 2
9 D 1
10 E 1
并希望有一个输出数据框架:
v1 v2
1 B 1
2 C 2
有人问过类似的问题,但我想不出最后一步。
如何将大型数据帧拆分为data.frames列表,并删除将行分组为特定数据帧的列?
示例:
#Load large dataframe
data <- mtcars
# split into a list based on "cyl" column
data_list <- split(data, f=data$cyl, drop = TRUE)
然后,我想从列表中的所有数据文件中删除"cyl“列。如果没有查看列表中的每个数据,是否有办法删除该列?
谢谢!
我正在尝试应用kfold方法,但我不知道如何访问生成的训练和测试集。在浏览了几个博客和scikitlearn用户指南之后,人们所做的唯一一件事就是打印训练和测试集。这对于较小的数据帧可能有效,但对于较大的数据帧则没有用处。有谁可以帮我? 我使用的数据:https://github.com/ageron/handson-ml/tree/master/datasets/housing 我现在所在的位置: X = housing[['total_rooms', 'total_bedrooms']]
y = housing['median_house_valu