开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

分组的dplyr::mutate错误地返回lubridate间隔的向量

是由于在dplyr中使用mutate函数时，对于lubridate包中的间隔类型（interval）的处理存在一些问题。具体来说，当使用mutate函数对数据进行分组操作时，如果对lubridate包中的间隔类型进行计算，会错误地返回一个向量，而不是按照分组进行计算。

解决这个问题的方法是使用dplyr的group_by函数对数据进行分组，然后使用do函数结合lubridate包中的相关函数进行计算。具体步骤如下：

使用group_by函数对数据进行分组，指定分组的变量。
使用do函数结合lubridate包中的相关函数对分组后的数据进行计算。
在do函数中，使用lubridate包中的函数对分组后的数据进行处理，得到想要的结果。
最后使用ungroup函数取消分组。

下面是一个示例代码：

library(dplyr)
library(lubridate)

# 假设有一个数据框df，包含两个变量group和interval
df <- data.frame(
  group = c("A", "A", "B", "B"),
  interval = interval(ymd_hms("2022-01-01 00:00:00"), ymd_hms("2022-01-01 01:00:00"))
)

# 使用dplyr进行分组计算
result <- df %>%
  group_by(group) %>%
  do(interval_sum = sum(.$interval)) %>%
  ungroup()

# 输出结果
print(result)

在这个示例中，我们首先使用group_by函数对数据框df按照group变量进行分组。然后使用do函数结合lubridate包中的sum函数对每个分组中的interval进行求和计算。最后使用ungroup函数取消分组，得到最终的结果。

这样，我们就可以正确地对分组的dplyr::mutate错误地返回lubridate间隔的向量进行处理，并得到正确的结果。

相关搜索:使用dplyr mutate根据列名的向量创建新列 dplyr、group by和mutate错误的结果大小 dplyr版本>= 0.7的mutate_at出现"Variable context not set“错误 Custom函数为dplyr的mutate中的所有行返回相同的值如何更简洁地初始化和返回向量的向量？R Dplyr:如何有条件地替换匹配列表中的项的向量中的项在dplyr中使用时，客户定义的函数返回错误 Postgres函数返回没有目的地的错误如何使用dplyr mutate通过将一列输入到返回列表的函数中来创建新列？如何更改将dplyr mutate_all等输出转换为抛出错误的data.table的包装器函数在Var中嵌入向量返回错误的心理函数describe()分组spark数据帧上的最大聚合返回错误的值如何修复变换透视函数错误地返回错误方向的图像 MongoDB C#驱动程序- CountDocuments错误地返回错误的值在向量中查找匹配的枚举，并在Rust中返回错误根据另一列的行值有条件地返回某些行值的向量 pandas分组数据帧的最大值返回空白断言错误按HTTP状态分组时未返回任何数据的错误率 Ruby Time.parse错误地返回字符串的时间戳没有TimeStamp值的JS Date对象错误地返回一天

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

数据处理第2节：将列转换为正确的形状

博客原文：https://suzan.rbind.io/2018/01/dplyr-tutorial-1/ 作者：Suzan Baert 这是一系列dplyr函数中的第二篇文章。...转换列：基础部分您可以使用mutate（）函数创建新列。 mutate中的选项几乎是无穷无尽的：你可以对普通向量做任何事情，可以在mutate（）函数内完成。...想象一下，我们有一个包含两个大值的数据库，我们假设它们是拼写错误或测量错误，我们想要排除它们。下面的代码将使任何brainwt值超过4并返回NA。在这种情况下，代码不会因4以下的任何内容而改变。...就像第1部分中的select（）函数一样，mutate（）有变种： *mutate_all（）将根据您的进一步说明改变所有列 *mutate_if（）首先需要一个返回布尔值的函数来选择列。...，可以使用dplyr中的连接函数。

8.1K3 0

数据处理的R包

plyr具体函数如下表所示：函数名输入值类型输出值类型 aaply 数组/向量/矩阵数组/向量/矩阵 adply 数组/向量/矩阵数据框 aply 数组/向量/矩阵列表 a_ply 数组/向量...(col_name)，就是把进行分组的变量名包含在.()中； fun：应用到每行的函数 > df select(df ,starts_with("s")) sex 1 M 2 M 3 F 4 F > # mutate()函数在数据集新增列，但不对原数据作更改 > mutate...Lubridate包可以减少在R中操作时间变量，内置函数提供了很好的解析日期与时间的便利方法。lubridate 包是 Hadley Wickham开发的用于高效处理时间数据的 R 包。...（1）日期函数 > library(lubridate) > time <- now() #返回系统的日期时间 > time [1] "2020-01-23 12:29:24 CST" > year(

4.7K2 0

Google Earth Engine——使用 R、dplyr 和 ggplot 可视化科罗拉多州丹佛市的每小时交通犯罪数据

library(dplyr) library(ggplot2) library(lubridate) 然后，我们需要下载包含原始数据的逗号分隔值文件。...下面的代码使用该dplyr包对数据进行子集化以仅包括交通事故犯罪 ( filter(...))...，使用mutate()函数为这些变量创建新列。...= hour(datetime), dow = wday(datetime), yday = yday(datetime)) 最后，我们将按小时和星期几对数据进行分组...此工作流用于dplyr处理我们的数据，然后将结果通过管道传输到ggplot2，以便我们在全局环境中仅创建一个对象p，即我们的绘图。

971 0

R语言·如何实现分组&有序累计求和

Alt+- 管道符号“%>% ” Ctrl+Shift+m 多行注释，例如：# library(tidyverse)# getwd()# setwd("C:/Users/Desktop") 选中需要注释的行...问题：依据group分组，按照dat（日期）升序对num列数据累计求和并生成cum_num列 ? ? 实现过程 ?...# 生成演示数据集 set.seed(1) da <- sample(1:12,12,replace = FALSE) dat <- lubridate::as_date(da) group <- rep...(letters[1:3],each=4) num <- 1:12 dft <- tibble::tibble(dat,group,num) # 演示数据集 library(dplyr) dft_c...% group_by(group) %>% arrange(group,dat) %>% mutate(cum_num = cumsum(num)) %>% ungroup

3.7K2 0

DAY6-学习R包

") 加载 library和require 使用一个R包需先安装再加载 library(dplyr）dplyr五个基础函数mutate(),新增列——mutate(test, new = Sepal.Length...)选择字符向量中的列，select中不能直接使用字符向量筛选，需要使用one_of函数vars % —— 相当于将左边的作为右边函数的第一个参数，快捷键: ctrl+shift+M（不管用——改为Ctrl＋a） test %>% group_by(Species...y表匹配的x表所有记录semi_join——semi_join(x = test1, y = test2, by = 'x')反连接：返回无法与y表匹配的x表的所记录anti_join——anti_join

2313 0

全网最全的R语言基础图形合集

对应两个坐标分别是统计样本以及该样本对应的某个属性如频率等度量。...，如下图表现得是数据差异性的具象化实例。...，展示的是样本间相关系数大小的热图。...element_text(size = 9, color = "black", face = "bold"), panel.grid = element_blank())韦恩图韦恩图是一种展示不同分组之间集合重叠区域的可视化图...), axis.title = element_text(size = 16), axis.text = element_text(size = 14))饼图饼图是用于刻画分组间如频率等属性的相对关系图

691 0

「R」dplyr 行式计算

It doesn’t have to be you. — Jenny Bryan❞ 载入包 library(dplyr, warn.conflicts = FALSE) 创建行式操作需要一个特殊的分组类型...按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单，当它与 rowwise() 结合时，它也可以简便地操作汇总一行多列。...mutate() 将列切分然后传入 length(y) 的时候，分组 mutate 使用 [ 操作，而行式 mutate 使用 [[。...rowwise()不仅适用于返回长度为1的向量的函数（又名总结函数）；如果结果是列表，它可以与任何函数一起工作。...，而mutate()表达式必须返回长度为1的值。

6.2K2 0

数据处理|R-dplyr

dplyr包实现数据的清洗处理，包括数据整合、关联、排序、筛选、汇总、分组等。...mutate(iris,sepal = Sepal.Length + Sepal.Width) transmute()函数在扩展新变量的时候，会删除所有原始变量。...计算一个或多个新列并删除原列 6）数据汇总 summarize()函数实现数据集聚合操作，将多个值汇总成一个值 summarise(iris,avg = mean(Sepal.Length)) 利用概述函数概括数据，输入数值向量而返回单一数值...： first 向量的第一个值。...last 向量的最后一个值。 IQR 向量的IQR（四分位距）。

2K1 0

R语言数据集合并、数据增减、不等长合并

数据选取与简单操作： which 返回一个向量中指定元素的索引 which.max 返回最大元素的索引 which.min 返回最小元素的索引 sample 随机在向量中抽取元素 subset 根据条件选取元素...id R M 1 1 9 7 2 2 7 2 其中，all=T代表全连接，all.x=T代表左联结；all.y=T代表右连接 2、dplyr包 dplyr包的数据合并，一般用left_join...3、paste函数生成一长串字符向量。 paste(c("X","Y"),1:10,sep="") #"X”,"Y"是长度为2的字符向量,1:10 长度为10的向量。...命令是让这两个向量粘合在一起生成新的字符串向量，粘合后的新字符之间没有间隔。...（RODBC、sqldf包）二、数据增减 x=x[,-1] #这个就代表，删除了x数据集中第一列数据或用dplyr包中的mutate函数 a=mutate(Hdma_dat,dou=2*survived

13.4K1 2

从头学R语言——DAY 3

包dplyr作为tidyverse中的核心包之一，主要用于数据转换。...此处先掌握dplyr的5个基本函数：mutate()，select()，filter()，arrange()，summaries()；1个重要的管道工具%>%#用dplyr包进行数据转换#5个核心函数test...<- iris[c(1:2,51:52,101:102),]#mutate()，新增列mutate(test, new = Sepal.Length * Sepal.Width)#select(),提取列...# 先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(test, Species),mean(...y表匹配的x表所有记录semi_join(x = test1, y = test2, by = 'x')#反连接，返回不能与y表匹配的x表所有记录anti_join(x = test1, y = test2

841 0

R 数据整理（六：根据分类新增列的种种方法 1.0）

library(dplyr) test <- iris[c(1:2,51:52,101:102),] rownames(test) =NULL 必备dplyr技巧 mutate 新增一列。...按列号 select(test,1) select(test,c(1,5)) 按列名如果想要用向量来存放希望筛选的列名，需要使用函数 one_of 来存放该向量。...，并返回不同信息及它们重复的次数。...而dplyr 也提供了更为全面的表格连接的函数—— join 系列。...semi_join(x = test1, y = test2, by = 'name') 反连接与半连接相反，返回的是x中所有的在y中不存在的记录。

2.1K2 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

2.8 mutate 可以为数据框计算新变量，返回含有新变量以及原变量的新数据框： mutate(test, new = Sepal.Length * Sepal.Width) > head(test,...按列号 select(test,1) select(test,c(1,5)) 按列名如果想要用向量来存放希望筛选的列名，需要使用函数 one_of 来存放该向量。...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...比如，需要对 cancer 数据集中 v0 和 v1 两个变量同时计算平均值和标准差: 显然，如果有许多变量要计算不止一个统计量，就需要人为地将每一个变量的每一个统计量单独命名。...Type 分组。

10.9K3 0

生信入门马拉松之R语言基础-脚本项目管理、条件循环、表达矩阵和一丢丢数据挖掘(Day 7)

数据框函数- 排序arrange()和desc参数、distinct()去重复、mutate()数据框新增列注意⚠️没有赋值就没有改变管道符号%>%-实现连续的步骤非常易读彩虹代码展现嵌套函数的逻辑。...yes：逻辑值T时返回的值no，逻辑值F时返回的值ifelse函数和str_detect()函数连用，王炸炸炸！！！..., b = rnorm(16), c = seq(1,3,0.1))slpply(x,length)#返回结果是个列表，用sapply(x,length)代码会返回一个向量...# 表达矩阵set.seed(10086)#使rnorm返回的可重复需要加上的代码。...7.5.3 箱线图的应用单个基因在两组之间表达量的差异可视化。分组信息：是一个有重复值的离散型的向量，分组向量的元素和表达矩阵的列是一一对应的。

1760 0

教你几招R语言中的聚合操作

variable3作聚合统计； data：指定需要分组统计的数据框或列表； subset：通过可选的向量指定data的数据子集用于分组聚合； na.action：指定缺失值的处理办法，默认为删除缺失值；...尽管它们都完成了聚合统计，但是第二种形式的返回结果更加的人性化，因为第二种用法所返回的数据框变量名称为Order_Date和Pay_Amt。...基于sqldf函数的聚合 ---- 尽管aggregate函数可以非常方便地实现数据的分组聚合，但是它存在两方面的缺点，一个是无法直接对数据集中的单个数值型变量使用不同的聚合函数（除法FUN为自定义函数...尽管sqldf函数可以借助于SQL语法实现数据的聚合，但是使用该函数时容易产生异常错误，例如参数drv的值指定错误，就会导致sqldf函数无法生成结果（根据经验，参数drv的值设置为’SQLite’时，...基于group_by和summarize函数的聚合 ---- 结合dplyr包中的group_by函数和summarize函数实现数据的分组聚合可以避开aggregate函数和sqldf函数的一些缺点，

3.3K2 0

Day6——R包

mutate()#新增列mutate(test, new = Sepal.Length * Sepal.Width)#新增一列数据为Sepal.Length与Sepal.Width的积select()#...索引范围可以是一个连续的整数向量，也可以是一个布尔向量。...setosa","versicolor的行#%in%判断前面一个向量内的元素是否在后面一个向量中，返回布尔值。...')#保留test1和test2 中的所有观测半连接semi_joinsemi_join(x = test1, y = test2, by = 'x')#返回能够与y表匹配的x表所有记录反连接anti_joinanti_join...(x = test2, y = test1, by = 'x')#返回无法与y表匹配的x表的所记录简单合并bind_rows()函数需要两个表格列数相同，而bind_cols()函数则需要两个数据框有相同的行数示例数据

1571 0

R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析

这篇文章只是提供了比较这两种语言的机会。本文中的数据每天都会更新，我的文件版本更大，为4.63 GB。 ---- CSV文件包含纽约市的311条投诉。...关于dplyr 默认情况下，dplyr查询只会从数据库中提取前10行。.../users/ryankelly/data.db')db 数据处理的两个最佳选择（除了R之外）是：数据表 dplyr 预览数据 # Wrapped in a function for display...BROOKLYN 02 Noise - Street/Sidewalk 2015-11-04 02:10:45 NEW YORK 02 汇总时间序列首先，创建一个时间戳记四舍五入到前15分钟间隔的新列...# Using lubridate::new_period()# dt[, interval := CreatedDate - new_period(900, 'seconds')][, .

1.2K0 0

《高效R语言编程》6--高效数据木匠

通常的数据清理是将非标准文本字符串转换成lubridate简介所描述的数据格式。vignette("lubridate") ? 整洁是个广泛的概念，也包括重构数据，以便有利于数据分析和建模。...使用broom::tidy()广泛应用于模型数据，并以标准数据框格式返回模型输出。使用变量名非标准化求值更高效，见R语言 dplyr传递参数_自由平等~忠诚奉献-CSDN博客[2]。...unlist()函数的作用，就是将list结构的数据，变成非list的数据，即将list数据变成字符串向量或者数字向量的形式。...summarize是一个多面手，用于返回自定义范围的汇总统计值。...数据库与dplyr 必须使用src_*()函数创建一个数据源。#　使用data.table()处理数据是dplyr的替代，两个哪个好存在争议，最好学一个一直坚持下去。

1.9K2 0

R数据科学|3.5内容介绍及习题解答

最重要的一点是，这种函数必须是向量化的；它必须接受一个向量作为输入，并返回一个向量作为输出，而且输入向量与输出向量具有同样数目的分量。...= 0)) > [1] 327150 结果是，有许多航班的air_time != arr_time - dep_time。除了数据错误，我可以想到两个原因。...在这种情况下，时间的差异应该是24小时(1,440分钟)。有些航班跨越时区，总飞行时间将以小时(60的倍数)为间隔。所有航班都是从纽约起飞的，都是美国国内航班。...，R会将较短向量的值，生成与较长向量相同长度的向量。...该代码还发出一个警告，即较短的向量不是较长向量的倍数。当发生这种情况时，会发出警告，因为这通常是无意的，可能是错误。

2.6K5 0

从零开始的异世界生信学习 R语言部分 06 R应用专题

数据新增列 # mutate，数据框新增一列，新增一列是两列数值的乘积 mutate(test, new = Sepal.Length * Sepal.Width) 图片图片 select和filter...可以用来进行分组，通过str_detect函数识别数据中的关键词，然后进行分组 samples = c("tumor1","tumor2","tumor3","normal1","normal2","...(group = rep(c("control","treat"),each = 3)) ##给数据添加一列分组列 ##最终生成作图过程中间的转换的数据框dat 图片 pdat = dat%>%...test <- list(x = 36:33,y = 32:35,z = 30:27);test #返回值是列表，对列表中的每个元素（向量）求均值(试试方差var,分位数quantile) lapply...lapply(test,fivenum) lapply(test, var) lapply(test, sd) lapply(test, quantile) 图片 ### 3.sapply 简化结果，返回矩阵或向量

2.5K3 0

Day6 呦呦鹿鸣—学习R包

)以dplyr包为例官方包的文档dplyr示例数据test <- iris[c(1:2,51:52,101:102),]取R自带的iris数据第1，2，51，52，101，103行?...iris可知其为150×5的列表dplyr五个基础函数1.mutate(),新增列mutate(test, new = Sepal.Length * Sepal.Width)mutate(df, z =...,每列数值的类型必须相同；以"by"的列为标准，补齐列表，空值为"NA"4.半连接：返回能够与y表匹配的x表所有记录semi_join交集表中test1部分的列semi_join(x = test1,...y = test2, by = 'x')5.反连接：返回无法与y表匹配的x表的所记录anti_jointest1中去除交叉部分的列表anti_join(x = test2, y = test1, by...，如有错误内容，欢迎评论区指正

1661 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭