我有30个传感器的CO2测量数据,它们不是同时测量的,也不是所有传感器都在完全相同的时间开始测量。我希望将它们尽可能地对齐,所以我认为取10秒的平均值可能是一个很好的解决方案。 在前面的问题中:Group by multiple variables and summarise dplyr,我将每个传感器的时间分成10秒,并平均每个传感器在这10秒内的读数。听起来不错,但是,我已经意识到,下面的代码缩短了每个传感器开始的时间,因此它们仍然没有对齐。我如何对齐它们? require(tidyverse)
require(lubridate)
df %>%
group
我从Oracle数据库获得的数据如下:
check HR Serie Name
14:00:31 13:59:19 6120 A
14:10:31 13:59:21 6120 A
14:00:31 13:57:19 6120 A
14:04:01 14:02:00 6120 B
14:06:01 14:02:14 6120 B
14:04:01 14:04:00 6120 B
14:04:01
我经常需要根据第二个数据集中定义为“事件”的间隔来计算时间序列数据集中许多参数的平均值。
下面的示例代码说明了我目前的方法,它确实工作得很好。
但是,随着我的数据集的增加,我想知道是否有一种更有效的方法(例如在我的PC上运行在30秒内)。
保持在dplyr/tidyverse中是很重要的(data.table的方法很受欢迎,但不会有任何帮助)。
library(tidyverse)
#generate time series data
data <- bind_cols(
data_frame(td=seq(from = as.POSIXct("2010-0
我有一个家庭的col1指数,每个家庭中人的col2指数,每个人的col3出行方式,col4和col5活动的开始和结束时间,我怎么能选择在每个家庭、司机和乘客中有相同的开始时间和结束时间的一行?
示例:
family persons mode start time end time
1 1 driver 3 8:45
1 1 walk 8:45 13:30
1 1 bus
我对R非常陌生,在运行函数来获得我需要的答案时遇到了麻烦。我有一个示例数据PCSTest
它看起来像这样:
Date Site Word
--------------------------------------
9/1/2012 slashdot javascript
9/1/2012 stackexchange R
9/1/2012 reddit R
9/1/2012 slashdot javascript
9/1/2012 stackexchange javascr
我使用以下脚本将任务分发给不同节点上的两个工作人员。
celery_call.py:
from celery_test import add
import time
results = []
for i in range(20):
results.append(add.delay(i))
for result in results:
timeStart = time.time()
resultValue = result.get(timeout=10)
timePassed = time.time() - timeStart
print(timePass
我有一个数据文件,每个参数都不同。我希望对每一行使用不同的参数集来合并行。以下是我的参数数据ZZ:
ZZ<-data.frame(Name =c("A","B","C","D","E","F"),A1=c(19,20,21,23,45,67),A2=c(1,2,3,4,5,6),A3=c(7,8,13,24,88,90),x=c(4,5,6,8,23,16),y=c(-3,-7,-6,-9,3,2))
> ZZ
Name A1 A2 A3 x y
1 A 19 1 7