以下代码给出了2016年3月1日至2017年2月28日期间向在线社区贡献标签的用户。
SELECT userid, COUNT(*) AS tags
FROM tag_events
WHERE tstamp >= ‘2016-03-01’ AND tstamp <= ‘2017-03-01’
GROUP BY userid
ORDER BY tags DESC;
tag_events是表,tstamp是标记的时间戳,userid是用户id,表中的每个条目都包含关于一个标记的信息。
我感兴趣的是那些在此期间第一次投稿至少在最后一次投稿前两个日历日的用户(所以7月1日和3日将被
我有一个下面的数据集,其中我有一个按项目逐月的可用性百分比。我希望能够计算项目的月度平均值以及滚动平均值。我可以成功地创建月度平均值,但对于滚动平均值,Tableau似乎正在取月平均值,并将其求平均,以获得滚动平均值。这是不正确的。
我需要的是Tableau获取前几个月的所有可用性百分比,并基于此计算滚动平均值,而不是取前几个月的平均值。
有什么建议吗?打包的工作簿已加载到dropbox -
Item Availability Percentage Month
A 90% 1/1/2017
A 95% 2/1/2017
B 98% 1/1/2017
B 67% 2/1/
我有一只熊猫的资料栏:
一月、二月、三月、四月
我想用一月减去二月。三月和二月。四月和三月等,然后为这些计算中的每一个创建一个新的列与计算。
我尝试过创建一个for循环,但它没有工作,因为我不确定如何将每个计算存储到一个新列中,以及如何声明2月-前一列等等。
任何帮助都将不胜感激。
Dataframe示例:
Sales January February March April
Team1 1000 2000 3000 4000
Team2 1000 2000 3000 4000
Dataframe结果:
Sales January diff February
简写版:
可以添加/合并StdDevs吗?即
if StdDev(11,14,16,17)=X and StdDev(21,34,43,12)=Y
can we calculate StdDev(11,14,16,17,21,34,43,12) from X & Y
长版本:
我正在设计一个星型模式。模式有一个fact_table (grain=transaction),它存储单个事务response_time。该模式还具有一个aggregate_table (grain=day),它每天存储response_time_sum。
在我的报告中,我需要计算给定时间维度的响应时间的标准
我已经编写了一个程序,它应该使用指数平滑来预测值。我有6个月的数据(从4月到9月)。基于这6个月,我想预测未来6个月(即10月至3月)。
这是我的代码:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from statsmodels.tsa.holtwinters import ExponentialSmoothing
d = {'Month':['April','May','June','July','Aug