这本身并不是一个特定于语法/编码的问题,但我在网上找不到任何真正有意义的文章来直接谈论它。当我开始使用Sql Server Analysis Services (2008R2)深入研究数据挖掘时,我想知道我是应该采用关系数据方法(因为我的数据目前已经存在),还是应该从OLAP模型开始。我正在研究5000个符号的每日股票市场数据。这意味着大约有12个表,每个表都有几百万行。根据我目前的基本理解,OLAP似乎增加了一层额外的复杂性,我认为这是不合理的。有什么想法吗?
从惯例开始-“请原谅,因为这是我的第一篇文章,我是一个相对的初学者”免责声明,我有以下问题…
我为一家非营利性的竞选组织工作,我已经建立了一个SSAS解决方案来衡量一组活动家(客户)采取的竞选行动(例如,给总理发电子邮件)。主要的事实表有行动的计数作为其衡量标准,并且可以按时间和地理进行切片……
..。但我也想有另一个事实表,可以显示有多少活动家在哪个邮寄部分计数……但是怎么做呢?这是可能的吗,或者我必须沿着每天有人在片段中加载一个事实的路线走下去吗?
非常感谢任何可以在结构上为我指明正确方向的人(广义的方法是错误的吗?)或者在SSAS中实际执行的实用性更好。
AJ
抱歉,我刚开始向基林倾斜
当我在kylin的默认示例多维数据集中执行sql select * from kylin_sales where price > 2时,它与消息一起失败。
ERROR while executing SQL "select * from kylin_sales where price > 2 LIMIT 50000": Can't find any realization. Please confirm with providers SQL digest: fact table DEFAULT.KYLIN_SALES,group b
我必须建立一个基于日期范围记录的多维数据集,并且不确定最好的处理方式。
想象一下,假设有一个汽车和保修期的立方体。每辆车都有一个开始日期和保修期结束。然后可能会有延长的保修期。所以想象一下
CAR REG TYPE WARRANTY START WARRANTY END
CAR A PURCHASE 01/01/2016 31/01/2016
CAR A EXTENDED 01/01/2017 30/06/2017
CAR A EXTENDED 01/08/2017 30/01/20
我正在和我的一个同事讨论。我们在工作中使用Linq to Sql,而我是个新手,所以我问他为什么我们不使用Linq to Entities?他做了一些争论,其中之一是“因为Linq to Entities比linq to Sql慢”。我对此有点怀疑,我确实知道Linq to Entities更复杂,而且有额外的功能,但我不明白为什么它会更慢。
Linq to Entities是否更慢?对这样的论点有什么好的回应呢?
我正在尝试从我的数据中创建一个报告,它用源/媒体/活动映射用户ids。
所以,想一想你在用户资源管理器中找到的表格,除了列: User id\ source source_ medium _medium运动之外。
这显然是不可用的,我也无法通过谷歌搜索找到任何有用的东西。我所发现的与用户id或竞选有关的东西,从来没有同时进行过:/
理想情况下,结果表是可导出的。会很感激你的帮助!
关于设计星型模式:我在事实表fact_table (insert_date, trade_date, close_date ...)中有三个日期列。我不知道应该创建多少个日期维度?
📷
案例1: Dim A。它的意思是:一行@fact_table有三个FKs到A。
案例2: Dim A(用于insert_date)、Dim B (trade_date)、Dim C (close_date)。它的意思是:一行@fact_table有一个FK到A,一个FK到B,一个FK到C。
问:应该创建多少个日期维度?