我有两个关于工作人员的资料来源表:征聘和培训。我需要把它们组合成一张桌子。我希望最终得到一个包含以下字段的表(称为SupplyRecruitment) -- using [UniqueID] AND [Supplier] as a join key (个人可以存在于多个供应商,因此需要基于UniqueID和UniqueID的唯一记录进行连接)。数据集不是很大(最多12,000行),因此性能不是一个很大的焦点。简单和准确是关键。
寻找基于SSIS任务的解决方案(使用SQL 2012)。如果这是不可能
我试图在postgresql中优化以下查询 FROM customer c
INNER JOIN我想使用合并连接,而不是哈希连接,因为我看到哈希连接并不真正使用索引,所以我使用Set enable_hashjoin=off来转换散列联接。我的查询现在是根据使用合并联接的查询计划进行的,但是它总是在合并连接之前执行快速排
连接是根据它们的id来进行的,我已经按列(用于连接)在集群上分发了大的一个,我也使用了这个列作为排序键。我在所有节点上都分布了一个小表,并在用于连接的列中使用了sortkey。SELECT * FROM big_table big JOIN small_table small ON big.id = small.id;
查询计划表示redshift是在执行哈希连接,而不是合并连接这就是预期的行为吗?我想要合并加入。
我试图合并两个列表,因为我有一个18个城市的列表,所以我增加了一个序列,最多可以计算到18个城市。这是我的转变:
基本上,我添加了city_ ID -序列,以便从我的文本文件ID开始执行最多为18的序列,有一个最多为18的字段"ID“。这个想法是在合并"merge 2”时,与所有具有相同ID的东西合并,重复"csv文件输入2“上的城市名称,这样我就很容易不用手工生成城市名称了。这是
我使用id和日期连接表本身,以便执行如下操作:SELET t1.id, t1.date, SUM(whatwever) FROM analytics.my_summary_by_day t1 LEFT JOIN analytics.my_summary_by_day t2 ON t1.id = t2.id AND DATEDIFF(DAY,t1.date,t2.date)>=-30 AND DATEDIFF(DAY,t1.date,t2.date)<0