我一直在关注一篇关于如何使用Pentaho data Integration/Kettle创建数据仓库的教程。本教程基于CSV文件,但我正在练习northwinds数据库和postgresql,我正在尝试弄清楚如何从多个表中选择值,然后将它们输出到单个表中。我的ETL过程是这样的:我为每个表有几个阶段,从每个表中选择值并将其存储在数据库
我想从一个表中选择两个列(A & B),并且只保留其中一个(A)的不同值。但是,A的单个值可以映射到B的多个值,因此下面的查询不能工作。select distinct A, B from table1select A, agg(B) from table1 group by A
我希望agg函数只是随机地从B中选择一个值如何<