我在一个仪表盘上工作。我有一个数据源,其中包含一个用逗号分隔的值为的列。我正在尝试使用这些列对行进行分组。但是,默认情况下不对值进行分类。我就可以得到这样的东西:Line 2 - C, B, ALine 4 - B, CLine 6 - AA, B, C - Line 1 and Line 2
A - line 3 and l
我正在尝试复制一些我在熊猫中做过的数据预处理到tensorflow变换中。我有几个CSV文件,我加入了这些文件,并与熊猫进行聚合,以生成一个培训数据集。现在,作为生产模型的一部分,我希望使用apache和tensorflow变换进行这种预处理。然而,我不太清楚如何在那里复制相同的数据操作。让我们来看看两个主要操作:JOIN dataset a和dataset b,以在dataset c上生成c和group by co