我们正在使用结构化流,并尝试对源数据执行一些重复数据删除。如果id列在20天内重复,我们需要插入最早的事件时间。20天可能有100-150亿行。我们正在考虑使用Cassandra表来存储状态(比如目前为止的id和min time )。每次触发微批次时,我们使用微批次中的in查找存储状态的Cassandra表。20天的Ids也在100-150亿级别,换句话说,Cassandra的状态表在100-150亿级别。那么在每个微批次中查找或连接这个Cassandra表</
使用C#、ODBC和Jet4.0引擎使用(旧的) Access数据库。任务要求我不使用DAO。new_name;RENAME 重命名表old_name TO old_name TO new_name;ALTER表old_name重命名为new_name;
但是,下面的语法确实有效是否有一种方法来创建表的副本,以及在复制保存中哪些字段是主键?