Google BigQuery没有主键或唯一约束。我们不能使用传统的SQL选项,比如insert ignore或insert on duplicate key update,那么如何防止重复记录被插入到Google BigQuery中呢?如果我必须先调用delete (基于我自己系统中的唯一键),然后再调用insert,以防止重复记录被插入到bigquery中,这是不是太低效了?我假设insert是最便宜的操作,没有查询,只是追加数据。对于每次插入,如
我计划每天将增量数据附加到BigQuery表中。每次向现有表添加增量数据时,我都希望从表中的现有数据中消除重复记录(基于主键列)。一种方法是-
在- SELECT all_cols from table where pkey_col NOT IN (INCR_KEYS)行上运行一个查询,并将结果存储在一个新表中。将增量数据附加到新<e