文章/答案/技术大牛

发布

社区首页 >问答首页 >计算表中每一列的空值数量

问计算表中每一列的空值数量
EN

Stack Overflow用户

提问于 2021-02-10 05:19:55

回答 3查看 448关注 0票数 1

我想计算表中每一列中为null的行的百分比。对于一个专栏，我使用的是：

SELECT ((SELECT COUNT(Col1)
FROM Table1)
/        
(SELECT COUNT(*)
FROM Table1)) AS Table1Stats

效果很好，而且速度很快。但是，我希望对表的所有~50列执行此操作，并且我的环境不允许我使用动态SQL。

有什么建议吗？我使用snowflake连接到AWS，但作为最终用户，我使用的是snowflake浏览器界面。

sql

snowflake-cloud-data-platform

回答 3

Stack Overflow用户

发布于 2021-02-10 05:31:26

您可以将其组合为：

SELECT COUNT(Col1) * 1.0 / COUNT(*)
FROM Table1;

或者，如果您喜欢：

SELECT AVG( (Col1 IS NOT NULL)::INT )
FROM Table1;

票数 1

Stack Overflow用户

发布于 2021-02-10 07:32:47

您可以混合使用object_construct()和flatten()将列名移动到行中。然后对缺少的值进行数学计算：

create or replace temp table many_cols as
select 1 a, 2 b, 3 c, 4 d
union all select 1, null, 3, 4
union all select 8, 8, null, null
union all select 8, 8, 7, null
union all select null, null, null, null;

select key column_name
  , 1-count(*)/(select count(*) from many_cols) ratio_null
from (
    select object_construct(a.*) x
    from many_cols a
), lateral flatten(x)
group by key
;

票数 1

Stack Overflow用户

发布于 2021-02-10 07:33:48

如果您不介意复制文本并在完成后运行它，您可以使用SQL生成器来完成此操作。

-- SQL generator option:
select 'select' || listagg(' ((select count(' || COLUMN_NAME || ') from "SNOWFLAKE_SAMPLE_DATA"."TPCH_SF10000"."ORDERS") / ' || 
       '(select count(*) from "SNOWFLAKE_SAMPLE_DATA"."TPCH_SF10000"."ORDERS")) as ' || COLUMN_NAME, ',') as SQL_STATEMENT
from "SNOWFLAKE_SAMPLE_DATA"."INFORMATION_SCHEMA"."COLUMNS" 
where TABLE_CATALOG = 'SNOWFLAKE_SAMPLE_DATA' and TABLE_SCHEMA = 'TPCH_SF10000' and TABLE_NAME = 'ORDERS'
;

如果由于需要编写脚本而无法进行复制和粘贴，则可以在我编写的存储过程中使用SQL生成器的结果来执行单行动态SQL：

call run_dynamic_sql(

select 'select' || listagg(' ((select count(' || COLUMN_NAME || ') from "SNOWFLAKE_SAMPLE_DATA"."TPCH_SF10000"."ORDERS") / ' || 
       '(select count(*) from "SNOWFLAKE_SAMPLE_DATA"."TPCH_SF10000"."ORDERS")) as ' || COLUMN_NAME, ',') as SQL_STATEMENT
from "SNOWFLAKE_SAMPLE_DATA"."INFORMATION_SCHEMA"."COLUMNS" 
where TABLE_CATALOG = 'SNOWFLAKE_SAMPLE_DATA' and TABLE_SCHEMA = 'TPCH_SF10000' and TABLE_NAME = 'ORDERS'

);

如果你想要这个存储过程，在Snowflake的博客上发布之前，你可以在这里找到：https://snowflake.pavlik.us/index.php/2021/01/22/running-dynamic-sql-in-snowflake/

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66127310

复制

相似问题

问计算表中每一列的空值数量
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算表中每一列的空值数量EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算表中每一列的空值数量
EN