我正在通过aws glue爬行数据到数据目录。但是我对数据库的定义有点困惑。根据我在亚马逊网络服务文档A database in the AWS Glue Data Catalog is a container that holds tables.它是否加载来自其他数据源的所有数据并在这些数据源上创建目录?或者它只包含目录?如何知道glue数据库中表的大小?以及它使用的数据库类型,如nosql、rds
例如,我创建了一个爬虫程序来从s3加载数据,并在<
我尝试在Glue Data Catalog中手动创建一个表,这是可以的,但是查询该表返回了0的结果。
当我使用Glue Crawler获取相同的数据并生成表元数据时,它正常工作,并按预期返回数据。因此,我从工作表中生成了DDL,更改了名称并运行了DDL来创建一个具有不同名称的工作表的副本,但是新表现在返回了0的结果!尽管我所做的