目标
我在ADLS gen2中以格式存储数据。此外,它们也可以通过蜂巢目录获得。值得注意的是,我们目前正在使用PowerBI,但是在将来,我们可能会切换到Excel。
问题
以Delta格式将AAS与我的ADLS gen2数据连接的最佳方法(或黑客)是什么?
问题
AAS支持源中没有数据库/Hive。AAS通过Blob连接器支持ADLS gen2,但AFAIK不支持Delta格式,只支持拼板。
可能解决办法
从这个文章中我看到这个问题可能通过PowerBI内置API网关来解决。
一个例子是Azure Analysis ( AAS )和Databricks之间的集成;Power BI有一个指向Databricks的本地连接器,但是这个连接器还没有到达AAS。为了弥补这一点,我们必须部署一个带有Power数据网关的虚拟机,并安装Spark驱动程序,以便从AAS连接到Databricks。这并不是一个节目的停止,但当AAS有一个更本地的Databricks连接时,我们会很高兴。
这个解决方案的问题是我们计划停止使用PowerBI。我不太明白它是如何工作的,它需要什么样的PBI许可证和实现/维护工作。你能更深入地了解一下它的工作原理吗?
UPD,2020年12月26日
现在,当使用Azure Synapse分析的GA时,它完全支持SQL .这意味着无服务器Synapse理论上可以用作AAS和Delta湖之间的粘合剂。见从Azure Synapse直接查询数据库的Delta湖。
同时,是否可以使用ODBC从Synapse按需查询Databricks目录(内部/外部)?突触支持ODBC作为外部源.
发布于 2020-10-20 07:38:23
现在支持Parquet文件,因此您可以从这些文件加载到Power,但是标准的设计模式是使用Azure SQL数据仓库加载文件然后再加载层Azure分析服务(AAS)。AAS不支持拼板,您必须创建最后一个表的CSV版本,或者将其加载到SQL数据库中。
如前所述,典型的体系结构是让Databricks执行部分或全部ETL,然后让Azure SQL DW对其进行处理。

Azure SQL DW现在已经转变为Azure Synapse,但是它的好处是Databricks/Spark数据库现在有一个影子副本,但是SQL功能可以访问。SQL on Demand不需要有Azure的数据仓库组件的实例,它按需运行,每个TB的查询都需要您。这里很好地概述了它如何提供帮助。另一种选择是让Azure Synapse将数据从外部表加载到该服务中,然后将AAS连接到该服务。
https://stackoverflow.com/questions/64431691
复制相似问题