XILEJUN
喜乐君
Tableau Visionary * 5
业务数据分析“专家”、敏捷BI布道师,《数据可视化分析》《业务可视化分析》多本书作者,中国地质大学(武汉)经管学院MBA校外导师
以Tableau会友,致力于构建业务分析通识框架,
XILEJUN.com 全球、VIZWISE.cn 国内
“唯有知识,让我们免于平庸”
01
—
Tableau管理视图
在 Tableau server 中,系统默认内置了多个管理视图,包括视图性能、提取性能、磁盘空间等多个主题。

近期,喜乐君为某外资客户提供了“Tableau Server 服务器运维服务”,为之诊断提取时间漫长、资源不足等问题。
起初,我准备使用系统默认的视图,比如上面的“数据提取的后台任务”:

官方视图内容翔实,但如果我要检查一周甚至一个月的数据提取,那么上面就会出现很长的滚动条,我很难检查每个提取的频次、时长等关键信息。
为此,聪明的服务器管理员可以连接 Tableau Server 的内置存储库Repository,使用其元数据底表完成自定义可视化分析——毕竟手中有 Tableau,还有什么可怕的呢。
为此,我申请开通了 Tableau Repository 的访问权限:
[admin@localhost ~]$ tsm data-access repository-access enable --repository-username readonly --repository-password "Tableau!@#¥%.*&"
此操作将执行服务器重新启动。是否确实要继续? (y/n):
y
正在开始更新存储库访问异步作业。
作业 ID 为“12”,超时为 75 分钟。
5% - 启用维护应用程序。
11% - 正在等待维护应用程序启动。
17% - 读取配置。
23% - 正在启用数据库服务。
29% - 正在等待数据库服务启用。
35% - 正在更新存储库中的角色。
41% - 更新待定配置。
47% - 禁用所有服务。
52% - 等待停止服务。
58% - 更新节点上的配置版本。 正在运行 - 正在等待服务重新配置。
64% - 正在等待服务重新配置。
70% - 启用所有服务。 正在运行 - 等待启动服务。
76% - 等待启动服务。
82% - 正在禁用数据库服务。
100% - 正在等待数据库服务禁用。而后使用Tableau连接 Postgresql 数据库,使用如下数据表完成分析:
_background_task 数据表:该视图包含后台任务和系统任务的关键信息。This view combines the important contents of both the background_jobs table and the async_jobs table to give an overall picture of jobs that were given to a backgrounder process. Tableau
该数据表的元数据如下所示:

于是,我使用上述数据表构建了一个管理视图仪表板,如下所示:

从上面可以看出,这里存在两个 Reporting_v2的数据模型,而且提取频率完全一致(每隔15分钟增量刷新),过去4天,每个数据累计提取时长102分钟,每次不足1分钟。
这样,我就能发现数据源存在的同质化问题,问题出在新数据源在不同位置发布了两遍,而我之前没有意识到!
另一家客户也是一样,但问题更加严重。同一份数据源在各个工厂中都有提取,本意是加强数据权限控制,但结果数据源大小竟然几乎一样,这就说明大量的提取消耗在了重复性提取上。如下图所示:

这种仪表板相比官方仪表板更适合长周期的检查分析,通过交互可以发现异常,也可以表示更多细节。
比如我发现有一个提取比平时要久一些(颜色更深),所以我可以鼠标悬停查看细节,发现平时只需要2分钟的提取,这次消耗了4分钟;好在最后成功完成;如果频繁出现这种情况,说明资源占用比较严重。如下所示:

是不是非常优雅。
02
—
全量+增量提取
如果一个数据每次提取时间超过二十分钟、不追求当日 T+0数据、历史数据更新不频繁,我就建议使用增量和全量相结合的方式。
比如某个数据源,全量数据对应1500万行,覆盖很多年的数据,每次全量提取就要消耗很久时间。考虑到几年前的数据基本不可能变化,因此可以考虑增量提取的方式;由于近期数据微小调整可能累计影响准确性,可以通过周日全量提取校正。
这样,平时每天的提取就只需要不足一万行数据,修改为增量提取之后,可以通过自定义的管理视图检查。
如下图所示,点击上面的数据源,就可以看到完整的抽取(refresh extracts)和增量刷新(increment extracts)的计划情况了。在下面的数据中,周末全量抽取需要超过30分钟,而平时每天的增量刷新只需要2分钟即可。

当然,如果是订单变化比较频繁的零售行业(很多订单存在隔日、隔几日的退货情况),订单量比制造业企业更多,那么也可以采用凌晨全量、整点增量的方式。比如,我为某家零售客户甚至了如下的计划:

可见,优秀的 BI 已经可以完成很多传统数据仓库肩负的工作,从视图 view 到 etl 计划,从数据整理到数据管理;优秀的 Bi 正在模糊数据仓库和业务分析之间的壁垒。
Tableau Server 不仅仅是 BI,更是 DW/BI 一体化的平台,这才是真正的 BI 商务智能系统。
如有需要,欢迎试用。
Tableau 不是曲高和寡的大公司专属,中小企业也能以极低的成本(每年数万)获得苹果、美孚、美国航空等世界巨头使用的超级工具。与其把时间花在寻找轮子、重复性造轮子的努力中,为什么企业不把精力花在主业上,好好赚钱呢?
工具是我们能力的天花板,也是企业盈利可能性的天花板。
最后说个好消息!
我在几个最为活跃的读者群中,时常介绍我在写的《数据分析通识》图书进展,目前已经基本完成书稿。八月份开始,我就准备逐步恢复视频录制啦。

一个多月没发文章,顺带来个抽奖,赠送一个定制手提袋如何(也让我测试一下这个礼物功能咋用)。点击即可参与。
礼物是这样的,现在已经晋升为我的短期差旅公文包啦。
@喜乐君 咨询顾问|上海唯知唯识创始人
《数据可视化分析:Tableau原理与实践》2020.8
《业务可视化分析:从问题到图形的Tableau方法》2021.7
《数据可视化分析:分析原理与Tableau、SQL实践》2023.9
《业务可视化分析:从问题到图形的分析原理与实践》2025.8
《数据分析通识·10讲:写给未来 CEOs》 2026Q1
………… MORE …………
「业务数据分析系列」图书
by 喜乐君·扫地sir