本文整理自瓴羊的王璟尧老师与镜舟科技石强老师的联合分享,围绕 Quick BI 在智能 BI 场景中的落地实践,深入探讨了 StarRocks 如何凭借 MPP 架构、实时分析能力与 AI 原生支持,成为智能分析的理想 Lakehouse 引擎底座,助力 BI 从“被动查询”迈向“主动决策”,开启数据“会说话”的新体验。
从近十余年 Gartner 魔力象限的变化中,可以清晰观察到商业智能(BI)与数据分析行业的演进趋势。从 2010 年到 2016 年,再到 2024 年,整个 BI 领域大致经历了三个阶段:传统 BI、敏捷 BI,以及智能 BI。
传统 BI 多依赖集中式分析,虽然具备数据整合和加工能力,但在满足更高阶的业务需求时存在明显局限。其典型问题包括:
以 Tableau 等为代表的敏捷 BI 工具引入可视化和自助式分析,通过拖拽操作降低了使用门槛,提升了交互性。尽管部分工具开始引入智能化特性,但整体仍以规则驱动为主,智能水平有限。
在传统的数据分析流程中,业务方提出需求后,数据团队往往只是“执行者”,负责生成报表,流程单一、响应周期长,常成为业务推进的瓶颈。即便敏捷 BI 工具提升了可视化和交互体验,仍未真正打通数据团队与业务团队之间的协作壁垒,分析流程依然割裂,难以形成端到端的闭环。
这一局限正在被大模型与分析引擎的技术突破所打破。QuickBI 借助大模型强大的语言理解与生成能力,BI 工具正从“报表工具”演进为“数字化助手”。用户只需用自然语言描述分析意图,系统即可理解上下文、自动拆解任务并高效返回结果,真正实现“人人皆可分析”。
智能 BI 相较于传统 BI,具备三大核心优势:
智能 BI 最直观的价值在于简化数据分析流程、降低使用门槛、提升响应效率,并推动分析真正走向洞察与行动。
在传统流程中,分析人员在发现数据异常后,需逐层确认指标定义、数据来源,甚至联系开发人员,排查是否是平台异常、服务中断或口径差异。这一过程依赖大量人工沟通,耗时且易出错。
而在智能 BI 支持下,流程被彻底重构:
这标志着数据分析从“事实呈现”跃迁至“洞察生成”与“行动建议”。在接入业务 Agent 的场景下,系统还能触发自动操作。
对话式 BI 的核心价值在于:通过自然语言交互,自动完成分析、洞察与建议输出。同时,智能 BI 的落地也对底层系统提出更高要求:必须具备高并发处理能力、实时响应性能,以及对 AI 模型的深度融合能力,如语义理解、逻辑推理和模型对接等 —— 而这正是 StarRocks 所擅长的。
“所有产品都值得用大模型技术重新做一遍”这句话同样适用于 BI。大模型正重塑 QuickBI 的分析流程,为传统的“数据连接—建模—分析—可视化—消费协同”链路注入智能化能力:
在智能搭建方面,Quick BI 的探索始于以自然语言替代传统拖拽操作,优化分析师的建模与报表流程,聚焦于高频、复杂、依赖经验的典型场景。例如:
在技术架构上,Quick BI 解耦底层搭建引擎、渲染引擎与会话系统,构建了指令系统与前端 API 层。大模型作为中介,将用户自然语言转化为产品指令,驱动搭建流程。
户在数据洞察中的核心诉求可分为五个阶段:看懂图表、补充信息、分析解释、定位问题、支持决策。要支撑这一链路,算法、数据与引擎需协同配合——算法需具备精度与泛化能力,数据源需丰富可靠,底层引擎则必须支持高频、多维的实时查询。
当前,Quick BI 的洞察能力聚焦于三方面:
这类高频、复杂、多维的分析任务,对底层引擎能力提出极高要求。Quick BI 正是依托 StarRocks 等高性能 MPP 架构查询引擎,才能在数据洞察体验上保持稳定与高效。
面对大模型时代对实时性、灵活性和智能化的需求,分析引擎经历了四个阶段的演进:
随着 AI 应用的普及,湖仓一体正进一步演化为智能湖仓,在原有统一架构的基础上,原生支持 AI 应用接入,具备更强的实时性、语义理解能力和向量检索能力,成为智能分析的新基石。
Lakehouse 之所以成为智能分析的核心基座,关键在于其兼具统一存储、高性能查询与 AI 原生支持三大能力,真正打通了从数据准备到模型训练、推理的全流程。
在智能分析场景中,数据通常经历 ETL 与特征工程 → 模型训练(training)→ 推理(inference)→ 服务(serving)等环节,整个链路的读取与存储均依赖 Lakehouse 架构中具备 AI 优化能力的存储层(AI-Optimized Storage)。
其核心价值体现在以下三方面:
StarRocks 定位为面向智能 BI 场景的 Lakehouse 分析引擎,具备高并发、低延迟、灵活访问与智能协同等能力,适配实时、批量与多湖数据的统一分析需求。
其核心能力包括:
总体来看,StarRocks 能在不改变现有数据架构的前提下,打通实时、离线与跨湖分析路径,天然契合智能 BI 对多源融合、分析灵活性与高性能的需求。
StarRocks 构建了统一的 Lakehouse 架构,有效支撑从数据接入、处理、分析到 AI 推理的全链路能力,正成为智能分析的关键底座。在数据接入层,StarRocks 支持对接主流 AI 基础设施,如 Ray 与 MLflow。其中,Ray 可通过 BC 接口直接访问 StarRocks,将生成的 embedding 数据写入,引导下游分析智能演进。
1. 实时洞察:秒级数据新鲜度,驱动动态决策
得益于 MPP 架构、Runtime Filter、CPU 优化器等核心能力,StarRocks 支持毫秒级复杂查询响应;系统支持上千并发连接,甚至在部分客户场景中稳定支持超 5000 并发。
在标准测试集(如 SSB、TPC-DS、TPC-H)中,查询性能普遍领先竞品 2–3 倍;多个实际迁移案例也实现 1–2 倍性能提升。
2. 简化架构:不搬数、减架构、省成本,提升分析效率
StarRocks 打破传统 BI 的多系统、多链路架构,支持 Flink、Spark 等导入方式,实现流批一体的数据接入。
通过 StarCatalog,可直接查询 Iceberg 等湖表,实现数据“零迁移”。分析结果也可写回原始湖表。
配合 AutoMV 自动生成物化视图,加速查询、简化建模,进一步提升分析效率。
3. 业务赋能:直面分析,业务人员按需加载
在 ELT 架构下,研发专注数据导入湖仓,业务人员可通过元数据平台按需获取数据,自主完成报表构建与分析探索,显著降低跨团队沟通与交付成本。
4. AI 集成:StarRocks 良好的 AI 特性支持
StarRocks 提供良好的 AI 集成能力:
ChatBI(如 QuickBI 智能问数)的核心在于将用户自然语言输入转化为结构化查询与语义解释,生成可视化结果与洞察建议。其背后依托大模型、向量检索与 StarRocks 查询引擎协同工作,整体流程包括以下几个环节:
整个流程大致如下:
关于 StarRocks 在 RAG 企业知识库场景中的应用,以及 MCP 协议如何实现大模型与 StarRocks 的高效交互,已有详尽阐述,详见以下文章:
前文所述 ChatBI 流程,实质上可通过一张系统链路图完整呈现,从用户提问到查询执行、再到结果生成与可视化输出。
用户在前端输入自然语言问题,系统将其传递给大语言模型(LLM),结合上下文完成意图识别与补全(如添加提示词),再转化为结构化查询语句(SQL)。
SQL 随后提交至 StarRocks 查询引擎执行。StarRocks 会根据目标数据来源自动选择访问路径:
无论数据存储在哪里,用户只需自然语言提问,大模型与 StarRocks 即可完成统一调度与即时分析,省去传统架构中大量开发与同步成本。StarRocks 还具备 I/O 优化与预加载机制,确保查询响应高效稳定。
查询完成后,结果将返回至大模型,由其进行排序、重写与语言润色,生成清晰易懂的答复。如有需要,还会自动生成图表,并基于上下文提出进一步的分析建议,真正实现从数据展示到业务行动。
在 ChatBI 场景中,StarRocks 作为底层分析引擎具备以下核心优势:
在某饮品品牌中,我们对 ChatBI 系统进行了针对性优化,验证了“好数据 + 清晰问题”对问数效果的决定性作用。
初期,由于提问模糊、缺乏上下文,系统问数准确率仅约 60%。在优化过程中,我们通过以下方式实现显著提升:
最终,问数准确率从 65% 提升至 92%,获得客户高度认可。
数据解读流程分为两步:数据摘取与洞察生成。
系统首先从报表或表格中提取结构化信息,转换为大模型可识别格式;再结合用户问题,进行归因分析与趋势判断,发现异常与潜在机会。
关键在于“选对数”——即识别与业务意图最相关的指标与维度。该过程由多个 Agent 协同完成,如搜索 Agent、分析 Agent、问数 Agent 等。
在进阶应用中,Quick BI 已支持 Multi-Agent 协同机制,实现从现状诊断、归因分析,到建议生成的闭环式智能报告。
例如,在专题分析、日报/周报自动撰写中,系统通过分析 Agent、报告生成 Agent、调度 Agent 等多角色协同,自动生成图文并茂的分析结果,甚至可通过信息流方式主动推送。
随着大模型技术持续演进,StarRocks 正在加速推动 AI 与 BI 的深度融合,未来将聚焦三个方向:
从行业趋势来看,智能 BI 正从“任务执行者”向“智能决策主体”演进。大模型将具备动态推演、任务拆解、多模态感知与自我反思能力,实现非预设路径的智能决策,QuickBI 也正朝着这个方向演进。
StarRocks 的目标,是成为这一转变的关键基座,让数据真正“会说话”,让每个人都能成为自己的分析师。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。