
大家好,我是人月聊IT。
本文基于我公众号已经发布过的关于本体论和AI原生应用的文章,让AI重新做了一次系统性的整理和规划,形成一篇结构完整的文章。作为我诸多本体论文章的一次阶段性总结。
一次从西方哲学的本体论出发,历经抽象建模、Palantir 本体、对象行为规则、事件驱动闭环、推理范式之争,最终走向本体模型驱动 AI 原生应用的完整思考记录。
过去大半年,我在公众号和视频号里断断续续聊了很多关于本体论的内容,也和 AI 大模型反复对话、推演、被纠正、再修正。回头看,这些零散的分享其实是一条完整的思考线索:从一个哲学概念出发,一步步走到了软件构建范式的变革。
这篇文章,我想把这条线索完整地串起来。它不是某一篇旧文的扩写,而是把我所有关于本体论、关于 AI 原生应用的思考做一次系统的归拢。我会从最基础的哲学谈起,再谈 Palantir,再谈方法论,最后落到工程实现和我对未来的判断。
我尽量用最朴素的方式把事情讲清楚。因为我越来越确信,本体论这个看似玄虚的词,背后其实是一套相当务实、相当接地气的思想。它正在重新定义我们怎么建模、怎么写软件、怎么让 AI 真正理解业务。


要谈本体论,绕不开西方哲学。我在公众号里发过相当多西方哲学的内容,整个哲学体系简单概括,你可以把它理解为包括了本体论和认识论两大分支。这两者构成了人类认识世界的两条根本路径。
本体论研究的是两个关键的东西。一个是整个宇宙事物它本身的本质构成,能不能形而上地进一步抽象;另一个是整个宇宙事物的类型、规则、规律究竟是什么样。简单说,本体论关心的是"世界由什么构成,它们遵循什么规律"。
而认识论里面其实又包括两个细点,一个叫知识论,一个叫方法论。它关心的不是世界本身,而是"我们如何去认识这个世界、如何形成对世界的可靠知识"。本体论回答"是什么",认识论回答"我怎么知道"。
早期古希腊哲学里,本体论和认识论两者是分离的。以亚里士多德为例,他对本体论核心的贡献是给出了四因说;而对于认识论,他核心的内容是形而上和形式逻辑。但这两者并没有更好地结合起来,这就埋下了一个关键问题。
这个问题是:你要更好地去研究世界事物的构成,一定要遵循科学的方法、科学的认识,才能把这个事情做好。也就是说,本体论的研究本身离不开认识论的支撑。研究"是什么",必须依赖一套可靠的"怎么知道"的方法。
到了近代哲学,培根进一步对形式逻辑进行了完善,通过科学归纳法这么一个思路,形成一种更加严谨地认识和分析世界的方法。本体论与认识论开始走向结合,人类对世界的抽象第一次有了可靠的方法论保障。
再到康德的哲学,有一个重点就是他的十二范畴。十二范畴里面包括了质的范畴、量的范畴和关系的范畴。其实它的范畴核心就是逻辑,而这个逻辑把本体论的知识和认识论的知识做了相关的融合和统一。
我原来在讲深度思考时也谈过,深度思考的核心就是空间加时间加逻辑。这个逻辑不能单独存在,它一定依附在事物上面,依附在一定的空间和时间上面。这就是我们对整个本体论最基础、最基本的认识。
通过上面这些哲学脉络,我想引出一个对后面所有内容都至关重要的关键点:事物不是一个静态的东西。研究事物,一定要去研究事物的动态特征。
这句话听起来简单,但它恰恰是传统建模最容易忽略的地方。我们习惯把世界看成一堆静态的对象和属性:一张合同表、一张客户表、一张订单表。我们认真研究它们的字段、它们的主外键关系,却很少认真研究它们是怎么动起来的。
研究事物的动态特征,包括它的行为特征,以及事物和事物组成要素之间的关系,这个才是重点。一个合同不只是一组字段,它会被录入、被审批、被开票、被收款,它在不断地产生行为,不断地与其他对象发生关系。
这一点正好呼应了康德"逻辑依附于事物、依附于时间空间"的洞察。对象是存在于时间之中的,它有生命周期,有状态变迁,有触发条件。脱离了动态行为去谈对象,就等于只描述了世界的一个静止切片。
所以我反复强调,本体不是一张静态的数据模型,而是对象、行为、规则三者交织而成的动态整体。哲学上对"存在"的理解从静态本质走向动态生成,恰好为我们在软件里怎么建模提供了最根本的指引。
把哲学放下,回到 Palantir 这家公司。它早期仅仅是一个做数据类、或者叫数据中台的公司。但后来为什么有了本体论的思想和相关技术算法之后,真正让这家公司如虎添翼了呢?
很多人理解很简单,认为 Palantir 只是在原来的数据模型和架构上增加了关系。这个理解是严重不对的。我们原来做数据架构时,除了数据对象和组件,本身也研究数据之间的关系,比如一对一、一对多、多对多,以及主外键的依赖和关联。
但大家一定要意识到,数据之间的关系原来也是静态的。关键是我们没有研究:看到的数据是一个结果,而形成这个数据的过程是什么?促进数据和数据之间流动的行为规则因素是什么?这些东西原来没有被研究,它们大量地存在于个人经验中,没有显性化成为规则定义。
如果你再去看 Palantir 的本体论,会发现它的核心不仅仅是数据和数据关系,更重要的是行为建模。这个行为就是我们讲的算法规则——促进数据形成的行为,促进数据流转的行为。行为建模,包括行为的可视化、显性化,才是整个本体论最核心的内容。
举个最简单的例子:生产管理中的生产排产。我们有静态数据,比如采购订单、生产工单、供应商数据、物料数据、工厂生产线工艺路线等。但拿到这些数据就能做出高质量的排产计划吗?当然不是。
真正要做好排产计划,还需要积累显性化的行为和规则约束。你把这些行为规则一起丢给 AI 大模型,才可能得出一个最优化、符合实际情况的生产排产计划。数据之间的关系原来就有,大家真正缺的是规则建模、行为建模,缺的是怎么把这部分内容更好地显性化。
而这正是 Palantir 本体论的真正价值所在。它已经不是简单的底层数据模型,而是整个企业本身的数字原生模型。当数据模型加上了行为、加上了规则,它就从一个静态的存储结构,变成了一个能够刻画企业如何运转的活的语义体系。
我后来也一直在想,我谈本体论时为什么并不特别强调"这是 Palantir 的本体论"?因为我觉得本体论的思想,对我们传统 IT 系统的构建带来了更深的参考。Palantir 是一个成功的样板,但它背后的思想,价值远大于这家公司本身。
我特别想说一句:如果你原来做过类似抽象建模的工作,其实是很方便理解本体论的。不管是软件建模、企业架构、BIM 建模,各种建模,通过这种建模你就理解到了本体论的一个核心本质——它本身是现实世界的一种抽象。
谈软件建模,大家都很清楚,最早就是基于面向对象分析和设计的思路,通过 UML 这种形式化的语言符号来建模。这个建模里既有静态的逻辑图,又有动态的逻辑图,比如用例图、活动图、状态图、序列图、部署图。
建模完之后你会发现,它既包括静态的对象、对象之间关系的建模,也包括行为规则的建模。静态的对象关系建模,类似类关系图,最终会转成数据模型,落到数据库设计里。而行为规则的建模,类似状态转换图、序列图,最终落地到源代码里。
UML 之后又出来一个东西叫 MDA 模型驱动架构。它把模型分成 PIM 和 PSM,一个叫平台无关模型,一个叫平台相关模型。平台无关模型相对更简单,让我们更加关注核心的、抽象的模型内核,而不是纠缠于具体实现。
MDA 之后,前几年又火起来一个东西叫领域驱动设计。领域建模更关心核心的领域对象、领域对象应该暴露的行为、事件和规则;而不关心你用什么开发语言、用三层还是五层框架。这样我做完领域建模,就只做核心内容的抽象,极大地控制了模型的规模和复杂度。
这条脉络其实指向同一个方向:建模在不断地剥离技术细节,不断地向业务本质收敛。从 UML 的全量建模,到 MDA 的平台无关,再到领域驱动的纯领域抽象,每一步都在做减法,把技术实现的噪声一层层剥掉。
而本体论建模,可以看成是这条脉络的自然延续和归宿。我们完全可以借鉴面向对象分析设计的思路,借鉴 MDA,借鉴领域建模,剥离掉语言相关的建模、分层架构的建模、技术实现的建模,最终围绕核心的业务、围绕对象行为规则去建模。
这里有一个我反复强调的关键现象,理解它你才能真正理解本体论解决了什么问题。任何一个软件建模,从设计态变到最终的运行态以后,数据模型和行为规则模型其实已经分离掉了。
什么意思?软件设计建模完成后,经过开发,最终部署上线。上线之后,对大部分人来讲实际上已经看不到代码了,因为代码已经编译构建成了部署包或镜像。但稍微有点技术背景的人,还是能看到数据库,能查看到数据库表、字段、属性、关系。
也就是说,对于数据模型,它往往落地到数据库表里,相对容易理解、容易可见。但是行为和规则模型这个东西就麻烦了——它在代码里,大部分时候是看不到的。它被编译进了二进制,被锁死在了运行的系统里。
那行为规则模型到底去哪里了?是不是原来构建 IT 系统时大量行为规则就丢失掉了?大家一定要注意,实际上不是的。行为和规则实际上打包在了源代码里,落地到了已经建设完的各个业务系统里。它们没有消失,只是变得不可见、不可追溯了。
这就造成了一个深远的后果:当我们事后想要追溯一个数据结果背后的业务逻辑时,几乎无从下手。我们只能回到一个个业务系统里去翻代码、查活动、查订单,靠人工和经验去还原那条被隐藏起来的行为规则链路。
所以本体论真正要做的事情之一,就是把这些被埋藏在代码里的行为和规则重新显性化出来。来源于哪里?来源于你的业务场景、业务活动,或者来源于你对已有 IT 系统源代码的理解。把它们抽象出来,变成一种伪代码语义或 Markdown 格式的定义。
只有这样,我才能构建一个完完整整的本体,才能真正解决"知其然又知其所以然"的问题。本体论的第一重价值,就是把那些在设计态到运行态过程中丢失的行为与规则,重新捞回来、显性化、并与对象数据重新整合成一个完整的语义体。

讲到这里,本体论建模的核心三要素就呼之欲出了:对象建模、行为建模、规则建模。我一直把它叫做 OBR 三要素,它是整个本体论建模方法论的基石。
什么是本体?本体是对现实世界中"存在什么"以及"它们如何关联"的形式化描述。落到软件系统建模上,对象本体回答"存在什么",行为本体回答"能做什么",规则本体回答"什么必须成立"。三者缺一不可。
为什么要把行为和规则单独拎出来,而不是像传统面向对象那样把规则塞进对象方法里?我当时给出的关键理由是:我需要对行为建模和规则建模通过独立的业务语义文档来建模,实现行为、规则和对象之间的解耦。
传统对象建模里其实没有"规则"这个独立的东西,规则往往融合在对象方法里。比如合同对象有"合同保存"方法,在这个方法里会调用完整性校验、预算校验等多个规则。规则被淹没在方法里,既不可见,也不可复用。
而在本体论建模里,我把规则独立出来,让它成为一等公民。规则对象本身是可以复用的,可以被多个行为引用。比如合同税率合规校验规则,既可以被"合同录入"行为引用,也可以被"开票录入"行为引用。一处定义,多处复用。
这套解耦带来的最大好处是灵活组装。当出现一个新的业务场景或流程时,它分为若干步骤,每一步可以调用底层已有的各种行为去组合,每个行为又可以引用已经定义好的各个业务规则。业务千变万化,但底层的对象、行为、规则是相对稳定、可以穷举的。
这也引出我对建模核心的一个重要判断:整个建模的核心不是业务场景,不是流程,而是对象。因为业务场景、业务流程千变万化,但核心的对象本身是可以穷举的,对象的行为也是可以穷举的。所有千变万化的业务,往往都是对象行为的灵活组装和编排。
所以本体论建模一定是围绕对象这个核心展开的。对象产生行为,行为调用规则,规则约束对象状态的转换。对象、行为、规则完完全全是一个相互制约、相互依赖的整体。你只要围绕核心对象,把它暴露的行为和规则全部搞清楚,就得到了一个高度抽象化的本体。
讲完了本体是什么、怎么建,必须回答一个更现实的问题:本体论究竟解决了什么样的业务问题,带来了什么样的业务价值?不回答这个,前面所有的抽象都是空中楼阁。
我们先回到传统 IT 系统建设的一个根本痛点。做过信息化的人都知道,IT 系统建设往往分两类:一类是偏事务处理的 OLTP 类系统,比如 CRM、SRM、ERP、MES;另一类是偏数据分析决策的 OLAP 类系统,比如数据仓库、BI、大数据平台、数据中台。
这两类系统的建设天然就存在一种割裂。数据分析类的系统和业务执行类的系统之间,没有办法有效地衔接起来。这是一个困扰了行业很多年的老大难问题。
举个我反复用的例子:我在 BI 系统里发现库存周转率这个指标出现了严重异常,理想是一年周转 12 次,现在只有 8 次。作为管理者,我更想追溯:到底是什么行为导致了这个下降?是采购周期延长了,还是交付周期延长了,还是有客户大量取消了订单?
在传统的 BI 或数据中台系统里,它根本没办法回答这个问题。因为底层只有数据模型,虽然有数据表和表之间的关系,但它没有数据形成的语义模型,没有形成这个数据背后的行为和规则模型。它只能告诉你结果,告诉你计算公式,却讲不清来龙去脉。
更麻烦的是后半段。即使我人工分析出了原因,要去调整,我还得手工回到采购系统、库存系统、计划系统里,一个个去更新数据和状态。分析在一个世界,执行在另一个世界,中间是一条需要人力反复搬运的鸿沟。
虽然这些年也做了不少努力,比如 TP/AP 一体化,但那仅仅是数据层面的融合统一,没办法解决业务逻辑层、语义层的融合统一。你只有真正理解了这个割裂,才能明白我们为什么要去做本体模型,本体论到底要解决什么。

本体论里有一个关键词叫"回写",很多人搞不明白。回写其实很简单:在数据这边发现的问题、做出的决策,能够动态地变更或回写到业务系统里去,这就叫回写。它是打通分析与执行那条鸿沟的关键动作。
我用供应链中断的例子讲透它。在整个采购供应链执行中,假设一个核心材料因为供应商原因出现了一两个月的交付中断。在 BI 系统里,这会表现为某个关键指标的预警。传统做法是把预警通知给供应链主管,然后主管自己去人工分析、人工调整。
但在本体论建模思路下,这个交付中断会触发一个事件,进入到本体模型的消息管道。而本体模型底层本身就有一个供应链计划优化调度的模型,它融合了供应商、物料、合同、订单、交期、约束规则等各种东西,天然地重合成一个大模型。
这个大模型拿到关键物料交期延误的消息后,会自动计算,给出一个最优决策。这个决策可能是把某个客户订单往后延,也可能是引入新的关键合作伙伴供应商。然后它调用供应链系统或 CRM 系统提供的回写 API 接口,把决策回写到业务系统里去。
这时对于业务主管来说就轻松了,他只需要在业务系统里审核一下本体模型或 AI 给出的最终建议:究竟是推迟客户交期,还是引入新供应商?审核通过后自动生效。整个过程从分析到执行连贯、自动化,人只在关键节点做审核。
通过这种模式,数据分析决策这一块跟业务运作系统实现了完整的双向协同和连接。这个双向连接的完成,需要底层有一个核心的本体模型来支撑。这个本体模型,不是单纯的传统数据模型,而是在数据模型基础上补充了原有缺失的业务语义、行为和规则。
所以"回写"这两个字,分量极重。它意味着本体论第一次真正打通了 OLAP 到 OLTP 的路线,实现了数据分析到后续数据业务执行行为之间的穿透。这在传统情况下是根本做不到的,而这恰恰是本体论带来的巨大价值。
我也由此产生了一个更大的思考:本体论会不会带来传统 IT 构建范式的大变革?我能不能在一开始就用本体论思想,构建一套融合的本体模型,既支撑 OLTP,又支撑 OLAP,还天然打通两者?我真正期望的目标是,最终 IT 系统的构建底层就是一套模型,直接打通业务事务处理到数据分析的完整路线。
本体论的价值还体现在一个更具体的领域——数据治理。我做过不少数据相关的项目,也常被问到:在 AI 时代,AI 赋能下的数据治理究竟应该怎么做?我的回答始终是一句话:数据治理一定是业务驱动的。
我曾遇到一个客户,想做数据治理咨询项目,去标准化数据模型、制定治理标准规范。我听了以后提了一个关键问题:你为什么要做数据治理?做完希望达到的目标究竟是什么?如果想不清楚,最后给的就是一堆标准、规范、模型,拿着也不知道怎么用。
我给的建议是:找到关键的业务场景切入,基于这些场景来做数据治理。比如预算管控一体化,或者研发全生命周期管理。因为在端到端流程贯通过程中,常常出现业务断点,影响实际效率,而这些断点背后大部分都是数据原因导致的。
以预算管理为例,往往是由于预算科目、会计科目、产品 BOM 的颗粒度不一致,导致虽然有预算编制下达,但后面的管控做不到一体化。从这个具体场景切入,该优化标准流程的优化流程,该重建责权利的重建责权利,该构建数据模型的构建模型,最后落到系统改造和集成。
这样做完之后,数据治理才真正带来了业务价值,业务部门也会积极配合。单个数据问题往往在单个部门、单个系统内部就解决了。真正上升到公司级的数据问题,往往都是影响跨系统、端到端业务流程的,这才是数据治理的关键价值点。
而本体模型,恰恰是承接这种业务驱动数据治理的最佳载体。传统数据模型在分析决策类系统的构建中天然丢失了业务语义——它只有数据对象、属性和关系,不会告诉你数据形成的来龙去脉,也不会告诉你数据状态变化要触发什么行为。
华为数据之道里讲的"数据分布",强调构建数据和数据之间衔接的数据链、数据流,反向支撑业务;数据中台讲的"数据反哺业务",把数据资产开放成数据服务直接给 OLTP 用——这些都是在弥补语义缺失。而本体模型用对象、行为、规则、事件,从根本上把这层语义补齐了。
所以归根结底,AI 加本体模型赋能数据治理,本质是用一个融合了业务语义的大模型,去解决业务和数据之间长期存在的断层和鸿沟。对象里包含关系,行为里包含事件,对象、关系、行为、规则、事件天然形成一个相互影响、相互约束的语义网络。这才是本体模型在数据治理上带来的最大价值。
理解了本体的价值,下一个问题是:到底怎么把一个业务建成本体?我做了不少尝试,最先成型的是一套基于 OBR(对象-行为-规则)思想的可视化建模方法。
我最初是从 MBSE 可视化建模、SBR 对象行为关系建模一路摸索过来的。中间我想起了 ARIS 流程建模底层的 EPC 事件流程链画法,它融合了业务对象、流程行为、规则等诸多内容。但我真正想要的,是一种弱化业务流程、突出对象行为规则三者核心关系的建模图。
为什么要弱化流程?因为这正是 OBR 方法和传统流程建模最根本的区别。OBR 强调"对象中心"而非"流程中心",通过对象链自然形成业务流程,从而避免了流程图的繁琐和易变性。流程会天天变,但对象和它们之间的引用关系是相对稳定的。
我给这套方法定了几条核心原则。对象是第一性的:先定义存在什么对象,再定义行为。行为改变对象状态:每个行为必然导致至少一个对象的状态变化。规则是不变式:无论何时何地,规则永远成立。对象链即流程:对象之间的引用关系自然形成业务流转路径。
"对象链即流程"这一条特别重要。以合同管理为例,合同对象和开票对象之间的映射,开票对象和收款对象之间的映射,本身就间接体现了一种对象流转。你不需要专门画一张流程图,对象之间的引用关系已经把业务流转的脉络勾勒出来了。
我把这套思想固化成了一套建模提示词,让 AI 基于它对合同管理需求进行建模。合同管理的需求并不复杂:管理对外销售合同,包含编号、名称、所属产品客户部门、责任人、金额、税率、付款条款等信息,付款条款是明细表,开票是独立明细,开票和付款阶段之间还有一张多对多映射表。
基于这套提示词,AI 输出了合同管理的完整本体建模图,对象、行为、规则三层清晰可辨。我还用同样的方法对生产排程、对离散制造的 MRP 算法做了本体建模。事实证明,只要 OBR 三要素的提示词设计得当,这套方法对不同领域都有很好的普适性。
这套建模方法,本质上融合了本体论的哲学思想、ARIS 的流程建模理念、领域驱动设计的对象思维,以及 UML 的图形化表达。它的目标只有一个:提供一种更贴近业务本质的建模方式,让模型围绕对象稳定地生长,而不是围绕易变的流程疲于奔命。

OBR 解决了静态的对象行为规则怎么组织,但还有一个动态的问题没解决:这些对象之间怎么联动起来,形成闭环?我的答案是引入事件驱动架构 EDA 的思想。
先看传统的面向对象。我录入一个销售合同,最终会到合同对象上,填充属性,调用合同保存方法,方法里再调用合同校验、交期承诺检查等规则,成功后返回保存成功。采购订单也是同样的道理,调用采购订单对象、执行保存、返回成功。这是一个完整的正向链路。
但你会发现,销售合同录入和采购订单录入这两个独立功能之间,并没有发生什么直接的关系。可实际上,在供应链 LTC 端到端的大本体里,它们之间存在着相当复杂的相互约束、相互影响的关系。传统 OOP 实现到"保存成功"就结束了,这些跨对象的联动关系被忽略了。
本体论建模怎么实现这个闭环?关键就在于借鉴和引用了事件驱动架构的思想。还是物料供货延期的例子:按传统功能实现,调用采购订单对象、执行订单变更方法、返回保存成功,就结束了。但本体论模型里,关键的闭环动作才刚刚开始。
物料供货延期这个数据保存成功后,一定会触发一个"供货延期"的事件。这个事件进入消息流管道,触发相应的规则,比如合同校验、交期承诺检查、销售合同交期是否需要调整。规则执行完后,需要变更合同的关键属性,于是又调用回写 API 执行合同保存,自动完成合同交期的调整。
我把这条链路总结成一句话:逆向闭环——事件到规则、规则到行为、行为到回写 API、回写 API 到更新数据。它刚好是正向"实现业务功能"过程的一个逆向。正向是用户驱动数据落库,逆向是数据变化驱动事件、驱动联动调整。
这个闭环里最核心的一个点就是事件驱动。通过事件驱动反向触发规则,通过规则反向触发数据回写,最终完成自动化的数据调整。虽然本体建模里用的仍然是面向对象那套对象、属性、行为、规则、方法,但事件驱动让它实现了传统 OOP 难以做到的跨对象闭环。
这也是为什么我在后来的本体建模里,把"事件模型"作为一个独立的模型专门拎出来。我一直强调,传统流程驱动模式构建的是长周期事务,而 EDA 事件驱动架构可以通过异步消息机制更好地实现解耦。事件,是把一个个孤立对象本体连接成完整网络的关键纽带。

我的本体模型不是一开始就完整的,它经历了一个明显的迭代生长过程。理解这个过程,有助于理解每个模型存在的必要性。
最早,我基于合同管理场景,让 AI 把需求高度浓缩为四个 Markdown 格式的元模型文件。第一个是对象模型,核心是数据模型,包括数据和数据之间的关系。第二个是行为模型,描述对象能产生哪些行为。第三个是规则模型,定义具体的业务规则。第四个是业务场景和流程模型,描述每个流程会调用哪些对象行为进行组装编排。
这四个元模型本身就构建了一套连接业务和 IT 实现的桥梁。它和传统 MDA 模型驱动的思路高度一致,但又借鉴了本体论和知识图谱的建模思想,更强调对象、行为、规则三者之间的关系——所有业务流程场景,都是对象、行为、规则的灵活组合。
第二次迭代,通过和 AI 大模型的反复交互,整个本体模型进一步扩充。我增加了主体模型、异常补偿模型等关键内容。AI 在深刻理解我的意图后,帮我输出了一个完整的本体论建模规范,并建议用 YAML 文件来更精确地定义本体模型,替代原先较为粗糙的 Markdown。
到最后,这套本体模型体系扩展成了九个维度。除了最初的对象、行为、规则、场景,还增加了:M5 主体模型,定义参与者、角色和权限边界,采用 RBAC 为基础、ABAC 扩展;M6 异常补偿模型,定义行为失败时的 Saga 补偿策略;ME 事件模型,显式定义流转的领域事件;M7 质量约束模型,把性能、一致性、AI 选型等非功能需求绑定到行为和场景;M9 UI 模型,定义页面结构和交互布局。
这九个模型共同构成了一套正交完备的业务语义体系——每个维度描述业务的一个独立关切,互不干扰,可独立演进。它和传统 OWL 知识图谱语义建模有几个关键区别。其一,结合了 EDA 事件驱动思想,通过事件实现对象行为解耦。其二,把规则模型独立出来,让规则可被多个行为复用。其三,增加了场景模型,通过场景实现底层行为规则的动态组装。
这几点改进,让整个本体建模能更好地支撑数据反向驱动业务的能力,也支撑顶层流程场景变化后,通过 AI 大模型动态组装的能力。从四个到九个,不是简单的数量增加,而是把一个业务域的完整语义——存在、行为、约束、流程、参与者、异常、事件、质量、交互——一层层补齐的过程。
有了 YAML 格式的本体模型,我自然想到一个问题:能不能做一个工具,让本体模型可以被编辑、被看见?于是我借助 AI 编程,做了一个本体模型编辑器,前端 TypeScript 加 React,后端 Python 加 Flask。
这里插一句我对 AI 编程工具的真实体感。我实际用过 Codex、GLM、Gemini Pro 和 Claude 等多个大模型来做这件事。最终效果最好、能一次输出成功的只有 Claude。这再次验证了我说过的一句话:在 AI 编程领域,就是 Claude 大模型和其它大模型之分。
这个编辑器打开后,左侧是一棵完整的模型树。先是对象模型,产品、客户、部门、人员、合同都是核心对象。展开合同对象,下面有属性和行为两个子节点:属性是合同编号、名称、责任人、签订时间等;行为类似传统 OOP 的方法,比如录入合同、关闭合同。
我做了一个关键增强:每个行为下面会显示它引用了哪些规则。比如合同录入,引用了合同金额合规性校验、税率合规性校验两个规则。每个规则有详细定义、伪代码表达式、违规提示语。规则模型是独立的一棵树,展开后能看到这个规则当前被哪几个对象、哪几个行为引用。
正是这种节点之间的双向引用关系,让看似一层层展开的树状结构,本质上构建成了一个知识图谱式的网络结构。对象引用规则,规则被多个行为引用,行为触发事件,事件被对象订阅——节点之间纵横交错,形成网络。
事件模型里,每个事件都有两类关键信息:它由哪个对象的行为触发,以及它被哪些对象消费订阅。比如"合同已录入"事件,触发对象是合同,订阅对象是付款条款。通过事件,各个对象本体被完整地连接起来,并实现了关键消息的回写。
场景模型则是完整的业务功能或流程,本质是多个行为、事件、规则之间的组合组装,思路和我讲的 SOA 面向服务架构完全一致。打开"录入合同"场景,可以看到它分为四步:录入合同、等待事件、批量创建付款条款、等待事件。
在编辑器基础上,我又加了一个可视化知识图谱功能。点击后它动态读取模型元数据,把模型转化为动态知识图谱,对象、行为、规则、事件、场景都能展示,还能按类型过滤。更进一步,我让 AI 实现了动态模拟:选择"合同录入流程",点击下一步,逐步演示先创建客户、再创建产品、再创建合同的全过程,连接线上标注调用顺序号。
这样,原本静态的知识网络图就有了时间脉络,把场景对象行为规则的动态调用过程完整地演绎了出来。这个编辑器加可视化图谱,让我对本体建模的工作第一次有了一个看得见、摸得着、可交互的载体。也正是在做这个工具的过程中,一个更大的构想开始在我脑子里成形:本体加 AI,能不能驱动一种全新的应用开发构建范式?
本体建好了,能编辑、能可视化了,但一个更本质的问题浮上来了:本体的推理能力从哪来?我有了完整的对象、行为、规则,面对一个新问题、新场景,谁来基于这套语义做推理?我梳理出当前主要有三种推理范式。
第一种是最传统的 OWL 基于描述逻辑 DL 的语义推理。这是知识图谱的经典路线,通过 SPARQL 加推理机,做语义蕴含、自动分类、一致性验证。它的特点是世界假设为开放世界 OWA,推理类型是演绎推理,逻辑严谨,但在百万三元组级别就开始变慢。
第二种是基于图数据库的查询推理,比如 Neo4j 的 Cypher。它的世界假设是封闭世界 CWA,核心能力是路径遍历、模式匹配,亿级边仍可高效遍历。它有自己形式的"推理":规则推理、变长路径推理表达传递性、以及 PageRank、社区发现等图算法推理。
第三种,也是我最感兴趣的,就是直接使用 AI 大模型本身的自然语义推理。把完整的本体当作结构化上下文喂给大模型,让它基于业务语义去理解问题、生成假设、做出判断。这是一条神经推理的路线,灵活、贴近自然语言,但有它自己的软肋。
这里有一个常被问到的具体问题:把基于 OWL 构建的知识图谱元模型存到图数据库后,还用 DL 推理吗?我的答案是:通常不再用 DL 推理,而是换成图数据库自己的查询范式。但这不是非此即彼的,具体取决于你的目标。
如果你需要严格的 OWL 本体推理,比如类分类、一致性验证,那就保留 Protégé 加推理机,让图数据库做查询加速层。如果以元模型存储加实例查询为主,就用 Neo4j 这类图数据库加 neosemantics 插件。如果是超大规模图加关系挖掘,就用纯图数据库加图算法库。
值得一提的是中间地带:GraphDB、Stardog、Amazon Neptune 这类 RDF 原生图数据库,既能跑 SPARQL 和 OWL 推理,又比传统三元组库有更好的图查询性能。它们最适合那种"不想放弃 DL 推理、但又需要图数据库规模"的场景。三种范式不是互斥的,关键是看你的问题落在哪个区间。
在和 AI 反复推演的过程中,我经历了一次相当深刻的自我纠正,这件事我必须诚实地讲出来,因为它直接改变了我对本体的根本判断。
我最初一个笃定的立场是:OWL 装不下复合业务规则。我列了一堆痛点——对象是静态的没有行为、跨对象的复合规则表达不了、场景化关系表达不了、N 元关系建模很笨拙,再加上开放世界假设和业务规则封闭语义之间的矛盾。我当时的结论是:OWL 不行,得另起炉灶。
但我被纠正了。事实是 OWL 2,尤其是 OWL 2 RL,以及 SHACL,早就把这些表达力补上了。n 元关系可以用具体化、中间类来表达,时序关系有 4D fluents,事件可以建模为类,约束和规则有 SHACL、SWRL、SHACL-AF。我批的其实是"老 OWL",我的出发点在事实层面是错的。
这让我一度有点泄气。但很快我意识到,我那股不满其实是对的,只是我一开始没说对原因。真正的症结不在于 OWL 能不能表达,而在于:这套形式化定义压根不是为 AI 大模型这个新消费者准备的。这是一个从"能不能表达"到"适不适合"的关键转折。
OWL 2 和 SHACL 的语法,是为推理机和校验器优化的,是给机器做逻辑演算用的,不是为"被一个概率模型当上下文读进去"而设计的。它编写成本高、需要专家、可读性差。它提供的"完备",是逻辑可判定意义上的完备,而不是大模型接地所需要的那种"语义清晰加覆盖充分"。
所以我的立场最终落定为:既不是抛弃 OWL,也不是再造一个更强的逻辑系统,而是承认它的边界、更承认它在大模型时代的载体错位。在 AI 时代,传统本体建模方法即使有了 OWL2 和 SHACL,为了方便大模型使用,也需要有所扬弃。
这正好和学界的转向相呼应。这一两年,领域内出现了一个被明确命名的重心转移:从"用 LLM 做本体工程",转向"为 LLM 服务的本体与知识图谱"。在这个阶段,知识图谱作为大模型的外部知识记忆,优先考虑事实覆盖、可扩展性和可维护性,而非纯粹的语义完备性。我摸索出来的方向,恰好在这条路上。

承认了载体错位,那答案是什么?是把推理全交给大模型吗?这里有一个我必须正面面对的内在张力,否则整个主张会塌掉。
张力在于:我那些招牌例子——供应链危险品逐级传播、交易双方国家必须不同、库存低于阈值触发补货——全是复合业务规则。而这些恰恰是最不能简单交给大模型去"推理执行"的那类逻辑。如果指望大模型去应用它们,会立刻继承大模型的三个硬伤:非确定性、规则的静默违反或幻觉、以及缺乏可审计的推理轨迹。
所以我必须把两件被混在一起的事拆开。一件是建模和编写的复杂度,也就是 OWL、SHACL 那套形式化负担,为了大模型友好,扬弃它是合理的。另一件是复合规则的确定性执行,这个不能交给大模型,该留在规则引擎或确定性计算里。两者的边界必须划清楚。
这就引出我对混合推理架构的判断:本体是封闭的精确定义,新问题天然是开放的模糊需求。图数据库推理对本体"忠诚但僵硬",大模型对本体"灵活但不忠诚"。真正有价值的架构,是让两者分工而不是替代。
具体怎么分工?图数据库推理适合"答案在本体里、问题也在本体语言里"的问题,比如找出所有违反规则 R 的实例、判断哪些规则之间存在冲突、查找对象 A 到对象 B 的合法行为路径。大模型推理适合"问题是模糊的、需要先翻译成本体语言或发现本体边界"的问题,比如新场景该组合哪些概念、用户说的"快速审批"对应哪条行为链。
最有价值的架构是:大模型负责理解问题和生成假设,图数据库或规则引擎负责验证假设是否符合本体规则。一个关键洞察是——你的本体越完整,大模型的幻觉风险就越低,因为它有了可以对照的"事实基准"。这正是投入本体建模的真正回报。
我还专门推演过一个工程上的现实问题:本体模型存在图数据库,但业务数据还在传统结构化数据库,这种情况图数据库的推理能力是"空转"的,就像有了完整法律条文却没有具体案件。最务实的解法是按需导入:基于特定场景的触发条件,从结构化库查出数据切片,导入图数据库,再用其推理能力。
按需导入的关键不是"能不能做",而是"切片粒度怎么定"。以"大额贷款审批"为例,触发条件是金额大于 50 万,实体范围是申请人加关联账户加近 6 个月交易加历史申请,推理目标是验证风控规则、找出欺诈模式,推理完成后结论写回业务库、图实例设 TTL 归档。还有最容易被忽略的一步:导入时必须把实例与本体的类定义挂钩,否则导入的只是孤立数据,而不是有语义的实例。
把这些都想清楚之后,我的最终主张就清晰了:本体只做定义,把业务语义说清楚到大模型能用;推理这件事,在确定性的部分交给规则引擎和图数据库,在开放灵活的部分交给大模型。用"可评测"替代"逻辑可判定",用"可追溯"替代"形式化保证",并主动接受非确定性这个取舍。这就是我从本体建模走到推理范式尽头时,得到的那个朴素而坚定的结论。
做完本体编辑器、想清楚推理范式之后,一个更大的构想彻底成形了。它始于一个根本性的问题:能不能用一种比代码更接近业务语义的中间语言,描述一个软件系统的全部知识,然后让 AI 从这套知识中自动派生出可运行的应用?
传统软件开发的核心摩擦在于翻译损耗。业务专家用自然语言描述意图,开发者把它翻译成代码,这个翻译过程充满歧义、反复沟通和理解偏差。需求文档与实际实现的偏差,是软件项目失败的头号原因。更深层的问题是,传统软件的交互核心是 UI 表单,用户必须学会操作软件,而不是软件理解用户。
AI 大模型的出现,让一种新的可能性浮现:如果软件的业务语义被精确地形式化,AI 是否可以成为软件的执行层,而不只是辅助开发的工具?换句话说,AI 能不能同时扮演两个角色——在建造期把语义翻译成代码,在运行期把用户意图翻译成系统行为?
这正是本体模型的用武之地。它恰好就是那套"比代码更接近业务语义的中间语言"。当本体精确表达了业务的全部语义,AI 就可以在两个层面同时发力:建造期把自然语言翻译成本体、把本体翻译成代码;运行期把用户意图翻译成本体行为、把执行结果翻译成自然语言响应。
我把这种新形态叫做"本体模型加 AI 大模型驱动的 AI 原生应用"。它不是"更好的低代码平台",也不是"带 AI 功能的传统应用"。它是一种以语义为核心基础设施的软件新形态——在这种形态下,业务专家和 AI 共同完成软件的定义,AI 和人类共同完成软件的运行。
这个构想的底气,来自前面所有的积累。OBR 三要素让我知道业务语义该怎么拆,事件驱动闭环让我知道对象怎么联动,九个元模型让我知道一个业务域的语义边界在哪,推理范式之争让我想清楚了什么交给确定性引擎、什么交给大模型。AI 原生应用,是这一切的汇聚点。
也是在这个阶段,我和我的架构师同事反复沟通,把这个构想从一个模糊的方向,逐步细化成了一套可落地的架构。核心一句话可以概括:本体加 AI,构建一种驱动应用开发与运行的全新范式。下面我把这套范式的几个关键设计逐一展开。

理解这套新范式的钥匙,是理解本体模型在系统里同时承担的三重角色。同一套本体 YAML,在系统的不同环节扮演完全不同的角色,这正是它作为"唯一真相源"的体现。
第一重角色是业务建模载体。本体模型是业务专家和技术团队的共同语言。业务专家通过自然语言对话与 AI 协作生成本体 YAML,不需要编程能力,只需要业务领域知识。生成的模型经过可视化工作台的人机协同审查确认后,成为整个系统的权威语义定义。
第二重角色是程序生成基础。AI 在建造期读取本体 YAML,自动生成数据库 DDL、API 骨架、权限策略、AI 工具 Schema 等全部程序产物。代码是本体语义的物理实现,不是手工逐行编写的。每一行生成的代码都携带溯源标签,指向它来源的本体模型节点。
第三重角色是 AI 推理知识底座。在运行期,本体模型的语义内容被加载进运行时注册表,作为大模型构建提示词上下文的结构化知识来源。AI 理解用户意图时,注册表提供了实体定义、行为边界、查询范围等精确语义,使 AI 的执行精度和可控性大幅提升。这一重,正好接上了我前面讲的"本体越完整、幻觉越低"。
这三重角色,串成了一个三层飞轮式的架构。
第一层是语义建模层,是整个平台的起点和大脑,包含语义对话引擎、本体抽取引擎和模型协作工作台。语义对话引擎不只是记录需求,而是主动识别歧义、追问边界;本体抽取引擎生成符合规范的元文件并做一致性校验;协作工作台提供可视化的人机协同审查。
第二层是模型驱动生成层,是本体元文件到可运行代码的转换引擎。它不是通用代码生成器,而是严格遵循本体语义的定向生成器:数据层生成器从对象模型派生数据库 Schema,服务层生成器从行为模型派生接口骨架和事件接入,权限层生成器从主体模型派生 RBAC 策略,交互层生成器从场景模型派生意图路由和轻 UI 组件。
第三层是 AI 原生应用运行层,是最终面向用户的形态。它重新定义了人机交互的主路径:自然语言意图是主交互方式,传统 UI 界面退为辅助性的数据呈现和操作确认。三层之间的驱动是单向的——建模层产出元文件,生成层消费元文件产出骨架,运行层基于骨架服务用户;但模型的演进是双向的——运行时的新需求可以反馈回建模层,触发增量更新。
把三层飞轮落成一套完整、可实施的架构,我把它命名为 OntoStack。它的本质主张只有一句话:本体模型是系统的唯一真相源,所有的代码、数据结构、权限策略、交互逻辑,都是本体模型在不同运行维度上的投影。
这个主张有三个推论。建造期,本体由自然语言对话生成,代码由本体派生,人类不再直接编写业务逻辑代码。运行期,用户意图通过语义路由映射到本体行为,系统按本体语义执行,不再依赖固定 UI 表单。演进期,业务变更只修改本体模型,代码和运行时行为自动同步,无需人工回溯代码库。
围绕这个主张,我定了六条设计原则:本体优先,不存在游离于本体之外的业务逻辑;血缘可追,每一行代码、每一条数据都能溯源到本体节点;语义驱动,交互以自然语言为主路径;两端分离,建模态与运行态通过版本化的本体快照对齐;推理分级,确定性逻辑用规则引擎、不确定性逻辑用大模型,两者不混用;渐进可信,关键节点必须人工审查才能推进。
"推理分级"这条,正是我在推理范式之争里得出的结论在架构层的固化。高频、确定性强的逻辑,在建模时预编译成确定性规则由规则引擎执行;大模型推理只用于低频、高复杂度、需要语义判断的场景。这样既守住了合规与可审计,又保留了大模型的灵活性。
云端交付方面,我选择的路线是只维护业务语义、基础设施全部由云平台承载。具体说,无需维护服务器、数据库集群、消息队列等有状态设施;业务逻辑以无状态函数运行,按调用计费、自动弹性;安全、认证、实时消息由 BaaS 平台原生提供;持续集成交付由 DevOps 流水线自动完成。
落到具体技术栈,我选的是 Supabase 作为 BaaS 底座,Edge Functions 跑无状态业务逻辑,配合 DevOps 流水线做注册表的构建与发布。这里有一个关键机制是版本对齐:CI/CD 把本体 YAML 编译成结构化的注册表 JSON,写入存储,Edge Function 冷启动时加载并做模块级缓存,响应时携带本体版本标识。
版本对齐之所以重要,是因为它直接关系到事件溯源的一致性。如果一个业务事件在旧版本本体下被触发,而推理引擎拉取时本体已经更新,就会产生难以追踪的"版本漂移"。我的做法是让事件携带产生它时的本体版本,推理引擎用事件自带的版本去处理,而不是拉取最新版本——这是事件溯源架构里的标准做法。整套云端交付,让"改本体即改系统"从一句口号变成了可工程化的现实。

架构再完整,也需要一个能让人直观理解的载体。所以我设计了一个四阶段的演示原型,把从一句话需求到一个可运行 AI 原生应用的全过程完整地走一遍。这个原型本身,也是一个 AI 原生应用形态的示范。
整个原型采用三栏结构:左侧是阶段导航侧栏,显示当前进度和回退按钮;中间是主工作区,承载每个阶段的核心内容;右侧是全程贯穿、有阶段感知能力的 AI 对话助理。它体现了一个核心理念——Hybrid UI:每个操作都有两种等价方式,既能点按钮,也能对 AI 说话,二者效果完全一样。点击就是说话,说话就是点击。
阶段一是需求确认和需求探索。业务专家用自然语言描述需求,比如"我需要一个合同管理系统,支持开票和收款跟踪"。这句话信息密度很低,存在大量隐含假设。语义对话引擎不会直接生成模型,而是主动追问:合同有哪些核心属性?一个付款阶段能开几次票?谁有权录入、谁有权关闭合同?通过多轮澄清,把隐性知识显性化,最终产出一份需求文档。
阶段二是本体建模。本体抽取引擎基于澄清后的语义,自动生成对象、行为、规则、场景等元文件。以合同管理为例,它会识别出合同、付款条款、开票明细、映射表等核心实体,定义录入合同、录入开票、录入收款等行为,提取税率合规、累计开票上限等规则,组装出履约回款的业务流程。产出以树结构加知识图谱双视图呈现,正是我前面那个编辑器的能力。
阶段三是应用交互原型。AI 基于本体模型和 UI 建模规范,生成完整的可交互原型,用户可以用自然语言调整布局、字段和交互流程。这里有一个我特别强调的约束:阶段三只能调整 UI 层面的东西。如果用户提出"我还需要一个合同审批流程",AI 必须明确提示——这是需求层面的变更,需要回退到阶段一重新确认需求,再重新建模和生成原型。
为什么定这条约束?因为它守护的是单一真相源原则。阶段之间有明确的方向性:可以向前推进,发现根本性问题时可以回退到对应的源头阶段,但绝不能在下游阶段偷偷改上游的东西。需求的问题,必须在需求阶段解决;本体的问题,必须在建模阶段解决。这保证了整条链路的语义一致性。
阶段四是 AI 编程实现与持续交付。AI 基于前三阶段确认的产物,生成完整代码并自动部署。在演示里,这一步用进度动画呈现:解析 UI 规范、生成导航、生成页面骨架、绑定业务行为、配置权限视图,最终交付一个可在浏览器演示的 AI 原生应用。它内置一个 AI 助理,用户可以直接说"查询张三负责的未收款合同",得到结构化的结果。
把这四个阶段连起来看,就完整呈现了我这套范式的全貌:自然语言进,AI 原生应用出,本体模型是贯穿始终的语义脊梁。这套范式不只适用于合同管理。我还推演过电商经营数据分析的版本——本体模型作为连接业务语义和数据库字段的桥梁,配合推理分级(确定性指标用 SQL 算、趋势异常用统计、因果归因用大模型、报告撰写用大模型),让 AI 真正理解数据在说什么,而不只是在做数字游戏。当一个新业务域要接入,只需提供对应的本体 YAML,整套技术栈即可复用。
走到这里,我必须诚实。这套从本体建模到 AI 原生应用的范式,目前更多还是一个有清晰核心主张、有若干原创设计的体系,但它远没有被充分验证。我把自己最纠结、最没想清楚的问题,老老实实列出来,一共八个。
第一,深链推理的可靠性边界。原子规则加组装,在多深的层级、多宽的规则集下还能稳定?大模型在多跳复合规则链上的可靠性本来就差,我需要构造分层级、分规模的评测集,去测定它的衰减曲线,而不是想当然地以为它一直可靠。
第二,精确与大规模约束怎么办。纯大模型做批量精确计算,会不会成为准确率的瓶颈?要不要、以及在多大程度上破例引入一次外部确定性计算来兜底?这一破例就偏离了"纯大模型"的初衷,是我现在最纠结的权衡点。
第三,场景层会不会自己变成新的复杂度。我原本想用场景层来降低复杂度,让系统先匹配场景、再激活相关的对象行为规则子集。但当场景从几个涨到成百上千时,"先匹配场景"这一步本身可能都得引入检索,类似 GraphRAG 的做法。降复杂度的设计,可能在大规模下带来新的复杂度。
第四,上下文塞不下怎么办。大型本体不可能整个丢进上下文,必须按场景做检索式装载。但检索粒度多大合适、检索错了会不会直接把推理带偏,这些我都还没有底。
第五,方差到底能压到什么水平。低温度、结构化输出、自一致性投票,这些手段在业务关键场景下能把不一致压到可接受的程度吗?因此对于AI大模型推理后的置信度这个必须量化,不能只说一句"会好一些"。
第六,"完整"怎么变成可测量的东西。我嘴上说的"覆盖充分、消歧到位",必须落成一套可测的判据,还要建一个能复现的基准。否则"完整业务语义"永远是一个无法证伪的口号。第七,本体和现实会不会越走越远——自然语言定义写着舒服,但它会随业务演进而漂移,怎么保证本体描述始终和真实业务对得上,是个工程治理问题。第八,我的真实增量到底比别人多在哪——GraphRAG、ontology-grounded 抽取、神经符号企业知识图谱都已经在这条线上,我得拿实证去和它们比,老实说清楚边界和真正多出来的那点东西。
列完这八个问题,我反而对本体建模的本质有了一层更冷静的认识。回到文章开头的哲学:本体论关心"是什么",认识论关心"我怎么知道"。我越来越觉得,本体论建模本质上是一个两阶段的认识论过程。
第一阶段,是从现实世界到知识图谱。我们观察一个业务域,把其中的实体、关系、活动识别出来,形成一张描述"有什么、怎么连"的网络。这一步偏归纳,偏经验,是从纷繁的现实里提炼出结构。它回答的是认识论里"我观察到了什么"。
第二阶段,是从知识图谱到本体模型。我们在结构之上进一步抽象,补上行为、规则、事件、场景,把那些隐藏在经验和代码里的动态语义显性化,形成一个能够刻画"为什么会这样、接下来会怎样"的本体。这一步偏演绎,偏形式化,是从结构里提炼出可运转的语义机制。
为什么说这是两阶段?因为这两步对应着不同的认识深度。知识图谱回答了"世界由什么构成、如何关联",停留在本体论的第一个问题;而本体模型进一步回答了"这些事物遵循什么规则、产生什么行为",触及了本体论的第二个问题。从图谱到本体,正是从静态存在走向动态生成的那一跃。
这也解释了我前面那次自我纠正的深层意义。我一开始纠结 OWL 能不能表达,其实是把问题停留在了第一阶段的工具之争上。当我意识到真正的问题是"这套语义为谁服务",我其实是跳到了认识论层面去追问:在 AI 时代,我们该用什么方法去构成一个本体,才能让这个本体真正发挥业务价值。
很多人谈本体论,一直在谈"本体是什么",却很少谈"我们怎么形成一个本体"、"怎么让这个本体真正发挥业务价值"。而后两者,恰恰是认识论、是方法论的问题,也恰恰是更重要的问题。本体论告诉我们世界由对象行为规则构成,但真正难的、真正有价值的,是那套从现实一步步构建出本体、并让它运转起来的方法。
把这一整条线索收束起来,我想说的其实是一件事:我们可能正站在一场软件范式结构性转变的门口。这场转变的本质,是在弥合软件开发中长期存在的三个鸿沟。
第一个是业务语义与代码实现之间的翻译鸿沟。从汇编到高级语言,从瀑布到敏捷,从单体到微服务,每一次范式跃迁的本质都是在降低"人的意图"转化为"机器执行"的摩擦成本。本体模型加 AI,让业务语义第一次可以被精确形式化,并由 AI 直接派生为实现,这条鸿沟有望被真正填平。
第二个是传统 UI 操作与用户真实意图之间的表达鸿沟。过去是软件为主体,用户削足适履地去适应菜单和表单。AI 原生应用倒转了这个关系:用户用自然语言表达意图,系统通过语义路由理解并执行,UI 退化为辅助呈现。软件第一次开始适应用户,而不是反过来。
第三个是静态软件架构与动态业务演进之间的适应鸿沟。传统系统一旦上线,业务一变就要漫长的需求、开发、测试、上线循环。而在本体驱动的范式下,业务变更只需修改本体模型,代码和运行时行为自动同步。软件的边界,从此不再由菜单和表单划定,而由业务的语义本身划定。
本体模型,是这场转变的核心杠杆。它不是文档,而是可执行的语义规范;不是静态的需求说明,而是驱动代码生成和运行时执行的、活的知识表示。它把我从哲学的本体论一路带到了工程的最前沿,而它的根,始终扎在那个朴素的洞察里——事物不是静态的,研究事物要研究它的动态行为和关系。
当然,我也很清楚,这目前还只是一个主张。它能不能立住,不取决于它逻辑上多漂亮,而取决于前面那八个问题里,我能用评测和真实落地回答掉几个。从被纠正的那个错误出发,到承认载体错位,再到把推理交还给大模型、把范式落到 AI 原生应用,这一圈我绕得值得。
最后我想回到 Palantir 给我的最初启发,并把它再往前推一步。Palantir 证明了,给数据补上行为和规则,就能让一家数据公司脱胎换骨成数字原生的引擎。而我相信,当本体遇上 AI 大模型,这种脱胎换骨不该只属于一家公司、一套昂贵的平台,它应该成为我们每一个人构建软件、理解业务的新的、朴素的、可及的方式。
这就是我从本体建模到 AI 原生这一路思考,最想留下的那句话。