首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >火热的本体论背后——警惕本体论和本体建模滥用和过度神话

火热的本体论背后——警惕本体论和本体建模滥用和过度神话

作者头像
人月聊IT
发布2026-06-02 14:36:04
发布2026-06-02 14:36:04
1610
举报

大家好,我是人月聊IT。

这大半年,本体论实在是太火了。我自己也在公众号和视频号里聊了很多期,从西方哲学的本体论,到 Palantir 的本体,到对象行为规则建模,再到本体驱动 AI 原生应用。坦白说,看到这么多人开始重视和研究本体论,包括能找到不少朋友共同研讨,本身是一件好事。

但最近我也越来越不安。因为我发现,本体论正在被捧成一种无所不能的神话,变成了一种能包治百病的灵丹妙药。仿佛任何一个难题,只要套上"本体"两个字,就立刻高大上了,就一定能解决了。

所以今天这篇文章,我想反过来泼一盆冷水。不是否定本体论,而是想认真地划一划它的边界:本体论到底适合解决什么问题,又有哪些场景根本不该硬上本体。讲清楚边界,本体论才不会沦为一个空洞的口号。

一、脱离场景谈本体,是水中月镜中花

我一直坚持一个原则:本体论必须是问题驱动、场景驱动的

也就是说,拿到一个具体的场景,我们要先问一句:这个场景到底适不适合构建本体模型来解决?它是否存在复杂的对象关系、复合的行为规则、大量的约束依赖?是否适合用本体模型结合 AI 大模型去做动态推理?

如果这些问题的答案都是否定的,那就别硬上本体。脱离了具体场景和具体问题去空谈本体论,基本就是水中月、镜中花,看着很美,抓不到手里。

我之前给过一个简单的判断准则:凡是涉及到需要采集大量已有数据,然后基于规则进行分析、预测、推理的场景,往往才是适合本体论的场景。

这句话背后其实藏着两个关键点。第一,预测和推理必须有数据来支撑,而且是高质量的数据,没有数据积累,推理就是无源之水。第二,场景里要有明确的对象、行为、规则、约束定义,但这些规则在不同场景下具体该怎么应用却不清楚,或者说场景千变万化,没办法把算法提前固定死。

恰恰是这第二点,才是 AI 大模型能够充分发挥动态推理优势的地方。如果规则的应用方式是固定的、可以提前写死的,那我直接写代码就好了,根本用不着大模型去"推理"。

二、一个公式,看清本体的位置

为了把这件事讲得更清楚,我提炼了一个简单的公式:

场景问题 → (模型 + 算法) → 结果

这个公式看着简单,但关键在于它把"模型"和"算法"拆成了两件事。

本体论真正解决的,是公式中"模型"这一侧的问题——它把对象、行为、规则、约束显性化,建立起一套完整的业务语义。而 AI 大模型解决的,是"算法"这一侧的问题——当算法无法提前固定时,由大模型基于模型去动态推理出落地的算法。

大量的本体论滥用,恰恰是混淆了这两件事。要么是拿本体去抢"算法早就固定好了"的活,画蛇添足;要么是指望本体模型本身能直接产出"精确结果",缘木求鱼。

想清楚这个公式,我们就能进一步追问:到底什么样的场景,才真正落在本体论的主场里?

三、两个轴,四个象限

我把判断的维度收敛成了两个轴,这样最清楚。

第一个轴,是算法能否预先固定。 能固定的,归到"编程域";不能预先固定、需要根据场景动态组合的,归到"推理域"。

第二个轴,是结果能否容忍一定的置信度。 必须 100% 精确的,本体最多只能辅助编程;能容忍一定置信度的,才谈得上本体加大模型的动态推理。

这里我要特别强调一句:真正区分"本体推理场景"和"本体编程场景"的那条分界线,其实是置信度要求,比"场景是否固定"更根本。 因为"要 100% 精确"这个要求,本身就和"动态推理"互斥——大模型可以降低幻觉,但永远给不了你 100% 的置信度。

这两个轴交叉,就形成了四个象限。而在这四个象限之上,我还要叠一个准入门槛:模型本身是否足够复杂?是否存在大量对象关联、复合规则与约束,并且有高质量数据支撑?如果连这个门槛都过不了,那根本不用看下面的四象限,直接劝退。因为构建本体的目的就是为了后续推理,模型本身都不复杂,也就不具备动态推理的价值。

我们逐个象限来看。

左上象限:本体几乎无关。 算法明确、结果要求精确,这种情况直接输出源代码就好,和本体没什么关系。

右上象限:本体仅辅助编程。 场景在变,但仍然要精确结果。这时本体的价值是驱动 AI 编程、产出精确代码,新场景出现了就再生成新程序去解决。本体的作用是辅助编码,而不是脱离代码去直接动态处理需求。

左下象限:谨慎使用。 能容忍置信度,但算法本可以固定。引入本体能降低幻觉,但并非必需,要权衡投入产出。

右下象限:这才是本体加 AI 动态推理真正的主场。 算法不可预先固定、需要动态组合,同时结果允许一定置信度。只有这一个象限,大模型才能真正基于本体去动态组合算法、推理出落地方案。

你看,四个象限里,只有一个是主场。这就是为什么我说,真正能用上本体动态推理的场景,本来就稀少而难得。

四、四个例子,对号入座

光讲象限太抽象,我用四个常见的例子来对号入座。

例子一:基于标准规范对文档做合规检查。

很多人觉得这是本体的典型场景。但要分情况。如果是规则明确、可枚举的合规检查,比如字段必填、金额是否超上限、税率是否合规,这完全可以用精确的算法处理,没必要强上本体,它落在左上象限。

但有一类合规是语义判断型的,比如"本条款是否构成对消费者的实质性不公平"。规则虽然写在法条里,但能不能套到具体条款上,需要语义推理。这一类就滑到了右下象限,恰恰需要本体加大模型。所以合规检查要拆成"规则可枚举"和"需语义裁量"两半看,不能一刀切。

例子二:智能问数、ChatBI 场景。

这种场景可用,引入本体能极大减少幻觉,但无法做到 100% 无幻觉。所以我把它归为"谨慎使用",落在左下象限。能用,但要清楚它的天花板在哪里。

例子三:基于本体构建 AI Agent 去替代传统业务系统,比如销售系统、合同系统。

我的回答是不可行。销售合同这类系统需要的是精确的算法、精确的结果,差一分钱都不行。本体在这里的作用仍然是去生成代码,而不是脱离代码生成这个环节,直接用大模型加本体去动态处理事务。它落在右上象限,本体辅助编程,仅此而已。

例子四:本身没有复杂对象模型、对象关系和约束的场景。

构建本体意义不大。这种场景连准入门槛都过不了,模型本身不复杂,也就不具备动态推理的价值。强行建本体,纯属为了建而建。

五、几个必须说清楚的边界

把框架讲完,我还想补充几个容易被忽略、但很关键的边界,免得这套判断本身又被用偏。

第一,"模型确定"这个前提,其实比想象中脆弱。 我把右下象限的前提写成"模型很确定",但真实世界里,本体会随业务演进而漂移,自然语言写的定义会和现实越走越远。所以更准确的说法是"模型可被充分刻画且相对稳定"——它需要持续的治理,而不是天然就确定。地基如果是流沙,上面的动态推理也站不稳。

第二,置信度才是那条真正的主线。 前面我反复强调了,再说一遍:很多人纠结"场景固定不固定""算法明确不明确",但真正一刀切下去的,是"结果能不能容忍置信度"。想明白这一条,前面四个象限其实可以用置信度这一根轴串起来。

第三,也是我自己最该坦诚的一点。 我之前基于一个合同管理需求,做过一次完整的端到端验证,用本体模型驱动 AI 编程构建了一个 AI 原生应用。这个应用确实具备业务语义理解、能和用户做自然语言对话。但它的核心,仍然是本体模型驱动 AI 编程、输出精确的源代码,它暂时并没有实现 Palantir 那种数据分析模式下真正的智能推理能力。

我把这句话特意放在这里,因为它恰恰印证了我整篇文章的观点:连我自己最完整的一次实践,目前也主要落在"本体辅助编程"这个象限,而不是"本体驱动动态推理"那个稀有的主场。这不是我的短板,反而是对"主场稀少而难得"最有力的自我印证。

六、回到 Palantir,回到价值本身

说了这么多边界,最后我想回到 Palantir,因为它恰好是那个落在主场里的正面例子。

Palantir 本体论真正解决的,是数据分析类的 OLAP 系统和事务操作类的 OLTP 系统之间的衔接与贯通。它通过本体模型建立了从 OLAP 到 OLTP 的桥梁,通过给传统数据模型补充业务语义,让数据分析能够从结果穿透到行为——既能发现问题,又能追本溯源,还能推理出行动建议,最终把建议通过 Action 回写到业务系统,形成闭环。

它为什么成立?

因为它刚好同时满足我前面说的所有条件:有数据积累支撑;底层模型相当复杂,对象间关联依赖约束很多;算法不固定,往往随场景动态变化,没有明确算法可以提前定义。在 AI 大模型推理之前,最多只能给出一个参考算法,而大模型推理之后形成的,才是真正落地、且可能动态变化的实际算法。这正是右下象限那个主场的标准画像。

所以你看,本体论不是不强大,它在自己的主场里强大得惊人。但也正因为它的主场如此明确,我们才更不该把它当成万能钥匙到处乱插。

本体论不是灵丹妙药,它是一把需要对准特定锁孔的钥匙。看清场景、看清问题、看清那两个轴和那道门槛,本体论才能真正发挥价值,而不是沦为又一个被吹上天、最后摔下来的技术神话。

好了,今天的分享就到这里。

希望对正在研究本体论的朋友有所启发。再见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人月聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、脱离场景谈本体,是水中月镜中花
  • 二、一个公式,看清本体的位置
  • 三、两个轴,四个象限
  • 四、四个例子,对号入座
  • 五、几个必须说清楚的边界
  • 六、回到 Palantir,回到价值本身
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档