第 11 章:本体论、知识图谱与数据库的区别

学本体论时,很容易把它和数据库、知识图谱混在一起。三者确实有关,但不是一回事。

最简单的区分是:

数据库保存数据,知识图谱保存实体关系,本体论定义对象世界的语义、类别、规则和约束。

数据库更像仓库。它关心数据如何存储、查询、更新。比如客户表、订单表、产品表、交易记录、日志数据。数据库很重要,但数据库本身不一定理解这些数据是什么意思。

知识图谱更像关系网络。它关心实体之间的连接。比如某个人属于某家公司,某家公司投资了另一家公司,某个产品使用某项技术,某个客户购买某个服务。知识图谱比数据库多了关系表达,但它也未必完整定义规则、权限、状态和操作逻辑。

本体论更像世界模型。它不仅问有哪些实体和关系,还问:这些对象属于什么类别?哪些属性重要?关系是什么意思?状态如何变化?什么规则约束操作?哪些推理成立?谁能改变对象?改变后触发什么流程?

这就是为什么 Palantir 的 ontology 不是普通数据库,也不是普通知识图谱。

如果只是数据库,Palantir 的价值就是把不同系统的数据接在一起。但现实中,企业早就有很多数据仓库、BI 工具、数据湖。问题不是没有数据,而是数据和现实行动之间断开。

如果只是知识图谱,Palantir 的价值就是把实体关系画出来。但企业真正需要的不只是“知道谁和谁有关”,而是能围绕对象状态做决策、分配权限、触发工作流、执行行动。

Operational ontology 的关键在 operational。它不是静态知识结构,而是能服务行动的对象系统。

比如在供应链场景中:

数据库可以记录订单、库存、供应商、运输路线。

知识图谱可以显示某个订单依赖某个供应商,某个供应商位于某个地区,某条路线经过某个港口。

本体论则要进一步定义:订单是什么状态?库存低到什么程度触发风险?谁有权限更换供应商?替代路线会影响哪些客户承诺?如果延误超过某个阈值,系统应该通知谁?AI 可以建议什么,不能自动执行什么?

这就是差异。

公司研究里,也不能把“有数据”误判成“理解对象”。很多公司说自己有大量数据,但数据本身不是护城河。关键是:数据是否映射到关键对象?是否有语义?是否能更新状态?是否能触发行动?是否能改进产品?是否有权限和规则保护?

同样,也不能把“有知识图谱”误判成“有本体论”。知识图谱如果只是实体关系展示,可能只是高级地图。本体论必须更进一步:它要定义对象类别、属性、状态、规则、约束、推理和操作。

AI 时代,这个区别会越来越重要。

大模型可以生成语言,但要进入企业,就必须接入真实对象世界。企业不能让 AI 在一堆无语义的数据表里随便猜,也不能只给 AI 一张静态关系图。AI 需要知道对象是什么、状态是什么、能做什么、不能做什么、改了以后影响谁。

所以,企业 AI 的落地路径很可能是:

数据层 → 语义层 → 对象层 → 工作流层 → 行动层。

数据库主要在数据层。知识图谱主要在语义关系层。本体论则跨越对象层、规则层和工作流层。它让 AI 从“读数据”走向“理解业务对象”,再走向“安全行动”。

这对公司研究也有启发。以后看 AI 企业软件公司,不要只问它有没有数据接入、有没有大模型、有没有智能问答,而要问:

  1. 它有没有定义客户真实对象?
  2. 它有没有统一语义?
  3. 它有没有对象状态?
  4. 它有没有权限、规则和约束?
  5. 它有没有进入工作流?
  6. 它是否让 AI 能安全改变对象状态?

如果没有,它可能只是“数据 + 聊天”;如果有,它才可能成为企业 AI 的操作层。

我们也可以用一个比喻收束:

  • 数据库像仓库,东西放得整齐;
  • 知识图谱像地图,告诉你谁和谁连接;
  • 本体论像操作系统,定义对象、规则、权限和行动方式。

当然,这个比喻不完美,但够用。

最后压缩:

数据库让数据可存取,知识图谱让关系可看见,本体论让对象世界可理解、可推理、可操作。

公司研究里,如果一家公司只拥有数据,不等于拥有本体论;只画出关系,不等于能改变现实工作流。真正值钱的是:它是否把客户现实世界变成了一个可以被人和 AI 共同操作的对象系统。