部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenSPG/KAG V0.7发布,多方面优化提升,事实推理效果领先且构建成本降至11%

OpenSPG/KAG V0.7发布,多方面优化提升,事实推理效果领先且构建成本降至11%

原创
作者头像
可信AI进展
发布于 2025-04-21 03:39:05
发布于 2025-04-21 03:39:05
3330
举报
文章被收录于专栏:社区动态社区动态

总体摘要

我们正式发布KAG 0.7版本,本次更新旨在持续提升大模型利用知识库推理问答的一致性、严谨性和精准性,并引入了多项重要功能特性。

首先,我们对框架进行了全面重构。新增了对staticiterative两种任务规划模式的支持,同时实现了更严谨的推理阶段知识分层机制。此外,新增的multi-executor扩展机制以及MCP协议的接入,使用户能够横向扩展多种符号求解器(如math-executorcypher-executor等)。这些改进不仅帮助用户快速搭建外挂知识库应用以验证创新想法或领域解决方案,还支持用户持续优化KAG Solver的能力,从而进一步提升垂直领域应用的推理严谨性。

其次,我们对产品体验进行了全面优化:在推理阶段新增"简易模式""深度推理"双模式,并支持流式推理输出,显著缩短了用户等待时间;特别值得关注的是,为更好的促进KAG的规模化业务应用,同时也回应社区最为关切的知识构建成本高的问题,本次发布提供了"轻量级构建"模式,如图1中KAG-V0.7LC列所示,我们测试了7B模型做知识构建、72B模型做知识问答的混合方案,在two_wiki、hotpotqa和musique三个榜单上的效果仅小幅下降1.20%、1.90%和3.11%,但十万字文档的构建token成本(参考阿里云百炼定价)从4.63¥减少到0.479¥, 降低89%,可大幅节约用户的时间和资金成本;我们还将发布KAG专用抽取模型和分布式离线批量构建版本,持续压缩模型尺寸提升构建吞吐,以实现单场景百万级甚至千万级文档的日构建能力。

最后,为了更好地推动大模型外挂知识库的业务应用、技术进步和社区交流,我们在KAG仓库的一级目录中新增了open_benchmark目录。该目录内置了各数据集的复现方法,帮助用户复现并提升KAG在各类任务上的效果。未来,我们将持续扩充更多垂直场景的任务数据集,为用户提供更丰富的资源。

除了上述框架和产品优化外,我们还修复了推理和构建阶段的若干Bug。本次更新以Qwen2.5-72B为基础模型,完成了各RAG框架及部分KG数据集的效果对齐。发布的整体榜单效果可参考图1和图2,榜单细节详见open_benchmark部分。

图1 Performance of KAG V0.7 and baselines on Multi-hop QA benchmarks
图1 Performance of KAG V0.7 and baselines on Multi-hop QA benchmarks
图2 Performance of KAG V0.7 and baselines(from OpenKG OneEval) on Knowledge based QA benchmarks
图2 Performance of KAG V0.7 and baselines(from OpenKG OneEval) on Knowledge based QA benchmarks

框架优化

1.静态与动态结合的任务规划

本次发布对KAG-Solver框架的实现进行了优化,为“边推理边检索”、“多场景算法实验”以及“大模型与符号引擎结合(基于MCP协议)”提供了更加灵活的框架支持。

通过Static/Iterative Planner,复杂问题可以被转换为多个Executor之间的有向无环图(DAG),并根据依赖关系逐步求解。框架内置了Static/Iterative Planner的Pipeline实现,并预定义了NaiveRAG Pipeline,方便开发者灵活自定义求解链路。

2.支持可扩展的符号求解器

基于LLM对FunctionCall的支持,我们优化了符号求解器(Executor)的设计,使其在复杂问题规划时能够更合理地匹配相应的求解器。本次更新内置了kag_hybrid_executormath_executorcypher_executor等求解器,同时提供了灵活的扩展机制,支持开发者定义新的求解器以满足个性化需求。

3.显性知识分层及分层检索、推理策略优化 

基于优化后的KAG-Solver框架,我们重写了kag_hybrid_executor的逻辑,实现了更严谨的推理阶段知识分层机制。根据业务场景对知识精准性的要求,按照KAG的知识分层定义,依次检索三层知识:KG_{CS}(基于schema-constraint)、KG_{fr} (基于schema-free)和 KG_{rc}(原始上下文),并在此基础上进行推理生成答案

4.拥抱MCP协议

KAG本次发版实现了对MCP协议的兼容,支持在KAG框架中通过MCP协议引入外部数据源和外部符号求解器。在example目录中,我们内置了baidu_map_mcp示例,供开发者参考使用。

OpenBenchmark

为更好地促进学术交流,加速大模型外挂知识库在企业中的落地和技术进步,KAG在本次发版中发布了更详细的Benchmark复现步骤,并开源了全部代码和数据。这将方便开发者和科研人员复现并对齐各数据集的结果。为了更准确地量化推理效果,我们采用了EM(Exact Match)、F1和LLM_Accuracy等多项评估指标。在原有TwoWiki、Musique、HotpotQA等数据集的基础上,本次更新新增了OpenKG OneEval知识图谱类问答数据集(如AffairQA和PRQA),以分别验证cypher_executor及KAG默认框架的能力。

搭建Benchmark是一个耗时且复杂的工程。在未来的工作中,我们将持续扩充更多Benchmark数据集,并提供针对不同领域的解决方案,进一步提升大模型利用外部知识的准确性、严谨性和一致性。我们也诚邀社区同仁共同参与,携手推进KAG框架在各类任务中的能力提升与实际应用落地。

1.多跳事实问答数据集

1.1 benchMark

  • musique

Method

EM

F1

llm_accuracy

Naive Gen

0.033

0.074

0.083

Naive RAG

0.248

0.357

0.384

HippoRAGV2

0.289

0.404

0.452

PIKE-RAG

0.383

0.498

0.565

KAG-V0.6.1

0.363

0.481

0.547

KAG-V0.7LC

0.379

0.513

0.560

KAG-V0.7

0.385

0.520

0.579

  • hotpotqa 

Method

EM

F1

llm_accuracy

Naive Gen

0.223

0.313

0.342

Naive RAG

0.566

0.704

0.762

HippoRAGV2

0.557

0.694

0.807

PIKE-RAG

0.558

0.686

0.787

KAG-V0.6.1

0.599

0.745

0.841

KAG-V0.7LC

0.600

0.744

0.828

KAG-V0.7L

0.603

0.748

0.844

  • twowiki

Method

EM

F1

llm_accuracy

Naive Gen

0.199

0.310

0.382

Naive RAG

0.448

0.512

0.573

HippoRAGV2

0.542

0.618

0.684

PIKE-RAG

0.63

0.72

0.81

KAG-V0.6.1

0.666

0.755

0.811

KAG-V0.7LC

0.683

0.769

0.826

KAG-V0.7

0.684

0.770

0.836

1.2 各种方法的参数配置

Method

数据集

基模(构建/推理)

向量模型

参数设置

Naive Gen

hippoRAG 论文提供的1万 docs、1千 questions;

qwen2.5-72B

bge-m3

Naive RAG

同上

qwen2.5-72B

bge-m3

num_docs: 10

HippoRAGV2

同上

qwen2.5-72B

bge-m3

retrieval_top_k=200linking_top_k=5max_qa_steps=3qa_top_k=5graph_type=facts_and_sim_passage_node_unidirectionalembedding_batch_size=8

PIKE-RAG

同上

qwen2.5-72B

bge-m3

tagging_llm_temperature: 0.7qa_llm_temperature: 0.0chunk_retrieve_k: 8chunk_retrieve_score_threshold: 0.5atom_retrieve_k: 16atomic_retrieve_score_threshold: 0.2max_num_question: 5num_parallel: 5

KAG-V0.6.1

同上

qwen2.5-72B

bge-m3

参见https://github.com/OpenSPG/KAG/tree/v0.6 examples 各子目录的kag_config.yaml

KAG-V0.7LC

同上

构建:qwen2.5-7B问答:qwen2.5-72B

bge-m3

参见https://github.com/OpenSPG/KAG open_benchmarks 各子目录kag_config.yaml

KAG-V0.7

同上

qwen2.5-72B

bge-m3

参见https://github.com/OpenSPG/KAG open_benchmarks 各子目录kag_config.yaml

2.结构化数据集

PeopleRelQA(人物关系问答) 和 AffairQA(政务问答) 分别是OpenKG OneEval榜单上阿里云天池大赛和浙江大学提供的数据集。KAG通过“语义化建模 + 结构化构图 + NL2Cypher检索”的方式,为垂直领域应用提供了一个简洁的落地范式。未来,我们将围绕大模型与知识引擎的结合,持续优化结构化数据问答的效果。

OpenKG OneEval 榜单的重点在于评估大语言模型(LLM)对各类知识的理解与运用能力。参考OpenKG官方描述,该榜单在知识检索方面采用了较为简单的策略,引入了较多噪声。KAG在这些场景中的指标提升得益于有效的检索策略保证了检索结果与问题之间的相关性。

本次更新中,KAG在AffairQA和PRQA数据集上验证了其针对传统知识图谱类任务的检索与推理能力。未来,KAG将进一步推动Schema的标准化和推理框架的对齐,并发布更多测试指标以支持更广泛的应用场景。

  • PeopleRelQA(人物关系问答)

Method

EM

F1

llm_accuracy

方法论

指标来源

deepseek-v3(OpenKG oneEval))

-

2.60%

-

Dense Retrieval+LLM Generation

OpenKG 公众号

qwen2.5-72B(OpenKG oneEval)

-

2.50%

-

Dense Retrieval+LLM Generation

OpenKG 公众号

GPT-4o(OpenKG oneEval)

-

3.20%

-

Dense Retrieval+LLM Generation

OpenKG 公众号

QWQ-32B(OpenKG oneEval)

-

3.00%

-

Dense Retrieval+LLM Generation

OpenKG 公众号

Grok 3(OpenKG oneEval)

-

4.70%

-

Dense Retrieval+LLM Generation

OpenKG 公众号

KAG-V0.7

45.5%

86.6%

84.8%

基于KAG 框架自定义AffairQA pipeline+ cypher_solver

蚂蚁KAG 团队

  • AffairQA(政务信息问答)

Method

EM

F1

llm_accuracy

方法论

指标提供者

deepseek-v3

-

42.50%

-

Dense Retrieval + LLM Generation

OpenKG 公众号

qwen2.5-72B

-

45.00%

-

Dense Retrieval + LLM Generation

OpenKG 公众号

GPT-4o

-

41.00%

-

Dense Retrieval + LLM Generation

OpenKG 公众号

QWQ-32B

-

45.00%

-

Dense Retrieval + LLM Generation

OpenKG 公众号

Grok 3

-

45.50%

-

Dense Retrieval + LLM Generation

OpenKG 公众号

KAG-V0.7

77.5%

83.1%

88.2%

基于KAG 框架自定义AffairQA pipeline

蚂蚁KAG 团队

➡️ OpenKG 公众号

产品及平台优化

本次更新优化了知识问答的产品体验,用户可访问 KAG 用户手册,在快速开始->产品模式一节,获取我们的语料文件以复现以下视频中的结果。

  • 知识构建Demo
  • 知识问答Demo

1.问答体验优化

通过优化KAG-Solver框架的规划、执行与生成功能,基于Qwen2.5-72B和DeepSeek-V3模型的应用,可实现与DeepSeek-R1相当的深度推理效果。在此基础上,产品新增三项能力:支持推理结果的流式动态输出、实现Markdown格式的图索引自动渲染,以及生成内容与原始文献引用的智能关联功能。

2.支持深度推理与普通检索

新增深度推理开关功能,用户可根据需求灵活启用或关闭,以平衡回答准确率与计算资源消耗;联网搜索的能力当前测试中,请关注KAG框架的后续版本更新。

3.索引构建能力完善

本次更新提升结构化数据导入能力,支持从 CSV、ODPS、SLS 等多种数据源导入结构化数据,优化数据加载流程,提升使用体验;可同时处理"结构化"和"非结构化"数据,满足多样性需求。同时,增强了知识构建的任务管理能力,提供任务调度、执行日志、数据抽样 等功能,便于问题追踪与分析。

后续计划

近期版本迭代中,我们持续致力于持续提升大模型利用外部知识库的能力,实现大模型与符号知识的双向增强和有机融合,不断提升专业场景推理问答的事实性、严谨性和一致性等,我们也将持续发布,不断提升能力的上限,不断推进垂直领域的落地。

致谢

本次发布修复了分层检索模块中的若干问题,在此特别感谢反馈这些问题的社区开发者们。

此次框架升级得到了以下专家和同仁的鼎力支持,我们深表感激:

  • 同济大学:王昊奋教授、王萌教授
  • 中科院计算所:白龙博士
  • 湖南科创信息:研发专家刘玲
  • 开源社区:资深开发者李云鹏
  • 交通银行:研发工程师高晨星
目前 KAG 还处于早期阶段,诚邀对知识服务和知识图谱技术感兴趣的用户和开发者加入我们,共建新一代 AI 引擎框架。我们建立了 OpenSPG 技术交流群,欢迎大家添加小助手微信加入:jqzn-robot。

GitHub

1、OpenSPG github 地址:https://github.com/OpenSPG/openspg

2、KAG github 地址:https://github.com/OpenSPG/KAG

3、KAG 官网文档:https://openspg.github.io/v2/

OpenSPG 和KAG 关系:OpenSPG 是语义增强的可编程知识图谱,KAG 是一个知识增强生成的专业领域知识服务框架,KAG 依赖 OpenSPG 提供的引擎依赖适配、知识索引、逻辑推理等能力。

🌟 欢迎大家 Star 关注~ 

蚂蚁集团-基础智能-知识引擎团队

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
手把手教你安装黑苹果之openCore-0.6.3 EFI制作全过程,非常详细
这篇文章主要是记录自己动手安装Big Sur在过程,和心理。略显繁琐,请自行跳跃观看。
全栈程序员站长
2022/09/12
22.7K0
手把手教你安装黑苹果之openCore-0.6.3 EFI制作全过程,非常详细
史上最全的黑苹果系统「MacOS」安装教程,小白也能秒掌握!
折腾过的人应该不陌生,自从苹果采用 Intel 的处理器,被解锁后可以安装在 Intel CPU 与部分 AMD CPU 的机器上。从而出现了一大批非苹果设备而使用苹果操作系统的机器,被称为黑苹果(Hackintosh)。
全栈程序员站长
2022/07/01
14.9K0
史上最全的黑苹果系统「MacOS」安装教程,小白也能秒掌握!
黑苹果扯犊子篇
近期发布了利用的checkm8漏洞的越狱工具,兼容的设备A7-A11(iPhone 5S~iPhone X)的12.3和以上系统,需要macOS安装软件(官网:https://checkra.in)支持白苹果,黑苹果,据说不支持虚拟机,越狱的教程 我这里就不再复制粘贴了,可以看看别的地方的文章
zby1101
2020/08/05
1.9K0
黑苹果扯犊子篇
【Share】Dell Precision 5510 Mojave Clover分享
首先先感谢 @darkhandz @黑果小兵 @Scottsanett 等大佬的分享
Hyejeong小DD
2018/12/04
5.7K1
【Share】Dell Precision 5510 Mojave Clover分享
Clover引导简明教程
选择 Boot macOS with selected options 启动 出现错误画面拍照发群里寻求帮助。
慕白
2020/01/02
17.3K1
Clover引导简明教程
黑苹果安装手记(一)
自从苹果的电脑采用了Intel的处理器,苹果的系统被黑客破解之后,能安装在Intel CPU与部分AMD CPU上,从而就出现了一大批非苹果电脑的设备,而使用苹果操作系统的机器。这一类就被称为黑苹果(Hackintosh)。简单的说,就是在非苹果电脑上,安装的苹果系统。
简单并不简单
2019/12/17
4.2K0
黑苹果安装手记(一)
技嘉AMD AX370 Gaming K3黑苹果Opencore引导EFI
其实黑苹果对于 reizhi 来说并不是刚需生产力工具,也不算是装逼好玩,只不过是某种情怀使然。想起来很多年前在 AMD 速龙2上折腾黑苹果的经历,不禁让人感叹 Clover 时代黑苹果的门槛降低了很多(当然也离不开各路大神对于驱动的贡献)。虽然目前 AMD Ryzen 平台使用 Clover 引导也还好好的,不过并不支持 macOS 10.15.2 及以上。所以只好还是向 Opencore 寻求解决方案。不得不说 Opencore 目前处在起步阶段,配置起来要比 Clover 麻烦得多。
reizhi
2022/09/26
1.3K0
技嘉AMD AX370 Gaming K3黑苹果Opencore引导EFI
杂项-黑苹果安装教程「建议收藏」
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/138553.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/23
5.1K0
黑苹果安装手记(二)
小编也是小白,现学现卖,现在仅能到把自己电脑的驱动都完善了,于是小编也写一下自己安装的过程,希望能让像我一样的小白同学也能装上黑苹果。
简单并不简单
2019/12/20
2.5K0
浅谈 Mac 黑苹果 Hackintosh 安装使用
这次我们聊下 MacOS,因为最近给笔记本(intel/nvidia)和台式机(amd/ati)吃上了黑苹果,也就是用上了 Mac OS 苹果电脑系统。很久以前就想过搞个 mac 玩一下,那时候没那个精力去搞事(其实还是懒)简单弄了个虚拟机苹果玩了下,体验极差!后来一想干脆算了,可能最后苹果吃不成还把现有系统搭进去都有可能hhh?.. 所以后面一直没搞过,win10随着时间的迭代也逐渐完善起来之后就更没有上苹果的想法了嗯。
2Broear
2024/03/12
3090
浅谈 Mac 黑苹果 Hackintosh 安装使用
HP暗影精灵3黑苹果基本完工
闲暇之余,又一次给暗影精灵3,装上了黑苹果(MacOS 10.14.5)。实现完美电源管理,以及不插电开机(暗影精灵系列的朋友,装过黑苹果的应该知道意味着什么)。并将efi以及补丁发布出来,以便相同的笔记本可以安装。
Bess Croft
2020/04/03
4.4K2
完美黑苹果功能自检手册
很多朋友自己鼓捣完黑苹果或者花钱请被人帮忙安装好黑苹果后,并不清楚目前自己的黑苹果完美度是多少。因此分享一下我心目中完美的黑苹果各项功能自检列表,看看您的黑苹果完美度有多少。
轩辕镜像
2024/09/29
2K0
完美黑苹果功能自检手册
OpenCore引导黑苹果
OpenCore(OC)是一种新的引导方式,随着越来越多的kexts开始放弃Clover, 我相信提早使用OC会对你未来使用黑苹果会有很大的帮助。这是一个自然的现象,就像变色龙被Clover淘汰,而现在OC代替Clover也是大势所趋。你应该需要看一些相关的文章,来帮助你理解我的正文内容,同时也需要下载我推荐的软件:
用户6808043
2022/02/25
2.1K0
安装CLOVER引导器到硬盘EFI分区
彻底脱离CLOVER引导U盘 目录: 1使用EFI TOOLS Clover 安装CLOVER引导器到EFI分区。 2使用Clover v2.3k rXXXX.pkg 安装CLOVER引导器到EFI分区 前言 我们的电脑里已经安装好了双系统,但是之前都是通过启动CLOVER引导U盘进行引导双系统的。 本章节内容,将简单的介绍将在MAC系统(=OSX系统)下将CLOVER引导器安装到硬盘EFI分区。至于WIN系统下,由于过程比较繁琐,再加上没有太多的必要性。因此本章节只讲解在MAC系统下。
全栈程序员站长
2022/07/23
5.6K0
安装CLOVER引导器到硬盘EFI分区
黑苹果,你准备好了吗
黑苹果、是把苹果公司出品的macOS操作系统在x86架构的非苹果电脑上运行的黑客协作计划。此计划的构思始于2005年6月的苹果全球开发者大会(WWDC 2005),当时苹果宣布他们将把其个人电脑从PowerPC架构转向英特尔架构。
海哥@开发
2022/04/06
1.3K0
黑苹果,你准备好了吗
联想Z470黑化之路:硬件升级还能刷苹果Mac系统!
11年入手了一台联想Z470,到现在也有些年头了,当年是看中了它的外观,现在想来性能是它的短板。然而为了工作需要,我便又购置了一台高性能电脑。现如今便想着怎么处理这台小Z,有人建议当废品出售,但无论如何它都跟了我这么多年,舍弃有些不忍。抱着勤俭持家的态度,我便狠了狠心决定多花点钱,将它全面更新升级。在上网找了些资料后,便开始整理思路,汇总如下: 更新内容:将原有部分硬件换新(声卡、网卡、外壳、键盘等) 升级内容:内存加到8G,添加固态硬盘 系统更换:黑化之苹果系统 这其中最繁琐的要数装黑苹果系统,技术含量
FB客服
2018/02/28
2.7K0
联想Z470黑化之路:硬件升级还能刷苹果Mac系统!
OC简要配置说明(旧)已修正
注意事项:OC对于有依赖的SSDT/KEXT加载顺序有严格要求,注意在config配置中的顺序。 主要适用于UEFI启动的电脑。 本文当前写作时OC正式版为0.5.9,0.6.0测试版。以下的配置适用于这两个版本,后续OC的更新可能会有些许改动,到时候应该再参考官方文档进行修改。
GOOPHER
2022/03/31
8.5K0
OC简要配置说明(旧)已修正
黑苹果安装教程OC引导「建议收藏」
首先声明,我也是小白,只是总结一下我安装黑苹果过程中参考过的教程。 以下内容如有帮助本人深感欣慰。
全栈程序员站长
2022/06/28
15.2K0
黑苹果安装教程OC引导「建议收藏」
黑苹果完整安装教程,内含后续系统优化「建议收藏」
这类主讲装双系统,VM虚拟机参考博客https://www.jianshu.com/p/5f10473f9047 虚拟机下载:https://www.vmware.com/go/getworkstation-win 秘钥:YG5H2-ANZ0H-M8ERY-TXZZZ-YKRV
全栈程序员站长
2022/08/28
7.9K0
黑苹果完整安装教程,内含后续系统优化「建议收藏」
记一次黑苹果的安装
最近老高的MBP和MACmini卡的不行,想换硬件吧,硬件直接焊死,简直良心苹果,参考了很多黑苹果的安装贴后果断决定在我的台式机上安装最新版的macOS-High-Sierra-10.13.6,系统选择的是【黑果小兵】,确实好用,老高十分推荐!
老高的技术博客
2022/12/28
2.1K0
记一次黑苹果的安装
推荐阅读
相关推荐
手把手教你安装黑苹果之openCore-0.6.3 EFI制作全过程,非常详细
更多 >
LV.1
这个人很懒,什么都没有留下~
目录
  • ​总体摘要
  • 框架优化
    • 1.静态与动态结合的任务规划
    • 2.支持可扩展的符号求解器
    • 3.显性知识分层及分层检索、推理策略优化 
    • 4.拥抱MCP协议
  • OpenBenchmark
    • 1.多跳事实问答数据集
      • 1.1 benchMark
      • 1.2 各种方法的参数配置
    • 2.结构化数据集
  • 产品及平台优化
    • 1.问答体验优化
    • 2.支持深度推理与普通检索
    • 3.索引构建能力完善
  • 后续计划
  • 致谢
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档