Coral协议在GAIA基准测试中以34%的性能优势击败某机构支持的Magnetic-UI系统,证明水平扩展(horizontal scaling)将成为智能体AI的未来发展方向。这一成果并非通过构建更大模型实现,而是通过协调多个小型专业模型完成。
GAIA是人工智能领域最严苛的测试之一,评估AI模型解决复杂现实问题的能力,涵盖450项高阶任务:
与测试记忆力的MMLU或逻辑谜题GSM8K不同,GAIA模拟通用AI助手场景,更能反映实际应用价值。
Coral是一个开源基础设施,其核心为多智能体协作框架:
该架构受CAMEL的OWL框架启发,但通过去中心化协调和互操作性设计实现突破。
开发者可通过Coral协议实现:
文档入口:https://docs.coralprotocol.org/CoralDoc/Introduction/WhatisCoralProtocol
Coral的成果标志着AI发展重点从参数规模转向系统级智能:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。