首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta 发布 AI 模型,可自主评估其他 AI 模型的工作

据路透社纽约10月18日报道,Facebook 母公司 Meta 于周五发布了一批新的 AI 模型,其中包括一个名为“Self-Taught Evaluator”(自学评估器)的模型,该模型可能减少 AI 开发过程中的人工参与。

今年8月,Meta 在一篇论文中介绍了这款工具,详细解释了它如何依靠与 OpenAI 最新发布的 o1 模型相同的“思维链”技术,对其模型的响应做出可靠的判断。该技术将复杂问题分解成更小的逻辑步骤,似乎提高了对科学、编码和数学等学科中挑战性问题的响应准确性。

Meta 的研究人员使用完全由 AI 生成的数据来训练评估器模型,从而在该阶段也消除了人工输入。

该项目背后的两名 Meta 研究人员告诉路透社,使用 AI 可靠地评估 AI 的能力,让我们看到了构建能够从自身错误中学习的自主 AI 代理的可能途径。

人工智能领域的许多人都将此类代理设想为足够智能的数字助理,无需人工干预即可执行大量任务。

自我改进的模型可以省去目前经常使用的一种昂贵且低效的流程,称为“基于人类反馈的强化学习”(RLHF),该流程需要人工标注员的输入,他们必须具备专业知识才能准确标记数据并验证复杂数学和写作查询的答案是否正确。

“我们希望,随着 AI 变得越来越强,它在检查自己的工作方面会越来越好,这样它实际上会比普通人类更好,”研究人员之一 Jason Weston 说。“自学和自我评估的想法对于达到这种超人类水平的 AI 至关重要,”他说。

包括谷歌和 Anthropic 在内的其他公司也发表了关于 RLAIF(基于人工智能反馈的强化学习)概念的研究。然而,与 Meta 不同的是,这些公司通常不会公开发布他们的模型。

Meta 周五发布的其他 AI 工具包括对其图像识别模型 Segment Anything 的更新、一个可以加快 LLM 响应生成时间的工具,以及可以用来帮助发现新无机材料的数据集。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O1FyW6XRr013BRNI98CgrEyQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券