首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

可以证明数学定理的AI大模型:LLEMMA(开源)

数学是一门基于严格的逻辑和证明的学科,它要求对概念和结构有清晰和精确的定义和理解。AI则是一门基于数据和统计的学科,它要求对现象和规律有有效和近似的描述和预测。

这两者之间存在着一定的差异,那么AI真的无法应用数学吗?

很多人不相信,所以有这么一个团队推出了针对数学领域的AI大模型:LLEMMA

LLEMMA是什么?

LLEMMA是一个由EleutherAI团队开发的大型语言模型,专门用于数学领域。

它是在Code Llama的基础上继续预训练的,使用了Proof-Pile-2这个包含了科学论文、网页数据和数学代码的混合数据集。

LLEMMA在MATH基准测试中超越了所有已知的开放的基础模型,以及未发布的Minerva模型套件(在相同参数数量的情况下)。

而且,LLEMMA还能够使用计算器、计算机代数系统和形式定理证明器等工具来解决问题,而不需要任何进一步的微调。

下面是一个针对 MATH 基准问题的 Llemma 34B 解决方案:

LLEMMA项目的亮点是,它将所有的模型、数据和代码都开源了,让任何人都可以下载、使用和改进。LLEMMA有7亿和34亿参数的两个版本,分别占用约2.5GB和12GB的内存空间。

它们可以在个人电脑上运行,不需要联网或者使用云服务。这意味着你可以随时随地和LLEMMA进行数学对话,无论是出于学习、研究还是娱乐的目的。

开源代码地址:

https://github.com/EleutherAI/math-lm

https://blog.eleuther.ai/llemma/

论文地址:

https://arxiv.org/abs/2310.10631

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OHg9rOnTtYsTmB3ORjZQhnRA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券