Google 近日推出了一款名为 Alpha Geometry 的先进大模型,专注于数学几何领域,其几何学能力已经达到了接近人类奥林匹克数学竞赛金牌得主的水平。值得一提的是,该模型的训练过程并非依赖于现有数据集,而是通过合成数据进行的。
Alpha Geometry 的训练方法颇具创新:它首先生成了十亿个随机几何形状,并深入分析了每个形状中点与线之间的所有关联。
该模型不仅识别了每个形状中的所有证明,还逆向推导出为了得出这些证明可能需要添加的额外几何构造。
根据谷歌的描述,AlphaGeometry 融合了神经网络语言模型和符号推理引擎的长处,构建了一个神经符号系统。这个系统能够协同作业,为复杂的几何定理寻找证明。
类似于心理学中的“快速思考”与“慢速思考”理论,该系统的一部分迅速产生直觉性的见解,而另一部分则进行细致、逻辑的决策过程。
语言模型在快速识别数据中的模式和关系方面表现出色,能够迅速预测可能的结构,但它们通常在严谨推理和决策解释方面有所不足。
相反,符号推理引擎基于形式逻辑,运用明确的规则来得出结论,它们是理性的、可解释的,但在独立处理大规模复杂问题时可能会显得效率低下和不够灵活。
简而言之,大型语言模型迅速提出各种可能性——大胆假设;而推理引擎则负责仔细验证这些快速思考的结果——谨慎求证。
具体到图上这样的一个几何题的例子,大型语言模型提出解决方案,推理引擎进行验证。如果验证失败,系统将继续优化方案或提出新的方案,直至找到最终的解决方案。
这无疑将为人工智能的未来进步,尤其是针对大语言模型可能出现的幻觉问题和数据稀缺的挑战,提供全新的视角和解决策略。
领取专属 10元无门槛券
私享最新 技术干货