首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI代理让计算化学走向大众:从专家专属到人人可用的范式转变

AI代理让计算化学走向大众:从专家专属到人人可用的范式转变

作者头像
MindDance
发布2026-01-22 12:22:10
发布2026-01-22 12:22:10
1490
举报

大语言模型正在驱动新一代AI代理的诞生,这些代理有望将计算化学从专业领域转变为任何研究者都能使用的工具。2025年,多个自主计算化学框架相继发布——El Agente、Aitomia、Dreams 和 ChemGraph——它们共同的愿景是打破领域壁垒,让量子化学计算不再依赖于编辑复杂的输入文件,而是通过自然语言对话完成。这场变革背后是 LLM 技术的突破、机器学习原子间势的成熟,以及开源文化的兴起。本文将带您了解这些平台如何改变计算化学的未来。

作者;Julia Robinson(原载《Chemistry World》2026年)

1. 计算化学的新时代

计算化学正进入一个崭新的时代。大语言模型的崛起催生了人工智能代理的出现,这些代理有可能将计算化学从专家保留的领域转变为任何有兴趣的人都能使用的工具。

2025年,多篇预印本论文展示了用于计算化学和量子化学的新型代理框架。开发这些平台的每个团队都有自己的个人动机,但他们共同的愿望是让这一领域走向大众化

多伦多大学化学与计算机科学教授、El Agente 开发实验室的联合主任 Alán Aspuru-Guzik 表示:世界总是存在两股力量——精英主义和大众化。为什么我要把计算化学限制在那些训练有素、能够编辑这些——说实话——古老且糟糕的文本文件的人手中? 这是因为人们只是遵循传统,他们没有足够的创造力去重新思考整个系统。

2. 个人动机:打破壁垒的初心

2.1 资源匮乏与语言障碍

这一新型AI代理通过用户的自然语言与其对话,自主解决特定的计算化学和量子化学问题。这些平台能够理解一般性的科学查询,并将其分解为步骤,选择合适的工具,然后在用户最小干预下解决问题。

对于一些开发者来说,他们希望让这个领域更广泛地为人所用,源于他们作为年轻研究者试图进入计算化学时所面临的障碍。

厦门大学理论化学教授、AI驱动平台 Aitomia 的首席研究员 Pavlo O Dral 在乌克兰长大,那里的资源极其有限,他不得不自己购买计算机才能开始学习计算化学。那不是最先进的设备, 他说。

Dral 将拥有丰富资源的研究小组与资源匮乏小组之间的差距描述为一个大问题。如果团队拥有大量资源,他们就能做最先进的科学研究;如果你是一个小团队,处于不太富裕的环境中,这就是一个巨大的障碍。

多伦多大学助理教授、与 Aspuru-Guzik 共同领导 El Agente 实验室的 Varinia Bernales 在她的祖国智利面临着严重的语言障碍。那是一个小国家,英语不是主要语言,我们被自然地理隔离,所以很艰难, 她回忆道。在大学阶段,读英文书籍都是一种挣扎……我不得不给人们发邮件索取论文,我很难读懂它们,所以花了很长时间。

2.2 即便有资源,掌握也不易

拥有合适的资源,不一定就能让计算化学更容易掌握。

化学家通常需要花费数年时间来掌握必要的软件,建立导航庞大且日益复杂的工具阵列所需的专业知识,以及准确解释结果。许多工作流程还依赖于高性能计算资源,而这些资源对于实验化学家和学生来说并不容易获得。

密歇根大学机械与航空航天工程专家、Dreams(基于密度泛函理论的代理材料筛选研究引擎)研究者之一 Venkat Viswanathan 表示:如果你看材料模拟和发现领域,人们要花很长时间——也许两到三年——把所有精力都花在弄清楚如何运行哪怕一次高质量的计算上,这相当耗时。

阿贡国家实验室的计算科学家、代理框架 ChemGraph 的开发者之一 Murat Keçeli 说:计算化学已经发展了很多,但它对化学研究的影响并没有达到应有的程度,其中一个原因是应用这些庞大工具阵列的难度,这往往需要专业知识和大量的计算资源。

3. 四大平台:重塑计算化学的未来

El Agente、Aitomia、ChemGraph 和 Dreams 是四个准备改变我们进行计算化学和量子化学方式的代理框架。

3.1 Aitomia:快速且高精度的机器学习驱动平台

团队:由厦门大学 Pavlo O Dral 领导的九名研究人员。

状态:自2025年5月11日起公开可用(http://mlatom.com/aitomia/)。

功能:Aitomia 协助研究人员完成工作的所有阶段,从设置计算、提供可能的选项、自动执行模拟,到帮助以可理解和可重复使用的格式分析结果。它支持广泛的AI驱动的原子和量子化学方法,能够进行基本计算,如能量计算、几何优化、分子动力学、热化学、反应和光谱模拟。

Dral 解释说:在底层,我们不使用纯量子力学方法。我们使用在大量量子力学数据上训练的机器学习模型,因此它能以高精度产生这些结果,但因为是机器学习,所以也非常非常快。

示例用户查询:计算乙烯与1,3-丁二烯之间 Diels-Alder 反应的热力学性质。

Aitomia 团队合影
Aitomia 团队合影

Aitomia 团队合影

3.2 ChemGraph:面向开发者与初学者的多层次接口

团队:阿贡国家实验室的 Murat Keçeli 领导的三名核心成员,以及来自全球的10多名合作者。

状态:代码可通过 GitHub 获取(https://github.com/argonne-lcf/ChemGraph)。

功能:ChemGraph 将自然语言处理与机器学习势能结合,执行一系列计算化学任务,从 SMILES 字符串和分子结构生成到几何优化、振动分析和热化学计算。

Keçeli 说:我们的目标是任何对学习计算化学感兴趣的人都应该能够使用它。我们有一个更偏向开发者的命令行界面,但我们也有图形用户界面,即使是想学习计算化学的本科生也能轻松管理。

示例用户查询:使用 MACE-MP 在400K温度下计算甲烷燃烧反应的反应焓。

ChemGraph 团队成员照片
ChemGraph 团队成员照片

ChemGraph 团队成员照片

3.3 Dreams:高通量、高保真的多代理DFT框架

团队:密歇根大学由 Venkat Viswanathan 领导的五人团队。

状态:代码可通过 GitHub 获取(https://github.com/BattModels/material_agent)。

功能:Dreams 是用于DFT模拟的多代理框架,将中央LLM规划代理与领域特定的LLM代理结合起来,用于原子结构生成、系统化DFT收敛测试、高性能计算调度和错误处理。共享画布帮助LLM代理构建讨论、保留上下文并防止幻觉。研究人员将其描述为通往大众化、高通量、高保真计算材料发现的可扩展路径

Viswanathan 说:这是一个全知的基础模型,能够协调计算性质的任务。它有一个知道如何运行代码的计算代理,有一个知道需要多少计算资源、多少时间、多少内存的HPC集群代理。然后你有一个验证代理,决定它是否达到了正确的精度水平。

示例用户查询:层状结构的钴酸锂的晶格常数是多少?

Dreams 团队户外合影
Dreams 团队户外合影

Dreams 团队户外合影

3.4 El Agente:高度自主的分层代理网络

团队:多伦多大学约27名研究人员,由 Alán Aspuru-Guzik 和 Varinia Bernales 领导。

状态:处于 alpha 测试阶段(https://www.elagente.ca/)。

工作原理:El Agente 采用基于 LLM 的专业化代理的分层网络,每个代理都配备了广泛的可用工具列表。这种层级结构有效地过滤掉每个代理的无关上下文,显著增强整个系统的决策性能,通过反馈循环实现复杂的规划和任务执行。

Bernales 说:我们的目标是拥有一个能够生成和验证假设并与你在实验室合作的科学家。我们与其他平台的区别在于,我们具有自主性、适应性、错误恢复、故障排除等水平,基本上不需要人工干预。我们有一个交互模式,你可以干预,或者如果你想让代理完成整个工作并正确完成,它也可以做到。

示例用户查询:在给定的有机金属催化剂上生成并优化CO₂还原的关键中间体,追踪成键和电荷如何沿反应路径演化。

El Agente 团队在历史建筑前的合影
El Agente 团队在历史建筑前的合影

El Agente 团队在历史建筑前的合影

4. 代理崛起的技术基础

4.1 大语言模型的关键作用

这些下一代代理模型现在涌现的最大因素之一是 ChatGPT 和 DeepSeek 等大语言模型的出现。LLM 在自然语言理解、推理和任务执行方面展现了广泛的能力,使其非常适合指导复杂的工作流程。

Bernales 解释说:代理自1990年代以来就存在了,但它们是基于规则的系统。现在的不同之处在于驱动这些代理的 LLM。

Keçeli 解释说,LLM 有助于创建自然语言或聊天界面,他说这将成为所有计算化学程序的常态。我们的主要任务应该是摆除这种关于特定领域或特定程序语法的障碍——借助 LLM,这一切都可以被泛化为自然语言界面。

4.2 AI推理模型与机器学习势能

对于 Viswanathan 和他的团队来说,他们发现对 Dreams 开发至关重要的主要元素之一是AI推理模型的出现。AI推理模型对于能够规划这类复杂任务至关重要,否则你可以做一些简单的事情,但随后它会在做任何复杂事情时卡住。

总体而言,他解释说,代理工具在过去一年中取得了巨大飞跃。如果你一年前告诉我我们可以做到这一点,我会说不可能!这真的是非凡的时代——那些能够使用它的人,确实就像拥有了超能力。

Keçeli 说,过去10到15年来一直在发展的机器学习原子间势是 ChemGraph 的另一个关键发展。AI 给计算化学世界带来了巨大的技术突破,因为你不需要一直求解薛定谔方程——这是所有量子化学中最耗时的部分。

原子间势能带给我们的是,如果你已经有一个由高精度计算组成的数据集,然后你在此基础上训练机器学习方法,你就能使用它来代替自己求解薛定谔方程。

4.3 文化转变与开源生态

总体而言,Bernales 说,人们对计算化学的看法也发生了转变,她说自己亲身经历了这种演变。从我作为本科生的早期,当时人们根本不信任计算结果,到我在陶氏化学公司工作期间,我的角色是使用现在被认为相当标准的技术来促进催化剂发现。

这当然是由硬件带来的计算效率和可访问性使之成为可能,并且显著受益于向开源的文化转变,包括代码、出版物和传播途径。

5. 挑战与解决方案

5.1 成本与多代理架构

当然,正如开辟新道路时的常态,每个团队在旅程中都经历了障碍。而且,随着AI的快速发展,挑战通常会像新挑战出现一样迅速得到解决。

对于 ChemGraph 来说,团队面临的一个主要问题是模型的成本,因此他们一直在努力尽可能降低成本,同时不限制平台的功能。Keçeli 解释说:这就是为什么我们不主张单一代理框架,而是主张具有不同代理的多代理框架;较小的语言模型可以完成更简单的任务,如果你想要更多推理,你可以在某些任务中使用大型语言模型。通过组合这些,我们将减少大型语言模型的令牌使用量,并显著降低成本。

5.2 精度与幻觉问题

对于其他团队来说,精度和幻觉问题——即不正确的信息被呈现为事实——要求他们在进行过程中进行调整,有时甚至不得不从头开始重写工具。

Viswanathan 说:大型语言模型的问题是也许99%是好的,但偶尔会有那1%做错。但在科学中,你不能有那1%。

Aspuru-Guzik 说,挑战和问题不断出现,但随着他们修复这些问题,平台也在变得更好。它过去像本科生,现在几乎像研究生了。但当我们发布时,我们希望它尽可能好。 他解释说,我们团队很酷的地方在于,我们正在研究层面构建大量工具,我们将随着时间的推移将它们添加到 El Agente 中。在发布时我们会有惊喜!

5.3 可持续性与能源消耗

虽然涉及AI时有关于可持续性的重要考虑——Aspuru-Guzik 说这让他夜不能寐。他认为 El Agente 有责任告诉用户他们的查询使用了多少二氧化碳,但也指出用户应该对他们如何使用AI更加谨慎。问题是,你想使用 ChatGPT 生成一些愚蠢的东西吗?我认为为你的研究模拟一个分子要重要得多。就像超级计算一样,重要的是你用它做什么。

Viswanathan 说,这些平台尽可能地具有计算效率很重要,但指出计算化学总体上是极其耗能的。欧洲的所有超级计算机、北美的所有超级计算机,约30%到40%仅用于DFT计算或量子化学计算。 如果你在那里放入代理工作流,它使用的资源量就会激增。

然而,随着更多人转向AI进行量子化学计算,这可能会提高其工作流程的整体效率。随着这种方法的增长,一些研究人员甚至宣告DFT的死亡——尽管 Aspuru-Guzik 不同意。DFT 还没有死,但 DFT 被代理永远改变了,因为你不会再通过编写输入文件来做 DFT,你将通过用你的母语交谈来做 DFT——DFT 被大众化了——DFT 是属于人民的。

Dral 解释说,在小型商用硬件上运行的较小 LLM 使用的能源要少得多,正变得越来越能够执行复杂的工作流程,因此未来可能有选择切换到它们的选项,这有助于减少碳足迹。

每个月都有更新、更好的模型——我们去年测试的以前的模型不是很好,所以我们切换回了完整模型。 他解释说,但现在,出现的最新模型越来越好——就电力消耗而言,与典型的台式计算机相比,并没有增加太多。

5.4 安全性与开放性的平衡

另一个问题是安全性和安全保障,以及希望开放和透明但又不希望平台被滥用之间的张力。对于 El Agente 来说,这意味着至少目前不会发布代码。这还有一个额外的好处,使他们能够在进行过程中修改代码。这给了我们一个机会,在不让人们看到我们凌乱代码的情况下进行实验, Aspuru-Guzik 说。一旦我们准备好,我们会发布其中的一部分。

对于 Keçeli 来说,安全性还在于确保工具尽可能准确和可靠地工作。浪费人们的时间也是对研究的伤害——这些是将要使用你的工具的科学家,他们的时间是宝贵的——评估你所使用的任何AI技术在实际用例中的性能非常重要。

6. 计算化学的未来图景

6.1 让实验化学家独立解决问题

各团队对计算化学的未来以及他们的平台将如何为之做出贡献都有自己的想法。

Keçeli 希望实验化学家使用 ChemGraph 独立解决他们可能会犹豫向他人询问的问题。我希望当他们能够以简单的方式访问这些工具时,他们将更快地解决重要问题。

这一愿望得到了 Aspuru-Guzik 的认同,他希望 El Agente 能够帮助实验人员进行日常研究,产生可信赖的可靠结果。然而,从长远来看,他对看到平台如何发展成为更智能的版本,并最终成为社会中的良善代理感到兴奋。我们有一个很酷的功能,我们希望在发布前拥有,每次你完成时,它会告诉你,哦,你刚刚计算了这个分子。你想了解更多关于它的安全性吗?

6.2 代理网络与跨平台协作

终极未来是代理之间相互对话的网络,所以我们的代理可以与所有其他代理对话, Aspuru-Guzik 说。这不仅仅是关于一个平台独有的代理网络,Bernales 说他们的目标之一是建立一个社区,其中所有平台——Dreams、Aitomia、ChemGraph 和 El Agente 以及其他平台——都可以协同工作。为什么不整合这些,让每个人都能以不同的方式做出贡献呢? 她问道。

Viswanathan 同意,指出连接这些并行努力,甚至可能将它们与同样在发展能力的自主实验室整合,可以显著加速材料科学的创新。如果你发明了一种新材料,从发明到商业化的时间跨度,跨学科平均约为18年。因此,目标是这可以大幅缩短这个时间。

6.3 从专家到全人类

所有四个平台的开发者都希望向几乎任何对计算化学感兴趣的人开放该领域,而不要求用户在该领域接受正式培训。AI系统的美妙之处意味着平台将不断升级,以改善和扩展用户体验。

Aspuru-Guzik 说:一开始将是计算化学家,然后是任何化学家,然后是任何人类,任何年龄,出于任何原因。El Agente 应该是你去讨论化学和材料科学的地方。这是可以做到的,现在有为你做各种事情的代理。我们的代理将只是化学代理。

7. 局限性与启示

7.1 当前的局限性

虽然这些平台还处于早期阶段,但看到它们如何影响计算化学领域将是非常有趣的——从进入该领域的人数(可能以前不会这样做)到它可能对研究和材料发现产生的影响。

Aspuru-Guzik 说:如果有人说,因为 El Agente,我对量子化学感兴趣……如果 El Agente 能为一个人做到这一点,那就是影响。我们只需要一个轶事,一个人。

7.2 未来的演变方向

虽然我们必须等待才能发现这一点,但显然重大变化已经在进行中。Dral 说:我很确定,在未来,人们会想知道人们以前是如何进行量子化学模拟的,就像我们现在对人们如何建造埃及金字塔感到惊讶一样。

值得思考的问题

Q1:AI代理是否会取代计算化学家的角色? 不会de。AI代理的目标是让计算化学工具更易于访问,降低入门门槛,但它们无法替代化学家的创造力、直觉和对问题的深刻理解。这些平台更像是赋能工具,让更多人能够参与到计算化学研究中。

Q2:这些平台在能源消耗方面是否可持续? 这是一个重要的考虑因素。虽然AI工作流会增加资源消耗,但代理框架通过优化计算路径、减少无效计算、使用更小的语言模型等方式来提高效率。同时,这些平台让计算化学变得更高效,从长远来看可能减少总体能源浪费。

Q3:自然语言接口是否足够精确以进行复杂的量子化学计算? 目前的代理系统通过多层验证、反馈循环和专家工具调用来确保精度。虽然早期可能存在1%的错误率,但随着技术成熟,这些问题正在快速解决。多代理架构、推理模型和机器学习势能的结合正在显著提高准确性。

Q4:这些平台之间能否实现互操作? 开发团队普遍表达了跨平台协作的愿景。未来可能会看到一个代理网络,其中 El Agente、Dreams、Aitomia 和 ChemGraph 可以相互通信,甚至与自主实验室集成,形成从计算到实验验证的完整闭环。

Q5:对于初学者,应该从哪个平台开始? 这取决于具体需求。Aitomia 适合需要快速、高精度计算的用户;ChemGraph 提供了从命令行到图形界面的多层次选择,适合不同技能水平的用户;Dreams 更专注于高通量DFT工作流;El Agente 则提供高度自主的端到端解决方案。建议根据研究方向和技术背景选择合适的平台。


参考文献: Julia Robinson, AI agents set to democratise computational chemistry, Chemistry World, 2025.

原文链接

https://www.chemistryworld.com/news/ai-agents-set-to-democratise-computational-chemistry/4022465.article

代码与平台

  • El Agente:https://www.elagente.ca/(alpha测试中)
  • Aitomia:http://mlatom.com/aitomia/(公开可用)
  • ChemGraph:https://github.com/argonne-lcf/ChemGraph
  • Dreams:https://github.com/BattModels/material_agent
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 计算化学的新时代
  • 2. 个人动机:打破壁垒的初心
    • 2.1 资源匮乏与语言障碍
    • 2.2 即便有资源,掌握也不易
  • 3. 四大平台:重塑计算化学的未来
    • 3.1 Aitomia:快速且高精度的机器学习驱动平台
    • 3.2 ChemGraph:面向开发者与初学者的多层次接口
    • 3.3 Dreams:高通量、高保真的多代理DFT框架
    • 3.4 El Agente:高度自主的分层代理网络
  • 4. 代理崛起的技术基础
    • 4.1 大语言模型的关键作用
    • 4.2 AI推理模型与机器学习势能
    • 4.3 文化转变与开源生态
  • 5. 挑战与解决方案
    • 5.1 成本与多代理架构
    • 5.2 精度与幻觉问题
    • 5.3 可持续性与能源消耗
    • 5.4 安全性与开放性的平衡
  • 6. 计算化学的未来图景
    • 6.1 让实验化学家独立解决问题
    • 6.2 代理网络与跨平台协作
    • 6.3 从专家到全人类
  • 7. 局限性与启示
    • 7.1 当前的局限性
    • 7.2 未来的演变方向
  • 值得思考的问题
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档