首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Cell|利用AI智能体增强生物医学发现能力

Cell|利用AI智能体增强生物医学发现能力

作者头像
智药邦
发布2024-11-29 16:38:05
发布2024-11-29 16:38:05
3700
举报
文章被收录于专栏:智药邦智药邦

人工智能的一个长期目标是开发出能够做出重大科学发现、自主学习和自动获取知识的人工智能系统。虽然“人工智能科学家”的概念仍是一个愿景,但基于AI的智能体 (agent-based AI) 技术的发展为这一目标的实现铺平了道路。

2024年10月31日,来自哈佛医学院、哈佛大学、麻省理工学院(MIT)、帝国理工学院以及布罗德研究所等机构的研究人员在Cell上发表文章Empowering biomedical discovery with AI agents,探讨了如何利用这些技术构建能够进行反思性学习和推理的AI智能体,它们能够协调大型语言模型(LLM)、机器学习(ML)工具、实验平台,甚至是它们的组合,以应对生物学的复杂性。

AI智能体在生物医学研究中的角色

生物学的复杂性要求我们能够灵活地将复杂问题分解为可操作的任务。AI智能体可将问题分解为易于管理的子任务,然后由具有专门功能的智能体进行处理,从而有针对性地解决问题并整合科学知识。这种自动化不仅提高了常规任务的效率,使重复性流程自动化,还能分析大型数据集,以超越当前人类工作的规模和精度浏览假设空间。展望未来,AI智能体甚至可以在获得实验测量结果之前进行跨时间和空间尺度的预测,从而提供超越传统机器学习所能达到的目标。

图1 利用AI智能体增强生物医学研究

大型语言模型与生物医学应用

经过聊天优化的LLM(如GPT-4)可以纳入反馈,使AI智能体能够通过相互对话和与人类对话进行合作。LLMs还展示了通过将复杂任务分解为子任务来解决复杂任务的能力。然而,假设我们遵循传统方法来建立LLMs等基础模型和其他大型预训练模型,我们可能无法开发出能产生新颖推理的AI智能体,因为用于训练模型的数据中并没有这种新颖性。生成新颖的假设需要创造力和科学知识的基础,而LLMs擅长的是生成遵守语义和句法规则的新颖文本。

为了克服这一挑战,我们提出一个观点:人工智能科学家可以作为AI智能体来实现,由人类、LLM、ML模型和实验平台等其他工具支持,共同构成复合人工智能系统。这种系统应该能够提出生物医学假设,对其进行批判性评估,描述其不确定性,并以此为驱动力,以人类科学家可以信赖的方式获取并完善其科学知识库。

AI智能体的类型与协作

图2 生物医学中AI智能体的多种配置——从基于LLM的AI智能体到具有AI模型、工具和集成物理设备的多智能体系统

基于LLM的AI智能体

对具有不同角色的单个LLM进行编程,可使基于LLM的AI智能体拥有仿真人类专业知识的对话界面,并可访问各种工具。这种方法的基本原理是先对LLM进行预训练以编码一般知识,然后对LLM进行领域内微调以编码特定领域的专业知识,并通过角色扮演和对话使LLM与人类用户保持一致。

我们设想了三种为生物AI智能体分配角色的方法:特定领域微调、上下文学习和智能体角色自动生成。特定领域微调是在许多生物任务中对LLM进行指令调整,使其立足于生物领域,然后通过人类反馈强化学习(RLHF)来确保调整后的LLM能执行符合科学家目标和需求的任务。上下文学习则利用LLM处理输入中提供的较长情境信息,使智能体能够掌握每个任务的领域情境。角色定义的转变使智能体能够自主生成和完善角色提示,并参与自主学习和角色识别。

多智能体人工智能系统

单个LLM智能体往往缺乏完成复杂任务所需的综合技能。一个实用的替代方案是部署多智能体人工智能系统,将任务细分为更易于管理的子任务。多智能体系统包含多个智能体,这些智能体拥有专门的能力、工具和特定领域的知识,通过遵守工作协议来合作完成任务。

集思广益智能体

与多个智能体一起集思广益提出研究想法是一个合作环节,通过科学家和智能体的共同专业知识,产生广泛的研究概念。这种方法鼓励提出非常规和新颖的想法,让参与者在他人建议的基础上探索新的研究途径。

专家咨询智能体

专家咨询需要向具有专业知识的个人或实体征询专业知识。这一过程包括专家智能体从各种来源收集信息,并提供见解、解决方案、决策或评估。AI智能体可以作为人类专业知识的补充,协助进行科学研究。

研究辩论智能体

在研究辩论中,两组智能体就一个研究课题提出截然不同的观点,目的是说服对方的智能体。这种方法促进了批判性思维,加强了有效沟通,因为每个团队都在努力构建最有说服力的论据来支持自己的立场。

圆桌讨论智能体

圆桌讨论涉及多个智能体参与一个促进表达不同观点的过程,以便就讨论的主题做出合作决策。这种方法促进了所有智能体的平等参与,敦促他们贡献自己的专业知识和观点,提出建设性的批评意见,以改进所提出的解决方案。

自动化实验室智能体

自动化实验室是一个多智能体系统,在该系统中,端到端发现工作流在科学家的总体指导下进行迭代优化,但不需要一步一步的人工监督。智能体系统可以描述测试生成假设所需的实验,分析实验结果,并利用这些结果改进其内部科学知识模型。

AI智能体的自主水平

根据AI智能体在假设生成、实验设计和执行以及推理方面的能力,我们将其分为四个级别:

0级:“无人工智能智能体”,使用ML模型作为工具,由交互式和基础学习模型协调。在这一层次,ML模型并不独立提出可检验和可证伪的陈述作为假设。

1级:智能体根据现有知识提出简单的假设,并利用有限的工具集,但缺乏实现更高自主水平所需的能力。

2级:“作为合作者的AI智能体”,智能体能够独立识别和执行任务,以完善科学家最初提出的假设,但其理解科学表象和提出创新性假设的能力仍然受限。

3级:“作为科学家的AI智能体”,智能体有能力开发和推断超出先前研究范围的假设,在总结研究结果之外综合概念,并在无法仅从文献中推断的发现之间建立简洁、翔实和清晰的概念联系,最终产生新的科学认识。

表1 AI智能体的自主性水平

构建AI智能体的路线图

AI智能体是一个复合系统,由多个模块组成,每个模块实现不同的功能。这些模块包括感知模块、对话模块、多模态感知模块、交互模块、记忆和学习模块以及推理模块。

图3 AI智能体中的关键模块:感知、交互、推理和记忆模块

感知模块

感知模块使基于LLM的智能体能够理解其运行环境中的元素(如生物工作流和人类用户)并与其互动。智能体需要整合从多个来源接收反馈的能力,包括科学家、环境和其他AI智能体。

对话模块

随着ChatGPT的兴起,AI智能体对自然语言的解释能力已经达到了很高的水平。现在可以建立完全基于自然语言的智能体系统界面,并对其进行有限的错误解释。科学家可以使用自己的语言表达询问,提高了主动性,并使他们能够准确描述自己的需求。

多模态感知模块

智能体将LLM与其他数据类型结合起来,以融合自然语言文本之外的数据模式。这种方法可以帮助智能体更好地模拟不断变化的环境,并根据新的情况动态调整其输出。

交互模块

除了对话模块,智能体还需要具备与科学家、其他AI智能体和工具进行交流与合作的交互能力。这包括智能体与人的交互、多智能体交互以及工具使用操作。

记忆和学习模块

记忆模块通过存储和调用必要的实验结果,减轻了手动记录日志的需要。长期记忆存储了支撑智能体行为和对世界理解的基本事实性知识,而短期记忆则用于在交互过程中临时存储信息。

推理模块

推理模块提高了智能体规划实验、就生物学假设做出决定以及解决相互竞争的候选生物学机制的能力。智能体可以通过直接推理和反馈推理来实现这一点。

挑战与展望

尽管AI智能体在生物医学研究中具有巨大的潜力,但仍面临许多挑战。这些挑战包括稳健性和可靠性、评估协议、数据集生成、AI智能体的管理以及风险与保障措施。

图4 人工智能在生物医学发现中的挑战

稳健性和可靠性

部署高级别的AI智能体系统面临的一个主要障碍是它们容易产生不可靠的预测,包括非事实信息的幻觉、推理错误、系统偏差以及与工具和实验平台连接时的规划失误。解决这些问题需要开发有效的错误管理策略和不确定性量化方法。

评估协议

随着越来越多的AI智能体被开发出来,需要制定全面的评估框架来评估智能体的性能,包括准确性、伦理考虑因素、监管合规性以及集成到发现工作流中的能力。

数据集生成

实现AI智能体的愿景需要全面且可访问的大型开放数据集。然而,收集和处理这些数据仍然是一个巨大的挑战,特别是考虑到数据的质量和数量差异。

AI智能体的管理

随着AI智能体在生物领域的工作流程中变得越来越不可或缺,对其行为的监控和管理也变得越来越复杂。需要制定强有力的指导方针来确保AI智能体的开发、部署和商业化是负责任的。

风险与保障措施

自主实验可能带来长期的风险,因此必须采取周密的规划、广泛的咨询、得力的执行和持续的调整来确保安全。此外,还需要解决与AI智能体相关的伦理和技术问题,以确保它们的行为符合人类价值观和安全标准。

展望未来,随着计算智能的发展,生物医学研究正在经历一个变革时代。通过构建能够进行反思性学习和推理的AI智能体系统,我们有望推动生物医学研究的进步,最终改善人类的健康和福祉。然而,要实现这一目标,还需要克服许多技术和伦理挑战,并确保AI智能体的行为既可靠又符合道德规范。

参考资料:

https://doi.org/10.1016/j.cell.2024.09.022

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档