摘要
大语言模型(LLMs)正通过助力 “虚拟细胞” 的开发来变革细胞生物学 —— 虚拟细胞是能表征、预测并推理细胞状态与行为的计算系统。本研究对用于虚拟细胞建模的大语言模型进行了全面综述。提出了一个统一的分类体系,将现有方法归为2大范式:作为 “神谕” 的大语言模型(用于直接细胞建模)和作为 “智能体” 的大语言模型(用于协调复杂科学任务)。明确了3大核心任务 —— 细胞表征、扰动预测和基因调控推断,并综述了与之相关的模型、数据集、评估基准,以及在可扩展性、泛化性和可解释性方面的关键挑战。
引言

图1 细胞多尺度组织示意图

图2 基于人工智能的虚拟细胞建模主要任务概述
作为神谕/智能体的大语言模型:用于虚拟细胞研究

图3 大语言模型邂逅虚拟细胞的分类体系
详细总结

思维导图
核心任务定义

关键数据集

评估指标

分子层面建模

核心应用场景

核心差异

参考
https://doi.org/10.48550/arXiv.2510.07706. Large Language Models Meet Virtual Cell: A Survey
注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。
End