
DRUGONE
随着单细胞技术的发展,研究人员能够在多种遗传、化学、环境或疾病扰动条件下解析细胞状态变化。然而,现有扰动分析方法往往针对单一任务,分析流程分散,难以适应大规模、多条件和多模态的数据需求。研究人员提出 Pertpy,一个基于 Python 的端到端扰动分析框架,用于系统性组织、分析和解释大规模单细胞扰动实验数据。Pertpy 集成了标准化的数据结构、丰富的扰动数据集与元数据资源,并实现了多种成熟与新提出的分析方法,覆盖从数据预处理到生物学解释的完整流程。作为 scverse 生态系统的一部分,Pertpy 具备良好的可扩展性和互操作性,为复杂扰动实验提供统一、可复用的分析范式。

理解细胞对扰动的响应是解析生物调控机制和疾病过程的核心问题。近年来,单细胞实验逐步从描述性研究转向系统性的扰动实验,包括基因编辑、药物处理、病理状态和环境刺激等多种形式。
尽管已经开发出多种统计和机器学习方法用于分析此类数据,但现有工具普遍存在以下局限:
因此,研究人员迫切需要一个可扩展、模块化、具备生物知识整合能力的统一扰动分析框架。
方法概述
Pertpy 是一个面向单细胞扰动数据的模块化分析框架,围绕统一的数据结构构建完整分析流程。其核心设计理念包括:
所有模块可自由组合,形成针对不同实验设计的定制化分析管线。
结果
Pertpy 的整体框架与分析流程
Pertpy 提供了从扰动数据输入到生物学解释的完整分析管线,涵盖数据整理、元数据注释、扰动空间构建和多类型下游分析。该框架适用于遗传扰动、药物筛选及疾病状态等多种实验场景。

图1|Pertpy 框架与核心模块。
学习可解释的扰动空间
通过构建“扰动空间”,Pertpy 将大量细胞级响应压缩为每个扰动对应的整体表征,从而揭示具有相似转录效应的扰动之间的关系。
在组合基因扰动实验中,该表示能够有效区分不同基因程序,并进一步细化或修正已有的生物学注释。

图2|组合 CRISPR 扰动数据中的扰动空间。
解析药物扰动中的细胞响应机制
在大规模药物扰动数据集中,Pertpy 通过整合药物敏感性信息,将基因表达响应分解为与细胞存活相关和与存活无关的两类效应。该分析揭示了传统机制注释难以捕捉的调控路径,为药物作用机制提供了新的解释维度。

图3|药物扰动中存活依赖与非依赖响应的分解分析。
组织水平的扰动效应解析
在肿瘤治疗相关的单细胞数据中,Pertpy 能够同时分析扰动引起的细胞类型比例变化和多细胞协同程序。研究人员借此识别了与治疗响应相关的关键免疫细胞亚群及其协同调控特征。

图4|多细胞组织中扰动效应的系统解析。
讨论
Pertpy 提供了一个覆盖数据组织、分析与解释的端到端扰动分析框架,有效弥合了现有工具在规模、通用性和生态整合方面的不足。其模块化设计不仅降低了复杂分析流程的门槛,也为新方法的快速集成提供了基础设施支持。
研究人员展示了 Pertpy 在基因扰动、药物筛选和肿瘤治疗响应分析中的通用性,表明统一的扰动表示和生物知识增强分析对于复杂单细胞实验至关重要。随着空间转录组等新型扰动数据的出现,Pertpy 有望成为构建大规模扰动图谱和评估基础模型的重要工具。
整理 | DrugOne团队
参考资料
Heumos, L., Ji, Y., May, L. et al. Pertpy: an end-to-end framework for perturbation analysis. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02909-7
内容为【DrugOne】公众号原创|转载请注明来源