前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Nat. Rev. Genet. | 单细胞时代下系统生物学解析人类疾病的复杂性

Nat. Rev. Genet. | 单细胞时代下系统生物学解析人类疾病的复杂性

作者头像
DrugAI
发布2025-03-17 20:42:15
发布2025-03-17 20:42:15
1010
举报
文章被收录于专栏:DrugAIDrugAI

系统生物学旨在通过测量、分析和扰动的迭代循环,全面理解细胞系统的分子机制。这一框架在单细胞模型生物中已取得显著成功。近年来,随着单细胞和空间组学分析、CRISPR基因编辑及机器学习等实验与计算技术的进步,研究人员有望借助这些策略更有效地预防、诊断和治疗人类疾病。然而,由于人类组织的生物特征与常用实验模型之间存在差异(本文称为“转化距离”),将系统生物学方法应用于解析人类疾病的复杂性仍具有挑战性。本文综述了如何在多尺度的人类疾病进程背景下,对样本、测量和分析进行系统整合,以减少数据与真实情境之间的差距。此外,研究人员还探讨了如何缩短系统驱动的人类疾病研究循环与模型系统验证循环之间的转化距离,以推动单细胞基因组时代的精准医学干预。

支撑人类健康与疾病的多细胞“生态系统”极为复杂,并在多个空间和时间尺度上展现动态特性。在空间上,这些特性可涵盖从单个分子和细胞的活动,到微环境、组织乃至整个器官系统的功能。在时间上,该层级结构中的任何变化都可能通过生理反馈机制在不同空间尺度上传播,时间跨度可从几秒至数十年。传统上,面对如此复杂的系统,研究人员往往采用还原论方法,即在特定空间和时间范围内聚焦于少数预选的关键组分。这一策略已成功揭示了多种人类疾病的分子靶点,例如某些肿瘤相关突变基因。然而,许多疾病并非由单一分子事件驱动,这增加了临床干预的复杂性。

近年来,研究人员开始利用单细胞和空间基因组技术,全面解析人类组织及其相互作用,构建细胞和组织图谱。这些数据可用于比较健康和疾病状态(如肿瘤),揭示潜在的致病机制和治疗靶点。从本质上看,这些研究借鉴了传统系统生物学框架的多个方面。系统生物学方法通常采用迭代的三步研究循环:首先干扰生物系统的关键组分(如细胞中的全部基因或代谢物),然后测量干预后的反应,最后通过定量模型建立各组分间的关系。该循环可不断提出潜在的机制假设,并通过定向干预进行验证,最终优化模型,使其更准确地描述生物系统的动态特征和调控模式,从而提升整体预测能力。典型案例包括解析酵母中的基因调控网络、细菌的代谢通路,以及真核细胞的信号级联反应。

这一方法的成功依赖于对同一系统进行系统性测量和干预,从而确保每个研究周期的结果直接相关。然而,尽管该方法在模式生物和简单系统中取得了显著成效,其推广至复杂人类疾病的研究却面临挑战。例如,在酵母培养中,几乎所有参数都可被操控,测量时间点可以精确设定,所得数据也可通过相对简单的定量模型进行解析。而在人类研究中,出于实际和伦理考量,研究人员通常只能利用有限的样本,通过高分辨率基因组技术进行快照式测量,并且这些数据往往缺乏对整个疾病进程的充分背景信息,限制了建模能力。此外,与定向干预实验不同,全基因组关联研究(GWAS)试图揭示自然遗传变异与复杂表型(如癌症易感性或感染疾病易感性)之间的关系。尽管这类研究具有强大的统计效能,但由于不同空间(如分子、细胞类型或微环境)和时间尺度(如突变的直接效应与随时间积累的反馈效应)上的变异性,它们可能掩盖关键的疾病机制。此外,遗传变异通常只能部分解释某一观察现象,环境因素可能同样发挥重要作用。

为厘清因果关系,研究人员通常依赖实验模型系统——如细胞系、类器官或模式生物——来复现疾病相关特征。然而,人类组织与实验模型的生物学差异(如突变作用的具体细胞类型及其微环境)可能限制研究人员对人类系统的理解,并削弱从实验模型获取洞见的能力,从而形成“转化距离”。实际上,人类疾病研究往往将系统生物学循环拆分为两部分:人类发现环路与模型验证环路。

本文提出了一种概念框架,以明确并解决影响人类发现环路与实验模型验证环路之间转化距离的采样、测量和建模局限性。研究人员探讨了横断面和纵向研究设计中的潜在挑战,并探讨如何控制研究疾病过程与实验模型之间的转化距离。此外,该框架补充了现有的系统遗传学研究,强调如何利用基因组学方法研究疾病机制和表型在不同空间尺度上的变化。基于信息密度和可扩展性,研究人员主要关注基因表达和染色质可及性测量,这些数据构成了近期众多细胞和组织图谱的核心内容,并讨论其与基因组、蛋白质组及其他细胞功能介质的关联。其他分析手段,如代谢组学、脂质组学和蛋白质组学,也可进一步补充该框架,以更全面地描述人类生物学的空间尺度。

捕捉疾病动态的瞬时快照

人类疾病展现出复杂的时空动态,跨越多个数量级的尺度。从空间尺度来看,相关生物过程可涵盖从分子(纳米级)到整个机体(米级);而在时间尺度上,这些过程可能涉及从纳秒级的分子重排到个体生命周期内的变化。例如,在癌症中,T 细胞表面的受体可在数秒内与抗原呈递细胞表面的肽-HLA 复合物相互作用,进而触发细胞内级联磷酸化反应,该过程可在微米级的空间范围内持续数秒至数分钟,最终引发基因表达变化,持续数小时。随后,活化的 T 细胞可能从淋巴结迁移至肿瘤区域,而某些恶性细胞也可能进入血流并最终形成转移灶,其时间跨度可从数天至数年。

为降低系统的复杂性,研究人员可以在特定的时空尺度上解析调控机制。例如,可以研究作用于分子尺度、时间跨度为秒至分钟的蛋白信号传导级联反应;也可以研究细胞尺度上,影响 T 细胞状态并与耗竭相关的基因表达程序,其变化时间范围为小时至天。此外,还可研究微环境尺度上控制 T 细胞活化及肿瘤细胞杀伤的细胞间相互作用,以及组织尺度上涉及肿瘤转移的长期动态过程。为了测量如此复杂的系统,研究人员通常采用时间序列实验,通过多个时间点的快照捕捉生物系统的关键特征。

在实验设计中,短时间间隔的快照有助于解析较小且动态变化较快的空间尺度(如磷酸化级联反应),而数天间隔的快照则更适用于捕捉 T 细胞耗竭的进程。当然,也存在例外情况,例如致癌突变的积累往往在分子尺度上持续数年。因此,关键在于明确每个生物过程的最优时空尺度,并在该尺度上进行快照采样,以建立定量模型来描述其动态变化。

分子尺度动态快照

调控人类生理过程的分子网络在疾病状态下通常会受到干扰。研究人员可利用不同的基因组学技术,捕捉多个关键分子层面的动态信息。例如,由于许多调控事件涉及特定蛋白的即时合成,因此基因表达及其调控的研究对于解析关键分子过程尤为重要。转录因子的活性可通过靶基因的转录组数据进行推测,而细胞内的代谢通量变化也可通过编码关键代谢酶的转录本水平进行推断。

在严格控制的时间间隔内进行转录组测量,有助于跟踪分子动态的变化。然而,在横断面或纵向人群研究中,采样时间跨度往往较长,可能会引入跨尺度的反馈回路及独立变量,从而干扰数据解释。例如,小分子药物对特定分子靶点的影响会因不同细胞类型的背景效应而有所不同,而未被充分考虑的遗传或表观遗传因素也可能降低对特定分子过程变化的确定性。

细胞尺度动态快照

细胞身份可视为对其分子状态的归纳与概括。在稳态条件下,不同细胞类型的变异性通常是离散的,由发育过程决定,并由染色质结构维持稳定;而细胞状态的变化则更加连续,可根据环境变化进行动态调整。在疾病状态下,单细胞基因组快照常用于解析细胞状态的变化,并推测潜在的细胞内外调控信号。

单细胞多组学测量可以捕捉组织内不同细胞群体的异质性。然而,由于个体细胞间的非同步性,这些快照仍能部分反映细胞系统的动态特征。例如,在明确的发育轨迹(如造血过程)中,研究人员可以推测细胞状态的时间变化趋势。然而,在更复杂的疾病背景下,细胞状态的内在变化常常受到外部反馈回路和微环境的影响。例如,在胰腺导管腺癌中,不同患者的癌细胞状态可分为经典型和基底型,这一分类对理解患者间的差异至关重要。但要真正理解个体癌细胞在这一状态谱上的变化,则需要将其置于特定的微环境信号背景下进行解析,如转化生长因子-β(TGF-β)的水平。

微环境(Niche)尺度动态快照

组织中的局部细胞群体通过相互作用共同执行特定功能,可被视为生物微环境(niche)。这些局部相互作用受配体-受体结合、代谢物交换及生物物理因素等调控。例如,在淋巴结中,多个细胞类型协同调控生发中心内 B 细胞的分化与增殖;而在骨髓中,造血干细胞的增殖受特定组织结构的影响。在许多疾病中,微环境的稳态特征可能遭到破坏,例如白血病中骨髓微环境的异常 B 细胞增殖,或肺结核中肉芽肿结构的形成。

研究人员可利用单细胞和空间基因组技术捕捉微环境的变化。例如,通过统计模型解析基因表达的协同变化、细胞类型组成的差异,或基于配体-受体的细胞通信网络,推测微环境的调控模式。然而,与细胞尺度类似,终末时间点的微环境测量可能会掩盖驱动其异质性的关键机制。例如,肿瘤微环境中的免疫细胞可能包括在肿瘤中驻留数天的细胞,以及刚刚从血流迁移而来的细胞,这使得研究人员难以确定哪些相互作用是核心驱动因素。此外,机体水平的反馈回路也可能影响微环境状态。例如,肺结核感染的组织微环境可能因宿主适应性免疫反应的时间差异而呈现不同状态,因此仅凭快照数据难以区分关键的病理驱动因素。

组织尺度动态快照

完整的组织可通过细胞和分子信号进行相互交流。在稳态条件下,淋巴系统负责监测组织是否发生疾病,而肺部吸收的氧气必须通过血液循环输送至全身。在感染过程中,受感染组织的命运不仅取决于局部防御机制,还受到远端组织形成的适应性免疫记忆的影响。

研究人员可以通过捕捉特定免疫状态下(如初次感染与二次感染)或不同组织间的对比快照,研究组织水平的生物过程。近期,空间基因组技术的发展使得研究人员能够在更大范围的组织区域内进行测量,并偶尔在单个快照中同时解析多个相互作用的组织区域。这有助于将观察到的变化与关键疾病生理特征联系起来,但由于组织取样往往较为稀疏,研究人员仍面临解析疾病核心驱动因素的挑战。

发现:研究分散的快照

尽管系统生物学方法因采样限制而变得复杂,使得动态模型难以通过模拟和推理整合时间序列快照数据,但合理的研究设计可以通过优化样本收集、测量和分析来减轻这些限制。虽然基因组学快照通常无法完全解构疾病的全时空动态,但它们可以用于识别与疾病动态相关的关键特征,这是发现过程的重要组成部分。通过将特定样本及其分析物置于整体疾病进程中,并结合生物启发的机器学习算法,研究人员可以围绕特定的时空尺度构建定量模型,并推测观测到的动态变化机制。这一发现环路为后续在实验模型中的验证提供了基础。

利用快照采样自然变异

在研究人类疾病时,样本通常来自组织或液体活检。尽管这些样本通常较小(毫米至厘米级),但仍可包含分子、细胞和微环境等关键特征。在单个患者和单一时间点的样本中,往往难以区分不同尺度对疾病过程的贡献。然而,通过收集覆盖特定过程的样本队列,研究人员可以识别每个尺度上的变化,这一策略已成功应用于癌症、感染性疾病和复杂疾病的研究。

然而,准确地将样本置于疾病的整体动态进程中仍然是一个挑战。在横断面研究中,个体间的生物特征差异(如性别、年龄、暴露史)以及疾病进展的不同步性可能会影响数据的解析。在纵向研究中,伦理和实际操作上的限制可能导致采样密度不足,进而遮蔽完整的疾病轨迹。例如,在许多癌症研究中,特定样本所代表的时间点可能存在不确定性,因此,研究人员通常会在横断面研究中将样本归类为粗略的疾病阶段,或在纵向队列中选取治疗前后的样本进行对比。

此外,疾病研究还受到可采样时间窗口的限制。例如,黑色素瘤患者的皮肤活检可以在早期预防筛查阶段进行,而胶质母细胞瘤的组织活检通常因检测延迟而在晚期才能获得。在某些疾病中,如肺部疾病,仅能从重症或死亡患者中获得相关组织样本。因此,研究早期肺肿瘤或肺结核的发展可能需要关注血液或支气管肺泡灌洗液等更易获取的外围组织,并注意这些组织与原发病灶的关联性。

在单次手术中获取的组织样本可用于研究组织间的关系。例如,可比较遗传相似但空间上分离的肿瘤克隆,或分析肿瘤与引流淋巴结之间的适应性免疫反应变化。此外,还可研究肿瘤核心区与周边区域之间的差异。这些采样策略能够覆盖疾病过程的特定时空维度,但关键在于确保采样方案能够与疾病进程保持一致。

通过测量和分析连接分散的快照

即使研究人员优化了队列设计和采样策略,所得样本仍然是分散在疾病进程中的。为了捕捉疾病过程的核心特征,并在实验模型中进一步探究,必须利用适当的测量方法和数据分析策略,将这些离散的快照连接起来,形成连贯的生物学描述。

当前的细胞和组织图谱通常依赖于单细胞转录组学快照,尽管这些细胞状态存在一定的时间异步性。要建立可解释的疾病动态图谱,研究人员不仅需要整合不同样本间的快照,还需在单个样本内部建立细胞快照之间的关联。这通常依赖于能够处理噪声和稀疏测量的计算整合策略,同时还需连接不同的细胞快照,以恢复疾病动态的潜在模型。

在跨样本整合转录组快照时,一个主要挑战在于单细胞基因表达数据的稀疏性以及实验批次之间的变异。为了解决这一问题,可以将细胞间的转录组数据聚合为基因表达特征、细胞簇或低维表示,以便在不同样本间进行注释和比较。这种聚合分析可用于识别疾病相关的细胞状态。例如,在 COVID-19 患者的样本中,研究人员识别到了共同的促纤维化巨噬细胞特征。此外,计算整合策略可以减轻实验批次效应带来的变异,并帮助提取特定疾病状态下的生物学信号。然而,由于未描述的生物和技术变异可能与实际生物学信号相关,该方法在某些情况下可能会削弱重要信号。

在细胞尺度上,研究人员常常希望解析细胞状态的动态转换,并将其与疾病轨迹相关联。与样本整合类似,计算方法可用于重构细胞沿特定生物变化轴的轨迹。这些轨迹可基于细胞快照本身,或结合额外的时间信息,如 RNA 速度模型推测的剪接动力学或代谢转录标记。此类计算模型已用于解析 COVID-19 相关纤维化中的巨噬细胞状态转变、造血过程中前体细胞的变化,以及细胞重编程中的成纤维细胞转变。此外,不同的基因组学特征可以用于连接不同时间间隔。例如,转录动力学可提供秒至分钟级的细胞状态变化信息,染色质可及性可用于预测未来数小时至数天的细胞命运变化,而系谱追踪或淋巴细胞克隆分析可帮助连接跨越更长时间跨度的细胞轨迹。

最终,有效整合的细胞快照不仅提供了研究疾病动态的框架,还可作为解析其他空间尺度模型的“切入点”。在分子尺度上,研究人员可以在特定细胞类型中探讨转录因子活性如何影响细胞状态变化;在微环境尺度上,研究人员可以利用细胞类型和状态标签推测细胞间通信,并结合空间分子特征进行验证。

利用定量模型解析时空尺度的变异

在疾病图谱中,研究人员通常希望将分子层面的异质性归因于潜在的机制驱动因素。研究人员可以通过定量建模,识别驱动基因表达变化的转录因子、将基因表达模式与临床数据关联,或解析多细胞系统的组成变动、结构重组及细胞间相互作用,以解释疾病微环境的异质性。

然而,在进行归因分析时,研究人员通常需要做出强假设。例如,在分子尺度上,研究人员可能假设基因表达的变异完全由细胞内在效应驱动,并可归因于转录因子的活性差异;在细胞尺度上,研究人员可能假设数据整合成功,从而可以利用细胞状态的丰度与样本元数据进行相关分析;在微环境尺度上,研究人员可能假设细胞类型间的基因表达差异主要由细胞间相互作用驱动。然而,如果定量模型的假设错误,可能会导致误归因。因此,研究人员通常会调整分析粒度,如将细胞归类为更广泛的类型,或调整关键分析的超参数,以测试结果的一致性。此外,还可通过在独立队列中重复测量和分析,或通过交叉验证来评估推测机制的稳健性。尽管新队列可能引入额外的变异因素,这些变异既可能是干扰因素,也可能强调保守且可重复的特征,但仍需进一步实验验证各尺度驱动因素对观测变异的贡献。

技术参数、测量的生物学真实性与实验模型的适用性

在实验设计中,研究人员需要评估技术参数的合理性,以及测量特定生物学特征(如单细胞转录组学中转录因子、配体和受体的定量)的准确性。此外,研究人员还需考虑已整理的基因集是否适用于研究系统,以及分子相互作用数据库(包括转录因子-靶基因和配体-受体的关系)的实用性。在进行这些验证时,选择适当的时空尺度和实验模型至关重要,以确保研究结果能够有效反馈至研究循环中。

复杂性与通量的权衡

选择合适的实验模型和研究尺度时,研究人员通常需要在复杂性(模型再现人类生物学特征的程度)和通量(可执行的实验扰动数量)之间做出权衡。发现环路通常会提出多个复杂假设,需要进行大量的扰动实验来全面测试。然而,由于在更复杂的模型(如转基因小鼠)中提高实验通量的难度较大,理想情况下,研究人员应尽可能选择复杂度最低但仍能提供有效生物学信息的模型(如细胞系)。

在分子尺度上,研究人员可使用多种工具解析蛋白质靶点,例如定点突变、CRISPR 基因编辑(如Prime Editing),以及深度突变扫描,以系统性地研究蛋白变异及其功能。此外,研究人员还可利用噬菌体展示技术来筛选蛋白-蛋白相互作用,从而发现潜在的治疗性抗体。

在细胞尺度上,CRISPR-Cas 介导的敲除、敲低、激活以及慢病毒过表达等基因扰动方法高度灵活,可用于大多数细胞水平的验证研究。这些方法不仅可以通过高通量筛选确定潜在靶点,还可结合单细胞测量技术(如Perturb-seq和CROP-seq)实现高效的表型分析。此外,研究人员可利用细胞工程技术,通过过表达感兴趣的蛋白,监测相应的细胞表型变化。同样,在体外实验中,可以通过配体刺激细胞,并结合单细胞测量,提高通量并解析细胞环境的影响。而在体内实验中,也可以通过细胞因子刺激来测试关键的微环境特征。对于更复杂的微环境特征(如配体-受体相互作用),研究人员可选择不同的实验模型(如初级细胞共培养、细胞系或类器官),结合组合筛选策略,在不显著降低通量的情况下进行研究。

进入组织尺度研究时,通常需要使用动物模型(如小鼠或非人灵长类)。然而,前述的功能基因组学方法在这些模型中的可操作性会受到实验和工程方面的限制。例如,研究人员需要精准地将基因编辑工具递送至目标细胞,或特异性干扰某一微环境的细胞群。针对不同组织,研究人员可采用特定策略,如分子约束病毒转导,用于靶向特定细胞群(如调控全身免疫应答的特定神经元)。尽管相比细胞系或类器官,动物模型的通量较低,但仍可利用大规模基因组筛选方法解析组织和机体水平的表型。然而,在这些模型中,分子和细胞水平的实验结果可能受到微环境和组织层级变化的干扰(如相邻细胞的并行扰动效应)。

在不同尺度研究疾病

许多疾病可在不同尺度上进行研究,并需要使用不同的实验模型。例如,在癌症研究中,研究人员可在分子尺度上筛选和突变关键基因,以研究致癌变异;在细胞尺度上,恶性细胞培养可用于研究突变异质性如何影响细胞状态;在微环境尺度上,可使用类器官共培养系统研究细胞间相互作用;在组织尺度上,转基因小鼠可用于解析肿瘤转移过程。

在多发性硬化症研究中,研究人员可使用**诱导多能干细胞(iPSC)**模型研究细胞特征;共培养模型可用于研究髓鞘形成的微环境因素;而小鼠模型可用于评估组织水平的神经功能变化。

然而,并非所有疾病在所有尺度上都有合适的实验模型。例如,在肺结核研究中,研究人员可以在细胞尺度上解析宿主细胞与结核分枝杆菌的相互作用,但要研究完整的肉芽肿微环境及其在结核潜伏期和进展中的作用,则需要使用非人灵长类动物模型,因为现有的共培养系统无法完全再现相关的微环境特征。

缩小转化距离

在癌症研究中,研究人员通常使用整体基因组测序对比患者样本与实验模型,以评估模型的遗传相似性。然而,患者来源的异种移植模型在体内进化过程中可能发生基因漂移,导致其与患者肿瘤的生物学特性产生偏差,影响治疗反应的准确性。尽管遗传异质性的丧失难以补救,但更具可塑性的表型(如细胞状态)可通过工程手段调整。例如,在肠道类器官研究中,研究人员发现常规培养条件下的类器官细胞多样性较低,但通过添加合适的微环境信号,可恢复其细胞类型的多样性,从而使其更接近真实的患者模型。在胰腺癌研究中,研究人员通过比对患者活检样本的单细胞数据,发现大多数类器官模型可维持其基因突变特征,但往往偏向某一种特定的基因表达状态。通过工程改造,这些模型可更好地模拟体内状态。此外,研究人员可利用更复杂的机器学习模型,通过分析基因表达模式,选择更接近人类组织状态的细胞模型,从而减少转化距离。

优化实验模型以缩小转化距离

综合来看,这些研究表明,不同空间尺度的实验模型可部分再现疾病特征,并具有一定的功能价值。例如,在测试靶向疗法(如 KRAS 抑制剂)时,确保模型中存在相应的突变可能已足够,但其他因素(如基因表达的异质性)可能会影响治疗效果。在微环境尺度上,研究人员可量化基因表达模式的扰动,并比较其与患者数据的一致性,以验证模型的有效性。

为了进一步缩小转化距离,研究人员需要在实验模型中选择适当的测量方法,并优化数据分析策略。一个关键方法是投影分析,即在患者组织和实验模型中进行相似的测量,以最大化两者分子特征的重叠,并计算机对齐两个环路的数据。例如,研究人员可通过比对不同条件下的差异表达基因,或利用深度学习方法,将实验模型中的细胞状态投影至人类组织数据,以优化模型的相似性。通过这些方法,研究人员可逐步缩小实验模型与真实人类生物学之间的转化距离,提高其在疾病研究和治疗靶点验证中的应用价值。

多尺度系统生物学:从理论到实践

在更新版的系统生物学循环中,描述性实验和干预性实验分别承担发现环路和验证环路的角色。这种基于特定尺度的方法打破了传统系统生物学中自下而上的建模范式,使研究人员不必仅在分子尺度上解析人类疾病系统,而是可以在细胞尺度上利用基因表达程序,在微环境尺度上分析细胞间相互作用,或在组织尺度上研究适应性免疫系统的特征。为了更精准地描述或验证某一尺度的生物机制,研究人员可以在该尺度上独立迭代优化实验设计,然后再整合至完整的系统生物学循环。例如,可以通过扩展队列进一步完善细胞图谱,或在实验模型中深入解析驱动观察结果的关键特征。

在这一过程中,研究人员可根据前述方法检查并缩小转化距离,例如,对比人类组织与细胞模型系统的基因表达特征,并通过细胞工程手段减少二者在基因表达模式上的偏差。这种优化后的模型可用于发现与验证循环,使测量数据能够通过投影分析在两者之间进行整合。以某一特定的时空尺度为起点,研究人员可以逐步扩展研究范围,以解析疾病的多尺度动态。例如,在研究胶质母细胞瘤的细胞状态异质性时,研究人员最初关注分子调控网络,随后发现该异质性受肿瘤微环境影响,表明微环境因素在调控细胞状态中的重要作用。同样,另一项研究首先在细胞尺度上分析 T 细胞耗竭的调控机制,随后在共培养系统(微环境尺度)以及小鼠模型(组织尺度)中进一步验证其作用机制。

此外,研究人员还可以对不同疾病进行对比,以寻找共同的生物学变化轴及其驱动因素。例如,比较所有表现出相同基因表达模式的癌症、不同呼吸道病毒诱导的基因表达特征,或所有肉芽肿性疾病的共性,可能揭示跨空间尺度的核心生物学特征,为后续研究提供线索。最终,经过充分对齐的定量疾病动态模型应能够识别出具有高转化潜力的生物标志物和治疗靶点,为精准医学和新药研发提供有力支持。

未来展望

正如以往的技术进步推动了系统生物学的发展,持续的测量和建模进展将推动多尺度系统生物学的进步。在发现环路中,研究人员不断努力扩大基因组学测序的样本量,这将使得以往无法研究的与疾病相关的现象得以探索。通过提高空间基因组学测量的分辨率,研究人员可以实现全面的微环境图谱绘制;在单细胞和空间分辨率下捕获蛋白质和代谢物丰度,将有助于填补高分辨率转录组学图谱中的空白,并丰富在发现过程中推测的机制。在验证环路中,实验模型系统不断改进,能够更好地再现人类疾病动态的时空尺度,特别是在类器官、组装体和芯片上的器官模型方面。初级样本的使用也越来越多,研究人员可以在基因组读数的帮助下进行干扰实验,例如,研究人员可以利用CRISPR筛选技术研究初级T细胞。机器学习方法的进步也在提高寻找与特定人类表型匹配的实验模型的效率。

随着我们对人类健康和疾病变异的进一步 cataloguing,优化和标定用于模拟人类特征的实验模型同样变得至关重要。通过系统化的努力,研究人员将能更准确地选择实验模型,并将其成果转化为人类健康的改善。然而,目前这是一个重要的缺失资源。

干扰实验本身也在不断进步。通过扩展单细胞分析实验或简化其测量输出,研究人员能够在单个实验中考虑更多的多重条件,从而在验证过程中进行更为系统的干扰实验。多重干扰的高效检测方法也日益可用,这有助于探索单一干扰无法揭示的复杂机制特征。利用CRISPR筛选技术检测整蛋白领域或变体,现在能够以新颖的方式连接分子和细胞尺度。最终,研究人员还在开发机器学习模型,以通过预测帮助设计干扰实验。

然而,我们仍然缺乏许多必要的标志来准确对齐人类和实验结果。例如,两个密切相关的细胞因子IL-4和IL-13在胰腺类器官和T细胞中的干扰反应差异显著,这使得从现有数据库预测胰腺类器官中的反应变得具有挑战性。填补这一空白,无论是通过实验还是计算方法,都是释放上述基因组数据发现潜力的关键,因为它有助于突出功能上重要的变化轴。

分析方法仅开始利用来自人类组织和实验模型系统的基因组数据的共同复杂性。尽管转录组等基因组数据中的变异具有相对鲁棒性,简单的定量模型已在将实验模型中的观察结果映射到人类生物学方面取得了一定成功,但这往往会损失学习意外变异的能力。例如,在体外工程化的T细胞状态全谱可能难以与体内状态对接,限制了其在理解体内T细胞状态的功能特征中的应用。当系统方法应用于模式生物时,干扰筛选通常依赖于微分方程模型来解释;然而,这些模型在研究人类疾病时,依然无法克服基因组学快照研究中的限制,因此并未在标准化工作流程中得到广泛应用。为了解决这一问题,研究人员预计将开发出更复杂的计算模型,这些模型能够更好地利用发现和验证过程中观察到的变异,例如,利用因果机器学习模型同时考虑两种测量,或通过跨时空尺度的模型来实现连接,或者开发基础的细胞生物学模型,能够从多个数据集中并行学习机制。

结论

人类组织在疾病过程中稀疏的采样和较弱的背景信息使得与传统的系统生物学方法存在矛盾。在多尺度框架下,可以通过结合发现环路和验证环路的手段,分别在人体组织和实验模型系统中研究孤立的时空尺度。为了捕捉人类组织生物学与实验模型之间的差异,我们引入了转化距离的概念,研究可能在每一尺度上出现的差异,并需要解决这些差异以保证系统生物学方法的完整性。通过仔细考虑和最小化转化距离,研究人员能够改善基于系统的人类疾病研究,并为将高分辨率人类图谱中的发现转化为新的预防和治疗方法提供路径。最终,通过跨尺度和跨模型的整合,目标是开发出能够理性预测某一尺度上结果的策略,同时考虑到其他尺度,从而实现新的精准医学。鉴于研究人类疾病的复杂性和个别尺度下实验的局限性,最终实现这一目标将是一个团队合作的过程。我们预计,新的突破将通过科学家、工程师、计算学家和临床医生之间的紧密合作获得。各尺度专家的合作无疑将有助于充分实现多尺度系统生物学的潜力。

整理 | WJM

参考资料

Fischer, D.S., Villanueva, M.A., Winter, P.S. et al. Adapting systems biology to address the complexity of human disease in the single-cell era. Nat Rev Genet (2025). https://doi.org/10.1038/s41576-025-00821-6

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档