前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >细胞标记一致性:健康和疾病中可解释的单细胞和空间组学注释

细胞标记一致性:健康和疾病中可解释的单细胞和空间组学注释

原创
作者头像
追风少年i
发布2025-02-10 14:42:23
发布2025-02-10 14:42:23
560
举报

作者,Evil Genius

人无远虑,必有近忧。

相亲对象要求22.8万的彩礼,买个新房,压30万,订婚、结婚办一办也需要将近20万, 还要个十几万的车,算下来光结婚这一下,快100万了,想问一下大家,该放弃,还是借一大堆饥荒顶上?

生活真难了,人是会痛苦一时,还是一直痛苦下去,杀手回答,人生一直都这样。

想结婚就是在渡劫。

今天我们来讨论讨论单细胞空间细胞注释的问题,尤其是识别人类病理中的疾病关键细胞,这种状态的细胞类型在正常样本或者非同类型疾病样本往往是没有的。

目前对于单细胞空间来讲,细胞类型和状态的可靠识别是一个瓶颈,尤其是细胞状态。

现有的数据库和分析工具使用不同的标记,导致注释不一致和可解释性差。此外,目前的工具主要关注生理细胞类型,限制了它们对疾病的适用性。

准确可靠地注释细胞类型是得出可靠生物学结论的关键。识别细胞类型的稳健性是辨别疾病关键细胞的重要前提,其特征是导致疾病发生、进展和治疗抵抗的异常细胞状态。

单细胞数据中细胞群的识别可以手动或自动执行。基于研究者的知识或从已发表的文献中得出的手动注释通常是主观的,由于缺乏标准化,通常是不可复制的。许多计算工具通过关联参考表达数据或从其他单细胞数据集传输标签来执行自动注释。这些方法需要纯化细胞的可靠转录组谱或高质量的注释单细胞数据。然而,这些参考数据集并不容易获得,特别是对于病理样本;公共数据集可能缺乏感兴趣的细胞群,并且可能容易受到平台或测序策略等技术特性的影响。许多当前的工具要求用户提供一组marker基因,这一过程容易产生偏差。

目前可用的基因标记数据库非常异质,包含同一细胞类型的不同标记集,并采用非标准的命名和分类,从而导致scRNA-seq和空间数据中细胞群的注释不一致,结果的可解释性较差。目前的工具和资源主要集中在生理细胞类型上,限制了对疾病关键细胞的识别。

现状一、数据库之间的广泛异构性导致细胞类型注释不一致

从CellMarker2.0和Panglao DB中提取标记基因,自动注释了已发表的人类骨髓scRNA-seq数据集,这两个数据库是细胞类型标记最全面的数据库。两个来源之间的细胞类型注释往往不一致,显示了分配给同一簇的不同细胞类型。结果表明,不同的标记基因数据库不可避免地会导致对单细胞数据生物学意义的不一致解释,并对数据挖掘产生深远的影响。

现状二、构建完整的细胞注释数据库以及疾病状态

现状三、改进细胞注释算法和可靠性

高精度空间数据的注释

最为关键的一点:识别人类病理中的疾病关键细胞

许多疾病,包括肿瘤,都包含表现出改变状态和异常基因表达的关键细胞群。这些疾病关键细胞显著影响疾病进展和治疗结果。恶性细胞选择性亚群的持续存在被认为是在各种癌症患者中常见的高复发率的根本原因,识别和表征人类病理学中的疾病关键细胞对于改善对阻断药物的诊断、了解发病机制和治疗耐药机制以及开发新的疗法来特异性靶向和根除癌变细胞,同时最大限度地减少对健康细胞的不利影响至关重要。

运用:鉴定剪接因子突变骨髓增生异常综合征患者细胞类型组成的改变

剪接因子(SF)基因突变在大约50%的骨髓增生异常综合征(MDS)和急性髓系白血病(AML)患者中普遍存在。这些突变,尤其是U2AF1突变,与AML转化的高风险和存活率降低有关

核心目的:区分突变带来的细胞类型表达状态的差异。

运用:识别小鼠骨髓中先天免疫途径的激活(m6A)

表征疾病或药物治疗模型中的病理相关途径。

参考链接:GitHub - TebaldiLab/cellmarkeraccordion

参考链接rdds.it/CellMarkerAccordion/

生活很好,有你更好

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 作者,Evil Genius
  • 人无远虑,必有近忧。
  • 相亲对象要求22.8万的彩礼,买个新房,压30万,订婚、结婚办一办也需要将近20万, 还要个十几万的车,算下来光结婚这一下,快100万了,想问一下大家,该放弃,还是借一大堆饥荒顶上?
  • 生活真难了,人是会痛苦一时,还是一直痛苦下去,杀手回答,人生一直都这样。
  • 想结婚就是在渡劫。
  • 今天我们来讨论讨论单细胞空间细胞注释的问题,尤其是识别人类病理中的疾病关键细胞,这种状态的细胞类型在正常样本或者非同类型疾病样本往往是没有的。
  • 目前对于单细胞空间来讲,细胞类型和状态的可靠识别是一个瓶颈,尤其是细胞状态。
  • 现有的数据库和分析工具使用不同的标记,导致注释不一致和可解释性差。此外,目前的工具主要关注生理细胞类型,限制了它们对疾病的适用性。
  • 准确可靠地注释细胞类型是得出可靠生物学结论的关键。识别细胞类型的稳健性是辨别疾病关键细胞的重要前提,其特征是导致疾病发生、进展和治疗抵抗的异常细胞状态。
  • 单细胞数据中细胞群的识别可以手动或自动执行。基于研究者的知识或从已发表的文献中得出的手动注释通常是主观的,由于缺乏标准化,通常是不可复制的。许多计算工具通过关联参考表达数据或从其他单细胞数据集传输标签来执行自动注释。这些方法需要纯化细胞的可靠转录组谱或高质量的注释单细胞数据。然而,这些参考数据集并不容易获得,特别是对于病理样本;公共数据集可能缺乏感兴趣的细胞群,并且可能容易受到平台或测序策略等技术特性的影响。许多当前的工具要求用户提供一组marker基因,这一过程容易产生偏差。
  • 目前可用的基因标记数据库非常异质,包含同一细胞类型的不同标记集,并采用非标准的命名和分类,从而导致scRNA-seq和空间数据中细胞群的注释不一致,结果的可解释性较差。目前的工具和资源主要集中在生理细胞类型上,限制了对疾病关键细胞的识别。
  • 现状一、数据库之间的广泛异构性导致细胞类型注释不一致
  • 从CellMarker2.0和Panglao DB中提取标记基因,自动注释了已发表的人类骨髓scRNA-seq数据集,这两个数据库是细胞类型标记最全面的数据库。两个来源之间的细胞类型注释往往不一致,显示了分配给同一簇的不同细胞类型。结果表明,不同的标记基因数据库不可避免地会导致对单细胞数据生物学意义的不一致解释,并对数据挖掘产生深远的影响。
  • 现状二、构建完整的细胞注释数据库以及疾病状态
  • 现状三、改进细胞注释算法和可靠性
  • 高精度空间数据的注释
  • 最为关键的一点:识别人类病理中的疾病关键细胞
  • 许多疾病,包括肿瘤,都包含表现出改变状态和异常基因表达的关键细胞群。这些疾病关键细胞显著影响疾病进展和治疗结果。恶性细胞选择性亚群的持续存在被认为是在各种癌症患者中常见的高复发率的根本原因,识别和表征人类病理学中的疾病关键细胞对于改善对阻断药物的诊断、了解发病机制和治疗耐药机制以及开发新的疗法来特异性靶向和根除癌变细胞,同时最大限度地减少对健康细胞的不利影响至关重要。
  • 运用:鉴定剪接因子突变骨髓增生异常综合征患者细胞类型组成的改变
  • 剪接因子(SF)基因突变在大约50%的骨髓增生异常综合征(MDS)和急性髓系白血病(AML)患者中普遍存在。这些突变,尤其是U2AF1突变,与AML转化的高风险和存活率降低有关
  • 核心目的:区分突变带来的细胞类型表达状态的差异。
  • 运用:识别小鼠骨髓中先天免疫途径的激活(m6A)
  • 表征疾病或药物治疗模型中的病理相关途径。
  • 参考链接:GitHub - TebaldiLab/cellmarkeraccordion
  • 参考链接rdds.it/CellMarkerAccordion/
  • 生活很好,有你更好
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档