追风少年i
知识扩展--基因变异与基因表达量之间的关系
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
追风少年i
社区首页
>
专栏
>
知识扩展--基因变异与基因表达量之间的关系
知识扩展--基因变异与基因表达量之间的关系
原创
追风少年i
关注
发布于 2025-10-15 10:10:53
发布于 2025-10-15 10:10:53
96
0
举报
作者,Evil Genius
今天我们知识扩展,分析一下基因变异与表达量之间的关系,以及为什么癌细胞突变(例如BRAF V600E等)的单细胞数据可以通过CNV的方式检测癌细胞。
突变的位置与功能
BRAF V600E 是什么? 这是一个在BRAF基因第600位的氨基酸缬氨酸被谷氨酸取代的点突变。这个位置处于蛋白质的激活区段。
主要影响:
正常BRAF:需要复杂的上游信号和调控才会被短暂激活,然后传递细胞生长和分裂的信号。
V600E突变BRAF:这个氨基酸的替换模拟了蛋白质被磷酸化的状态,导致蛋白质的构象发生改变,使其 “伪装”成一直处于激活状态。这意味着它不再需要上游信号的指令,就能持续、高强度地向下游传递生长信号。
BRAF V600E 对 BRAF 表达量的影响
转录水平(mRNA): BRAF V600E 突变点位于蛋白质的编码区,而不是基因的调控区(如启动子)。因此,它不会直接导致细胞转录出更多的BRAF mRNA。在大多数研究中,携带BRAF V600E的肿瘤细胞,其总的BRAF mRNA水平与正常细胞相比,并没有一致性的、大幅度的升高。
蛋白质水平: 这里情况稍微复杂一点,但核心结论不变。
BRAF V600E 蛋白本身没有变得更稳定或更容易积累。
首先来看第一部分,基因变异(主要是突变)与基因表达量的关系
关键区别:表达量 vs. 活性
这是理解整个问题的核心:
表达量:可以理解为 “数量”。即细胞里有多少BRAF分子。
活性:可以理解为 “工作效率”。即每个BRAF分子有多活跃。
BRAF V600E 的改变是“质变”而非“量变”。
一个正常的细胞可能有10,000个BRAF分子,但只有1%是活跃的,那么有效工作分子是100个。
一个携带BRAF V600E的癌细胞也可能有10,000个BRAF分子,但由于突变,超过50%甚至更多都处于持续激活状态,那么有效工作分子就是5,000个以上。
尽管分子“数量”相当,但突变细胞的信号输出“强度”放大了数十倍甚至数百倍。 这正是它驱动肿瘤生长的根本原因。
实际上,由于它持续激活,可能会触发一些负反馈调节机制。细胞为了对抗这种异常强烈的信号,有时甚至会尝试下调BRAF的表达或活性。
因此,总的BRAF蛋白质水平通常也不会因为V600E突变而显著增加。
基因突变如何影响基因表达量?
突变可以通过多种方式间接或直接地影响其自身或其他基因的表达量:
直接影响(较少见):
启动子/增强子突变:如果突变发生在基因的调控区域(如启动子或增强子),它可能会直接改变转录因子与DNA的结合能力,从而直接上调或下调该基因的转录水平,导致mRNA和蛋白质总量发生变化。
间接影响或功能性影响(更常见,尤其是对于BRAF V600E这类突变):
组成性激活信号通路:这是BRAF常见激活突变(如 V600E)的主要机制。
正常情况:BRAF蛋白需要与信号分子结合才会被激活,然后传递细胞生长和增殖的信号。
突变情况(如BRAF V600E):突变改变了BRAF蛋白的三维结构,使其即使没有信号分子结合,也处于持续激活状态(组成性激活)。
结果:虽然BRAF的基因表达总量(mRNA水平)可能没有变化,但这个“一直开着”的突变蛋白会持续向下游发送强大的生长信号。从细胞的角度看,BRAF信号通路的“功能性输出”被极大地放大了,这比单纯的表达量增加要致命得多。
影响蛋白质稳定性和降解:某些突变可能使蛋白质变得更加稳定,不易被细胞内的降解系统清除。这会导致突变蛋白在细胞中积累,即使mRNA水平不变,其蛋白质水平也会升高。
通过反馈环路影响表达:持续的激活信号可能会触发细胞内的反馈调节机制。有时为了对抗过强的信号,细胞可能会下调该受体的表达。但在癌症中,这些反馈机制通常已经失效。
我们总结一下:这种突变本身通常不会直接、显著地增加BRAF基因的总表达量(mRNA水平),但它会通过根本性地改变BRAF蛋白质的功能,从而强烈地驱动癌症。其致癌机制是“功能获得”,而非“表达量增加”。
再来看第二部分,为什么肿瘤的单细胞数据可以依靠CNV来识别肿瘤细胞
核心原因在于:inferCNV 并不是通过检测 BRAF V600E 这个突变本身来识别癌细胞的,而是通过检测这个突变所引发的、在癌细胞中普遍存在的“基因组大规模结构性改变”来将其与正常细胞区分开。
InferCNV 的工作原理是什么?
核心思想: 比较一组“疑似细胞”(比如肿瘤样本细胞)和一组“参考细胞”(比如正常的癌旁组织细胞)在全基因组各个位置基因表达量的相对强弱。
理论基础: 如果一个基因组区域发生了拷贝数扩增(DNA片段变多了),那么位于这个区域的所有基因的表达量通常会整体性、协同性地升高。反之,如果一个区域发生了拷贝数缺失(DNA片段变少了),那么基因的表达量则会整体性降低。
输出结果: InferCNV会生成一张热图,直观地展示每个细胞在全染色体范围内,哪些区域是“高表达”(可能扩增,如红色),哪些区域是“低表达”(可能缺失,如蓝色)。
2. BRAF V600E 与拷贝数变异(CNV)的关系
BRAF V600E 是一个点突变,它本身不会在DNA测序的 reads count 上产生大规模的信号,让inferCNV直接捕捉到。
然而,关键点在于: BRAF V600E 是一个强力的驱动突变。它就像是一个卡在“加速”位置的油门,迫使细胞疯狂增殖。
在这种高速、且DNA复制修复机制可能出错的增殖过程中,癌细胞基因组会变得非常不稳定。
这会导致大量随机性的拷贝数变异(CNV) 产生,例如整个染色体的臂的获得或丢失(比如1号染色体长臂扩增、17号染色体短臂缺失等)。
因此,携带BRAF V600E的肺癌细胞,其基因组几乎总是伴随着广泛的、大规模的CNV事件。 而这些CNV事件,正是inferCNV能够敏锐捕捉到的信号。
3. 单细胞分析中的实际操作流程
在单细胞RNA测序(scRNA-seq)分析中,鉴定癌细胞通常是一个多步骤、多证据的综合判断过程:
第一步:初步细胞分群
首先,对所有细胞进行无监督聚类,根据它们的整体基因表达谱,得到几十个不同的细胞亚群。
第二步:细胞类型注释
通过已知的细胞标志物来识别这些亚群:比如,表达 EPCAM,
KRTTAP1-5
的是上皮细胞(可能的癌细胞);表达 PECAM1, VWF 的是内皮细胞;表达 CD3D, NKG7 的是免疫细胞等。
第三步:使用 InferCNV 进行“恶性”评估
此时,我们将所有上皮细胞作为“疑似细胞”,将所有免疫细胞、基质细胞等作为“参考细胞”(因为这些正常细胞理论上不应该有CNV),运行inferCNV。
结果解读:
癌细胞: 会显示出强烈且大范围的CNV信号(热图上出现大片的红色和蓝色区块)。这是因为它们的基因组不稳定。
正常上皮细胞: 它们的基因组是稳定的,因此不会显示出这种大范围的CNV模式,其热图看起来会比较“平淡”或与参考细胞相似。
第四步:综合确认
最终,我们认定那些既表达上皮细胞标志物,又在inferCNV分析中显示出强CNV信号的细胞,为癌细胞。
随后,我们可以通过对scRNA-seq数据中的突变位点进行“挖取”,在这些已经被鉴定出的癌细胞中,专门去寻找和验证 BRAF V600E 突变的存在。这反过来也证实了BRAF V600E就是驱动这些具有CNV特征的癌细胞的元凶。
总结
为什么单细胞可以用inferCNV检测携带BRAF V600E的癌细胞?
不是因为 inferCNV 检测到了 BRAF V600E 本身。
而是因为 BRAF V600E 作为一种驱动突变,会导致细胞基因组不稳定,从而产生广泛的拷贝数变异(CNV)。
InferCNV 是一个出色的工具,用于检测这种基因组不稳定的间接标志,从而将基因组混乱的癌细胞(无论其驱动突变是什么)与基因组稳定的正常细胞区分开来。
简单来说:InferCNV通过检测“犯罪现场”(癌细胞基因组)的“混乱痕迹”(CNV)来锁定“嫌疑人”(癌细胞),而BRAF V600E则是这个“嫌疑人”所使用的特定“凶器”(驱动突变)。 在破案时,我们先通过现场的混乱痕迹找到嫌疑人,然后再从他身上搜出特定的凶器。
生活很好,有你更好
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
数据分析
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
数据分析
#单细胞
#CNV
#突变
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
作者,Evil Genius
今天我们知识扩展,分析一下基因变异与表达量之间的关系,以及为什么癌细胞突变(例如BRAF V600E等)的单细胞数据可以通过CNV的方式检测癌细胞。
突变的位置与功能
BRAF V600E 是什么? 这是一个在BRAF基因第600位的氨基酸缬氨酸被谷氨酸取代的点突变。这个位置处于蛋白质的激活区段。
主要影响:
正常BRAF:需要复杂的上游信号和调控才会被短暂激活,然后传递细胞生长和分裂的信号。
V600E突变BRAF:这个氨基酸的替换模拟了蛋白质被磷酸化的状态,导致蛋白质的构象发生改变,使其 “伪装”成一直处于激活状态。这意味着它不再需要上游信号的指令,就能持续、高强度地向下游传递生长信号。
BRAF V600E 对 BRAF 表达量的影响
转录水平(mRNA): BRAF V600E 突变点位于蛋白质的编码区,而不是基因的调控区(如启动子)。因此,它不会直接导致细胞转录出更多的BRAF mRNA。在大多数研究中,携带BRAF V600E的肿瘤细胞,其总的BRAF mRNA水平与正常细胞相比,并没有一致性的、大幅度的升高。
蛋白质水平: 这里情况稍微复杂一点,但核心结论不变。
BRAF V600E 蛋白本身没有变得更稳定或更容易积累。
首先来看第一部分,基因变异(主要是突变)与基因表达量的关系
关键区别:表达量 vs. 活性
这是理解整个问题的核心:
表达量:可以理解为 “数量”。即细胞里有多少BRAF分子。
活性:可以理解为 “工作效率”。即每个BRAF分子有多活跃。
BRAF V600E 的改变是“质变”而非“量变”。
一个正常的细胞可能有10,000个BRAF分子,但只有1%是活跃的,那么有效工作分子是100个。
一个携带BRAF V600E的癌细胞也可能有10,000个BRAF分子,但由于突变,超过50%甚至更多都处于持续激活状态,那么有效工作分子就是5,000个以上。
尽管分子“数量”相当,但突变细胞的信号输出“强度”放大了数十倍甚至数百倍。 这正是它驱动肿瘤生长的根本原因。
实际上,由于它持续激活,可能会触发一些负反馈调节机制。细胞为了对抗这种异常强烈的信号,有时甚至会尝试下调BRAF的表达或活性。
因此,总的BRAF蛋白质水平通常也不会因为V600E突变而显著增加。
基因突变如何影响基因表达量?
突变可以通过多种方式间接或直接地影响其自身或其他基因的表达量:
直接影响(较少见):
启动子/增强子突变:如果突变发生在基因的调控区域(如启动子或增强子),它可能会直接改变转录因子与DNA的结合能力,从而直接上调或下调该基因的转录水平,导致mRNA和蛋白质总量发生变化。
间接影响或功能性影响(更常见,尤其是对于BRAF V600E这类突变):
组成性激活信号通路:这是BRAF常见激活突变(如 V600E)的主要机制。
正常情况:BRAF蛋白需要与信号分子结合才会被激活,然后传递细胞生长和增殖的信号。
突变情况(如BRAF V600E):突变改变了BRAF蛋白的三维结构,使其即使没有信号分子结合,也处于持续激活状态(组成性激活)。
结果:虽然BRAF的基因表达总量(mRNA水平)可能没有变化,但这个“一直开着”的突变蛋白会持续向下游发送强大的生长信号。从细胞的角度看,BRAF信号通路的“功能性输出”被极大地放大了,这比单纯的表达量增加要致命得多。
影响蛋白质稳定性和降解:某些突变可能使蛋白质变得更加稳定,不易被细胞内的降解系统清除。这会导致突变蛋白在细胞中积累,即使mRNA水平不变,其蛋白质水平也会升高。
通过反馈环路影响表达:持续的激活信号可能会触发细胞内的反馈调节机制。有时为了对抗过强的信号,细胞可能会下调该受体的表达。但在癌症中,这些反馈机制通常已经失效。
我们总结一下:这种突变本身通常不会直接、显著地增加BRAF基因的总表达量(mRNA水平),但它会通过根本性地改变BRAF蛋白质的功能,从而强烈地驱动癌症。其致癌机制是“功能获得”,而非“表达量增加”。
再来看第二部分,为什么肿瘤的单细胞数据可以依靠CNV来识别肿瘤细胞
核心原因在于:inferCNV 并不是通过检测 BRAF V600E 这个突变本身来识别癌细胞的,而是通过检测这个突变所引发的、在癌细胞中普遍存在的“基因组大规模结构性改变”来将其与正常细胞区分开。
InferCNV 的工作原理是什么?
核心思想: 比较一组“疑似细胞”(比如肿瘤样本细胞)和一组“参考细胞”(比如正常的癌旁组织细胞)在全基因组各个位置基因表达量的相对强弱。
理论基础: 如果一个基因组区域发生了拷贝数扩增(DNA片段变多了),那么位于这个区域的所有基因的表达量通常会整体性、协同性地升高。反之,如果一个区域发生了拷贝数缺失(DNA片段变少了),那么基因的表达量则会整体性降低。
输出结果: InferCNV会生成一张热图,直观地展示每个细胞在全染色体范围内,哪些区域是“高表达”(可能扩增,如红色),哪些区域是“低表达”(可能缺失,如蓝色)。
2. BRAF V600E 与拷贝数变异(CNV)的关系
BRAF V600E 是一个点突变,它本身不会在DNA测序的 reads count 上产生大规模的信号,让inferCNV直接捕捉到。
然而,关键点在于: BRAF V600E 是一个强力的驱动突变。它就像是一个卡在“加速”位置的油门,迫使细胞疯狂增殖。
在这种高速、且DNA复制修复机制可能出错的增殖过程中,癌细胞基因组会变得非常不稳定。
这会导致大量随机性的拷贝数变异(CNV) 产生,例如整个染色体的臂的获得或丢失(比如1号染色体长臂扩增、17号染色体短臂缺失等)。
因此,携带BRAF V600E的肺癌细胞,其基因组几乎总是伴随着广泛的、大规模的CNV事件。 而这些CNV事件,正是inferCNV能够敏锐捕捉到的信号。
3. 单细胞分析中的实际操作流程
在单细胞RNA测序(scRNA-seq)分析中,鉴定癌细胞通常是一个多步骤、多证据的综合判断过程:
第一步:初步细胞分群
首先,对所有细胞进行无监督聚类,根据它们的整体基因表达谱,得到几十个不同的细胞亚群。
第二步:细胞类型注释
通过已知的细胞标志物来识别这些亚群:比如,表达 EPCAM, KRTTAP1-5 的是上皮细胞(可能的癌细胞);表达 PECAM1, VWF 的是内皮细胞;表达 CD3D, NKG7 的是免疫细胞等。
第三步:使用 InferCNV 进行“恶性”评估
此时,我们将所有上皮细胞作为“疑似细胞”,将所有免疫细胞、基质细胞等作为“参考细胞”(因为这些正常细胞理论上不应该有CNV),运行inferCNV。
结果解读:
癌细胞: 会显示出强烈且大范围的CNV信号(热图上出现大片的红色和蓝色区块)。这是因为它们的基因组不稳定。
正常上皮细胞: 它们的基因组是稳定的,因此不会显示出这种大范围的CNV模式,其热图看起来会比较“平淡”或与参考细胞相似。
第四步:综合确认
最终,我们认定那些既表达上皮细胞标志物,又在inferCNV分析中显示出强CNV信号的细胞,为癌细胞。
随后,我们可以通过对scRNA-seq数据中的突变位点进行“挖取”,在这些已经被鉴定出的癌细胞中,专门去寻找和验证 BRAF V600E 突变的存在。这反过来也证实了BRAF V600E就是驱动这些具有CNV特征的癌细胞的元凶。
总结
为什么单细胞可以用inferCNV检测携带BRAF V600E的癌细胞?
不是因为 inferCNV 检测到了 BRAF V600E 本身。
而是因为 BRAF V600E 作为一种驱动突变,会导致细胞基因组不稳定,从而产生广泛的拷贝数变异(CNV)。
InferCNV 是一个出色的工具,用于检测这种基因组不稳定的间接标志,从而将基因组混乱的癌细胞(无论其驱动突变是什么)与基因组稳定的正常细胞区分开来。
简单来说:InferCNV通过检测“犯罪现场”(癌细胞基因组)的“混乱痕迹”(CNV)来锁定“嫌疑人”(癌细胞),而BRAF V600E则是这个“嫌疑人”所使用的特定“凶器”(驱动突变)。 在破案时,我们先通过现场的混乱痕迹找到嫌疑人,然后再从他身上搜出特定的凶器。
生活很好,有你更好
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐