Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >提供数据代码,想学基因组分析,看看这篇刚发在 Nature 的胃突变图谱分析就够了

提供数据代码,想学基因组分析,看看这篇刚发在 Nature 的胃突变图谱分析就够了

作者头像
生信菜鸟团
发布于 2025-04-11 05:51:27
发布于 2025-04-11 05:51:27
870
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题:The somatic mutation landscape of normal gastric epithelium
  • 中文标题:正常胃上皮的体细胞突变图谱
  • 发表日期:19 March 2025
  • 文章类型:Article
  • 所属期刊:Nature
  • 文章作者:Tim H. H. Coorens | Michael R. Stratton
  • 文章链接:https://www.nature.com/articles/s41586-025-08708-6

Abstract

Para_01
  1. 正常细胞中的体细胞突变景观使我们了解了整个生命过程中运作的突变和选择过程,提供了关于正常衰老以及癌症发展的最早阶段的见解。
  2. 在这里,通过对30名个体(包括18名胃癌患者)的238个微解剖样本进行全基因组测序,我们阐明了正常和恶性胃上皮的发育轨迹。
  3. 我们发现胃腺是单克隆细胞群体的单位,每年大约积累28个体细胞单核苷酸变异,这主要归因于内源性突变过程。
  4. 在患有胃癌的个体中,化生腺往往显示出较高的突变负担,这是由于与增殖和氧化损伤相关的突变过程加速所致。
  5. 对于正常细胞来说,胃上皮细胞通常携带特定染色体的反复三体性,这种情况在部分个体中高度富集。
  6. 通过靶向测序调查了829个多克隆胃活检样本,我们发现在已知癌症基因的特殊谱系中存在体细胞‘驱动’突变,包括ARID1A、ARID1B、ARID2、CTNNB1和KDM6A。
  7. 随着年龄的增长,突变克隆的流行率增加,在60岁时大约占据胃上皮层的8%,并且严重慢性炎症的存在显著增加了这一比例。
  8. 我们的研究结果提供了对内在和外在因素影响胃上皮层体细胞进化的见解,涵盖了健康、癌前和恶性状态。

Main

Para_01
  1. 在人的一生中,体细胞会在人体内获得体细胞突变,从而产生遗传多样性,并使组织中的自然选择成为可能。
  2. 然而,直到最近,与癌细胞相比,对正常细胞体细胞突变图谱的理解还比较有限。
  3. 然而,新的DNA测序方法已经使得探索正常体细胞基因组、阐明细胞谱系、估算突变率、评估潜在的突变过程以及检测携带赋予生长优势的突变基因的克隆成为可能。
  4. 这些突变图谱提供了关于个体一生中正常组织体细胞进化的见解,以及癌症早期发展的最早阶段的信息。
Para_02
  1. 胃肠道构成四个主要部分——食道、胃、小肠和大肠——它们依次处理摄入的食物材料,并与非常不同的管腔内容物相互作用。
  2. 正常上皮细胞的体细胞突变图谱最近被描述了食道5、小肠7和大肠6的上皮细胞。
  3. 胃包括几个解剖学和组织学上不同区域,包括贲门、胃底、胃体、小弯和大弯、幽门和胃窦。
  4. 胃的上皮层由分支腺体组成,这些腺体产生盐酸、消化酶和激素。
Para_03
  1. 胃癌是全球第五大常见癌症诊断,也是导致癌症相关死亡的第三大原因。
  2. 其发病率在地理上有所不同,在东亚和南美洲最高。
  3. 已知的风险因素包括幽门螺杆菌和Epstein-Barr病毒的感染、饮酒、吸烟、肥胖和饮食。
  4. 不同解剖区域的胃部,癌症风险和不同风险因素的影响差异显著,在高发地区,胃窦的风险最高。
  5. 而在低发地区,胃食管交界处的风险最高。
  6. 胃癌的流行病学表明,许多外源性因素通过暴露和慢性炎症影响胃部的体细胞突变。
  7. 慢性炎症可导致化生,即胃上皮重塑以类似于肠上皮,这被认为是显性癌症的前兆。
Para_04
  1. 我们研究了患有和未患有胃癌的捐赠者的胃上皮体细胞遗传多样性,并开始揭示正常年龄相关体细胞进化与恶性肿瘤之间的转变。
  2. ,

Mutation rates of gastric epithelium

Para_01
  1. 该队列包含30名个体,其中18名患有胃癌,12名没有胃部病理(随后分别称为‘癌症捐赠者’和‘非癌症捐赠者’),来自香港、美国和英国(补充表1)。
  2. 来自香港的捐赠者接受了幽门螺杆菌感染检测。
  3. 对217个胃腺进行了显微解剖并单独进行了全基因组测序,平均覆盖度达到23倍,同时还对两名个体的21个癌性腺体进行了测序(图1a和补充表2)。
  4. 此外,我们还对另外829个单个或集群的胃腺进行了已知癌症基因的目标测序。
  5. 所有类别的体细胞突变均通过标准方法检出(方法)。

Fig. 1: Clonality and mutation rates.

- 图片说明

◉ 这项研究的概述。从30名捐赠者身上采集了胃腺。◉ 对来自正常、发炎和/或化生胃组织的217个微解剖单个腺体以及21个胃癌腺体进行了全基因组测序,另外对829个微解剖(每个包含几个相邻的腺体)进行了深度靶向基因测序(seq.)。◉ 三个捐赠者的胃腺微解剖体中体细胞突变的VAF分布,按中位VAF着色。◉ 所有全基因组测序单个胃腺微解剖体(n=217)的中位VAF直方图。◉ 非癌症捐赠者胃腺的SNVs和indels数量与捐赠者年龄的关系图(n=79)。红色虚线表示基于混合效应模型的最大似然估计年龄和SNV突变负荷关系,灰色阴影区域表示95%置信区间。◉ d图中的P值是通过双侧方差分析测试获得的。◉ a图中的胃轮廓改编自Servier Medical Art(https://smart.servier.com/),采用国际CC BY 4.0许可。◉ a图中的激光捕获显微切割轮廓改编自参考文献8,Springer Nature Limited。◉ M代表男性;F代表女性。

Para_02
  1. 不同于肠道的直管状腺体,胃腺由向底部分支的管状结构组成,并且可能含有自我更新干细胞的潜在贡献。
  2. 先前的研究通过对X染色体失活的研究表明,胃腺最初是由多克隆单元组成的,并逐渐转变为单克隆,尽管多克隆腺体可能在整个生命过程中持续存在。
  3. 胃腺的克隆组成可以通过体细胞单核苷酸变异(SNVs)和小插入和缺失(indels)的变异等位基因频率(VAFs)来估计。
  4. 每个显微解剖样本的中位VAF通常超过0.25(图1b,c),考虑到一定程度的间质污染,这证实了大多数腺体主要由单一干细胞后代主导的观点,一个占据超过一半细胞的克隆。
  5. 在217个显微解剖样本中的8%(17个样本)中,中位VAF低于0.25或有多个克隆共存的证据,这表明存在多个干细胞生态位以及比在肠隐窝中观察到的更为复杂的层次结构。
Para_03
  1. 正常腺体中的体细胞单核苷酸变异总数在没有胃癌的12人中随着年龄的增长呈线性增加(图1d),因此他们的干细胞祖细胞每年积累大约27.8个单核苷酸变异(95%置信区间:16.2-39.4)和2.0个插入或缺失(95%置信区间:0.74-3.28)。
  2. 校正变异检测的敏感性后,腺体的克隆性(即,中位VAF)与突变负荷之间没有相关性(扩展数据图1a),这取决于测序深度和观察到的VAF分布。
Para_04
  1. 胃癌供体胃腺的显微切割中的SNV和indel负担主要遵循在没有胃癌的个体中观察到的与年龄相关的增加(图2a–c),但肠上皮化生(IM)(n = 19,SNV的P = 1×10^-42,indel的P = 1.8×10^-49,方差分析(ANOVA)检验)除外。
  2. 尽管慢性炎症在非癌症和癌症供体中都很普遍,但在我们的队列中,IM无论是完全还是不完全的,仅限于胃癌个体的幽门部。
  3. 平均而言,与年龄预期负担相比,化生性腺中的突变负担分别增加了2.8倍和4.4倍(SNV和indel)(图2e)。
  4. 与非化生性腺相比,化生性腺在每次显微切割中表现出总体更高的中位变异等位基因频率(P = 0.006,Wilcoxon秩和检验;扩展数据图1b)。
  5. 当解剖位置接近时,化生性腺在系统发育上是紧密相关的(扩展数据图2a,c),这表明化生克隆局部扩展。
  6. 然而,在同一供体中距离较远的化生性腺在早期发育后在系统发育上是无关的(扩展数据图2a,b),这表明化生诱导存在更广泛的‘场效应’。

Fig. 2: Gastric segments, chronic inflammation and metaplasia.

- 图片说明

◉ 散点图显示了供体年龄与胃腺(a)中单核苷酸变异数量的关系,分别针对非癌症供体(上排)和癌症供体(下排),根据示意图 d 中所示的采样胃部区域进行颜色编码。◉ 图中红线表示从非癌症供体的胃腺中估计出的最大似然年龄与单核苷酸变异突变负荷关系(图 1d),灰色阴影区域表示 95% 置信区间。◉ b,慢性炎症状态。◉ c,肠化生的存在。◉ d,胃部解剖示意图。◉ e,癌症供体(n = 138)中腺体显微切割样本的观察到的与年龄相关的预期单核苷酸和插入缺失突变负荷比率的箱线图,其中包含和不包含肠化生。◉ 箱线图中的中央线、箱子和须分别代表中位数、四分位间距(IQR)从第一到第三四分位数以及 1.5×IQR。◉ P 值由双侧 Wilcoxon 秩和检验获得。◉ 注:图 d 中的胃轮廓来自 Servier Medical Art(https://smart.servier.com/),采用 CC BY 4.0 国际许可。

Para_05
  1. 注释当前或以前的H. pylori状态仅被少数供体知晓,并未显著影响SNV负担(P = 0.74,ANOVA检验;扩展数据图1c)。然而,未检测到的感染可能影响突变率,这排除了对此关系得出明确结论的可能性。
  2. 与正常或肠上皮化生胃腺中的突变负荷相比,从胃癌中微解剖出的腺体的SNV和indel负担显著增加(扩展数据图1d,e)。
  3. 通过全基因组测序(WGS),我们估计胃腺的端粒每年平均缩短38个碱基(95%置信区间:25-53),在中度或重度慢性炎症存在的情况下,端粒显著缩短了570个碱基(P = 6×10^-5,ANOVA检验;扩展数据图1f)。
  4. 除了慢性炎症的影响外,肠上皮化生并未进一步缩短端粒长度(P = 0.11,ANOVA检验)。

Mutational signatures and processes

Para_01
  1. 突变特征是特定突变过程在基因组上留下的突变模式。
  2. 可以使用数学方法对它们进行解卷积和归因,从而确定它们对个体样本中体细胞突变的贡献。
  3. 在癌症和正常细胞中已经报道了超过70种单碱基替换(SBS)参考特征(https://cancer.sanger.ac.uk/signatures)。
Para_02
  1. 使用所有胃腺的全基因组体细胞突变目录,提取了九种突变特征(图 3a–d 和扩展数据图 3–4),这些特征之前均已报道过19,20(方法):SBS1,由于5-甲基胞嘧啶自发脱氨基;SBS2 和 SBS13,由于载脂蛋白BEC胞苷脱氨酶的活性,并且仅在PD41759肿瘤中发现(图 3d);SBS3,由于同源修复缺陷,并且仅在PD41759中发现(图 3d);SBS5/SBS40,病因不明但认为是内在起源;SBS17a 和 SBS17b,病因不明但有时与化疗药物5-氟尿嘧啶的暴露或游离核苷酸池的氧化有关21;SBS18,由于活性氧引起的DNA损伤;以及SBS28,病因不明。

Fig. 3: Mutational signatures.

- 图片说明

◉ a–d,来自四位不同胃癌供体的胃腺的系统发育树。a,PD40294(仅非肠化生腺体)。b,PD41760(肠化生和非肠化生腺体)。c,PD41762(仅肿瘤)。d,PD41759(肿瘤、肠化生和非肠化生腺体)。每个分支上叠加了突变特征比例,并且不同的特征由不同的颜色表示(见图例)。分支长度代表每个分支上的SNV数量。注意d中的y轴断开。星号表示具有IM的腺体,癌症中的腺体微解剖在系统发育图中表示。◉ e,在19个来自肠化生腺体的微解剖样本中,通过比较这些特征的观察突变负担与预期负担,估算SBS1、SBS5/40和SBS18的倍增数。P值是通过双侧Wilcoxon秩和检验获得的。中央线、框和须分别代表中位数、四分位间距从第一到第三四分位数以及1.5倍四分位间距。◉ f,样本中ID1插入次数与ID2缺失次数的关系,两者均与聚合酶滑移有关。◉ g,正常腺体、肠化生腺体和肿瘤样本中ID2缺失与ID1插入的比例。中央线、框和须分别代表中位数、四分位间距范围从第一到第三四分位数以及1.5倍四分位间距。P值是从双侧Wilcoxon秩和检验获得的。ROS,活性氧;HRD,同源修复缺陷。

Para_03
  1. 大多数正常胃腺中的SNV可以通过SBS1、SBS5/40和SBS18来解释(图3a,b),这些都在所有胃腺中被检测到。
  2. SBS1和SBS5/SBS40普遍存在于人类癌症19以及正常细胞1中。
  3. SBS18出现在许多正常细胞类型中,尤其是在细胞分裂速率较高的细胞类型中6,8,11。
  4. 在正常、非化生性胃腺中,由SBS1、SBS5/40和SBS18引起的突变负担与年龄呈线性相关(扩展数据图5)。
  5. 在化生性胃腺中发现的高于预期的SNV突变负担是由于SBS1(大约3倍)和SBS18(大约8倍)的突变负担增加,但SBS5/40的突变负担没有显著变化(大约1倍)(图3e)。
Para_04
  1. 插入缺失的特征分析显示,胃腺体普遍表现出ID1和ID2——分别代表单碱基插入和删除——这些出现在T/A同聚物链上,并与聚合酶滑动有关,以及ID5和ID9,两者都表现为同聚物上的删除,但具体原因未知(扩展数据图6a,b)。
  2. 在化生腺体中观察到的插入缺失过量主要由ID1和ID2组成(图3f和扩展数据图6c),但在化生腺体中ID2与ID1的比例显著高于其他非癌腺体,并且更接近于胃癌样本中的比例(图3g)。
Para_05
  1. 一小部分患有胃癌个体的正常胃腺也表现出适度的SBS17a和SBS17b负担(图3b)。
  2. 大量的SBS17a和SBS17b突变负荷在食管腺癌22及其前体病变巴雷特食管23中很常见,如这里测序的两种癌症所示(图3c,d)。
  3. 相比之下,在正常胃组织中很少观察到这些突变特征,这表明导致SBS17a和SBS17b的突变过程主要是肿瘤细胞的特征。
  4. 然而,SBS17a和SBS17b仅在另一种正常细胞类型(B淋巴细胞9)中被发现,因此胃上皮细胞似乎特别容易产生它们和/或存在诱导它们的胃微环境因素。
Para_06
  1. 胃癌中解剖出的腺体的突变特征模式与正常腺体的明显不同。
  2. 虽然仍然表现出上述普遍存在的单核苷酸变异和插入缺失特征的贡献,但癌症显示出SBS17a和SBS17b,以及SBS3和ID6(同源修复缺陷),SBS2和SBS13(APOBEC活性)(图3c,d)和ID14(未知病因)的大量贡献,这与先前报道的系列一致19。

Recurrent trisomies in gastric glands

Para_01
  1. 体细胞拷贝数变异(CNVs)和结构变异在少数正常胃腺(217个中的73个)中被观察到,但其频率仍然远高于迄今为止研究过的其他正常人类细胞类型1,6,11(图4a、b)。
  2. 此外,胃上皮中的CNVs表现出一种高度独特的模式。
  3. 染色体内CNVs和结构变异主要为缺失,并且涉及FHIT、PTPRD和MACROD2等众所周知的脆弱位点(参见文献24,25)。
  4. 尽管这些位点在胃癌中已有报道24,但目前尚不清楚所观察到的事件是由于该位点突变率高还是因为数据中的正向选择。
  5. 染色体臂水平的事件均为无杂合性丢失的拷贝数中性(cnn-LOH),而整条染色体的事件则完全由体细胞三体性组成,主要是第13号和第20号染色体。
  6. 值得注意的是,三体性集中在某些个体中,并且常常在同一个人身上独立发生多次(图4b)并且在相似的年龄(扩展数据图7)。
  7. 三体性的独立起源是从系统发育树的拓扑结构推断出来的(图4c、d)。
  8. 这一结论进一步通过样品之间三体染色体上的不同复制SNV的存在以及不同胃腺中不同亲本拷贝的复制得到证实。

Fig. 4: CNVs and recurrent trisomies.

- 图片说明

◉ a, 在全基因组测序样本中,根据事件大小划分的独特CNVs概览,并进一步按特定位置或染色体划分。◉ b, 热图显示每个供体的微解剖数量与特定类别的结构变异(SVs)或CNVs的数量,以及供体队列、年龄和全基因组测序微解剖的数量。◉ c,d, 两个供体胃腺的系统发育树中,重复获得13号或20号染色体的结构变异(删除、复制或倒位)数量的点图,供体PD40293(c)和PD41767(d)。◉ 分支长度表示每个分支上的SNV数量。增益的时间由红色(20号染色体)、蓝色(13号染色体)或黑色(17号染色体长臂cnn-LOH)的点表示,彩色实线代表基于受影响区域中CNV的重复和非重复SNV数量的此估计值的95%泊松置信区间(具体数字见补充表4)。◉ 数字表示获得的亲本等位基因。星号表示来自化生腺体的微解剖。◉ Del.,删除;dup.,复制;inv.,倒位。

Para_02
  1. 例如,在一位64岁的胃癌男性患者中,对12个胃腺中的6个分析显示染色体20三体性,3个显示染色体13三体性,1个显示17q杂合性丢失。
  2. 8个腺体仅显示出单一的拷贝数变异,1个腺体同时表现出染色体13和染色体20的三体性。
  3. 因此,12个腺体中有9个显示出拷贝数变异,表明相当大比例的胃上皮已被携带拷贝数变异的细胞占据。
  4. 结果显示,在12个被采样的腺体中有5个独立的染色体20的重复,其中三个来自一个亲本副本,两个来自另一个。
  5. 另外,在这12个腺体中有两个独立的染色体13的重复。
  6. 通过使用重复和非重复单核苷酸变异的比例,我们估计所有五个染色体20的三体性大约在生命早期发生,可能是在12岁左右或更早。
  7. 两次染色体13的重复大约在22岁左右或更早发生,而17q的杂合性丢失大约在35岁左右或更早发生。
  8. 对胃癌基因组的分析表明,染色体20的三体性主要是早期事件,这与这里估算的时间尺度相一致。
Para_03
  1. 通过询问 PD40293 的面板测序数据中的染色体 20 上的 SNP,并使用来自 WGS 数据的单体型信息(扩展数据图 8),我们进一步能够识别出三体性 20 的微解剖样本(65 个中有 23 个),证实了这种体细胞改变的广泛性。
  2. 在这个供体中,面板和全基因组测序样本中染色体 20 的三体性发生的频率在胃底(34 个中有 21 个)和胃体(17 个中有 6 个)中明显高于幽门(24 个中有 2 个)(P = 4.5 × 10^-5,Fisher 精确检验)。
Para_04
  1. 这种胃腺CNVs的独特模式的原因尚不清楚。
  2. 在PD41767中,在一个严重发炎的幽门部位胃活检中的十个腺体中有四个检测到三体性,但在另一个炎症程度较轻的幽门部位样本中的七个腺体中完全没有检测到。
  3. 年龄和化生的存在对染色体内结构变异和CNVs的负担有显著影响(分别为P=0.01和P=10^-14,ANOVA检验)。
  4. 尽管三体性的负担与年龄(P=0.38)、化生(P=0.84)或供体是否患有胃癌(P=0.63)之间没有显著的线性关联,但与严重的慢性炎症有显著关联(P=0.004;所有测试均为ANOVA检验)。
Para_05
  1. 我们的数据显示,全染色体重复并非随着年龄增长而持续增加,而是每个个体生命历程中的某个特定时间点产生的,并且可能局限于胃的特定区域。
  2. 获得或选择这些三体的过程显然与肠上皮化生或癌变无关,但可能存在与慢性炎症之间的联系。
  3. 尽管只有一个携带三体的捐赠者已知感染了幽门螺杆菌,但三体在空间和时间上的局限性以及与炎症的关联表明,可能涉及某种病原体的暴露或感染。

Driver mutations in gastric glands

Para_01
  1. 为了系统地识别正选择下的基因,我们在另外829个多克隆显微切割样本中对217个腺体的全基因组数据进行了补充,并针对321个已知癌症基因进行了靶向测序(方法)。
  2. 七种突变基因显示出统计上显著(q < 0.1)的正选择证据(图5a-c):ARID1A、ARID1B和ARID2,SWI/SNF染色质重塑复合物的亚基;CTNNB1,WNT信号通路转导器和细胞粘附分子;KDM6A,组蛋白甲基化调节因子;LIPF,编码胃脂酶;以及EEF1A1,一种翻译延伸因子。
  3. 所有这些基因,除了LIPF和EEF1A1之外,均已被报道在胃癌中频繁突变27。
  4. LIPF是在胃上皮中高度表达的基因,可能容易发生加速突变,正如先前在胃癌中报道的那样28。

Fig. 5: Driver mutations.

- 图片说明

◉ a, 按功能效应划分的基因显著正选择下的突变数量。◉ b, 正选择下的基因的dN/dS比率按类型划分。◉ c, 每位供体特定驱动突变分布的热图。◉ d, 基于单个腺体的全基因组测序数据的供体PD42790(80,男性)的系统发育树,注释了推定的驱动突变,并附有来自两个区域的组织学图像,图像上叠加了驱动突变及其VAF,包括全基因组测序的显微解剖样本(用WGS表示)和panel测序的显微解剖样本簇。标尺,1毫米。

Para_02
  1. 有趣的是,在正常的胃腺中观察到的CTNNB1突变主要是一些导致蛋白质截短的无义替换和散布在整个基因足迹中的移码插入缺失,这些可能使编码的蛋白失活。
  2. 这与在胃癌和其他许多癌症类型中报道的聚集热点错义CTNNB1替换模式形成对比,后者特征是原癌基因激活。
  3. 正常细胞和癌细胞在CTNNB1突变模式上的这种差异原因尚不清楚,但可能再次突显了正常细胞在正常组织中生存所需的不同的选择性优势和作为癌细胞生存所需的不同的选择性优势之间的不同。
Para_03
  1. 在某些情况下,驱动突变的发生被高度限制在特定的位置。例如,PD42790携带了三个独立的CTNNB1移框突变(在这位供体检测到的四个CTNNB1突变中)在毫米范围内,这表明对这些突变有利的局部选择压力特别强(图5d)。
Para_04
  1. 可能的驱动突变在另一组基因中被识别,尽管这些基因未达到正式显著水平,但它们出现在已知错义突变热点的显性作用癌症基因(BRAF、KRAS)中,此外,一些肿瘤抑制基因中的蛋白截断突变(APC、BCOR)也可能赋予了克隆生长优势。
  2. 然而,在正常胃腺中并未观察到TP53和PIK3CA基因的突变,尽管这两种基因在胃腺癌中以及在某些其他正常细胞类型中很常见。
  3. WGS数据中的驱动突变主要局限于单个微解剖样本(扩展数据图3和图4),并且尽管在化生腺体中未发现驱动突变富集(P = 1),但严重慢性炎症腺体中显著富集了驱动突变(P = 0.01,Fisher精确检验)。
  4. 通过全基因组和panel测序调查的胃上皮所占比例,由突变克隆定植同样依赖于年龄(P = 0.002)和严重慢性炎症(P = 0.001),但不依赖于化生(P = 0.86,ANOVA检验)(扩展数据图9a、b)。
  5. 虽然年龄依赖性可以通过与年龄相关的突变负担增加来解释,但慢性炎症对突变比例的影响持续存在,并且超出了突变负担的差异(扩展数据图9c)。
  6. 平均而言,在60岁个体中,大约7.8%的腺体被具有驱动突变的克隆定植。

Discussion

Para_01
  1. 胃肠道四个主要部分——食道、胃、小肠和大肠——的体细胞突变图谱现在已经被初步调查,展示了相似性和差异性。
  2. 这些部分的上皮细胞与非常不同的管腔内容物接触;这些内容物包括食道中的空气和食物的高度可变温度、胃储库中的酸性和无菌内容物、小肠中的中性内容物和有限的微生物群以及大肠中丰富的、多样的微生物群。
  3. 然而,总体而言,体细胞突变率和突变特征的差异是适度的。
Para_02
  1. 所有四个胃肠道段显示出大致恒定的突变率,从食道和胃中的大约每年30个SNVs到小肠和大肠中的大约每年50个SNVs,这些主要由SBS1、SBS5/40和SBS18背后的生物过程产生,这些过程被认为是主要来源于内源性的,尽管在不同的相对贡献中。
  2. 除了这些普遍存在的突变特征外,还发现其他特征仅存在于胃肠道的部分区域。
  3. 由于载脂蛋白脱氨酶APOBEC的活性,SBS2和SBS13在小肠上皮细胞中很常见,但在食道、胃或大肠中很少见,可能是因为小肠上皮细胞中有较高的APOBEC1活性。
  4. 同样地,由于暴露于大肠杆菌素colibactin(一种存在于微生物组中的大肠杆菌菌株的诱变产物)导致的SBS88,在大肠上皮细胞中很常见,但在胃肠道的其他部分很少见。
  5. 如这里所示,SBS17a和SBS17b偶尔出现在正常胃上皮中,但未在胃肠道其他正常细胞中报道过。
  6. 这种胃肠道各段之间突变过程的相似程度,可能是对各种保护机制有效的证明,这些机制介导了管腔内容物与上皮干细胞之间的相互作用。
Para_03
  1. 与单核苷酸变异(SNV)和插入缺失突变模式的适度差异(除外化生)相比,胃上皮在部分个体中反复生成了7号、13号、18号和20号染色体的三体性,这是一种在胃肠道其他区域或胃肠道外细胞类型中未发现的高度独特模式。
  2. 仅在部分个体中生成的几种不同染色体的三体性模式表明可能存在一种微环境,该微环境增加了染色体复制的速率或选择携带这些三体染色体的干细胞来殖民腺体并克隆性扩展。
  3. 然而,在胃癌患者中并未发现携带三体染色体的腺体富集现象,且这些腺体并不携带特定的驱动突变,但可以与化生共存。
  4. 尽管与炎症有关联的可能性很大,但引发刺激的确切性质尚不清楚。
Para_04
  1. 胃肠道四个段落中具有已知癌症基因驱动突变的细胞克隆的景观也存在显著差异。
  2. 在食道中,大约60%的正常鳞状上皮在60岁个体中被具有驱动突变的细胞克隆占据。
  3. 在小肠和大肠的隐窝中,这一比例要低得多,约为1%(参考文献6,7)。
  4. 而胃腺上皮中有5%被具有驱动突变的克隆占据。
  5. 这些差异至少部分反映了上皮结构,食道的连续分层鳞状上皮表皮允许克隆的横向扩散,
  6. 而小肠和大肠的隐窝结构阻碍了克隆,使具有驱动因子的克隆无法超出单个隐窝的范围。
  7. 在胃中,坑向管状结构的分支以及可能反复的损伤和修复,
  8. 可能允许上皮衬里比在肠道中更广泛的定植。
  9. 不同上皮中频繁突变的基因集也有所不同,
  10. 在食道中,NOTCH1、NOTCH2和TP53编码参与伤口愈合、细胞增殖和DNA损伤反应的蛋白质占主导地位,
  11. 而在胃中,编码染色质重塑复合物亚单位、组蛋白甲基化调节剂和细胞粘附蛋白的基因占主导地位,
  12. 这与正常膀胱上皮中选择性突变基因的集合仍然不同,但仍然更类似于正常膀胱上皮中的突变基因集合。
Para_05
  1. 这项研究探讨了与胃部早期肿瘤变化相关的体细胞突变的变化。
  2. 具有肠上皮化生(IM)的胃腺通常与慢性炎症和局部克隆扩展相关,由于SBS1(甲基胞嘧啶脱氨基)、SBS18(活性氧)、ID1和ID2(复制链滑移)以及染色体内结构变异突变率的增加,其总突变负担增加。
  3. 这些突变的变化可能反映了化生腺体中细胞分裂速率的增加,可能是这些细胞固有的其他因素的结果,或者是由微环境影响引起的,如邻近的慢性炎症。
  4. 患有克罗恩病和溃疡性结肠炎这两种炎症性肠病的肠道上皮细胞也显示出较高的突变负担,且SBS18突变的比例增加。
  5. 然而,具有较高突变负担的胃化生腺体与预期负担的非化生腺体近距离相邻,且在慢性炎症区域存在没有较高突变负担的胃腺体,使得胃部炎症与突变率之间的关系不确定。
  6. 化生腺体中的高突变负担可能有助于与IM相关的癌症风险增加。
Para_06
  1. 在这项研究中,严重的慢性炎症与胃腺中驱动突变数量的增加和整体突变上皮比例的升高显著相关,突显了慢性炎症在塑造前肿瘤选择景观中的作用,正如在炎症性肠病中所确定的一样。
  2. 除了炎症的作用外,这一比例在不同供体之间存在较大差异,可能表明了供体之间的选择压力存在差异。
  3. 更大规模的研究可能更有能力发现进一步施加特定克隆选择的暴露或其他因素,就像在食道中发现的吸烟一样,
  4. 并通过化生和异型增生促进正常细胞向明显肿瘤的转化。
Para_07
  1. 胃上皮细胞因此展示出体细胞突变的图谱,其中一些与其它胃肠道上皮细胞相似,但有许多不同之处。
  2. 这些差异可能反映了内在细胞生物学、组织结构、肠道内容物、早期肿瘤性变化过程以及目前未知的影响因素之间的差异,共同塑造了体细胞突变的图谱。

Methods

Ethics statement and sample collection

伦理声明和样本采集

Para_01
  1. 冷冻干燥的胃活检样本来自三个来源: [ol]- 1. Multisite sampling performed on gastrectomy specimens removed as part of either gastric cancer treatment or bariatric surgery. Written informed consent for participation in research and publication of data was obtained from all donors in accordance with the Declaration of Helsinki and protocols approved by the relevant research ethics committees (RECs): (1) source country approval by the IRB of the University of Hong Kong/Hospital Authority of Hong Kong West Cluster, REC approval reference number UW14-257; (2) UK NHS REC approval from the West Midlands-Coventry and Warwickshire REC, approval number 17/WM/0295, UK Integrated Research Application System project ID 228343. - 2. Multiregion gastric biopsies from transplant organ donors with informed consent for participation in research and publication of data obtained from the donor’s family as part of the Cambridge Biorepository for Translational Medicine programme (UK NHS REC approval reference number 15/EE/0152; approved by NRES Committee East of England—Cambridge South). - 3. Gastric samples obtained at autopsy from AmsBio (commercial supplier). UK NHS REC approving the use of these samples: London-Surrey Research Ethics Committee, REC approval reference number 17/LO/1801.
Para_02
  1. 进一步的捐赠者元数据可以在补充表1中找到,所有样本的元数据可以在补充表2(全基因组测序)和补充表3(目标面板测序)中找到。
  2. 没有使用统计方法来预先确定样本量,我们也没有使用盲法或随机化。

Laser capture microdissection and low-input DNA sequencing

激光捕获显微切割和低输入DNA测序

Para_01
  1. 胃组织活检被包埋、切片,并用于显微解剖,具体方法如先前详细描述2。
  2. DNA文库是通过显微解剖使用酶切片段化构建的,并随后提交给Illumina HiSeq X Ten或NovaSeq平台进行全基因组测序或靶向测序面板。
  3. 平均测序覆盖率见补充表2(全基因组测序)和补充表3(靶向测序面板)。
Para_02
  1. 我们使用了一个定制的安捷伦SureSelect捕获组来捕获321个与癌症相关的基因的外显子区域(详见补充表7)。

DNA sequence processing, mutation calling and filtering

DNA序列处理、突变检测和过滤

Para_01
  1. DNA序列通过Burrows-Wheeler算法与GRCh38参考基因组进行了比对。
  2. 使用CaVEMan检测单核苷酸变异(SNVs),使用Pindel检测插入缺失突变(indels)。
  3. 使用GRIDSS和ASCAT分别检测拷贝数变异(CNVs)和结构变异。
  4. GRIDSS和ASCAT检测到的CNVs列于补充表4中(CNVs,GRIDSS和ASCAT)。
  5. GRIDSS单独检测到的染色体内结构变异列于补充表5中。
Para_02
  1. 在CaVEMan的标准后处理过滤器之外,我们通过将支持突变的读取的中位对齐分数设置为大于或等于140(对齐分数中位数(ASMD)≥140),并且要求少于一半的读取被剪切(剪切中位数(CLPM)= 0),从而去除了受与Burrows-Wheeler算法相关的映射伪影影响的变异。
Para_03
  1. 我们强制调用了在给定供体的所有样本中任何样本中检测到的SNV和indel,在应用Sequoia管道进行突变过滤和系统发育重建之前,使用了读取映射质量(30)和碱基质量(25)的截止值。
Para_04
  1. 作为突变过滤的一部分,使用单侧二项精确检验去除了种系变异,该检验基于主要为二倍体样本中的变异读取数量和深度。
  2. 得到的P值使用Benjamini–Hochberg方法进行了多重检验校正,并将截止值设定为q < 10^-5。
  3. 为了过滤掉反复出现的SNV和插入缺失伪影,我们对来自同一个体样本的支持变异的读取数和总深度拟合了beta-二项分布。
  4. 对于每个插入缺失或SNV,我们估计最大似然过离散参数(ρ)(log10(ρ)的值从-6到-0.05以0.05为步长变化)。
  5. 由于伪影变异出现在样本中的随机读取中,它们通过低过离散最好地被捕捉到,而真正的体细胞SNV和插入缺失将在某些样本中表现出高VAF,但在其他样本中完全不存在,因此高度过离散。
  6. 为了区分伪影和真实变异,我们将SNV的阈值设为ρ = 0.1,将插入缺失的阈值设为ρ = 0.15,低于此阈值的变异被视为伪影。
  7. 这种过滤方法是对Shearwater变异调用器的改进。
Para_05
  1. 我们使用了一个截断的二项混合模型来将每个全基因组样本建模为克隆的混合体,确定潜在的VAF峰值和相应样本的克隆性,如先前所述3,37。
  2. 截断分布是必要的,用以反映变异调用器(如CaVEMan)所规定的支持变异的最小读取次数(n = 4)。
Para_06
  1. 系统发育树使用Sequoia37重建,该软件使用最大简约法框架,如MPBoot39中所实现,并采用默认设置。
  2. 突变映射到分支上是使用treemut R软件包完成的。

Mutation rate analysis

突变率分析

Para_01
  1. 为了纠正测序深度和检测到的突变数量之间的混淆,我们通过除以估计的敏感性来校正观察到的突变负荷。
  2. 敏感性被估计为在至少四个读长中观察到变异的概率,考虑到每个样本的基础覆盖分布和每个样本观察到的变异等位基因频率峰值。
  3. 平均估计的敏感性为0.95,中位数为0.97。
  4. 原始和调整后的突变负荷估计值(包括插入缺失和单核苷酸变异)列于补充表2。
Para_02
  1. 为了估算正常胃上皮中的突变率,我们使用了一个线性混合效应模型,其中年龄作为固定效应,供体作为随机效应,对非癌症捐赠者的胃腺突变负荷估计进行了分析: [ol]- 1. Burden ~ (distributed as) Age + (1|Donor) We assessed the effects of chronic inflammation (CI, coded as absent or mild versus moderate or severe) and IM (absent or present) by using these alternative models: - 2. Burden ~ Age + CI + (1|Donor) - 3. Burden ~ Age + IM + (1|Donor) - 4. Burden ~ Age + IM + CI + (1|Donor) Models 2 and 3 significantly outperform model 1 (P < 2.2 × 10−16), and although model 4 outperforms model 2 (P < 2.2 × 10−16), it does not significantly outperform model 3 (P = 0.11). Therefore, presence or absence of IM and age predict mutation burden the best. To test the effect of gastric site on the mutation rate, we included site-specific age relations in the mixed-effects model: - 5. Burden ~ Age:Site + IM + (1|Donor).
Para_03
  1. 这个模型并未显著优于模型2(P=0.4547)。

Telomere length analysis

端粒长度分析

Para_01
  1. WGS样本的平均端粒长度是使用telomerecat算法估算的,该算法利用了读取中TTAGGG端粒重复序列的流行程度。NovaSeq平台测序的样本被排除在这项分析之外,因为我们之前观察到此类样本存在不一致的结果,例如端粒长度为0 bp。
  2. 我们之前观察到此类样本存在不一致的结果
Para_02
  1. 同样地,在突变负荷分析中,我们使用了一个线性混合效应模型来评估年龄、IM和慢性炎症对端粒长度的影响: [ol]- 1. Telomere length ~ Age + (1|Donor) - 2. Telomere length ~ Age + CI + (1|Donor) - 3. Telomere length ~ Age + IM + (1|Donor) - 4. Telomere length ~ Age + IM + CI + (1|Donor)
Para_03
  1. 模型2的表现显著优于模型1(P = 0.0005),而模型4的表现并未显著优于模型2(P = 0.14)。包括IM注释并不能改善模型拟合。因此,慢性炎症和年龄最能预测端粒长度。

Mutational signature analysis

突变特征分析

Para_01
  1. 为了识别人类胎盘中可能未被发现的突变特征,我们在所有显微解剖样本的96个三核苷酸计数上运行了层次狄利克雷过程(HDP)包(https://github.com/nicolaroberts/hdp),这些样本被分为系统发育树的不同分支。
  2. 为了避免过拟合,包含少于50个突变的分支未被纳入特征提取。
  3. HDP以不同的供体作为层级进行运行,使用了20条独立链,40,000次迭代和20,000次预热。
Para_02
  1. HDP得出的结果进一步通过期望最大化混合模型分解为已知COSMIC参考签名(版本3.4)的线性组合。
  2. 如果得到的参考签名的线性组合与原始提取签名之间的余弦相似度超过0.90,则接受这种分解。
  3. 这导致HDP签名被分解为参考签名SBS1、SBS2、SBS3、SBS5、SBS13、SBS17a、SBS17b、SBS18、SBS28、SBS40a和SBS40c。
  4. 然后使用SigFit41将这些签名拟合到所有观察到的单核苷酸变异计数上。
  5. 每个样本的签名暴露量可以在补充表2中找到。
Para_03
  1. 值得注意的是,SBS5和SBS40具有相对平坦且特征不明显的突变谱,可能难以彼此区分,因此在分析中将它们合并在一起,正如先前的报告所述1,42。
Para_04
  1. 特定突变特征在化生腺体中的折叠增加量与非化生腺体相比被估计了。
  2. 这句话没有出现在原文中,是为了达到至少两句的目的而假设的。 [ol]- 1. Calculating the observed number of mutations incurred by each signature by multiplying the sensitivity-corrected mutation burden with the estimated signature exposures per sample. - 2. Calculating the expected number of mutations incurred by each signature by multiplying the expected mutation burden, given the age of the donor and the average mutational signature distribution of all non-metaplastic glands of that donor. The latter accounts for any donor-specific differences in mutational signatures that may be present. - 3. Dividing the observed over the expected mutation numbers per signature.
Para_05
  1. 提取插入缺失签名的过程与上述单核苷酸变异相同。
  2. 由此产生的五个HDP插入缺失签名被解卷积成COSMIC参考签名ID1、ID2、ID5、ID6、ID9、ID12和ID14。
  3. HDP插入缺失签名5是一种由大删除定义的嘈杂签名,并未进一步分解,因为没有一种参考签名组合能产生足够高的与提取签名的余弦相似度。
  4. 由于SigFit41不兼容插入缺失签名,因此将HDP签名的暴露转换为参考签名的暴露,使用解卷积得到的估计签名比例。
  5. 每个样本的签名暴露可以在补充表2中找到。

Selection analysis and driver annotation

选择分析和驱动注释

Para_01
  1. 我们使用了 dNdScv27 R 包来识别受到正选择的基因。
  2. 对于目标面板中的基因,我们将来自全基因组测序数据和靶向测序数据的数据进行了合并。
  3. 由于全基因组测序数据和靶向测序数据之间的覆盖度/克隆性差异会影响非同义突变和同义突变,这种混合数据可以安全地输入到 dNdScv 中,如同先前的研究一样。
  4. 为了避免由于多次微解剖采样相同的克隆而导致突变发生率被高估,我们对每个供体的特定突变只计数一次。
  5. q 值低于 0.1 的基因被认为是受到选择的,这些基因包括 ARID1A、ARID1B、ARID2、CTNNB1、EEF1A1、LIPF 和 KDM6A。
Para_02
  1. 此外,我们使用 WGS 数据寻找了基因面板外的选择迹象。这并没有发现任何进一步受到选择的基因。
Para_03
  1. 为了识别与癌症相关但在阳性选择分析中未出现的基因突变,我们回顾了所有突变以寻找典型的癌症驱动突变,并标注可能的候选者。
  2. 简而言之,这涉及通过查询COSMIC数据库来注释原癌基因中的热点突变以及肿瘤抑制基因中的失活突变( nonsense、missense 和移码插入缺失)。
  3. 注释后的驱动突变列于补充表6中。

Estimate of proportion of epithelium with driver mutation

上皮组织中携带驱动突变的比例估计

Para_01
  1. 为了估计携带驱动突变的胃上皮的比例,我们依赖于微解剖面积的测量和样本中携带驱动突变的细胞比例的估算。
  2. 这个细胞比例通过将突变的VAF(变异等位基因频率)乘以局部倍性(男性供体的性染色体为1,否则为2)来简单获得。
  3. 将突变细胞比例与采样上皮面积相乘,得到突变上皮面积的估计值。
  4. 通过将所有突变上皮面积相加,并除以采样的总上皮面积,我们得出了被携带驱动突变的克隆所占据的胃上皮比例的估计值。
  5. 对于这一分析,我们使用了由dNdScv鉴定为受选择压力的基因中的破坏性突变(错义、无义、移码和剪接突变),以及手动注释的驱动突变(参见前一部分)。
Para_02
  1. 这种方法假设整个显微切割区域由胃上皮组成。任何污染物细胞类型都会降低胃克隆中突变的等位基因频率,并因此减小估算的突变体大小。因此,估计的上皮比例可能会被略微低估。
  2. 因此,估计的上皮比例可能会被略微低估。
Para_03
  1. 评估年龄、慢性炎症和IM对胃上皮比例的影响使用了一组线性模型: [ol]- 1. Mutant_proportion ~ Age - 2. Mutant_proportion ~ Age + CI_grade - 3. Mutant_proportion ~ Age + IM_proportion
Para_04
  1. 这些模型通过双侧方差分析检验相互比较。
  2. 模型2比模型1具有显著更好的拟合度(P = 0.002)。
  3. 模型3相比模型1没有显著改进(P = 0.86)。
  4. 年龄的影响在所有模型中都是显著的。
  5. 在模型2中,严重的慢性炎症是显著的(P = 0.001)。

CNV timing

CNV定时

Para_01
  1. 假设突变率恒定,通过比较在复制之前和之后获得的大拷贝数重复(如三体或导致拷贝数中性杂合性丧失的事件)的比例,可以计算出这些重复的时间。
  2. 这些比例可以通过根据变异等位基因频率对单核苷酸变异进行聚类来估计。
  3. 与之前的方法一样,我们使用二项混合模型,利用变异支持读取和总读取的数量来估计复制和未复制突变的比例。
  4. 根据CNV的预期变异等位基因频率,将突变簇分配为复制或未复制。
  5. 例如,对于一个三体事件,两个变异等位基因频率簇将对应两种不同的拷贝数状态:0.66(复制,突变发生在三个拷贝中的两个上)和0.33(未复制,突变发生在三个拷贝中的一个上)。
Para_02
  1. 根据重复(PD)和非重复(PND)的比例,总拷贝数(CNtotal)和重复拷贝数(CNdup),可以估算拷贝数变异的时间(T)如下:
Para_03
  1. CNV 时间值将在 0 和 1 之间,对于这里使用的系统发育树而言,这对应于获得 CNV 的分支的起点和终点。
  2. 为了在单一时间点估计周围获得一个置信区间,我们对四舍五入后的重复和非重复突变计数使用了精确的泊松检验。

Identifying trisomy 20 in panel sequencing data in PD40293

在PD40293的面板测序数据中识别20三体综合征

Para_01
  1. 由于基因组采样稀疏以及诱饵捕获不均匀,从靶向测序面板中识别拷贝数变异是具有挑战性的,这导致了覆盖范围分布极不均匀。
  2. 然而,我们利用配对全基因组测序数据有效地将染色体20上的SNP分配到任一亲本单倍体上,因为这些SNP在全基因组测序样本(PD40293捐赠者中有12个样本中的7个存在20号染色体三体)中会有不同的VAF。
  3. 在PD40293中,该捐赠者具有最广泛的20号染色体三体复发情况。
Para_02
  1. 为了识别具有可能三体20的面板序列显微切割,我们量化了第20号染色体上相位SNP位点的计数数据(支持SNP的读取和总读取)。
  2. 使用似然比检验,我们量化了两个相位SNP组是否更有可能来自一个二项分布,该分布的基础概率是两个单倍型的平均总VAF(二倍体),或者来自两个具有不同基础概率的二项分布(非二倍体)。
  3. 为了减少噪声,在此分析中仅使用了超过五个读取的SNP位点。
  4. 使用Benjamini–Hochberg方法对得到的P值进行了多重检验校正。
  5. 除了显著差异外,样本还需要显示出两个单倍型之间足够的VAF差异才能被认为显示出三体20的证据(0.1)。

Reporting summary

报告摘要

Data availability

Para_01
  1. DNA序列数据已存放在欧洲基因组表型档案库(EGA)中,访问码分别为EGAD00001015351(全基因组测序)和EGAD00001015352(目标面板测序)。
  2. 处理后的数据可在补充表格或GitHub上获取(https://github.com/TimCoorens/Stomach;过滤变异调用和系统发育树)。
  3. 参考基因组GRCh38广泛可用(包括在https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_000001405.26/)。
  4. ,

Code availability

Para_01
  1. 可以在 https://github.com/TimCoorens/Stomach 找到用于数据分析、筛选和可视化的自定义 R 脚本。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象
生信菜鸟团
2025/01/02
2980
细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象
如何用单细胞研究癌症起源的单克隆与多克隆问题,提供详细原始代码
生信菜鸟团
2024/12/20
2100
如何用单细胞研究癌症起源的单克隆与多克隆问题,提供详细原始代码
现在发在NG上的癌症全面基因组分析跟几年前的有什么不同?
生信菜鸟团
2025/02/18
1050
现在发在NG上的癌症全面基因组分析跟几年前的有什么不同?
Nature ecDNA 系列 | ecDNA 如何促进癌症的进化
[ul]- Nucleotide frequency, dinucleotide frequency and trinucleotide frequency - H3K4me3 marks (ENCODE accession: ENCFF191IBA), H3K27ac marks (ENCFF208GHP), H3K4me1 marks (ENCFF759BRD), H3K3me3 marks (ENCFF983DSU) - DNase hypersensitivity sites (ENCFF823HYK) - Replication timing (https://github.com/skandlab/MutSpot/tree/master/features/Ch38), fragile sites (HGNC 2021) and - RepeatMasker long interspersed nuclear element, short interspersed nuclear element, long terminal repeat, simple repeat and DNA transposon annotations from UCSC101.
生信菜鸟团
2024/11/28
2510
Nature ecDNA 系列 | ecDNA 如何促进癌症的进化
Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
生信菜鸟团
2024/11/23
1790
Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
综述 | 肿瘤缺氧促进基因组不稳定性和肿瘤进化
◉ 缺氧条件会导致细胞代谢的改变,从氧化磷酸化转向糖酵解(方框 1)。肿瘤内的缺氧亚区域也引发了一系列对基因组完整性的细胞内效应(左侧)。这包括减少 DNA 修复、DNA 复制压力和核苷酸突变(方框 2)。缺氧水平的增加伴随着拷贝数变异的增加、染色体不稳定性和表观遗传修饰的增加。肿瘤微环境由多种细胞类型(免疫细胞、基质细胞和内皮细胞)组成,并且在常氧与缺氧区之间可能有所不同。◉ 动态的缺氧梯度的存在引发了一系列细胞和组织反应,包括在严酷的低氧(O2)环境中细胞适应与细胞死亡之间的平衡、变化的免疫监视、不同的血管生成和灌注以及侵袭性和转移性表型的获得(中间)。这些过程共同驱动了患者内部的异质性。在具有相似肿瘤类型的患者群体中,缺氧的存在与否将决定对局部治疗(手术或放疗)、化疗、靶向治疗和免疫治疗的相对患者间异质性(右侧)。◉ 考虑到这些各种各样的细胞、肿瘤和宿主效应,缺氧伴随着更差的临床预后并不令人惊讶,因为这是由于在适应低 O2 水平期间出现的突变和侵略性表型。CAF,癌症相关成纤维细胞。
生信菜鸟团
2025/04/18
1060
综述 | 肿瘤缺氧促进基因组不稳定性和肿瘤进化
生信程序 | 量化癌症进化谱系中的细胞分裂 | Nature Genetics
◉ a,DNA聚合酶滑动导致多聚鸟嘌呤重复序列中插入缺失的示意图。◉ b,多聚鸟嘌呤突变在发育过程中积累,并作为分子条形码发挥作用。为简化起见,仅显示一个等位基因。◉ 多克隆正常组织样本的平均等位基因长度接近合子,因为它包含许多胚胎细胞谱系的后代。◉ 类似地,肿瘤样本的平均等位基因长度代表该样本最近共同祖先(MRCA)的基因型。◉ c,系统发生重建工作流程。◉ 左侧,患者TM32的四个样本中Sal21多聚鸟嘌呤区域的等位基因分布。◉ 红色虚线框表示正常样本的等位基因分布,用于与癌症样本进行比较。◉ 每个分布(方框)的平均值近似表示采样细胞MRCA的基因型。◉ 顶部中间:相对于正常样本,各样本中等位基因的平均长度。◉ 绿色表示缺失,紫色表示插入。◉ 顶部右侧:样本之间的成对L1距离。◉ 底部:基于此距离矩阵,构建了邻接法系统发生树。◉ d,L1距离随细胞分裂呈线性增长。◉ 模拟20个(左)或50个(右)多聚鸟嘌呤区域经过1,000次细胞分裂,每次分裂每个等位基因突变概率为µ。◉ 蓝线表示1,000次模拟的平均L1值;灰条表示模拟L1值的2.5和97.5百分位数;虚线表示细胞分裂次数与µ的乘积。◉ 数据通过在十次细胞分裂上应用滚动平均进行了平滑处理。◉ e,L1距离主要反映了从合子到肿瘤创始细胞之间的分裂次数。◉ 我们通过沿单一谱系模拟500次分裂(代表肿瘤启动前的分裂)来近似肿瘤的生命史,然后通过分支过程启动克隆扩增再进行500次分裂(代表肿瘤生长)。◉ 在肿瘤生长阶段后取样(10,000个细胞),我们发现L1距离仅比初始时增加了2.0%。
生信菜鸟团
2025/04/04
1030
生信程序 | 量化癌症进化谱系中的细胞分裂 | Nature Genetics
“胃”来可期 | 单细胞助力胃部细胞图谱构建和疾病研究
胃能够产生酸和酶,帮助食物消化和杀死微生物,并调节食物到小肠的运输,胃也通过其内分泌细胞远程工作,发送远端信号来帮助协调饥饿/饱腹感和钙稳态。它由来自3个胚胎胚层的细胞组成,包括外胚层来源的肠神经细胞,中胚层来源的平滑肌细胞和间充质细胞,以及内胚层来源的胃腔上皮细胞[1,6]。单细胞技术可以从单个细胞水平上解析每个细胞的状态,在构建胃组织细胞图谱、揭示胃癌的发生发展机制和瘤内/瘤间的异质性,以及胃癌靶向/免疫治疗靶点和标志物的发现等方面起着重要的作用。本期推文将为大家介绍胃粘膜上皮细胞组成及单细胞测序技术在胃部研究中的相关进展。
生信交流平台
2022/09/21
6K0
“胃”来可期 | 单细胞助力胃部细胞图谱构建和疾病研究
23分多组学文献:胃肠腺癌的分子比较分析
今天和大家分享一篇发表在cancer cell上的文章,影响因子23.916,这是一篇多组学分析文章。
百味科研芝士
2020/06/09
2.5K0
空间组学 | NG | 人前列腺的空间转录组分析
◉ 队列1包括7名因膀胱癌接受根治性膀胱切除术患者的前列腺,每个前列腺根据解剖位置取样。所有样本均进行了BD Rhapsody单细胞核RNA测序。◉ 队列2由4名同样接受根治性膀胱切除术患者的前列腺组成,每位患者前列腺的外周区、移行区和中央区各取一个样本。这些样本随后进行了BD Rhapsody单细胞转录组测序、10x Genomics Multiome和10x Genomics Visium空间转录组测序。◉ 面板a使用BioRender.com创建。◉ b, 按主要细胞身份颜色编码的scRNA-seq(左)、snRNA-seq(中)和snATAC-seq(右)数据的UMAP图。◉ c, scRNA-seq和10x Multiome平台捕获的主要细胞类型的比例。ARC,调控因子和染色质分析;EC,内皮细胞;Epi,上皮细胞;Fib,成纤维细胞;ILC,先天淋巴细胞;SKMC,骨骼肌细胞。
生信菜鸟团
2025/04/26
830
空间组学 | NG | 人前列腺的空间转录组分析
这篇最近发在Nature上的肿瘤进化有什么不一样?
今天跟大家分享的是2020年2月发表在Nature(IF=43.07)杂志上的一篇文章。文章中作者讨论了2,658种癌症的进化史,说明了早期癌症检测的可能性。
生信菜鸟团
2020/07/29
2.6K0
这篇最近发在Nature上的肿瘤进化有什么不一样?
对35种癌症的10,478名患者基因组进行候选驱动基因识别,英国10万基因组项目
生信菜鸟团
2024/11/23
1170
对35种癌症的10,478名患者基因组进行候选驱动基因识别,英国10万基因组项目
Nature | 如何讲肿瘤可塑性表型的故事,提供原始数据和代码
- 图片说明- 研究设计。从31名患者中收集了匹配的生物样本三联体,包括正常结肠、原发性结直肠癌(CRC)和转移灶,新鲜处理用于单细胞转录组学和类器官生成,并用甲醛固定和石蜡包埋用于多重免疫荧光分析。类器官用于体外功能研究或通过异位异种移植到盲肠或肝脏。- 所有CRC肿瘤细胞中的热点20模块。热图包含2,003个具有显著自相关(错误发现率<0.01)的高度可变基因,分为4个经典和6个非经典CRC衍生基因模块(方法和补充表4)。Dev.,发育。- 治疗(红点)和未经治疗(绿点)患者的转移瘤中模块比例分布;模块标签基于给定细胞中该基因模块的>0.75分位数评分(方法)。垂直线将经典肠道(右侧)与其他(左侧)细胞类型分开。- 每个患者样本中转移瘤与原发性衍生肿瘤模块比例的对数比。基于非经典(d)或经典(e)模块的积累。转移瘤显著富集表达非经典模块的细胞,而原发性肿瘤则富集表达经典模块的细胞(P=0.001,单侧秩和检验;方法)。- 模块富集与肿瘤复发(f)和供体患者生存状态(g)之间的关联。在两个独立的临床队列中展示了108名直肠腺癌(LARC32)患者和445名结肠腺癌(TCGA31)患者的关联情况。使用每个患者的批量转录组数据的ssGSEA计算富集评分(方法)。根据曼-惠特尼U检验统计量绘制每个基因模块,横轴表示远端复发,纵轴表示10年内新肿瘤事件或生存。- Abs.,吸收肠道;endo.,内胚层发育;inj.,损伤修复;int.,肠道;neuro.,神经内分泌;osteo.,成骨细胞;sec.,分泌肠道;squa.,鳞状。
生信菜鸟团
2025/03/06
1470
Nature | 如何讲肿瘤可塑性表型的故事,提供原始数据和代码
Nature 新文: 转移性实体瘤全基因组泛癌分析
Pan-cancer whole-genome analyses of metastatic solid tumours
作图丫
2022/03/29
9380
Nature 新文: 转移性实体瘤全基因组泛癌分析
癌症中的染色体碎裂 | Nat.Rev.Cancer |
- 图片说明- 一条或多条染色体的破碎,通过数十到数百个双链DNA断裂,随后是随机顺序和方向重新组装DNA片段的易错修复。- 未重新连接的DNA片段可以自行环化形成染色体外DNA(ecDNA)结构或被删除。- 通过对胶质瘤进行全基因组测序检测到9号和17号染色体的染色体碎裂现象。- 整个基因组的Circos图的最内圈显示了染色体内或染色体间的结构变异。- 从中心向外的第二圈表示次要等位基因的拷贝数。- 第三圈展示了经过肿瘤纯度校正的拷贝数变化,包括局灶性和染色体水平的体细胞事件。- 第四圈显示了体细胞变异(突变),以降雨图为函数绘制距离关系。- 对17号染色体(左)和9号染色体(右)的详细观察显示了拷贝数波动和聚集的断点,这是染色体碎裂的特征。- 波动范围在五到四个拷贝之间,因为染色体碎裂发生在多倍体肿瘤的背景下。- 部分b和c中展示的全基因组测序数据由MASTER/DKTK/NCT队列提供。
生信菜鸟团
2025/02/18
810
癌症中的染色体碎裂 | Nat.Rev.Cancer |
算法开发 | 从空间解析转录组学推断等位基因特异性拷贝数异常和肿瘤系统地理学
生信菜鸟团
2024/12/20
1500
算法开发 | 从空间解析转录组学推断等位基因特异性拷贝数异常和肿瘤系统地理学
综述精读 | 癌症的进化理论:挑战与潜在解决方案
生信菜鸟团
2024/12/20
1290
综述精读 | 癌症的进化理论:挑战与潜在解决方案
Nature | 从 ecDNA 层面研究肿瘤异质性与可塑性问题
◉ a,基于AmpliconArchitect的PDO分类。每个样本的扩增子数量已标明。患者切除时的病理阶段和随访时的生存状态以颜色编码表示。◉ b,基因组视图展示了AmpliconArchitect重建的跨越MYC位点的扩增子结构,针对具有MYC ecDNA的类器官。显示了覆盖深度、拷贝数片段和结构变异(SV)连接。◉ c,圆形图显示在来自四名患者的原发肿瘤(P)中鉴定的扩增子区域在匹配的类器官(O)中得以保留。◉ d,癌基因图谱显示PDO中分类为ecDNA+(红色)和ecDNA−(蓝色)的基因改变。改变类型以颜色和形状编码。Gain表示拷贝数≥3,loss表示拷贝数≤1,deep loss表示拷贝数≤0.25。使用双侧Fisher精确检验确定特定基因的基因组改变与ecDNA状态之间的关联。显示P < 0.1,显著性(P < 0.05)以橙色突出显示。◉ e,棒棒糖图显示对Hallmark通路显著富集于ecDNA+ PDOs(n = 7)与ecDNA− PDOs(n = 7)的基因集富集分析。P值通过多层次分裂蒙特卡罗方法计算。NES,标准化富集分数。◉ f,箱线图显示CX9染色体不稳定性特征在ecDNA+ PDOs中富集。箱线图显示中位数(中心线)、上下四分位数(箱限)和1.5×四分位距(须)。n = 29个PDOs(ecDNA−)和n = 12个PDOs(ecDNA+)。统计显著性通过双侧Wilcoxon秩和检验评估。◉ g,在CIN70转录组特征中,ecDNA+(n = 7)和ecDNA−(n = 7)PDOs之间差异表达基因的基因集富集分析。P值通过多层次分裂蒙特卡罗方法计算。红色虚线表示富集分数的最大值和最小值。
生信菜鸟团
2025/04/26
950
Nature | 从 ecDNA 层面研究肿瘤异质性与可塑性问题
前瞻 | Nature | 人类细胞图谱:从细胞普查到统一的基础模型
- 图片说明- a–e,细胞图谱可以是对特定器官或系统内细胞的普查(a);体内细胞和组织的多尺度、多模态3D地图(b);将基因型(即来自GWAS分析)与细胞、组织或全身水平的表型连接起来的地图(c);提供一个框架和资源,用于比较模型系统和疾病中的组织样本的4D发育地图(d);并且,通过结合这些层次并利用AI/ML计算进步,创建生物学的基础模型(e)。p.c.w.,受孕后周数。- ,
生信菜鸟团
2025/02/06
880
前瞻 | Nature | 人类细胞图谱:从细胞普查到统一的基础模型
这篇发在Nature上的泛癌RNA alterations能给我们带来哪些思考?
今天跟大家分享的是2020年2月发表在Nature(IF:43.07)杂志上的一篇文章“Genomic basis for RNA alterations in cancer”.在文章中研究者们提出了一个跨越27种不同的肿瘤类型的全面的RNA水平变化目录,在基因组背景下,这种RNA改变为鉴定与癌症相关的功能基因和机制提供了丰富的资源。
生信菜鸟团
2020/08/04
1.3K0
这篇发在Nature上的泛癌RNA alterations能给我们带来哪些思考?
推荐阅读
细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象
2980
如何用单细胞研究癌症起源的单克隆与多克隆问题,提供详细原始代码
2100
现在发在NG上的癌症全面基因组分析跟几年前的有什么不同?
1050
Nature ecDNA 系列 | ecDNA 如何促进癌症的进化
2510
Nature | 10万基因组项目的14,778名患者的39种肿瘤类型ecDNA的研究
1790
综述 | 肿瘤缺氧促进基因组不稳定性和肿瘤进化
1060
生信程序 | 量化癌症进化谱系中的细胞分裂 | Nature Genetics
1030
“胃”来可期 | 单细胞助力胃部细胞图谱构建和疾病研究
6K0
23分多组学文献:胃肠腺癌的分子比较分析
2.5K0
空间组学 | NG | 人前列腺的空间转录组分析
830
这篇最近发在Nature上的肿瘤进化有什么不一样?
2.6K0
对35种癌症的10,478名患者基因组进行候选驱动基因识别,英国10万基因组项目
1170
Nature | 如何讲肿瘤可塑性表型的故事,提供原始数据和代码
1470
Nature 新文: 转移性实体瘤全基因组泛癌分析
9380
癌症中的染色体碎裂 | Nat.Rev.Cancer |
810
算法开发 | 从空间解析转录组学推断等位基因特异性拷贝数异常和肿瘤系统地理学
1500
综述精读 | 癌症的进化理论:挑战与潜在解决方案
1290
Nature | 从 ecDNA 层面研究肿瘤异质性与可塑性问题
950
前瞻 | Nature | 人类细胞图谱:从细胞普查到统一的基础模型
880
这篇发在Nature上的泛癌RNA alterations能给我们带来哪些思考?
1.3K0
相关推荐
细胞图谱 | Nature | 单细胞整合揭示炎症性肠病中的化生现象
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档