导语
遗传和非遗传因素有助于乳腺癌的发展。在易于获取的样本中捕获这些成分的基于表观基因组的特征可以识别处于危险中的女性。
背景介绍
DNA甲基化相关分析是一个经久不衰的热点,今天小编为大家带来的这篇文章,作者利用基于宫颈液体的细胞学样本,开发了基于 DNA 甲基化的女性乳腺癌风险识别指数 (WID-BC-index),该指数可识别患有乳腺癌的女性。文章发表在《nature communications》上,影响因子为17.694,文章题目为:The WID-BC-index identifies women with primary poor prognostic breast cancer based on DNA methylation in cervical samples。
数据介绍
本研究从14个欧洲中心收集了329例预后不良的原发性乳腺癌患者的样本,869名非乳腺癌女性(图1)。并且本研究自测了相关的DNA甲基化数据。
为了根据宫颈甲基化 WID-BC-index得出区分乳腺癌女性和非乳腺癌女性的特征,本研究使用岭回归和套索回归将个体分类为病例或对照。分类器在发现数据集的三分之二(572 例对照,217 例乳腺癌病例)上进行训练,其余三分之一用作内部验证集(297 例对照,112 例病例)(图 1)。
由 225 名对照和 113 名乳腺癌病例组成的单独独立外部验证数据集用于验证WID-BC-index表现(图 1)。
图 1
技术路线
本研究技术路线如图所示。
结果解析
01
样品异质性和差异甲基化
本研究使用 EpiDISH 评估了每个宫颈样本中细胞类型异质性的水平,该算法推断每个样本中上皮细胞、成纤维细胞和七种免疫细胞亚型的相对比例。在癌症病例和对照中,免疫细胞比例大致均匀分布。在发现数据集中,癌症中的上皮细胞比例显著增加,而所有亚型(特别是单核细胞)的相应免疫细胞减少(图 2a)。样本异质性阻碍了在病例和对照之间识别具有差异甲基化的 CpG,因为在具有高免疫细胞比例的样本中,任何特定于上皮细胞的差异甲基化都大大减少(见图2b中的例子)。
图 2
02
歧视性指标的开发
本研究使用预测性能作为n的函数进行评估,使用内部验证数据集用于训练分类器的cpg数量(图2c),使用 29,000 个 CpG 实现了 0.84(95% CI:0.80-0.88)的最佳性能岭回归(图 2d)。WID-BC-index与内部验证集的免疫细胞比例比例呈显著正相关(图2e)。
在免疫细胞比例分数 ≤0.5 和免疫细胞比例 >0.5 的样本中,AUC 分别为 0.85和 0.86,表明在上皮细胞和免疫细胞中均存在鉴别信号。本研究使用一个统计模型来估计 29,000 个 CpG 中每一个的上皮和免疫特异性变异,并将它们分为“上皮”(18,190 个 CpG)、“免疫”(3,533 个 CpG)或“共享”(7,277 个 CpG)亚群,如图 2f 所示。
图 2
此外,本研究根据岭模型回归系数的绝对值对用于定义 WID-BC-index的 29,000 个 CpG 进行了排序。为了评估排序靠前 CpG 位点的信息量,本研究在前 n 个站点上训练了子分类器(图 2g)。结果观察到,前 500 和 1000 个 CpG 分别可以实现 0.78 和 0.81 的 AUC,这表明排名靠前的子集特别有用。
03
宫颈样本中乳腺癌组织特征的表现
为了评估是否可以在子宫颈中检测到任何乳腺癌组织特异性变化(例如通过无细胞 DNA),本研究基于 TCGA-BRCA 的数据,通过在正常组织和原发性肿瘤组织之间的顶部差异甲基化 CpG应用套索回归开发了乳腺癌特异性表观遗传特征。这一特征,即 TCGA-乳腺癌指数 (TCGA-BC-index),由 31 个 CpG 组成,能够在验证集中完美区分非癌和乳腺癌组织,但不能在宫颈癌中区分病例和对照样本(图 2h)。这表明观察到的 WID-BC-index 似乎不是由实际乳腺癌本身中存在的表观遗传变化驱动的。
04
在独立数据集中进行验证
在独立验证集中,本研究为每位女性计算 WID-BC-index(图 3a),得出 AUC 为 0.81(图 3b)。为了研究 WID-BC-index 的预测性能,本研究分析了卡罗林斯卡大学实验室宫颈细胞学生物库样本,这些样本来自患乳腺癌的女性。为了评估存储协议对 DNAme 的影响,本研究开发了一种统计技术来推断每个样本的信噪比。结果发现,与发现集相比,生物样本集的信噪比较低(图 3c)。
图 3
尽管存在这种退化,在131例预后不良的乳腺癌病例中,本研究估计在最高信噪比水平的样本中AUC为> 0.7(图3d)。在未归为预后不良的154例病例中,本研究未检测到任何鉴别信号(图3e)。这些发现表明,生物样本集的样本遭受了严重的退化,并且在最低质量的样本中,识别信号可能被背景噪声掩盖了。
05
在匹配的口腔和血液样本中的指数表现
DNAme 具有高度的组织特异性,并且特定的暴露记录在某些细胞亚型中。图 2f 中的指数分解表明 WID-BC-index 使用上皮和免疫特异性信号以及共享成分。为了评估 WID-BC-index(源自基于宫颈液体的细胞学样本)是否可以扩展到其他组织类型,本研究分析了来自上述 BRCA 数据集的匹配的口腔和血液样本(图 1)。结果发现与宫颈样本类似,很大一部分口腔 DNA 来自免疫细胞。在 BRCA1 携带者中,本研究发现口腔样本的 AUC 为 0.67,血液中的 AUC 为 0.64。在 BRCA2 携带者中,口腔样本中的 AUC 为 0.61,血液中的 AUC 为 0.60。
本研究接下来分析了来自内部验证集(69 名对照和 66 名病例)中 135 名女性子集的匹配口腔样本。结果发现使用宫颈样本得出的鉴别信号也存在于这些匹配的颊侧样本中(图 4a),产生的 AUC 为 0.69(图 4b)。在匹配的颈部和口腔样本中计算的 WID-BC-index 之间存在 0.57的相关性。
图 4
06
在患有卵巢癌或子宫内膜癌的女性中进行验证
患有乳腺癌的女性患卵巢癌和子宫内膜癌的风险也较高。因此,本研究还分别分析了来自患有卵巢癌和子宫内膜癌的女性的 242 份和 217 份宫颈样本(图 1)。在这些卵巢癌和子宫内膜癌病例以及同样来自乳腺癌内部验证集的297个对照样本中,本研究分别获得了 0.69(图 4c 和 d)和 0.58(图 4e、f)的 AUC,卵巢癌组的子成分遵循与乳腺癌病例相似的模式。对于每个验证数据集,本研究还计算了对应于 WID-BC-index 四分位数的优势比(表 1)。
表 1
07
与流行病学和临床因素的关联
本研究使用内部和外部验证数据集研究了 WID-BC-index 与各种流行病学变量之间的关系。在 WID-BC 指数和年龄之间发现了统计学上的显著关联(图 5a)。在来自内部验证集的 107 例病例和 280 例对照中,本研究发现对照中的 PRS 和 WID-BC-index 之间存在显著的相关性(图 5b),而病例中没有显著相关性。在 PRS 数据可用的发现集的所有样本中,AUC 为 0.67(图 5c)。
本研究还评估了去除最近描述的与乳腺癌风险相关的甲基化定量基因座 (mQTL) 是否会影响该指数。结果发现,其中 78 个 mQTL 被包含在 WID-BC-index 中,然而,从 WID-BC-index 中删除这 78 个 mQTL 并没有导致性能显著下降(图 5d)。在对照样本中,未发现 WID-BC-index 和 BMI(图 5e)、0 和 ≥1 一级亲属患有乳腺癌的个体(图 5f)、初潮年龄(图 5g)和第一次活产年龄(图 5h)之间没有显著关联。该指数在绝经后女性(图 5i)和未接受激素替代治疗的女性(图 5j)中显著升高。在乳腺癌病例中,WID-BC-index 与癌症的临床病理特征之间没有关联(图 5m-o)。
图 5
08
WID-BC-index 反应了脂肪细胞的分化
为了评估 WID-BC-index 是否反映了细胞特异性程序,本研究分析了 EPIC 阵列数据可用的所有 ENCODE 样本。对所有原代细胞样品和体外分化细胞样品中的 WID-BC-index 进行排序和绘图,并在非上皮细胞中发现了高 WID-BC-index 指数(图 6a)。大多数组织样本包含相当大比例的脂肪,由 EpiDISH 算法确定,由此本研究绘制了 WID-BC-index 对各个组织样本的脂肪含量的图(图 6b)。并发现 WID-BC-index 与样本脂肪含量之间存在直接相关性,表明 WID-BC-index反映了脂肪细胞程序。
图 6
09
宫颈上皮细胞反应乳腺上皮细胞
在预后较差的乳腺癌的关键驱动因素中,黄体酮以其在脂肪细胞和乳腺细胞中的脂肪生成作用而闻名。因此,本研究想评估高危乳腺组织中孕酮受体结合位点 (PR-BS CpG)的异常 DNAme 是否反映在宫颈细胞中。本研究评估了 EPIC 阵列上可用的 19,258 个 PR-BS CpG,并计算了来自健康女性的 14 个正常乳房样本和来自与三阴性乳腺癌相邻的女性的 14 个正常乳房样本中 PR-BS CpG 的平均甲基化差异。
接下来本研究将这一结果与发现的宫颈样本中健康对照和乳腺癌患者的平均宫颈 PR-BS 甲基化的差异进行了比较,并观察到高危妇女的宫颈和乳腺组织中均存在低甲基化的PR-BS位点显著倾斜,在乳腺和宫颈样本中有2,623个低甲基化cpg高度显著重叠(图6c)。此外,与 14 个正常乳腺组织样本相比,本研究观察到具有 BRCA 突变的女性的 14 个正常乳腺组织样本中的 2,623 个低甲基化 PR-BS CpG 的平均甲基化显著降低(图 6d)。
图 6
总之,本研究在乳腺癌女性的宫颈样本和BRCA突变女性的正常乳腺组织中发现PR-BSs的大量重叠,这一事实与以下观点完全一致:风险女性整体(终身)较高的孕酮水平导致宫颈和乳腺组织中甲基化的减少,从而最终引发乳腺癌(图6e)。
小编总结
本研究确定了一个宫颈 DNAme 特征,即 WID-BC-index,它提供了一个机会,可以根据与患病器官没有直接解剖联系的样本来识别患有预后不良的原发性乳腺癌的女性。不足之处在于,WID-BC-index已在欧洲人群中开发和验证,但该测试还需要在非欧洲人群中进一步验证。在宫颈细胞学样本和乳腺组织样本中评估的 DNAme 谱是否也可以作为监测乳腺癌预防措施的替代物,需要在大规模前瞻性临床试验中进行评估。总之,本研究的切入点十分新颖,将宫颈与乳腺癌结合起来,值得大家在日后的研究中进行借鉴!