前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NC:结构连接组学的遗传结构

NC:结构连接组学的遗传结构

原创
作者头像
悦影科技
发布2024-06-14 15:23:24
1350
发布2024-06-14 15:23:24

摘要:由髓轴突形成长程连接,使远端大脑区域之间能够快速通信,但遗传学如何控制这些连接的强度和组织仍不清楚。我们对206名参与者的扩散磁共振成像束得出的26333种结构连接进行了全基因组关联研究,每种测量都代表了一对皮质网络、皮质下结构、皮质半球内部之间的髓鞘连接密度。在Bonferroni校正后,我们确定了30个独立的全基因组显着变异,用于研究的测量数量涉及髓鞘形成(SEMA3A)、神经突伸长和引导(NUAK1、STRN、DPYSL2、EPHA3、SEMA3A、HGF、SHTN1)、神经细胞增殖和分化(GMNCs、CELF4、HGF)、神经元迁移(CCDC88C)、细胞骨架组织(CTTNBP2、MAPT、DAAM1、MYO16、PLEC)和脑金属转运(SLC39A8)。结构连通性测量是高度多基因的,估计有9.1%的常见变异对每个测量具有非零影响,并表现出负选择的特征。结构连通性测量与各种神经精神和认知特征具有显着的遗传相关性,表明连通性改变变异往往会影响大脑健康和认知功能。在成人少突胶质细胞和多种胎儿细胞类型中染色质增加的区域,遗传性富集,表明结构连接的遗传控制由对髓鞘形成和早期大脑发育的影响介导。我们的研究结果表明,通过不同的神经发育途径对白质结构连接进行普遍的、多效性的和空间结构的遗传控制,并支持这种遗传控制与健康大脑功能的相关性。

1. 引言

人脑的体积大约相等,灰质和白质。与灰质不同,灰质主要包含密集排列的神经元和神经胶质细胞体,白质几乎由有髓轴突束组成。髓磷脂的主要目的是显着加快沿轴突的动作电位传导,使穿过白质的轴突能够在远处的大脑区域之间有效地传递信息。白质纤维是大脑结构连接组的关键成分,是脑细胞之间完整的解剖连接集。结构连接是大脑的基本组织属性。

白质的微观结构特性可以通过扩散磁共振成像(dMRI)在体内进行非侵入性量化。这是因为轴突周围的髓鞘,以及轴突膜本身和纤维束内轴突的相干性或密度(组织),构成了限制水分子扩散的物理屏障,因此它们更容易沿着轴突扩散而不是垂直于轴突,导致在施加定向磁场梯度时 MRI 信号失真。

可以使用一种称为光纤跟踪或牵引成像的技术来评估结构连通性,它基于水通过白质扩散的方向性构建了白质纤维的路径模型。通过叠加自己选择的大脑图谱,可以量化成对的大脑区域之间的连接。因此,与TBSS不同,束成像具有量化结构连接组的能力,提供有关与认知等复杂过程相关的全脑组织特性的丰富细节和功能连接。束成像与多种神经精神疾病的连接组紊乱有关。

在这里,我们扩展了先前的白质GWAS,以检查206个基于束成像的结构连接测量,这些测量代表了大脑丰富的组织结构。每个测量都量化了一对完善的大规模皮层脑网络内部或之间的白质纤维密度、皮质下结构或半球。我们的初步分析(图1)包括来自英国生物样本库的26333名参与者。

图片
图片

图1 研究概述

2. 结果

2.1 26333名英国生物样本库参与者的牵引成像

参与者在第一次扫描时为53%的女性,年龄在40-70岁之间。dMRI数据在使用前根据UKB管道进行了广泛的预处理。为了获得每个参与者的连接组,我们使用了MRtrix弥散 MRI 软件包。

我们选择以生物学上可解释的方式减少每个参与者的连接体基质的维度。我们推导出三种类型的测量值,总共有206个测量值(图 2):(1)半球水平的皮质到皮质的连通性,(2)14个半球特异性网络和网络水平皮质到皮质连接。这206项测量在 2400 名参与者中具有中等可重复性。

2.2 与结构连通性相关的变体

我们使用regenie遗传分析工具包对这206种连通性测量进行了全基因组关联研究。我们分析了英国生物样本库估算基因型中存在的9423516个变异,其次要等位基因频率至少为1%,并通过了质量控制。前10位基因型主成分。我们确定了30个基因组宽显著位点(图3),经过Bonferroni校正后,至少与206个测量值中的一个相关。

图片
图片

图2 26333名英国生物样本库参与者的牵引图

图片
图片

图3 206个结构连通性测量中每个变体的最小 p 值的曼哈顿图

2.3 结构连通性的两种广泛的空间关联模式

接下来,我们探讨了206个测量中30个先导变体中每个变体的关联空间模式(图 4)。我们注释了通过Bonferroni校正的全基因组显着性的关联。我们表征了这30个位点对206个测量值的多效性影响,仅对30个变体乘以测量数。在这个宽松的阈值下,我们观察到206项措施中30个铅变体存在实质性的多效性。

我们观察到四种广泛的空间关联模式与结构连通性。30个铅变体中最重要的,几乎完全与皮质丘脑连接相关,即各种皮质网络与丘脑之间的连接。另外三个,靠近GMNC,NUAK1和INPP5D,主要与半球间皮质连接以及皮质丘脑连接相关。这种半球间模式之所以存在,部分原因是半球间的连接被更可靠地检测到,这反映在它们更高的可复制性上(图2C)。另外8个,在EEF1AKMT2、STRN、CTTNBP2、MYO16、PLEC SLC4A10、SLC45A4和ENSG00000282278附近,显示出半球间模式,但没有显示皮质丘脑模式。其余 18个变体往往具有空间弥漫的关联模式。

还存在其他更微妙的模式。例如,SLC39A8变体rs13107325在30个变体中独一无二,与皮质-海马体有关,并且在较小程度上与皮质-杏仁核的连通性相关。SLC39A8独特的关联模式可能反映了其作为大脑金属转运蛋白的独特机制。

图片
图片

图4 与结构连通性相关的空间模式

2.4 相关变异涉及具有神经发育作用的基因

30个先导变异中有17个具有与神经发育直接生物学相关的最接近的基因。最显着的关联是与 rs941760,这是CCDC88C年的一种内含子变体。CCDC88C功能丧失变异会破坏Wnt信号转导,这是一种核心发育信号通路,并引起常染色体隐性脑积水,有时伴有脑室周围神经元异位(神经元迁移异常导致的脑畸形)、发育迟缓和癫痫发作。在30个先导变体中,另一个将Wnt家族成员WNT16作为最接近的基因,但WNT16与神经发育的相关性尚未得到最终证明。

第二重要的关联是与基因间变异 rs905124的相关性,GMNC是最接近的蛋白质编码基因。GMNC,也称为 GEMC1,是多纤毛细胞分化的主要调节因子82,特别是排列在大脑脑室的纤毛室管膜细胞。GMNC 是脑室下区的放射状神经胶质细胞分化为多纤毛室管膜细胞所必需的;当GMNC下调时,这些放射状神经胶质细胞倾向于分化为神经干细胞,促进神经发生。GMNC与人类和小鼠的先天性脑积水有关。根据GWAS目录,rs905124以前与脑容量和皮质表面积有关。

第三重要的变体rs13107325是SLC39A8中的错义变体。SLC39A8编码锌、镉、铁和锰离子的跨膜转运蛋白,有时称为 ZIP886。SLC38A8/ZIP8 缺乏症会损害锰的摄取并损害锰依赖性酶的功能,包括糖基化所需的酶,从而导致严重的神经发育缺陷和其他表型。该变异是迄今为止最大的精神分裂症GWAS中第八重要的铅变异,并且该变体也被证明会损害小鼠大脑中的糖基化。RS13107325与皮质-海马连接的独特强关联,与有关海马大小、形态、功能和与精神分裂症连接的长期文献一致。rs13135092在 GWAS 目录中有 477 个报告的关联,包括与各种脑成像测量的关联。

第五重要的变体 rs12146713。NUAK1通过对线粒体代谢和运输的影响,剂量依赖性地调节轴突伸长和分支。NUAK1 是自闭症谱系障碍 (ASD)、注意力缺陷/多动障碍 (ADHD) 和智力障碍的候选基因。在小鼠中,NUAK1单倍体功能不全会损害皮质发育,并对认知产生广谱影响。GWAS目录报告了rs12146713的73个关联,所有关联都与大脑结构有关。

第六大显著变异rs35050623是基因间变异,STRN是最接近的蛋白质编码基因。STRN是一种钙调蛋白结合蛋白,富含树突棘。在培养的纹状体神经元中,STRN敲低导致树突状树原化增加和粗棘密度增加,表明在调节纹状体神经发育中起作用。rs35050623有一个 GWAS 目录关联,具有大脑形状。

第八重要的变体 rs4799450是CELF4 中的内含子变体。CELF4是一种 RNA 结合蛋白,也是产前新皮质亚板层突触发育的翻译调节因子。CELF4 参与神经元的分化和激发、皮质丘脑发育、突触传递和神经可塑性,是mRNA稳定性和翻译可用性的重要调节因子。缺乏可导致神经元兴奋功能失调和突触传递受损。CELF4功能障碍与多种神经精神疾病有关,包括自闭症、双相情感障碍、精神分裂症和癫痫。rs4799450 具有一个 GWAS 目录关联,具有白质微观结构。

第九重要的变体 rs199790004是 DPYSL2 中的内含子变体。DPYSL2 是一种微管稳定蛋白,在神经发育过程中调节轴突生长、树突发育、突触伸长和囊泡运输中发挥作用并且是神经干细胞分化的关键调节因子。DPYSL2 是一种已知的精神分裂症风险基因,其表达在精神分裂症患者大脑中发生改变,可能是 mTOR 信号中断的下游结果。

第十个最重要的变异,rs35124509是EPHA3中的错义变异,EPHA3是任一方向上超过1兆碱基的唯一蛋白质编码基因。EPHA3 的敲除破坏了轴突通过胼胝体的寻路。EPHA3 激活可减少神经突的生长,更具体地说,诱导生长锥塌陷。EPHA3还影响更高层次的结构连接模式,调节兴奋抑制平衡和GABA能中间神经元突触密度。rs35124509 有 16 个 GWAS 目录关联,所有关联都与脑成像测量有关。

第 11 个最重要的变异 rs150346963是位于CTTNBP2上游 ~100 千碱基的基因间变异。CTTNBP2是一种细胞骨架蛋白,主要在神经元中表达,通过与皮质蛋白相互作用来控制突触和树突棘的形成和维持,皮质蛋白与肌动蛋白丝结合并稳定肌动蛋白丝。CTTNBP2是自闭症谱系障碍的候选基因在敲入CTTNBP2中具有自闭症谱系障碍相关突变的小鼠突触功能受损。同时,CTTNBP2敲除小鼠降低了脑锌水平并改变了突触蛋白靶向,而补锌可挽救突触CTTNBP2的保留并改善这些小鼠的社交行为。rs150346963与重度抑郁症有一个 GWAS 目录关联。

第12个最重要的变体 rs118087478是MAPT中的内含子UTR 变体。MAPT以其在神经退行性疾病中的核心作用而闻名,但它也参与神经发育,并在其中高度表达并调节微管的组装和稳定性及其与质膜的连接。MAPT 遗传区的微缺失与智力障碍有关,这被认为是改变tau剂量的结果,MAPT敲除导致自闭症小鼠模型中自闭症行为的减少。rs118087478 有一个 GWAS 目录关联,与脑容量相关联。

第14个最重要的变体 RS79814107是 DAAM1中的内含子变体。DAAM1是一种支架蛋白,它作用于 Wnt 信号转导的下游,并通过调节肌动蛋白细胞骨架组织来控制细胞极性和运动。在小鼠中,Daam1中神经特异性微外显子的缺失导致记忆缺陷,长期增强减少和树突棘数量减少。根据GWAS目录,rs79814107以前与脑容量和白质完整性有关。

第15个最重要的变体 RS34844662是 MYO16 中的内含子变体。MYO16 是一种非常规肌球蛋白,参与细胞骨架重塑,主要在中枢神经系统中表达。在神经元内,MYO16 与 WAVE 调节复合物相互作用,该复合物通过调节肌动蛋白聚合(特别是在浦肯野细胞中)和突触组织来调节树突棘形态。

第17个最重要的变体RS59154421是SLC4A10中的内含子变体。SLC4A10 是质膜中的一种转运蛋白,主要在神经元中表达。它通过吸收碳酸氢盐来帮助调节神经元的pH值,碳酸氢盐由跨膜的钠梯度驱动,这有助于去除氢离子。案例研究表明,常染色体隐性遗传SLC4A10功能丧失会导致智力障碍、小头畸形和侧脑室异常。Slc4a10敲除小鼠具有较小的脑室和行为异常,并且SLC4A10调节小鼠大脑中的GABA(但不是谷氨酸)释放。SLC4A10是自闭症谱系障碍的候选基因和癫痫。

第19个最重要的变体RS13228652是 SEMA3A 中的内含子变体。信号素是膜蛋白家族,可协调轴突引导并诱导生长锥塌陷。SEMA3A是第一个发现的信号并充当轴突化学驱虫剂并诱导生长锥塌陷。除了这一主要作用外,SEMA3A在抑制多发性硬化症的髓鞘再生中也具有重要的次要作用,至少部分通过抑制少突胶质细胞前体细胞分化和向脱髓鞘病变的募集。

第22个最重要的变体 RS975360 位于 HGF 转录起始位点上游。HGF是一种多效性细胞因子,为神经元提供营养支持,并参与促进细胞运动、轴突生长和树突形态。HGF在神经发育过程中在皮层和海马体中表达,调节丘脑皮质轴突生长。HGF的同源受体酪氨酸激酶MET是一种高置信度的自闭症风险基因,与健康对照组相比,自闭症患者大脑中的MET蛋白水平较低。HGF和MET表达降低的小鼠模型显示神经发育过程中神经元间迁移的缺陷。

第28个最重要的变异 RS5788199是两个重叠基因 SHTN1 和 ENO4 中的内含子变异。SHTN1是神经元极化所必需的,神经元极化是发育神经元中的一个神经突最终成为轴突,其余成为树突的过程。SHTN1在最终成为轴突的神经突中不对称地积聚,通过过表达或敲低来破坏这种不对称积累会破坏神经元极化。Shtn1基因敲除小鼠表现出多个白质束(胼胝体、前连合和海马连合)变薄,以及隔膜缺失。

2.5 结构连通性是高度多基因的,并表现出负选择的特征

接下来,我们通过应用最近开发的SBayesS方法推断了每个结构连通性测量的遗传结构的全局特性(图5)。

图片
图片

图5 结构连通性遗传结构的全局特性

遗传力比例(h2)由GWAS中包含的9423516个常见变体共同解释,相对温和,在206个GWAS中从3.3%到27.7%不等(中位数为13.9%)。正如预期的那样,最可遗传的测量值在初始扫描和后续扫描之间也是最可复制的,表明这些测量值随着时间的推移具有更高的稳定性。

引人注目的是,涉及默认模式和对照网络的皮质丘脑连接测量是多基因最少的,尽管是遗传性最高的。低多基因性和高遗传性的结合表明,与其他类型的连接相比,这些皮质丘脑连接由更特异性的基因集控制。这一观察结果与我们鉴定的变异一致,这些变异总体上与皮质丘脑连接性不成比例,靠近CCDC88C、GMNC、NUAK1和INPP5D(图4)。

SBayes 还估计一个选择参数。性状被选择的程度可以从次要等位基因频率和GWAS效应大小之间的关系中推断出来。例如,如果一个性状处于强烈的负选择之下,那么对该性状有很大影响的变异往往很少见,因为携带这些变异的个体将具有较低的进化适应性,并且不太可能传递他们的基因。206个测量值中有194个估计处于负选择状态(S 的 95% 置信区间完全低于 0),表明低频变体的效应量明显更大。所有 206 个测量值的点估计值均低于0,范围从-1.13到 -0.03。

总体而言,这些措施的高多基因性表明基因组的很大一部分参与了遗传决定结构连通性,并且仍有待未来的GWAS发现。同时,这些措施似乎处于负选择之下,这一事实表明,影响结构连通性的变异往往会对进化适应性产生负面影响。

2.6 结构连通性在遗传上与一系列精神和认知特征相关

我们计算了遗传相关性(rg)在我们的 206 个 GWAS 和 15 个强大的 GWAS 之间,用于神经、精神、神经发育和认知特征,使用遗传协方差分析仪(GNOVA)方法。我们之所以选择 GNOVA,是因为它改进了相对于交叉性状 LD 分数回归的样本重叠校。在对 206 × 15 个遗传相关性进行Bonferroni校正后,我们观察到18个显着的遗传相关性。6个性状具有至少1个显著的遗传相关性(图 3):双相情感障碍、多动症、失眠、阿尔茨海默病、教育程度和反应时间。这些显著的遗传相关性对ADHD呈阳性、失眠和阿尔茨海默病,表明与连通性增加相关的遗传变异往往是与这些疾病风险增加相关的相同遗传变异,当观察整个基因组时,而不仅仅是全基因组的重要变异。相反,双相情感障碍的显著遗传相关性为负,表明与连接性增加相关的遗传变异往往与双相情感障碍风险降低、教育程度降低以及 - 考虑到教育程度结果有点矛盾 - 更好的反应时间相关的遗传变异。总的来说,这些遗传相关性支持遗传因素的相关性,这些遗传因素影响结构连接与一系列神经精神和认知结果的相关性。

我们还利用这些措施的先前GWAS,计算了基于TBSS和神经突取向分散和密度成像(NODDI)的三种半球水平测量值与432种弥散MRI测量值之间的表型和遗传相关性。跨半球连通性与432项措施中的401项和197项分别具有Bonferroni显著的表型和遗传相关性。表型相关性范围从-0.60到0.53。遗传相关性范围从-0.59到0.5。总体而言,该分析表明,结构连通性与表型和遗传相关,但与更广泛使用的弥散 MRI 测量有很大不同。

2.7 在少突胶质细胞染色质可及性增加的区域,结构连通性遗传性富集

我们应用了分区连锁不平衡得分回归,研究每种结构连接性测量的遗传力是否在 6 种主要脑细胞类型(星形胶质细胞、兴奋性神经元、抑制性神经元、小胶质细胞、少突胶质细胞和少突胶质细胞前体细胞)中染色质可及性增加的区域中富集,通过死后成人运动皮层的单核染色质可及性和信使 RNA 表达测序 (SNARE-seq2) 测量。在对测试的 206 × 6 种细胞类型富集进行 Bonferroni 校正后,我们发现 4 种细胞类型的 7 种结构连接测量存在显着富集(图 1)。还有许多次显著富集,特别是对于星形胶质细胞和少突胶质细胞。鉴于少突胶质细胞是负责髓鞘形成的细胞类型,而少突胶质细胞的主要功能之一是髓鞘化白质纤维,观察到的少突胶质细胞遗传性富集表明,结构连通性的遗传控制可能部分由髓鞘形成的影响介导。

我们对来自发育中的人类皮层的 12 种细胞类型进行了相同的细胞类型富集分析,使用已发表的单细胞测定法对具有高通量测序 (ATAC-seq) 数据的转座酶可及染色质进行检测。在对测试的 206 × 12 种细胞类型富集进行 Bonferroni 校正后,我们发现四种细胞类型的遗传力显着富集,均为非神经元。这些细胞类型为:星形胶质细胞和少突胶质细胞祖细胞、内皮细胞/壁细胞、小胶质细胞和放射状神经胶质细胞,干细胞是神经元和特定神经胶质细胞的祖细胞,即星形胶质细胞和少突胶质细胞。我们还发现岛状神经元的遗传力显著去富集。多种胎儿细胞类型的这些遗传性富集表明,结构连接部分是由对早期大脑发育的影响介导的,特别是在非神经元中。

3. 讨论

在这项研究中,我们通过对206名英国生物样本库参与者的26333项牵引学衍生测量的全基因组关联研究,描述了白质结构连接的遗传结构。在对进行的多次统计检验进行严格校正后,我们发现了 30 个与结构连通性相关的位点(其中 126 个位点具有名义全基因组显着性)。这些基因座精确定位了对髓鞘形成 (SEMA3A)、神经突伸长和引导 (NUAK1、STRN、DPYSL2、EPHA3、SEMA3A、HGF、SHTN1)、神经细胞增殖和分化 (GMNC、CELF4、HGF)、神经元迁移 (CCDC88C)、细胞骨架组织 (CTTNBP2、MAPT、DAAM1、MYO16、PLEC)和脑金属转运 (SLC39A8)。除了这些生物过程外,我们还观察到在少突胶质细胞、小胶质细胞、抑制性神经元、星形胶质细胞和多种胎儿细胞类型中染色质可及性增加的区域中,结构连通性的遗传性增强,支持髓鞘形成和早期大脑发育在结构连通性的遗传学中的作用。我们的研究结果扩展了MRI GWAS测量大脑结构和功能其他方面的丰富文献。

我们首次表明,结构连通性是高度多基因的:我们估计,对于我们队列中的参与者,平均连通性测量受到基因组中所有常见(>1%频率)变异的9.1%的影响。这表明我们的 30 个位点仅代表对结构连接组的遗传影响的一小部分;可能需要更大的样本量,可能达到数千万,才能发现其余的样本。这种高度的多基因性伴随着负选择的证据:高频变异往往对结构连通性的影响较小。总之,这些结果意味着一种遗传结构,即大量不成比例的常见变异对结构连通性产生微小影响,而效应较大的变异由于其有害性而倾向于从种群中清除。另一方面,SBayesS 论文中分析的 18 个英国生物样本库性状147尽管具有类似的负选择证据,但往往比我们的结构连通性测量的多基因性要低。

我们的结果远非提供特定遗传变异和特定区域连通性之间的一对一图谱,而是表明结构连通性相关变异的广泛多效性。我们的30个先导变体每个都与206个测量值中的7.5个中位数相关,并且许多还与大脑结构的其他方面相关。涉及默认模式和对照网络的皮质丘脑连接测量尽管是遗传性最强的,但也是多基因最少的,这为支持皮质丘脑连接比其他类型的连接由更特异性的基因集控制提供了进一步的证据。相对于其他类型的结构连接,皮质丘脑结构连接可能具有非常重要的意义,因为它支撑着皮质-丘脑-皮质环路,皮质-丘脑环路是参与意识和感知的大脑组织的模块化单元。

遗传相关性分析表明,结构连接与一系列神经精神和认知特征之间存在共同的遗传影响。这些关联的方向性有些违反直觉:与结构连接性增加相关的变异往往与多动症、失眠和阿尔茨海默病的风险增加、双相情感障碍风险降低、教育程度降低和反应时间缩短有关。虽然认知能力下降与结构连接性降低有关,以及通过增加连接性提高的认知弹性,在轻度认知障碍、阿尔茨海默病和/或衰老中,考虑年龄后健康个体的结构连接与认知之间的关系研究较少。请注意,我们使用的阿尔茨海默病GWAS包括阿尔茨海默病和相关痴呆症的代理病例,这增加了功效,但也可能导致遗传流行病学分析的偏倚。

与我们的研究同时,另一项研究还检查了英国生物样本库中白质结构连接的遗传结构。与我们的研究不同,作者使用了多变量GWAS技术MOSTest,通过利用与结构连接相关的GWAS变体往往与大脑多个部分的连接变化相关的事实来增强功率。虽然较少关注单个因果基因候选基因的潜在机制,但作者仍然表明,它们对许多相同的神经发育过程的GWAS关联在全球范围内丰富,正如我们报告的单个因果基因候选基因一样,包括神经发生、神经分化、神经迁移、神经投射引导和轴突发育。与我们的研究一样,作者报告了结构连接和神经精神疾病之间普遍存在的共享遗传学。

这项研究有几个重要的局限性。首先,我们研究的核心局限性是使用牵引成像来推断结构连通性。术语“结构连通性”以及我们可以从基于扩散 MRI 的方法中推断出连通性的假设本质上是有限的;所有使用 MRI 衍生指标来推断神经生物学细节的情况都是如此。与组织学束示踪等离体方法不同,束成像不是结构连通性的直接测量。它所基于的测量与组织中水分子的扩散有关,组织结构或组织会影响扩散率。这与真正的结构连通性(在轴突水平上)相去甚远,因此我们充其量只是在构建一个大规模连通性趋势的估计模型。束成像难以分辨小的或混合的轴突束,并且容易受到假阳性连接的影响。此外,牵引成像不适合测量灰质典型的短程和无髓鞘连接。不同的牵引算法也可能因牵引模型和参数而有所不同,这可能因区域而异。我们的方法试图使用当前的最佳实践来最大限度地减少杂散束的产生并评估可靠性。随着扩散算法和成像技术的改进,可能会得出更可靠和可解释的指标。这可能导致识别更具体地与不同类型的生物变异相关的指标(例如髓鞘形成与堆积密度),从而可以识别与结构变异的不同方面特别相关的遗传变异。因此,虽然我们能够确定这些大规模结构连接模型与遗传学之间的关系,但这些结果应该在当前扩散成像方法的局限性内进行解释。这些局限性应与基于弥散 MRI 的牵引成像提供的独特机会和可扩展性进行权衡,以揭示遗传对人脑物理布线的影响。

其次,我们的结果来自40-70岁参与者的MRI扫描,可能无法推广到其他年龄组的参与者。特别是,与年龄相关的结构连接变化与认知能力下降有关,这可能与我们意外观察到结构连接和认知测量之间的负遗传相关性有关。

总之,我们的研究结果表明,遗传对人类大脑内结构连接的普遍影响,并支持它们与健康和疾病中大脑功能的相关性。未来有必要使用更复杂的成像技术进行研究,以将这些结果扩展到灰质结构连接,并开发对人类结构连接组的遗传影响的真正全面的图谱。

4. 方法

4.1 队列选择和MRI质量控制

总共有41,489名来自英国生物样本库的参与者被列为在基线时同时进行 T1和扩散加权MRI 扫描。然而,在这些基线扫描中,有1456例缺乏针对涡流校正的扩散加权MRI扫描、头部运动、异常切片和梯度失真。另有8725个缺少涡流校正的BVEC 文件。

接下来,我们考虑了英国生物样本库提供的四个质量控制指标:T1反信噪比、T1 反比噪声比、扩散 MRI 异常值切片的数量以及弥散 MRI 中通过涡流测量的从左到右的头部运动。所有四个质量控制指标都经过定义,因此值越高越差。注意到所有四个指标的分布在不同程度上都是右偏的,尾部是低质量的扫描,我们排除了四个指标中的任何一个比平均值高出3个标准差以上的扫描。1113名受试者被排除在基线扫描之外,剩下30196名受试者。

这些参与者中总共有26445人具有欧洲遗传血统,并且还具有被认为适合遗传分析的基因分型数据:可用的基因型,遗传性别和自我报告的性别之间没有不匹配,没有性染色体非整倍体,并且未标记为“杂合性或缺失率的异常值”。另有668名受试者具有非欧洲遗传血统,并且具有被认为适合遗传分析的基因分型数据。

因此,我们在27113次基线扫描上运行了我们的 Tractography。我们对主要GWAS使用了26333次欧洲基线扫描,对复制GWAS使用了665次非欧洲基线扫描。为了评估区域成像测量本身的可复制性,我们使用了2400名具有欧洲遗传血统的参与者的子集,他们也进行了重复扫描,这些扫描通过了上述所有过滤器并成功运行。

4.2 表型定义

我们总共定义了3个半球级别的连通性测量(左半球内、右半球内、半球间)。具体来说,我们对左半球所有包裹对的连接组矩阵条目进行平均,以获得左半球内的整体连通性,右半球也是如此。我们通过平均连接左半球任何地块和右半球任何地块的条目来量化整体半球间连通性。

我们总共定义了105个网络级连接度量。Schaefer 图谱中的每个地块之前都已映射到 7 个大型大脑网络之一,这些网络是以基于功能连接的数据驱动方式得出的:视觉 (“Vis”)、躯体运动 (“SomMot”)、背侧注意 (“DorsAttn”)、显著/腹侧注意 (“SalVentAttn”)、边缘、控制 (“Cont”)和默认模式 (“默认”)。由于每个网络都存在于两个半球,因此有 14 个半球特定的网络,例如表示左半球视觉网络的“LH Vis”和右半球控制网络的“RH Cont”。对于每个网络,我们对该网络中所有宗地对的连接组矩阵条目进行平均,以定义 14 个网络内连接度量。此外,对于每对网络,我们对连接第一个网络中任何地块和第二个网络中任何地块的连接组矩阵的条目进行平均,以定义91个网络间连接度量。

最后,我们定义了总共98个皮质到皮质下连接测量,在14个半球特异性 Yeo 7 网络和 7个皮质下结构(丘脑、尾状核、壳核、苍白、海马、杏仁核和伏隔)之间。

4.3 全基因相关联研究

我们通过使用 regenie 遗传分析工具包对9423516个单核苷酸遗传变异的每个测量值进行线性回归,对 206 个连通性测量值进行了全基因组关联研究。regenie通过计算相关表型的多基因风险评,然后在执行实际关联测试时将此PRS作为协变量包含,来考虑样本相关性和群体结构。regenie使用留一条染色体方案来构建 PRS。

4.4 鉴定独立的全基因组显著变异

为了鉴定独立的全基因组显著变异,我们将5兆碱基内的变异聚集在一起,并具有连锁不平衡 (LD),使用 plink 2.0.0 版本中的--clump命令,选项为 --clump-p1 5e-8 --clump-p2 0.001 --clump-r2 0.01 --clump-kb 5000。对于图3,我们对 206 个测量值中每个变体的最小p值(即曼哈顿图中显示的 p 值)进行了这种聚类。

4.5 P值膨胀和连锁不平衡、分数回归、截距和遗传力

我们观察到可接受的p 值膨胀,基因组膨胀因子 (λ气相色谱仪)为1.014至1.093(中位数为1.044),分布在206个GWAS中。这种膨胀大部分是由于多基因性而不是混杂因素,连锁不平衡(LD)分数回归截距仅为 0.996 至 1.016(中位数1.006)。

我们没有使用预定义的LD分数,而是选择从英国生物样本库的估算基因型中计算 GWAS中9423516个变异的LD分数。我们通过以下方式做到这一点:(1)随机抽取26,333名参与者中的1000名,(2)将插补变异转换为硬调用,以及(3)运行ldsc的--l2命令,其中包含英国生物银行通过--bfile标志提供的硬调用基因型。当运行 --l2 时,我们使用了1兆碱基窗口 (--ld-wind-kb 1000)而不是通常的1厘米器官窗口,因为英国生物样本库的估算基因型文件没有报告厘米根距离。

4.6 使用 SBayesS 进行遗传力、多基因性和选择分析

我们使用了 SBayesS 方法估计遗传力(h2)、多基因性(π)和选择(S)参数,用于我们206个GWAS中的每一个。我们对每个GWAS的汇总统计量运行全基因组复杂性状贝叶斯分析(GCTB)软件。SBayesS 使用马尔可夫链蒙特卡洛采样来推断 h2、π 和 S。我们使用的默认设置是运行马尔可夫链的 10000 次迭代并从每10次迭中对参数进行采样,从迭代2000开始,从而生成每个参数的800个估计值中,我们通过取 800 个估计值的平均值来获得每个参数的单个估计值,并通过取这 800 个估计值的第 2.5 个和第 97.5 个百分位数来获得置信区间。

4.7 细胞类型富集分析

我们使用了分区LD分数回归从LDSC软件包中,对人皮质细胞类型进行细胞类型富集分析。我们使用了两个染色质可及性数据集,一个是成人数据集,一个是发育数据集。

首先,我们纳入了来自死后成人运动皮层的 6 种细胞类型的区域,这些细胞类型来自单核染色质可及性和信使 RNA 表达测序 (SNARE-seq2)。我们从表中获得了这些区。由于这些区域仅适用于神经元亚类,但亚类特异性分析可能不够强大,因此我们合并了跨亚类的区域。我们通过合并第 2-3 层端脑内(L2-3 IT)、第5 层端脑外(L5 ET)、第 5 层端脑内(L5 IT)、第 5-6 层非突出锥体(L5-6 NP)、第 6 层皮质丘脑 (L6 CT)、第 6 层端脑内 (L6 IT)、表达CAR3 的第 6 层端脑内 (L6 IT Car3) 和第 6b 层 (L6b)兴奋性神经元。我们通过合并 LAMP5、PVALB、SNCG、SST、SST CHODL 和 VIP 抑制性神经元的特异性区域来获得抑制性神经元特异性区域。我们注意到,这种选择不能捕获存在于多个兴奋性神经元亚类中的兴奋性神经元特异性区域,或存在于多个抑制性神经元亚类中的抑制性神经元特异性区域。

我们为这18种细胞类型中的每一种都创建了一个二进制注释文件,每个变体都有1或 0,具体取决于它是否位于该细胞类型中染色质可及性增加的区域。例如,对于 SNARE-Seq2 数据集,我们的 GWAS 中的9423516个变体中有29398个(0.35%)位于星形胶质细胞特异性开放染色质区域,112321个(1.33%) 位于兴奋性特异性区域,87192个(1.03%)位于抑制特异性区域,35754个(0.42%)位于小胶质细胞特异性区域,30394个(0.36%)位于少突胶质细胞特异性区域,36246个(0.43%)位于OPC特异性区域。我们还创建了一个“截距”注释文件,其中所有9423516个变体都被分配了1。

该分析可生成每种GWAS和细胞类型的富集(以及该富集的标准误差和p值)。这种富集表示,相对于不重叠该区域的平均变异,平均变异与该细胞类型中染色质可及性增加的区域重叠来解释遗传力高出多少倍。LD 分数回归的使用使该分析对 LD 的混杂效应具有鲁棒性:如果没有它,注释可能会被错误地认为是遗传力富集的,即使这种富集背后的整个 GWAS 信号来自 LD 中不重叠的变体注释。

参考文献:Genetic architecture of the structural connectome.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档