个体间行为差异的大脑结构有何关联?十多年前,结构MRI的进步为解决这个问题开辟了有希望的新途径。最初的研究浪潮逐渐导致概念和方法的重大转变,复制危机揭示了传统方法的局限性,包括在健康个体的小样本中寻找局部神经解剖学测量和行为变量之间的联系。考虑到这些方法论上的问题,以及对心理构造与大脑区域一对一映射的想法越来越多的怀疑,新的观点出现了。这些研究不仅包含了大脑结构与行为关系的多元本质,并促进了概率性,而且还包含了大脑结构与行为数据之间关系的表征,即个体间差异的潜在维度。在这里,我们回顾了健康人群大脑结构行为关联研究的过去和现在,并解决当前的挑战和未来研究的未决问题。
在本展望中,我们回顾了基于大脑结构的神经成像测量的脑结构行为(BSB)相关性研究的主要进展和有影响力的研究,并描述了随后逐渐出现的复制危机。我们考虑了这项工作的主要潜在限制因素:小样本量和抽样可变性,以及大脑体素、顶点和行为变量的多重共线性。这些考虑汇集了一个概念上的转变,即从大脑区域和行为特征之间的一对一映射,转向能够在未来促进更好理解的多元视图。然后我们处理这个视图的两个方面。首先,我们考虑使用预测方法将多个大脑变量映射到特定的行为变量。其次,我们描述了旨在识别大脑行为潜在维度的多变量方法,通过解释大脑变量和行为变量这两组数据的多变量性质。我们通过考虑这些新趋势中可能的陷阱和限制,以及理想的样本外复制的挑战,来遵循这些。最后,我们根据当前的方法挑战讨论解释陷阱。
1 局部脑-行为映射
人类的一个显著特征是我们在个性和认知等行为方面的个体间显著的差异。长期以来,这一观察结果促使人们探索它们的生物学基础。在过去的20年里,神经成像技术为在活体个体样本中进行大脑形态测量提供了可能,从而可以检查与个体特征的可变性有关的大脑结构特征。特别是,目前的神经成像技术很容易提供局部灰质体积和大脑皮层厚度的估计。随着磁共振成像技术对大脑结构的量化,大量的BSB文献应运而生。
图1 局部大脑形态与行为特征或表现之间的映射
2 复制危机
神经科学和心理学最近出现了广泛的复制危机,一些作者甚至认为,大多数已发表的神经科学文献可能是不可复制的。在这方面,传统BSB关联研究的可重复性也同样受到质疑。对几个已发表的BSB相关性的纯验证性重复研究不能找到几乎所有研究相关性的支持(图2);事实上,对于大多数(以前重要的)关系,验证性贝叶斯假设检验显示了支持无效假设的证据。这些令人担忧的发现之后,本报告的作者和其他人就重复研究的局限性进行了生动的讨论。沿着同样的思路,我们发现,即使使用相同的分析方法,在一个功能良好的样本中,认知控制的标准测量与灰质体积之间的显著相关性也无法在第二种人口统计学相似的样本中得到复制(图2)。
值得一提的是,这些令人担忧的发现主要与基于体素的形态测量有关。这种方法被批评为估计局部神经解剖学的一种相对粗糙的方法,这可能导致可能相当弱的关联的低重复性。这就提出了一个问题:其他方法是否可能导致更多可复制的BSB关联。为了直接解决这个问题,最近的研究表明,先前关于人格特征与皮质厚度、表面积或白质完整性之间关系的报道同样不能在大的群体中得到复制。在一组高质量的健康年轻成人大数据集中,皮质厚度估计与一系列行为测量之间的关联的重复性较差,证实了这些发现。因此,BSB相关性的复制危机似乎与大脑结构的特定MRI测量无关,而是一种包括灰质和白质体积测量以及基于表面测量的一般危机。
综上所述,这些发现与对神经影像学发现的重复性的普遍关注产生了共鸣。在更广泛的背景下,皮质厚度估计的跨扫描仪可变性仍然是一个重要的控制因素。此外,还讨论了分析软件的有效性和可靠性。事实上,十年前就报道过特定软件的特定版本存在令人担忧的差异。认知因素和皮层厚度之间的关联在不同的皮层厚度管道中评估时的低重复性也得到了证明(图2)。然而,对于常用的评估管道的最新版本,尽管局部估计失败,但相对可靠的皮质厚度估计及其个体间的变化已被证明。因此,尽管神经解剖学计算工具的用户群体在一定程度上可以得到保证,但在BSB研究中,关于扫描仪间变异、跨版本变异和处理管道变异的局部效应的许多问题仍然值得关注。
除了使用MRI技术对个体大脑结构进行量化之外,还应仔细考虑行为测量的心理测量特性。在差分心理学中,对于智力、人格特质等核心概念的测量,一般都是不断发展和评价的,以提高其效度和信度。相比之下,更多的研究领域特定结构可能显示较差的效度和可靠性,和/或统计分析的不充分分布。例如,政治取向变量的缺乏变异是导致BSB复制尝试失败的一个潜在因素(图2)。因此,当研究复杂的心理概念和MRI技术衍生的大脑估计时,有限的有效性,大脑和行为两方面变量的可靠性和分布应铭记于心,因为在BSB研究中,限制因素在一定程度上导致了复制问题。
总之,在一系列行为测量和各种流行的大脑结构估计中,BSB关联的可重复性受到了质疑。重要的是,这不仅涉及到以前发表的论文中发现的重复,还涉及到独立样本中的研究内发现的重复,甚至涉及到给定队列中的次抽样。然而,这些结果不应该导致大脑结构和行为表型之间的联系是无法实现的结论。相反,他们认为这种关联的规模可能是相对有限的,目前的标准方法无法可靠地捕捉到。
图2 结构性大脑行为联系的可重复性差
3 小的效应大小,效度和假阳性
最近的复制研究和使用非常大的数据集的探索性研究,如英国生物银行,表明大脑结构和行为方面之间的联系的影响大小,通过标准的心理测量工具测量的健康人群可能是非常小的,相关系数似乎在0.1左右。找到真实效应的可能性(例如,局部大脑结构和行为测量之间的联系),也就是说,实验的力量与效应大小和样本量直接相关。因此,在小样本中发现真实效应的概率相对较低。更准确地说,由200 ~ 300名参与者组成的样本似乎没有能力在健康参与者中确定可靠的BSB关联。最近的调查指出,要在标准认知测试(如智力测试)和心理量表(如人格和精神病理量表)中可靠地识别BSB与标准认知测试(如智力测试)的联系,需要更大的约1,000名参与者的队列。
尽管有上述发现,构成当前文献的绝大多数BSB研究通常基于相对较小的样本(n<200)。因此,可以合理地说,在这些研究中报告虚假或不确定结果的可能性极高。尽管驱动虚假关联的确切因素仍是一个研究主题,但可以假设,统计上显著关联的报告可能会受到数据挖掘和相关实践的影响。在概念层面上,这些问题意味着BSB的发现和建立在这些基础上的神经科学理论必须谨慎对待。反过来,在方法层面上,特定大脑行为关联的小效应量和数据挖掘的假阳性风险意味着需要大的队列和替代方法来深入了解健康人群的大脑结构和行为方面的关系。
4 多元结构大脑行为映射
4.1多元分析作为一种替代方法
从认识论的观点来看,人类大脑结构和行为功能之间映射关系的第一个科学证据来自于病变研究。通过显示相对局部的损伤和相对特定的行为缺陷之间的因果关系,第一次损伤研究因此支持了大脑区域和各自行为功能之间相对特定映射的概念,例如海马和情景记忆之间的映射。然而,在过去的几十年里,这种最初的一对一映射概念被重新审视,转而支持多对多的观点,特别是在健康人群中功能和结构神经成像研究的繁荣之后。因此,心理测量工具所探究的导致复杂行为方面的潜在机制,如今被认为不是模块化地定位于单个大脑区域,而是依赖于分布式神经网络。换句话说,尽管根据对临床人群重大损伤的研究,某些区域的结构完整性似乎对某一行为领域的正常功能是必要的,但正常功能范围内的表现变化似乎依赖于一系列大脑区域的结构变化。
然而,在健康人群中寻找行为测量的结构相关性通常是利用统计单变量方法进行的,在这种方法中,对与行为变量的相关性进行了大脑局部的统计检验,无论是对每个体素或大脑区域使用一般的线性模型,还是对感兴趣的区域使用先验定义的相关方法。考虑到小的效应大小和通常假设的这些关联在大脑中的空间分布性质,单变量方法似乎特别局限于捕捉复杂的大脑行为关系。此外,这些方法没有考虑到不同大脑体素/顶点或区域之间的相互依赖性,这些在结构协方差模式中很容易看到。出于这些原因,在旨在识别与特定心理变量(或一组心理变量)相关的大脑结构特征的探索性研究中,多变量技术提供了一种考虑到大脑数据的多变量性质的替代方法。
为了评估多个脑区域(或体素/顶点)与给定行为变量的联合协方差,可以使用多元回归方法。在这个框架中,我们将描述如何使用采用正则化多元回归形式的预测技术,将大脑结构特征联合映射到特定的行为测量。然而,当研究大脑和行为时,值得考虑的是,多个测量来源之间的相互依赖性不仅存在于大脑变量(体素、顶点或区域)之间,而且存在于行为测量之间。从流行病学的角度来看,可以预期在人口协方差框架内行为测量之间存在共线性,因为可以假设,年龄、教育或文化等独特因素共同影响行为表型的许多方面(见下文)。此外,从心理学的角度来看,可以假设不同认知测量之间存在共线性,因为这些不同的测量深入到潜在的过程,或隐藏的构念或过程。后一种考虑通常证明在心理科学中使用析因分析提取潜在因素(也称为合成变量)是正确的。然后,可以使用单变量(如传统的体素一般线性模型)或多变量方法将衍生的合成行为变量单独映射到大脑结构。前方法在这里将不讨论,从概念的角度看,它可以假定一个合成变量在健康人群心理数据反映了广泛的行为维度(如流动智力),因此可以将多因的关于它的认知过程,因此,不会映射到特定的大脑区域。将这样一个综合变量映射到共同考虑的大脑结构特征,可以使用下一节所述的预测框架来执行。
4.2从大脑结构模式预测行为变量
一个预测框架可以将多个大脑结构特征映射到一个单一的行为变量。具体地说,一组大脑变量被用作目标行为变量的预测因子。如前所述,这个变量的兴趣可能是一个测量变量,如一个特定的问卷得分,或可能是一个综合变量,如总分的基础上定义特定的理论(例如,通常是一个智力总分)或加载得分计算基于分解的数据。例如,当从一个应用临床问题或心理科学的立场出发时,展示大量大脑结构特征和被调查变量之间的关系可以有助于后者的神经生物学验证。简单地说,如果参与者在这个变量上的得分可以通过大脑结构数据来预测,那么就可以假设大脑结构特征和行为变量之间的关系。预测能力通常与交叉验证评估机器学习框架内设置。这样,拟合的大脑行为关系的普遍性来自于训练样本评估使用的预测精度验证或看不见的数据集。
近年来,基于大脑的行为表型预测在神经成像界引起了相当大的兴趣。可能出于概念上的原因(行为功能源于大脑区域之间的功能相互作用),大多数心理测量学预测研究都集中于大脑静息状态的功能连接(或结构和功能连接特征的组合)。因此,基于大脑的预测的主要发展最初起源于功能(和/或扩散)研究。然而,在过去的十年中,一些研究利用交叉验证的方法评估了基于估计的大脑结构的行为变量的预测。这些研究BSB关联的机器学习方法的先驱者通常是在假设驱动的框架下进行的,以证明特定大脑区域结构(如杏仁核或纹状体)与特定的认知、情绪或个性方面的关联。在一个相关的框架中,第一个BSB预测研究中使用的样本量通常是相对有限的,导致了夸大的效应量,类似于单变量研究中的观察结果。更普遍的是,随着应用神经影像特征预测表型的方法的全球趋势,预测精度指标所反映的预测能力被高估了,原因是队列规模有限、受数据泄漏或双点分析影响的不恰当的交叉验证方案。因此,在有限的队列(<200名参与者)中的第一个研究通常报告了非常乐观的预测准确性(就预测和观察行为得分之间的相关性而言),范围从0.40到0.74。然而,当样本量变大时(>200个参与者),在验证数据集中的预测精度较低,范围在0.11到0.28之间 (图3)。
从基本的神经科学观点来看,对健康人群大脑结构行为的适度预测可能表明,大脑结构的个体间变异对个体间行为的个体间变异的贡献有限。然而,应当注意的是,总的来说,基于大脑结构的行为预测性能与使用大脑功能特征(通常是功能连接估计)时的性能相似。同样,尽管在多模态框架中结合结构特征和功能特征通常比在大型队列中专注于单一模态更能提高预测能力,但结合方法的预测能力仍然相对有限。因此,基于神经成像标记物的行为预测模型在健康人群中仍然有其自身的挑战,无论所探测的神经生物学方面(大脑结构或功能连接)。认识到这些全球性的挑战,大脑结构对行为表型预测的贡献仍然是一个重要的研究课题。初步研究表明,使用相同的数据集对健康成年人,基于大脑结构特点预测模型可能表现得一样,甚至好于那些基于功能特性预测的一些行为评分(图3)。它也可以从这些调查,当预测基于多模态数据时,在许多认知测量的预测中,结构特征(如表面积、皮层厚度和灰质体积)往往比功能特征具有更高的权重。尽管还需要进一步的研究,但大脑结构特征似乎是研究大脑行为关系的重要信息来源。在下一节中,我们将进一步讨论在共同考虑一系列行为变量的同时探索这种关系的方法。
图3 机器学习和研究大脑结构行为关联的多元方法
4.3 将一系列表型变量映射到大脑结构数据
将多变量大脑特征映射到一个行为变量的补充方法可以由双多变量方法提供,在双多变量方法中,一组大脑变量被联合映射到一组行为变量。更具体地说,两组数据或数据块之间的协方差模式,行为和大脑数据可以概括为潜在或隐藏维度,这是大脑(如几个大脑区域的灰质体积)和行为变量的线性(或非线性)组合。因此,这种双多元方法能够在由出现的不同维度形成的潜在空间中,代表大脑结构和行为的个体间差异的广泛模式。除了可能由于同时考虑这两组多元特征而出现新的结构行为因素之外,从概念的角度来看,这种方法避免了将注意力集中在单个先验行为方面的陷阱,就像一棵树隐藏了森林一样。此外,从数据科学或统计学的角度来看,这些方法在大脑和行为层面都考虑到,不同的变量可以代表可变性的冗余来源。
5.展望和挑战
5.1从健康人群的相关性到临床效用
从历史上看,如上所述,对BSB相关性的研究在一开始就受到了对局部病变和特定行为缺陷相关性的早期观察的强烈影响。然而,后来发现,这些临床人群研究表明的区域-行为关系,以其最简单的形式(即一对一映射),并没有扩展到健康人群的个体间BSB模式。如今,随着神经成像技术在这些人群中促进了BSB的研究,反向概念扩展的相关性也同样受到质疑。在健康人群中发现的BSB模式在多大程度上相关,以及如何利用它们更好地理解临床人群中的脑症状关系。这确实是一个不平凡的问题。虽然承认机器学习技术在神经成像方面的应用可能仍处于早期阶段,当采用纯数据驱动的方法时,这些技术揭示的大脑行为关联模式并不容易与脑成像文献相呼应。例如,健康成人队列的一般智力得分被发现可以通过成人队列(增强的NKI队列)的小脑灰质体积和HCP队列感觉运动皮层的皮层厚度来预测。尽管这些发现需要在未来进行非队列复制,但他们目前强调,从在健康人群中基于预测的神经科学发现到对临床人群的影响的科学道路仍然漫长而复杂。
5.2 绝对样本外复制作为公开挑战
BSB研究中的复制危机不仅指出了此类调查中小样本的局限性,暗示了重大的发表偏倚,而且还强调了对BSB研究结果的样本外复制的迫切需要。这需要在独立的数据集中进行复制尝试;也就是队列外复制。然而,由于实际原因,在机器学习研究中,通常将重点放在数据集内的泛化。不幸的是,这种做法并不能完全阻止统计模型捕捉数据集的特性,而这些数据集是统计模型的来源。这一陷阱对于心理测量数据尤其可能存在,因为它们所依赖的评估工具是为特定环境下的特定人群开发的,其在不同亚人群中的有效性可能是可变的。此外,心理测量数据可能容易受到考官效应的影响。重要的是,大脑结构的神经成像估计也容易受到扫描仪和序列效应的影响,因此心理测量和神经成像数据都特别容易产生批量效应。
5.3 协方差,混淆和明智的科学解释
当试图理解大脑结构和行为表型是如何相关时,明确定义混淆和中介变量是很重要的。作为混淆变量或中介变量的标记应依赖于应仔细制定或评估的先验假设。
6 结论
在过去的二十年里,大量的BSB相关文献已经产生,为差异心理学和认知神经科学理论提供了额外的经验背景。然而,这一经验支柱最近受到了一场复制危机的冲击。在一系列行为测量和各种流行的大脑结构估计中,BSB相关性的重复性较差已得到证明。这一危机应该引导该领域重新考虑我们的科学方法,以健康人群个体间变异模式为基础的BSB关联。特别是,大型队列(~ 1000名参与者)对BSB研究至关重要。与此同时,机器学习技术考虑到大脑结构和行为测量的多变量性质,并促进稳健的关联模式,有望为更传统的单变量方法提供补充。这些新趋势已经突出表明,大脑结构的个体间差异性在一定程度上与行为表型的个体间差异性相关,至少与大脑功能连接的差异性类似。然而,研究结果的概念有效性仍需通过队列外和概念重复仔细评估。这一挑战突出表明需要提供更多的群组。在这方面,在新群体中增加地理多样性和社会经济多样性的努力进一步掌握了衍生的脑行为模型的有用性的关键,并为BSB关联的影响因素提供了深入的见解。最终,这些努力可以帮助更好地确定环境因素在BSB协会中的作用。
参考文献:Linking interindividual variability in brain structure to behaviour
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。