在语言和其他认知计算研究过程中的一个重要问题是:工具使用是否与语言的句法加工共享计算过程?因为,使用工具的行为可以被认为是给运动计划增加了一个层级结构。而在语言领域,句法加工相互依赖的语言基本元素(即词),它也是一个具有层级结构的认知功能。那么语言的句法层级结构是否具有特异的神经加工机制呢?
这项研究使用功能性磁共振成像,在基底神经节中检测到了工具使用和语言句法计算共同的神经表征。在作者的实验中,这两种能力引发了相似的神经活动模式,表明这两种功能存在神经资源的共享。作者通过两个控制任务:手动的动作和言语工作记忆的任务来作为对照,发现这种任务在基底神经节没有表现出一致的激活模式。在此之上,作者们通过训练观察到了工具使用和语言句法技能使用的双向行为增强,表明对一种功能的训练会提高另一种功能。这揭示了工具使用和语言句法使用在层级计算上超模态的表征一致性。本文发表在Science杂志。
曾做过多篇语言相关文章解读,结合阅读,加深理解,感谢帮转支持:
脑损伤患者基于语言任务的功能磁共振成像与静息态功能磁共振成像对躯体运动网络的识别
Psychological Science:自上而下的词汇加工影响着早期言语
PNAS:两个一起学更好:婴儿看视频同样可以学语言的ERP证据
PNAS脑电研究:说话人的注视增加婴儿和成人大脑之间的信息偶联
研究背景:
工具使用是一项高度复杂的技能,它的感觉和运动成分已经在各学科中得到广泛研究。有人认为,工具使用为运动计划增加一个层级结构。与此相似,相互依赖的元素和层级在语言中很常见,许多研究指出:句法是加工复杂语言结构的认知功能。那么,工具使用是否与语言的句法计算共享层级计算的加工过程呢?已有的研究已经发现,认知加工在相当广泛的范围引起感觉运动区的活动。因此,作者也假设:句法加工也建立在感觉运动的层级结构的基础上。
中心嵌入的宾语关系句为复杂的语言结构提供了一个范例(表1A)。嵌入式子句拆分相互依赖的元素,并在句子中添加更多的依赖项。然而,通过处理层级顺序,句法加工将使我们理解这样复杂的结构。研究表明,动作和语言共享句法加工。动作行为确实涉及整个运动序列中相互依赖的子成分构成的层级结构。灵活的工具使用至少包含了一个外部对象,身体和外部物体执行动作的功能组合在动作执行的次序中嵌入到一个层级结构中。以目标为导向的运动往往具有几个整合在动作序列中的子成分,如到达、抓住、举起、旋转和放置物体等。此类动作序列提供了一个具有几个元素的复杂运动结构的例子,我们可以看出,当工具嵌入到动作行为中时,这些元素的关系需要微妙地重新排列以形成有序的层级结构。一个人在这种运动任务中使用工具的灵活性可能预示了他在句法受限的任务中的语言产出技能。
表1. 句子理解的二选一迫选任务。
在这类句子中,句意会有两种可能的解释,需要被试选择正确的语义。CCs句子是典型的主谓宾句,这个句子不容易产生歧义,因为两个从句是并列的关系(and),被试在A的句子阅读的语义编码阶段理解这个句子,在B阶段的测试过程中被试需要在四个选项中选择正确的理解。对于CCs句,正确的理解是write仰慕这个诗人,writer也写了这篇文章。SRCs句也是一个典型的主谓宾顺序的句子,但是加入了一个从句:that admires the poet,这使得这个句子变得更加复杂,但理解其实和CCs句没有差别,这种句子就是典型的中心嵌入句。而在ORCs这种非典型的主谓宾句中,从句里的诗人仰慕主句的主语,因此在这个理解上和其他两个句子是不同的。从理解上,这三个句子其实都不难,比较容易从句法中分析出正确的理解,但词和词之间的层级关系很好地说明了句法加工的层级特性。
已有的神经成像研究支持工具使用和语言句法加工之间的行为联系。语言层级结构的句法加工依赖于左额下回(lIFG)和基底神经节(BG)的活动,尤其是纹状体内的活动。类似地,在额顶网络和基底神经节的活动也支持熟练的工具使用。因此,已有的脑成像研究已经能看出句法和工具使用的神经网络的部分重叠。然而,到目前为止,大家对句法和工具使用的研究都是在各自领域内进行,而没有对这部分重叠的功能网络进行探究。因此,本研究假设:工具使用和句法处理存在共享的计算机制和神经表征,并且,这两种能力在行为层面上会相互影响。
材料和方法
被试
共有244名被试被纳入研究,包括五个不同的实验。没有一个被试参加了一个以上的实验。所有被试都是健康人、惯用右手、以法语为母语,视力正常或矫正至正常,没有已知的运动、语言或神经障碍,在实验前签署了知情同意书。
实验1:实验1中的功能磁共振成像采集包括24名被试。共有四名被试被排除在外:两名在任何神经影像采集前未达到预设的熟悉性要求,一名在纳入阶段后退出,一名因大量头部运动(几次运动> 1.5毫米)而被排除在分析之外。分析了来自20名被试的数据,这些被试在社会人口学特征和利手上一致。
实验2:在这项实验中,招募了85名被试。六名被试由于在至少一个句子条件下的表现低于机会水平而被排除在分析之外,一名被试因错误地使用右手按下按钮而被排除在外。其余分析的78名被试的社会人口学特征和利手上一致。
实验3:在这个实验中,招募了46名被试。根据实验2中获取的d’分数来作为实验3排除被试的阈值。两个被试的数据被排除在外,因为数据计算有问题;另外四人因d’分数低于阈值而被排除在外,一人因在任务过程中颠倒了反应键而被排除在外。
实验4:在这项实验中,招募了48名被试。该组共纳入24名男性和24名女性。
实验5:在这个实验中,招募了41名被试,由于技术问题,一名被试的数据被排除在外。13例男性,27例女性,在社会人口学特征和利手上一致。
任务:
(1)句法任务
使用有两个选项的强制选择任务(2-AFC)评估被试的句法能力,被试需要处理由相同内容单词组成但具有不同结构的句子:并列从句、中心嵌入的主语从句或中心嵌入的宾语从句。表1A提供了每个条件的示例。句子中包含的内容词由来自Lexique 3.80数据库的词频和音节数以及所述动作的主体和客体的性别控制。使用快速连续视觉呈现(RSVP)将每个句子呈现为六个连续的片段,在屏幕中间显示500 ms,然后是500 ms空白屏幕间隔。这种呈现模式是在前人工作的基础上选择的,可以利用视觉呈现句子的理解任务来避免特殊的阅读策略和/或扫视性的眼球运动。在呈现每个句子的最后一段后,屏幕上会显示测试问题需要被试回答(表1B),直到被试回答或持续最长5s。
被试被要求用左手按下按钮,尽可能快速、准确地回答关于前一句话的某类理解是对还是错。按钮反应的关联在被试中得到平衡。在功能磁共振成像实验1中,总共有48个试验在运行过程中以随机顺序呈现,包括以三种不同句法结构为特征的相等比例的句子呈现(n =16个):并列从句、主语关系从句和宾语系从句。句子的呈现间隔在5到7秒之间随机(即jitter 设计,具体见图1A)。
行为实验2和3在核磁外完成,每个实验的试次总数是72个,每个句法结构有24个试次。在2.5到3.5秒之间随机间隔,并在中途增加1分钟的休息时间。使用psychtoolbox完成实验的刺激呈现和反应记录。
(2)词汇工作记忆任务
在实验1中,为了分离工作记忆对句法大脑活动的潜在贡献,被试还执行了一个n-back任务,其中有四个长度和频率相等的单词。每个被试分别扫描了两个run的1-back和3-back任务。文字在屏幕中央显示1500毫秒。刺激的间隔时间在1到4秒之间随机,每个back内的间隔为1秒。如果屏幕上出现的目标单词与前面的单词(1-back)或前两步出现的单词(3-back)匹配,被试需要用左手食指按下按钮进行反应。每个run包括76个试次,有19个目标。也使用了psychtoolbox来编程,和句法任务一样的刺激呈现方式。
(3)工具使用任务
被试需要参与两个任务,第一个是用手拿着一个30cm长的镊子,将一个钉子从一个孔中取出然后放入到另一孔中,如下图这样的,但是在核磁实验里,被试的孔只有两个,如图1d所示,被试只需要从左下移动到右上,然后从右上再移回左下。除了使用镊子(也就是文中的工具)以外,被试还需要直接用手来完成相同的对钉子的移动。被试通过听纯音调的单次呈现进行准备,4秒钟后该音调会双次呈现,提示被试可以开始移动。整个过程(4秒计划、4秒执行、4秒计划、4秒执行然后是10秒休息),在一个run中被试要重复15次。如果一个钉子掉了,那么被试必须用左手食指按下一个按钮,然后从板的左侧抓起一个新的钉子。少数遗漏的试次(< 0.5%)被单独建模。被试的手臂和肩膀在整个过程中被固定在核磁仪器上,以减少头动。
钉子和塑料模板的示例
(4)工具使用训练
工具使用训练中使用的任务类似于功能磁共振成像采集的任务。如前所述,被试被要求用右手用同样的30厘米长的镊子在板子上插入钉子。训练是用带槽的钥匙形状的钉子进行的,这些钉子需要精确地定位以适合目标孔。总共有四块板放在被试面前,一个塑料盒放在板的前面。训练包括:在2分钟的block中插入尽可能多的钉子,每个block中间会有1分钟的休息,每个被试会有9个block。被试的运动技能由正确插入的销钉总数来表示。实验2和实验3的被试被用来测试该假设:与控制组的被试相比,使用该工具训练的被试组的句法技能有所提高。一个控制组是使用相同的运动训练但用右手自由手动完成(即不用工具)(实验2和3)。另一个控制组是在没有任何运动任务的情况下,观看9个block的插入钉子的视频,也是每个视频两分钟,间隔1分钟。
(5)句法训练
为了评估语言训练对实验4中工具使用的影响,实验1到实验3中使用的句法任务改编成训练方案。训练由96个试次组成,分成6个组块,每个组块16个句子。各组块间穿插有1分钟的休息时间。被试被允许在最多5秒的时间内用左手按下两个按钮中的一个来回答每句话后的测试确认。一旦他们回答,1.5秒内就会出现连贯的反馈:绿色“√”表示正确答案,红色“X”表示错误答案。在每个组块的最后,展示了平均正确率和反应时可以让被试知道他们在实验2和3中的运动训练的进步。采用单盲法,被试被分成两组,一组接受主语关系从句训练,另一组接受宾语关系从句训练。要求被试努力提高他们在每个组块的正确率和反应时表现。在实验5中,所有被试都接受了与实验4相同的训练,但只用了宾语关系从句。
分析:
实验1-5的行为学统计分析:
在句法和言语工作记忆任务中,测试者的确认词和目标词显示的时间间隔(RT)和d’分数来评价工作记忆的表现。在工作记忆任务中,为了补充分析,作者还研究了击中率和虚报率(false alarm rate,这都是信号检测论视角下的指标,在工作记忆任务中很常见)。实验结果RTs偏离了平均值±2.5 个SD的,从分析中剔除,这占所有试次的1.4% 。这些数据的统计在R-studio 与内置的统计功能和 afex 包上运行。对于所有的分析,使用Tukey 事后比较进一步探索重要的相互作用。
实验1:行为学分析
对于句法任务,在RTs上进行了重复测量方差分析和LMM模型。单因素方差分析采用被试内因素设计(并列从句、主语关系从句、宾语关系从句)。在RTs上进行的LMM也为试内测量,句子为固定因子,被试和句子随机因子。
为了解释1-back 和3-back 工作记忆任务的表现差异,对d’(命中率和误报率的比)进行了配对样本t检验。其后将难度(1-back 和3-back)作为被试内因素做了LMM模型,将被试/难度作为随机因子加入模型。
实验2、3:统计
在每个行为实验中,为了评估运动训练过程中的表现,以组块(9个组块)为被试内因素,以训练方式(实验2中的工具使用vs自由手动和实验3中工具使用vs限制性手动)为受试者间因素,进行了关于插入钉子数量的重复测量方差分析。为了确定训练条件之间的表现差异,在实验2中,通过配对样本t检验(训练:工具使用与自由手动)和在实验3中使用单因素重复测量方差分析(训练:工具使用vs自由手动vs限制性手动),评估了跨九个组块插入的钉子的总数。
作者考虑了被试最初的句法技能对后测改进的可能影响。通过在RTs上进行方差分析分析时将初始的句法表现作为协变量来建模,句子和时间作为被试内因素,训练作为被试间因素。其次,通过使用LMM模型对句法任务的RTs进行比较,并将训练(实验2中工具使用vs自由手动vs视频,实验3中工具使用vs自由手动vs限制性手动)作为被试间因素,将句子(并列从句vs主语关系从句vs宾语关系从句)和时间(前测与后测)作为被试内因素。加入被试、句子和时间以考虑随机效应。对d’进行重复测量方差分析,以训练为被试间因素,以句子和时间作为被试内因素。
为了量化实验2和实验3中工具使用训练后的句法进步的稳健性,作者最后计算了句法任务前后测改进的效应量。研究对象中的效应大小与训练(工具使用与自由手动操作)和实验(实验2与实验3)有关。
实验4、5:统计
实验四在d’上采用重复测量方差分析和RTs上的LMM测试来评估句法训练过程中的进步。重复测量方差分析以组块(6个组块)为被试内因素,训练(宾语关系从句vs主语关系从句)为被试间的因素。在RTs上进行的LMM包括相同的被试内因素,额外把被试和组块作为随机因素。
接下来,对这些句法训练后的被试在工具使用任务中插入的钉子总数进行LMM分析,其中训练(宾语关系从句vs主语关系从句)作为被试间的因素,时间(前测和后测)和组块(四个组块)作为被试内的因素,被试、时间和组块被作为随机因子加入模型。
最后,为了证实结果,使用重复测量方差分析进行运动表现的分析,在个体进步斜率的(β)上将训练(宾语关系从句vs主语关系从句)作为被试间因素,时间(前后测)作为被试内因素。进步斜率是通过对每个被试在句法训练前后插入的钉子的数量分别进行线性回归来获得的。作者还分别对宾语关系和主语关系进行了一次配对样本t检验,并将斜率与零进行了比较。差异显著则代表工具使用的表现存在显著的变化,如正(表现提高)或负(表现降低)斜率所显示的那样。采用Bonferroni校正法对多重比较的P值进行校正。
在实验5中,采用了与实验4相似的模型。为了评估句法训练期间的表现进步,在d’上采用重复测量方差分析和RTs上的LMM分析。重复测量方差分析采用组块(6个组块)作为被试内因素,运动测试(工具使用vs限制性手动)作为被试间因素。在RTs上进行的LMM包括相同的被试内因素,被试和组块作为随机因素。为了评估运动表现,对前测和后测中插入的钉子数量进行了重复测量方差分析。
对于前测,考虑了在最后一个组块中插入的钉子的数量,即当被试达到所需的运动阈值(8个钉子)时。相反,对于后测,计算了执行的四个组块的平均值。重复测量方差分析以时间(前测与后测)为被试内因素,以运动测试(工具使用vs限制性手动)为被试间因素。还通过仅考虑所执行的四个组块的后测表现来进行重复测量方差分析。为了证实实验4中发现的效应,在最后一个前测组块和每个后测组块之间分别针对工具使用和限制性手动条件进行配对样本t检验。另外还进行了两样本t检验,以比较每个后测组块在两种运动状态之间插入的钉子数量。应用Bonferroni校正来解释多重比较。
实验1:fMRI分析
预处理。fMRI数据用SPM12进行分析。使用标准程序对功能数据进行预处理,包括空间对齐、slice time和两步配准,重采样至3×3×3 mm。数据用三维(3D)高斯核进行空间平滑,FWHM为8 mm,并使用1/128 Hz的截止滤波进行高通滤波。
单变量分析。在被试水平,每个被试的血流动力学反应用boxcar函数建模。每一个运动模块都设计有计划、执行、休息,还包括错过的试次和头部运动作为协变量。在钉子插入运动中的两个方向(前后)都被考虑在内。在句法任务中,分别对句子呈现(即句法编码)和测试确认过程中的并列从句、主语关系从句和宾语关系从句进行建模。最后一部分包含了被试的RTs、错误反应和头部运动,这些都是作为协变量输入。对于工作记忆任务,考虑了命中、虚报、正确拒绝、未命中试次和头部运动。
在第二个水平首先用了一个within-subjects 的ANOVA分析来确定每个功能的基本网络。通过计算[(tool-use planning - free-hand planning)–(tool-use execution – free-hand execution)]的交互效应确定了tool-use planning network 。
通过计算句法编码阶段[2 object-relative clauses –(coordinated clauses + subject-relative clauses)]的主效应获取句法激活网络。
对于工作记忆,通过计算(hits3-back – hits1-back)的contrast来得到working memory的激活网络。然后将这些map进行conjunction analysis 即:[最小统计量与联合分布下的null hypothesis相比],使他们能够评估不同加工过程之间的激活脑区的重叠:检验tool-use planning network ⌒ syntax network ,将 tool-use planning network ⌒ working memory network作为null hypothesis。为了进一步控制工具使用计划和句法之间共享功能激活的特殊性,作者还计算了free-hand planning network,并将其和句法网络进行了conjunction分析,来检测是否有激活重叠。为了研究在操作执行期间激活的网络,他们还计算了工具使用执行网络和自由手动执行网络,然后进一步研究了两个网络的conjunction analysis。
为了保证结果的可靠性,对于每一次分析,作者报告了全脑水平上包含>10个连续体素(>270mm3)的cluster,voxel水平的p值低于0.001(未校正,但不是把这个作为阳性结果直接讨论)。此外,作者使用了未校正的0.05水平的无关比较的激活区作为mask,在对主要结果进行比较时,将这些区域排除,作者所汇报的结果都是在cluster水平的FWE校正后存活的结果(高亮的区域)。
多变量分析
作者评估了工具使用和语法计算内共享认知过程的区域的表征相似性和预测性能。
首先,使用了 CoSMoMVPA工具箱为每个被试从conjunction分析中得出的重叠cluster的每个体素中提取非平滑下的的参数估计值(即beta值) ,然后测试了工具使用和自由手动条件下的表征相似性。对宾语和主语关系从句也做了同样的表征相似性分析。
这为每个被试生成了四个参数估计向量(即,每个条件一个) 。然后作者进行了表征相似性分析。对于每个被试,四个个体向量被输入到一个4×4的相似矩阵中,每个节点代表两个条件下活动模式之间的相关性。更高的相关性分数表明更好的相似性。得到的矩阵的对角线是对称的,包含六个感兴趣的节点,对应于不同条件下的所有成对比较。
然后将得到的每个个体的相似性矩阵与假设驱动模型(也就是表2的两个假设下的矩阵,需要注意的是,这里是相似性矩阵,而不是比较常见dissimilarity矩阵)进行比较,以便可以解释。通过计算观测相似矩阵与模型的相关性作为模型拟合的度量: 相关系数越高,模型拟合越好。在任何统计分析之前,每个个体的相关分数都是Fisher’s z转换,并对零进行单侧样本检验,用Bonferroni校正多次比较。
作者测试了两个模型,这两个模型都包括两个运动条件和两个最复杂的句法条件之间的相似性。至关重要的是,两个模型对于测试的跨域(即跨领域)相似性有所不同。第一个模型用矩阵1(表2)表示,测试了工具使用计划和宾语关系从句之间的跨域相似性; 第二个控制模型用矩阵2(表3)表示,测试了自由手动计划和宾语关系从句之间的跨域相似性。
表2.相似度矩阵1。
表3.相似度矩阵2。
为了评估句法和工具使用模式之间相似性的特殊性,同样的分析也以工作记忆模式作为对照。换句话说,测试了3-back 和工具使用模式之间可能的跨域相似性。为此,输入了上述活动模式在1-back 和3-back 任务中产生的矩阵,而不是分别在宾语和主语关系模式中产生的矩阵。
作者进一步测试了模式之间的相似性是否可以用复杂句法加工数据来分类工具使用和自由手动。使用 CoSMoMVPA工具箱运行了一个基于分类的MVPA,使用了一个leave-one-subject-out的程序。数据来自41个体素(也就是BG(基底神经节)区域的conjunction分析的cluster)。然后,作者使用一个支持向量机来训练分类工具使用激活map和自由手动的激活map(都是没有平滑的map),使用了留一交叉验证来训练模型,在模型训练前对特征进行了归一化处理。
在获取到最优参数后,使用该模型对所有被试的句法任务的宾语关系从句激活map(有20个被试)进行分类,如果被分类为工具使用情况的概率显著大于0.5(即机会概率),说明工具使用的计划计算确实和宾语从句的句法计算共享了认知资源。这样就可以得到对所有被试分类的平均准确率。使用置换检验,置换10000次后得到零分布。然后采用同样的方法对3-back 任务进行句法特异性假设的检验,即使用运动数据训练支持向量机分类器,对3-back 数据进行相同的测试。
结果:
基底神经节中工具使用和句法活动的解剖重叠
作者使用fMRI绘制了工具使用和句法加工重叠的大脑区域。为了分离句法网络,要求20名被试加工中心嵌入的关系从句(图1A)。该方案的句子表达依赖于相同的实词,但具有三种不同的句法结构:一个并列从句(例如,“The writer admires the poet and writes the paper”),一个主语关系从句(例如,“The writer that admires the poet writes the paper”),或者一个宾语关系从句(例如,“The writer that the poet admires writes the paper”);见表1 A)。每个句子之后都有一个测试(例如,“The poet admires the writer”;见表1 B) ,根据前面的句子判断这个句子是真是假。被试成功完成这项任务,表明在这项任务(图1B)中,如预期的那样,揭示了与主语关系从句(d’=1.98±0.06;RTs=1.519±76ms;P<0.001,Tukey事后检验)和并列从句(d’=2.01±0.06;RTs=1.487±87ms;P<0.001)相比,宾语关系从句的敏感性指数(d’)得分最差和反应时间(RTS)最长(平均值±SEM:d′=1.25±0.12;RTs=1769±97 ms)。并列从句和主语关系从句之间差异不显著(P>0.74)。该模式反映了相对于另外两个条件,宾语关系的句法复杂性增加。作者通过对比呈现宾语关系从句和呈现其他两类从句时诱发的大脑活动来评估功能句法网络。该感兴趣的窗口以句子材料的潜在句法编码过程为目标,而不是嵌入句子重组以应对测试的过程。句法网络包括前额顶叶皮质区域的活动以及BG(基底神经节)内皮质下的活动[P(PFWE)<0.05],包括双侧尾状核、苍白球内侧核(GPi)和壳核。在位于布罗卡区的cluster内的lIFG观察到额叶活动(P<0.001,未校正) (图1C)。
为了确定句法和工具使用网络之间的重叠,作者要求相同的被试使用一对30cm长的钳子,或者在不同的试次中自由使用他们的右手,将钉子从木板的一边移动到另一边(图1D)。当他们用工具或工具准备和执行动作时,作者记录了他们的大脑活动。计划阶段涉及组织后续动作的成分所需的加工,并且不受公开动作执行期间出现的视觉差异的影响。因此,作者分离出与使用工具准备动作具体相关的活动,并减去与准备手动动作以及使用工具和手执行动作相关的活动。
工具使用计划涉及一个包括顶叶和前额叶区域以及BG(cluster水平的PFWE<0.05)的网络,包括双侧尾状核、GPI和壳核(图1E)。位于腹侧运动前皮层的LIFG内的额区也被激活(P<0.01),该区域比句法任务中识别的区域更靠后。因此,句法和工具使用计划网络在BG(基底神经节)的解剖位置上重叠,共享左侧尾状核(lCau)和双侧GPi的显著激活(图1,F至I)。尽管句法和工具使用计划都依赖于lIFG,但各自的激活cluster并不重叠(即使在一个宽松的阈值P<0.005,未经校正的情况下也是如此)。作者对工具使用计划使用了严格的对比;尽管如此,在全脑水平上寻找自由手动计划和句法之间的潜在重叠,但没有发现任何显著的共享激活cluster。尽管句法已经从工作记忆资源中分离出来,但后者仍可能支持复杂句法结构的加工。为了排除工作记忆对工具使用计划和句法网络之间重叠的这种贡献,作者测量了相同被试在执行两个难度水平的两个动词背任务时的大脑活动(见图3)。工作记忆主要调用了双侧顶叶下部(角回)、左额中回和左尾状回的网络。工作记忆的大脑激活与工具使用计划网络没有明显重叠。
图1.句法加工和工具使用计划活动的重叠。
(A)句法任务的实验设计。
(B) d’(左图)和RTs (右图)用于三种句子结构的句法理解。
(C)用于句法(与其他两种句子类型相比的宾语关系从句类型)的统计图阈值P < 0.001(未校正)。
(D)工具使用和自由手部运动任务的设置和实验设计。
(E)用于工具使用计划的未校正的统计图。
(F) BG内句法和工具使用计划的联合神经元活动,阈值为P < 0.001(未校正)。
(G到I)两个任务都能显著激活每个cluster的平均大脑活动水平。在运动任务和句法任务中,工具使用计划(蓝色)和宾语关系从句(黄色)的激活率最高。
基底神经节中工具使用的计划阶段和句法加工的神经认知资源
BG(基底神经节)内工具使用计划和句法加工的大脑活动神经重叠是否反映了共同的认知过程?如果是这样,那么应该在不同的条件下调用相同的神经资源。因此,在与宾语关系从句中,作为工具使用计划和句法编码基础的大脑活动可能在重叠cluster内它们各自的空间分布上表现出表征相似性。
因此,作者研究了两种运动条件(工具使用和自由手动计划)和两种最复杂的语言条件(宾语关系从句和主语关系从句)的大脑活动模式的表征相似性。考虑到联合分析揭示的重叠体素(n=41),作者检验了两个模型,包括同一领域条件(运动领域的工具使用和自由手动以及语言领域的宾语和主语关系)之间的预期相似性。
第一个模型检验了工具使用计划活动模式和宾语关系活动模式之间跨域相似性的假设。第二个控制模型测试的是自由手动计划和宾语关系之间的跨域相似性。评估工具使用计划与宾语关系表征相似性的模型有显著性 (皮尔逊相关r均值=0.25±0.08;Fisher’s z均值=0.29±0.10;t(19)=3.0;P=0.007经Bonferroni校正,Cohen’s d=0.66)。相比之下,自由手动计划和宾语关系从句之间相似性的第二个模型检验并不能很好地拟合数据。为了检验工具使用模式和宾语关系模式之间相似性的特异性,作者提取了由同一体素上的言语工作记忆任务(3-back和1-back)引发的模式,并将它们输入到作者的模型中。没有显示出与工具使用或自由手动计划有任何显著的相似之处,这说明工具使用计划与宾语关系表征相似性的模型具有特异性。
作者进一步调查了所报道的显著相似性是否允许根据运动模式(工具使用和自由手动)训练的分类器预测由宾语关系引起的计算过程。成功的跨域分类将证实这两种能力共享共同神经资源。
研究将基于分类的多体素模式分析(MVPA)应用于通过联合分析识别的重叠体素(n=41)中提取的活动模式。一个支持向量机(SVM)分类器在运动数据(工具使用计划与自由手动计划)上进行训练,并使用leave-one-subject-out程序在与宾语关系的数据上进行跨域测试。作者用被归类为工具使用模式的宾语关系神经模式的比例来评估分类器的准确性。精确度为0.5表示分类器的执行是偶然的。精确度明显高于偶然性水平意味着与宾语关系的模式更多地被归类为工具使用而不是自由手动模式,而精确度显著低于0.5的精确值则表明相反。宾语关系的模式被显著地归类为工具使用模式,而不是自由手动计划模式(准确度=0.87,P=0.003)。当在同一体素内对工作记忆神经模式(3-back)进行跨域测试时,同一分类器的准确率与机会水平没有显著差异(平均准确率=0.64,P=0.15)。
作者进一步计算了支持工具使用计划和成功理解宾语关系的活动水平之间的体素皮尔逊相关性分数。将这些相关分数与自由手动计划和宾语关系加工之间的相关分数进行比较。将两个观察到的皮尔逊r值之间的差异与10000次排列后得到的差异的经验零分布进行了比较。在lGPi和rGPi中,观察到的工具使用计划模式与宾语关系理解模式之间的相关性显著大于自由手动计划模式与宾语关系模式之间的相关性(图2A-F)。lCau的差异无显著统计学差异。
总体而言,这些发现确定了工具使用和句法计算依赖于BG(基底神经节)中共同的神经活动。两种任务独立诱发的活动呈现出相似的空间分布,这与共同的神经资源是一致的。已有文献证明,当两个功能共享神经资源和认知加工时,学习迁移就会发生:因此,训练特定的能力可以使未经训练的能力受益。因此,作者预测了语言中工具使用和句法技能之间的跨域学习迁移。
图2. 实验一:工具使用计划与句法之间的功能联系。在10000个排列后,皮尔逊的差异分布(ATOC)分别计算了lCau(A)、lGPi(B)和rGPi(C)的宾语关系从句的脑活动模式与工具使用和自由手动计划的脑活动模式之间的相关性。黑线表示观测到的差异,红色虚线表示设置为0.05的p值阈值。(D、E、F)BG中用于工具使用计划、宾语关系计划和自由手动计划的神经活动的空间分布。每个单色方块表示lCau(D)、lGPi(E)和rGPi(F)的单个体素。
从工具使用到句法技能的语言学习迁移
在实验2中,作者测试了工具使用训练是否提高了语言的句法技能。使用与实验1相同的句法任务来测量26名健康成年人在工具使用训练前后的句法技能(图3A)。工具使用的特异性是通过测试一个对照组(n=26)来控制的,这组被试在自由手动方面接受相同的训练制度。第三个对照组(n=26)也被包括在内,以量化潜在的重测效应。这些被试在观看自然纪录片之前和之后观看自然纪录片的时间与两个从事运动训练的活动组的时间相同。这三组人在相关的社会人口特征方面匹配。
为了评估向句法任务的学习迁移,作者确保被试在各自的运动训练(图3B)中相比之前可以获得任务表现的显著提高,然后分析了工具使用训练与自由手动训练和被动观看视频对句法任务表现的效应。通过在RTs上运行的三因素:训练×时间×感知协方差分析(ANCOVA)中将预测成绩(d’)作为协变量来解释初始句法水平的潜在个体间差异。结果发现,句法的改善取决于训练的类型和被试最初的句法水平(F(2,72)=3.99;P=0.02;ƞG2=0.009)。因为训练前得分较低的被试更倾向于通过任务重复来改善语境,作者特别研究了低分和高分的被试与高水平初始句法技能的被试之间的训练依赖效应。作者根据前测中的表现设置d’阈值,定义为样本中位数减去1个SD(阈值d’>1.38)。句法技能较低的被试(工具使用组:n=8;自由手动组:n=6;视频组:n=6)在后测中所有句子结构都有显著提高,这与训练无关。这种重新测试的改进,潜在地与任务的更多语境方面(如运动和反应选择)有关,可能会提高训练的效果。在表现出较高初始句法技能的被试(工具使用组:n=18,自由手动组:n=20,视频组:n=20)中,与自由手动训练和被动观看视频相比,工具使用训练组显著提高了句法成绩(图3C)。使用工具后,被试正确加工宾语关系的速度明显快于使用前(前测RTs=1892±137ms,后测RTs=1591±133ms,P<0.001)。相比之下,其他两组被试的宾语关系表现差异无统计学意义(自由手动:前测RTs=1994±109ms vs后测RTs=1910±109ms,P=0.17;视频:前测RTs=2051±119ms vs后测RTs=1940±128ms,P=0.10)。训练前三组对宾语关系的理解差异无显著性(P>0.05)。在更简单的句法结构,即并列和主语关系从句上,发现了显著的改善;然而,这些改善在三组中是相当的。
图3. 实验2和实验3:语言中从工具使用到句法技能的跨域学习迁移。
(A)训练和句法前测和后测的时间表。不同的组被训练使用工具(紫)或自由手动(绿)来获取钥匙形状的钉子并将其插入凹槽孔中,或者他们被动地观看视频(灰)。在实验3中,通过进一步的手动训练条件(红)来控制训练难度,增加的感觉运动限制模仿工具使用时的感觉运动限制。
(B)在实验2中,在工具使用训练(紫)和自由手动训练(绿)过程中运动性提高。
(C)在实验2中,具有较高初始句法技能的被试在使用工具训练(紫)后,在句法任务中的宾语关系表现提高了,但在自由手动训练(绿)或被动观看视频(灰)之后,他们的句法能力没有提高。前测和后测的连接点代表单独的数据。
(D)在实验3中,在工具使用训练(紫)、自由手动训练(绿)和限制性手动训练(红)过程中,被试的感觉改善。
(E)在实验3中,在使用工具后,被试在句法任务(紫)中的宾语关系的表现有所改善,但在自由手动(绿)训练或用模仿类似感觉运动限制的手动作为工具进行训练后,被试的感觉运动表现没有提高。
(F)实验2和实验3中改进的效应大小。双因素训练×实验方差分析:训练有显著的主效应,无交互作用。
使用工具训练可以提高语言任务中的句法能力。这种影响依赖于个体的初始句法水平,并且在训练前表现出较好句法技能的被试身上发现。为了证实这一发现,作者进行了一项附加实验(实验3),其中包括39名在前测阶段表现出高句法分数的被试。作为一个独立的评判标准,在实验2中的训练确定之前(d’> 1.38) ,作者已经做出了相应的决定。为了排除使用工具任务的感知运动困难作为促进学习迁移的因素,他们增加了一个训练条件,在这个条件下,减少了自由手动的自由度,以模仿工具强加的自由手动。触觉反馈进一步受到阻碍(图3A)。这些变化是为了很好地模拟钳子的感觉运动限制和难度。两组被试都接受了实验2中的工具使用或自由手动训练,以在一组具有较高句法技能的独立样本中重复他们的发现。第三组被分配到有限制手动的控制训练条件下。与之前的运动训练前后评估一样,对三组的句法技能进行了测量。
首先,作者仍旧发现工具使用训练选择性地提高了被试对宾语关系的理解[图3E,训练×时间×三因素重复测量方差分析交互作用显著:F(3.1,56.4)=2.81;P=0.04;ƞG2=0.03]。第二,无论是自由手动训练还是限制性手动训练都没有显著提高宾语关系表现。训练结束后,工具使用组在宾语关系的理解上的表现明显优于自由手动使用组和限制性手动组。在更简单的句法结构上,观察到不同组之间的差异。此外,迁移的幅度与实验2中观察到的句法改善是一致的(图3F)。
从语言句法训练到工具使用的学习迁移
与前面的结论一致的是,工具使用和语言之间共享的神经功能资源也可以预测反向学习迁移:用复句训练句法加工可以提高工具使用能力。在单盲实验4中,作者通过测量48名健康成年人在语言句法训练前后的工具使用表现来检验这一预测(图4A)。被试被随机分配使用宾语关系从句或主语关系从句进行训练。在句法训练前后,测量了在之前的实验2和实验3中设计的改变版运动任务中用工具输入的钉子数量。实验者对被分配给被试的句法训练类型是不知道的。这两组人在相关的社会人口学特征方面匹配。考虑到复杂的语言结构和工具使用所调用的共享句法加工,作者希望被试在与宾语关系一起训练后,比与主语关系一起训练后,使用工具表现得更好。
两组在训练过程中对关系从句的加工能力都有所提高(图4B和C)。在前测期间,两组的进步程度相似。在后测中,与主语关系训练的被试相比,宾语关系训练的被试能够输入显著更多的钉子。与宾语关系一起训练的被试使用该工具后仍有显著提高。相比之下,主语关系被试一起训练后,被试的运动表现与训练前的最好成绩没有任何差异。作者通过回归分别建立训练前后个人运动表现的模型,斜率用来表示运动表现的改善。正斜率表示使用该工具的运动表现沿组块改善,而负斜率或水平斜率表示没有改善。双因素训练×时间重复测量方差分析显示出显著的交互作用(图4E;F(1,46)=4.57;P=0.03;ƞG2=0.0 5)。训练前两组运动进展无明显差异。训练后,从观察到斜率与水平线之间有显著差异以及与主语关系组的比较中,可以看出宾语关系组进一步提高(β=0.95±0.21)。
图4. 从语言中的句法到工具使用的跨域学习迁移。
(A)使用工具进行句法训练、运动前测和后测的时间轴。不同组在训练前后分别用宾语关系从句(蓝色)和主语关系从句(橙色)以尽可能快的速度钉钉子。
(B、C)句法训练中 RTs (B)和 d’(C)的语言进步。
(D) 根据两组在前测中使用工具插入的钉子的数量相应的评估运动表现。在后测中,只有与宾语关系(蓝色)训练的组有改善,而与主语关系(橙色)训练的组没有改善
(E)语言句法结构训练前(前测)和后(后测)后,运动改善量化依据回归线的斜率,从第一组块到第四组块工具使用的过程。
讨论:
这项研究的发现为语言中工具使用和句法之间的神经认知联系,以及支持跨域迁移的原则提供了重要的新见解。首先,工具的使用和句法依赖于解剖学上重叠的神经网络的大脑活动,特别是在纹状体结构(lCau)和GPi中。这种重叠排除了工作记忆几个或非特定困难作为基础成分。其次,工具使用和句法引发了相似的活动模式,这与两个任务的共同神经过程一致。
这些发现支持了超模态句法功能既服务于动作又服务于语言的假设,这与背侧纹状体在处理运动和语言领域的复杂层级结构中的作用是一致的。背侧纹状体支持多种物种和任务的程序性学习过程。程序系统的这一部分涉及句法训练和语法规则的执行。此外,它还充当块(chunk)运动序列的动作解析器。准确而有效的工具使用需要将外部物体嵌入到运动序列中,因此更多地依赖纹状体而不是手动操作来解析运动基元。在灵活的工具使用过程中,手的移动整合了工具的功能结构,以保持与动作目标的有效交互。由工具施加的感觉运动转换嵌入在手动运动程序中。解析和层级加工还支持对中心嵌入宾语关系的句法理解。这项研究揭示的工具使用和句法之间的神经重叠反映了这些功能上的相似之处。但是,要处理的层级结构的复杂性可能不是严格相称的。值得注意的是,这种重叠是在BG中发现的,而不是在左侧IFG中。根据其在工具使用和语言这两个方面的记录,LIFG由两个功能在两个单独的聚类区域被调用。根据LIFG对运动和语言加工的细胞结构和功能特化,这一现象发生在腹侧运动前皮质(用于工具使用)更靠后的位置,在布罗卡区(用于句法理解)更靠前的位置。
这些结果解释了语言中从工具使用到句法技能、从语言句法训练到熟练工具使用的跨域学习迁移。如果训练和未训练的任务依赖重叠的神经网络和共享的认知过程,就会出现学习迁移。从经过训练到未经训练的同一领域的任务:知觉、运动或认知控制,迁移效应已被证明。至关重要的是,作者将迁移原则扩展到了不同的认知领域,这一原则到目前为止仅限于一个领域。因此,即使涉及不同的认知域,如动作和语言,这种迁移也是正确的。如果受过训练和未受过训练的任务不共享共同的神经认知资源,那么迁移可能会减弱或缺失。事实上,使用主语关系结构的训练并不能提高使用该工具的运动表现,自由手动训练也不能在理解复杂结构时对句法产生好处。此外,与自由手动相比,使用工具比使用语言带来的好处不仅仅基于使用工具执行的动作的额外感觉运动复杂性。与自由手动训练被试相比,在使用工具施加的类似感觉运动限制的手动训练后,被试在加工复杂句法结构方面没有显示出任何优势。语言中工具使用和句法加工之间的学习迁移是双向的。这一发现明确地表明,这两种能力依赖于一个共同的认知成分,即超模态句法(译者觉得不该再叫句法了,它是一个跨认知域的层级计算能力,表征了你对客体的操作计算过程)。它还表明,两种能力中的任何一种都可以同样地调动共享功能的潜在神经资源,以改善另一种能力。
是什么推动了这种跨域迁移?公共资源的预激活和共享环路中的快速可塑性可以相互促进工具使用中的行为表现和语言中的句法加工。训练可以作为后续任务的功能起点:依赖训练的神经元反应由工具使用或句法加工引起,从而产生神经元适应和更有效的活动。这进而促进了依赖于相同神经成分的未训练任务的后续行为表现。或者,跨域迁移可能依赖于共享环路内的快速可塑性变化。短暂的运动训练(即<2小时)会触发快速的功能变化,这伴随着行为表现的改善。未经训练的任务可能会从这种可塑性变化中受益,并在共享领域内调用新的资源。这些结果提出了这样一个问题:学习迁移是否可以推广到其他语言任务?最优的训练时间是否能最大限度地提高效益?
总结:
总而言之,这项研究发现重新证实了工具使用和语言共同进化的假说。由来已久的理论声称语言在进化过程中是运动起源。工具使用的出现和改进促进了为运动和交际目的服务的新认知技能的发展。根据这一假设,工具使用的作用是双重的。一方面,工具使用和工具制造的复杂性提出了对认知功能的需求,以有效地分块、临时解析和处理序列的层级结构。另一方面,工具使用和工具制造对沟通构成了进化压力,使得知识可以更好地进行社会传播。因此,对运动系统需求作出反应的功能会满足交际需要,并逐渐为语言所用。这种共同进化的情景涉及一个庞大的大脑网络,从顶叶到额叶,包括BG(基底神经节)。在这里,作者提供了基于人类研究的证据,特别指出BG是一种既服务于动作又服务于语言的超模态计算功能的神经生态位。这项发现表明,运动系统可以被用来促进其他认知功能,这些功能在一定程度上具有相同的神经认知基础。