AI科技评论获授权转载自BrainQuake大脑激荡
Science杂志推出语言神经机制专辑
原创 | Peter Hagoort 编译 | 王如雪 洪波
语言是人类特有的技能,语言的运用使我们能和其他人交流思想、传播知识,创造文化,从而促进我们思想的进步与人类自身发展进程。语言本身具有多文化特性,为更好地理解语言复杂的语言结构和语言神经科学基础,我们需要将语言能力分解为两部分:
基本语言单元 (Elementary Linguistic Units, ELUs)
基本的语言组成单元 ELUs包括表达一种或多种语言所必需的发音知识、语言词汇含义、语法特征(如名词、动词和表达不同性别需要的词法等)、阅读时的字形特征或者聋哑人的肢体符号语言等;
核心语言功能 (Elementary Linguistic Operations, ELOs)
核心语言功能ELOs则包括从记忆存储知识中获取ELUs,如字词识别时所需,以及由这些基本语言单元ELUs生成更大的语言结构,如复合词构词法、动词形式变换和语句含义理解时所需。
另外,结合ELUs和ELOs之后还需与语言所处的直接或非直接的语境相结合,才能真正理解语言表达的含义(1,2)。举个例子,如果有人说“The editor of the journal loved the paper”,这句话没有任何语病,但这些名词:“editor”, “journal”, “paper”本身具有多种含义,只有将它们联系到特定表达习惯或特定使用语境下后才能理解说话人想要表达的真正含义。当然这些只是语言复杂性的一小部分的展现。
尽管科学家在进化史上曾发现人类语言的前身,但语言作为一种整体的高级认知功能,则是人类特有的。尽管语言这么复杂,大部分儿童没有学会怎么系鞋带或做算术之前,就能掌握这项技能,甚至不需要正式的学习训练。这表明人类的大脑结构使得儿童本来就具备学习和掌握语言的能力,比如:一个显著的特点是我们的大脑可以从序列数据 (sequential data) 中推理树状结构 (tree structures )。树状结构由Wilhelm Wundt提出(3),与层次化结构 (hierarchy) 相联系,词汇组成的构词法和短语结构的层次化理解都包含了树状结构(如图1)。
图1. 树状结构在词汇生成和短语、句子理解上的体现。(A)单词“carelessness”由“care”(N,名词),“less”(A,形容词的标志)和“ness”(N,名词的标志)组成,最后的“ness”决定了整个词是名词。(B)短语“The second green ball”被31位被试里的31人都解读为指第三个圆圈而不是第二个圆圈,这是对这个短语层次化解读之后的结果,圆括号里的部分也就等同于一个树状结构,而被试看到的语句是不含括号的。(C)一个由三角形和圆形组成的序列,短语“The second blue ball”又被99%的被试解读为指的是第五个形状而不是第二个蓝色的形状(即第三个形状),这也是大脑层次化加工的体现。
语言神经机制的经典观点
很长时间语言相关的神经科学认知都来源于19世纪末20世纪初神经科学家的观点,包括Broca, Wernicke和Lichtheim (4,5)。按照经典的观点,大脑中负责语言加工的脑区就位于左侧外侧裂语言区,并且在额叶和颞叶脑区有着严格的功能分工:左侧颞叶皮层的Wernicke区被认为进行语言感知 (language perception),而左侧下额叶皮层的Broca区则支持语言产生 (language production),弓形束 (arcuate fasciculus) 则是连接这两个脑区的神经纤维。尽管这一经典观点仍影响深远,但这个大脑语言处理模型被证实具有局限性,而且很大程度上是错误的(6)。主要观点如下:
因此,可以认为经典的观点更主要地基于语言加工中的单字词处理而言,而并未认识到语言运用本身远远超出单字词处理,这也就一定程度上解释了为什么语言处理的神经科学基础的经典观点不足以涵盖所有的语言相关脑区和神经纤维。
图2. 语言处理的神经结构基础。(A)连接多个语言相关脑区的神经纤维。(B)在一项对于204位被试的fMRI研究中,对听语句和读语句任务有相同响应的脑区。(Schoffelen, 2019)
人类总能毫不费力地理解不同字词结合形式的语言语句,而这种对多种句法结构组合方式的处理则是通过Broca区、左下额叶皮层邻近脑区,和颞叶顶叶皮层之间的动态交互来实现的,这种动态交互保证了从记忆存储中调取的单个字词语义信息能被一致而统一地整合进具有多层次语法结构和语义信息的多字词语句中。
语言处理的神经可塑性
一个另外的观点是语言相关的脑区在某种程度上并非一成不变的。
一些研究已经表明在某些特定的情况下除经典外侧裂语言区的脑区也参与到语言加工中,比如先天性失明者的枕叶“视觉”皮层可以参与语言加工(11,12),枕叶“视觉”皮层的激活强度被发现与一项词汇记忆任务表现优劣相关;先天性盲人的枕叶皮层还被发现对句子的语法结构有选择性响应,对类似难度的数学公式计算并无响应。
总的来说,这些研究表明尽管不同脑区得以形成某种特定认知功能依赖于相对稳定和基础的细胞结构特征,但并非完全受限,可能留有一定程度的可发展性。一旦特定脑区的输入信息模式发生长久的变化,这个脑区就可能被另外的功能再利用。
因此,Bedny总结为“人类大脑皮层在可能原本有执行多种认知功能的能力,随着生活经验和特定的输入信息特征才形成了对特定认知功能的专有化和选择性,当然这种专有化并非毫无依据和限制,是受到大脑各脑区间连接性约束的。”当然语言运用中基本语言单元ELU和基本语言功能ELO之间的关系,大脑的语言神经机制,以及其中个体差异性的程度还远没有理解清楚。
语言加工的即时原则
随着神经测量方法的不断改进,高时间分辨率的神经记录使得大脑语言加工的动态过程也越来越清晰。语言加工的速度很快,我们通常每秒能很容易地产生和理解2-5个单词,在语言产生和理解中,基本语言组成单元的获取和整合过程是逐步发生的。
语言加工呈现出“即时原则(immediacy principle)(13)”,比如在理解语句时,语境知识和世界知识、同时伴随的其他模态的信息(如说话时的手势姿势等),对说话人的认识等这些语言学信息一旦被获取可用,将被我们的大脑语言系统迅速整合加工从而理解说话人表达的含义,而其中左侧下额叶皮层(LIFC)和顶颞叶的动态活动起到关键作用。
另外,尽管还没有完全确定性的依据,大脑预测对语言理解的重要性已经被越来越重视,而且这种大脑预测可能与语言加工的即时性相契合(14)。
大脑很可能能够整合已有的词汇、语义和句法结构信息来预测语句中接下来的词是什么,包括下一个词的语法和语义组成。而这种基于已有语境的预测和基于实际语句输入的自下而上的分析结果的冲突,将引起大脑立即调用额外的信息和能量来保证在线语句理解的正常进行。
信息结构
话语的内容往往是说话人和听者间长时间互动沟通而传递的信息,因此其中传达的一些语义信息已经被对话的多个人共识,这些信息常被称作“话题topic”;此外的信息则是新增加的关键的信息,这些信息则常被称作“观点comment”。
信息结构就指的是一句话中话题信息和观点信息的组织方式。说话人总是重点关注包含新的信息的核心成分,当然说话人表达核心成分的方式在不同种语言中可能有所不同,语法结构中特定的位置、措辞方式、重读等都可以作为核心成分的标志。在英文一问一答中,回答里新的信息一般都会被重音强调:比如问句为“What did Mary buy at the market?”,回答将会是“Mary bought VEGETABLES” (大写表示重读单词),这里“vegetables”就是核心成分,因为它提供了新的信息。
研究发现,这样的信息结构可以调节fMRI中语言相关的激活模式以及电生理信号。当新输入的语义信息与大脑预测不一致,以及句法结构不合法时分别会造成N400和P600效应,但只有当新输入的信息是核心成分的一部分时才会有明显的N400和P600效应(如图3)。另外,语句中重音强调的核心成分会激活注意网络(domain-general attention network)(15)。
图3. 当新输入的语义信息与大脑预测不一致时引发的N400响应的脑地形图分布。(A)当新输入的信息是语句中核心成分时N400响应较为显著(顶叶蓝色部分);(B) 当新输入的信息不是语句中核心成分时,N400响应不显著。(Wang and Hagoort, 2011)
大部分情况下,听者可能不会特别详细和完整地重建和理解语句的每个成分和结构,但这种对语句的不尽完备的分析和理解已经足够好了“good-enough”(17)。依照这种“good-enough”主张,语言理解中一些语义和语法结构信息可能会被忽略。
最近一项研究指出了大脑依据已有语境对新输入信息的预测、已有语句的信息结构和这种“good-enough”语言加工的联系。他们提出以上提到的话题信息(topic)是用“good-enough”的方式来加工的,而听者的大脑预测主要贡献于新的核心的观点信息(comment),因为对语句信息的把握和理解主要来源于新的观点信息,而话题信息早就已经成为了共识。
语用推理
一句话的含义很大程度上依赖于语境信息(可以理解为言外之意),如果只是理解语句中的词汇语义和句法结构信息则很难完全决定所表达的全部信息。而语境信息又往往不直接出现在语句本身中,提取一句话的语境信息则需要基于参与沟通的所有人在所在场景下的一些共同认知和意图,以及对所使用语言的用法的共识。
举个简单的例子,在正确的语境信息理解下,“It is hot here”不只是在描述现在场景下的温度情况,更重要的是作为一个简洁的请求或要求去做一些相关的事情(比如打开窗户或者降低空调热风的温度等)。而语言在社交和沟通中的作用就依赖于我们能基于语句进行正确的语用推断这一前提。
至今,除语句语义理解、句法结构分析之外,关于有效沟通的神经机制的研究还并不多,但这些已有研究达成了比较一致的观点。大脑中心智理论(Theory of Mind, ToM)网络的关键脑区支持语用推断,这些脑区包括右侧颞顶叶连接处(right temporoparietal junction)和内侧前额叶皮层(medial prefrontal cortex),它们通常参与需要心理状态推理(mental state reasoning)的任务,换句话说,就是考虑他人的感受、观点和情感的任务。
相关的一项研究里,作者给被试同时展示一些图片和句子,比如其中一种情况是一张图片上画了一个门,同时配有句子“It is hot here”,被试就理解为这是一个间接的开门的请求;而另一种情况下一张图片上画了沙漠,也同时配有句子“It is hot here”,被试此时就理解为这句话就是一个客观陈述了。相比第二种情况,ToM网络的脑区在第一种传达间接的请求的情况里被很强地激活。当然,ToM网络内各个节点的具体贡献将来还需要更深入的研究(18)。
多网络协同的观点
研究语言神经机制的一种方法是,首先确定人类语言的本质,一旦确定了语言区别于其他的核心特征,那么这个问题将变成,人类大脑结构和功能的哪些方面能够支持这样的语言学本质。类似地,如果说递归 (recursion) 是语言的核心特征 (19),那么Broca区则可以认为是负责语言加工的核心脑区,其作用类似于支持这种人类特有的递归计算能力的下推堆栈 (push-down stack) (20)。
作者认为:
语言运用中基本语言组成单元ELUs的处理很大程度上是语言学专有的 (domain-specific),但基本语言功能ELOs的一些关键部分,比如整合统一的能力可能也与其他认知功能(音乐、算术等)相一致。也就是说,语言运用中除了不同语言相关 (language-specific) 脑区负责语言的多种子功能外,其他脑网络(负责其他认知任务)的参与也都为充分理解语言语句所表达的含义,充分发挥语言在沟通交流中的重要作用提供了支持。因为语言的理解和运用远远不止单个字词的加工和处理,也远远超出通过初级感觉皮层输入的声学或字形特征所蕴含的信息。当然,这个多网络协同的观点并非否认,将来研究者还需要对多个脑网络中不同节点在语言加工中的特定贡献的进行更加深入的研究。
Peter Hagoort
Peter Hagoort是语言神经机制研究的国际知名学者,Max Planck心理语言研究所所长。2019年10月5日他在Science杂志的语言神经机制专辑发表综述文章The neurobiology of language beyond single-word processing,提出了支持人类特有的语言功能的多网络协同 (multiple-network) 的神经科学基础,这一观点是在经典的语言学神经科学模型之上,对更多相关大脑脑区间动态活动更加复杂的认识。因为语言的运用并非只是单个字词的处理,语言的理解也远远超出通过初级感觉皮层输入的声学或字形特征所蕴含的信息,这些都需要多个具有特定功能的脑区所组成的脑网络的共同协同作用。清华大学洪波研究组通过颅内脑电动态分析揭示了中文声调处理的功能网络,涉及了颞叶听觉脑区、颞叶语义脑区和额叶运动脑区之间的协同(21)。
参考文献:
原文出处:
Hagoort P. The neurobiology of language beyond single-word processing. Science. 2019 Oct 4;366(6461):55-58. doi: 10.1126/science.aax0289. Review.