据联合国教科文组织《世界濒危语言地图集》统计,目前全球约6000种语言中至少有43%濒临灭绝。相关部门正努力寻求新科技以拯救这些即将消失的语言,人工智能(AI)便是其中之一。然而,前行的道路上充满了不确定性。
人工智能在世界范围内被越来越广泛地用于辅助语言学习,许多科技公司也在这方面不断加大投入力度。然而,谷歌前执行主席Eric Schmidt指出,人工智能在冷门语言方面还存在着很多不足。这些语言面临消失的风险不仅是因为以它们作为母语的人数正在减少,还因为当今的科技系统更偏向于被广泛使用的语言。
不过,还是有一些例子显示人工智能被用于帮助拯救濒临灭绝的语言。ARC语言动态卓越中心(CoEDL)的研究人员Janet Wiles博士致力于通过转录来保护某些濒危语言。据估计,用传统方法转录这些音频需要大约200万小时,而通过AI技术,这一时间可以缩短为5万小时。目前,这一技术也被纪录用于为澳大利亚的12种土著语言。
尽管人工智能或者其他技术提供了保护语言的机会,但要想振兴它们依旧困难重重。以一些土著语言为例,它们许多主要存在于口头形式,如果将它们通过书面的形式表达出来则很可能会改变原本的含义从而造成误解。人们说话的方式,他们的面部表情,以及他们说话的语境和环境,都对信息的传达起着重要作用。
当然,只是纯粹记录土著语言并使用录音来开发人工智能工具还不足以保护和振兴土著语言的,因为语言不仅仅是一连串的字母和声音那么简单。为此,情感计算领域的研究人员正试图开发一种能够识别和反映人类情感的技术。
一些研究人员认为,有的国家可以通过语言在国际范围内进行文化渗透甚至是统治。出于此原因,一些寄宿学校就会打压冷门语言,宣扬主流语言,从孩子开始实施文化统治。而不仅是线下,大部分的线上文字内容也是通过英语和汉语储存的。值得注意的是,前十大流行的语言占到了储存空间的80%。冷门语言在线参与度的薄弱很可能加剧它们消失的风险,但是当这些语种国家的年轻人更多参与到线上互动或者使用更多数字软件时,他们对于世界的理解又可能产生变化,这在某种程度上会使他们的文化更加被边缘化。
以加拿大北部土著哥威讯(Gwich’in)为例,世界上说这种土著语言的人数只有不超过670人,加拿大本国也只有约370人。年轻的JaceyFirth-Hagen正是哥威讯人,希望让更多人了解哥威讯语的她开始在网上向大家介绍这种语言。她和其它哥威讯语学习或演讲者在网上分享了一些含有哥威讯语单词和短语的文章,以及学习这种语言的资源链接。但这些还谈不上振兴这门语言,最直接的原因便是,目前还没有一种工具可以将一般的对话翻译成哥威讯语。针对这一情况,加拿大政府准备成立一个致力于保护和发展土著语言的部门。
土著长者将语言和知识传递给年轻一代的方式是人工智能的识别能力永远无法取代的。现在的问题在于,虽然一些研究员试图通过人工智能或者其它数字科技拯救那些濒临消失的语言,但是以那些语言作为母语的人的参与度却不够高。
即将到来的2019年是联合国指定的“土著语言年”,许多研究人员可能会以此为契机,加大力度保护那些即将消失的语言。科技本身无法拯救语言,人们在发展科技的同时应该更加重视同讲冷门语言的族群加深联系,才可以更好理解那些语言的精髓,避免形似神不似的结果。
领取专属 10元无门槛券
私享最新 技术干货