人工智能在全球当下无疑是一大热点,探讨语言学与人工智能发展的关系意义重大而且十分必要。为此,中国语情与社会发展研究中心于2019年1月8日举办了新的一期“语言与国家”学术沙龙,专题研讨“语言学与人工智能”这一重大话题。邀请校内外多个学科领域的青年学者共同探讨人工智能发展的语言需求和人工智能对语言生活及语言学的影响等前沿问题。本次活动由语情中心资源建设研究室主任黄晓春副教授主持,在校的中心成员都参加了研讨。
语情中心主任赵世举教授介绍了此次活动的背景。他指出,“语言与国家”学术沙龙是语情中心的常设活动,旨在给不同学科领域的中青年学者提供一个就前沿问题进行思想碰撞的平台和机会。而确定此次活动以“语言学与人工智能”为主题,主要基于以下三个方面的考虑:一是社会发展的驱动——近年来人工智能技术飞速发展,日益广泛而深刻地影响着社会的方方面面,引发了广泛关注,很多有识之士从哲学的、伦理的、社会的等诸多方面开展研究。这也应该引起我们的重视。二是学科的使命——语言学与人工智能密切相关,尤其是人工智能最终要解决的核心问题是机器的自然语言理解问题,语言学者、语言学科应该为此发挥应有的作用,这也就决定了开展相关问题研讨的必要性。三是语情中心的义务——中国语情与社会发展研究中心是国家语委科研机构和国家语言文字智库建设首批试点单位,有责任有义务关注这一前沿问题,开展相关研究,努力为国家制定面向人工智能发展的语言文字政策、事业发展规划和相关决策献计献策。
关于这次研讨的具体议题,赵世举教授提出主要聚焦两个维度:一是人工智能发展对语言学有什么需求?就此思考语言学在人工智能发展中能从哪些方面发挥作用;二是人工智能的发展对语言生活和语言学将会产生什么影响?并思考语言学将怎样适应和利用人工智能的发展。
武汉大学国家网络安全学院大数据分析与人工智能研究所所长姬东鸿教授委托谢东博士首先做了书面发言。他首先介绍了人工智能领域的最近进展,然后重点就与语言学密切相关的领域,如数据挖掘、情感分析、深度问答与智能对话、小语种翻译、自动写稿等进行了深入而具体的分析。他又论述了人工智能对语言研究的一些具体需求,例如触发词、语义角色等语言学核心概念在事件抽取等研究中的重要作用;中文的标准化标注数据的稀缺;在深度学习研究中需要回归一些语言本身的概念,等等。最后,还谈到了语言智能的研究热点,具体介绍了新词新语和颜文字研究、语言暴力和敏感词识别、话题的演化分析、对话标准的构建等。
中南民族大学计算机科学学院唐菀教授结合自己求学经历和研究实践,充分肯定了语言学在计算机科学技术和人工智能发展中的重要性。她详细介绍了人工智能专业建设情况以及跟语言学相关的课程设置。接着从不同的角度论述了语言学与人工智能发展的相关性。她指出,相关领域既可以基于已有的文献材料,利用语法语义分析和理解、语言模型、语音计算、文本分类、信息抽取等挖掘需要的信息,也可以用来开展各种预测,如剧本受众预测、畅销度预测等。她还谈到了利用人工智能技术对小语种开展保护的问题,又结合淘宝机器人客服和订票软件等案例,具体分析了语言学在人工智能中的具体应用问题。最后,她结合语情中心已有的研究课题,如性别语言差异研究、小孩语码混用问题研究等发散性地论述了自己的创新性想法和建议。
中南民族大学计算机科学学院杜小坤博士着重介绍了自己关于文本规范化和情感分析等方面的研究,具体讨论了火星文和网络空间语言简写的自动还原问题,自己参与面向智能考试系统的政治知识库的构建。他认为“规则本身很好,只是没有用好”,计算机网络最终还是要按规则进行设计的。同时,他也指出了语料库建设的不易和目前存在的问题,感到合适好用的语料库实在太少,期待有更多的人参与语料库建设。他还谈到了词向量训练标准的制定等问题。
杜老师的发言引发了与会者对语言规则和语法树构建的讨论。赵老师指出,规则受到轻视的原因,恐怕不是规则不重要,而是我们已经研究出的很多规则与语言事实有距离,这才是问题的所在。这恰恰说明,需要语言学界的努力。语情中心副主任赫琳教授回顾了自己研究“从小”等副词语义指向及其计算机识别问题的经历,指出语法规则究竟有多少能够实际运用于计算机信息处理中,是语言学者面临的一个很大的问题。赫老师还分享了自己的切身体会——很多计算机专家的报告听起来像语言学家,然而反过来却不是如此。她期待语言学同行们共同努力,切实加强与其他学科学者的交流与合作,为人工智能发展做出应有的贡献。
华中师范大学国家数字学习工程研究中心舒江波教授指出,语言学很多的研究都可以做,都是人工智能技术发展需要的,并重点谈到了人才培养的问题。他认为人工智能是一个综合性很强的研究领域,需要综合性人才,相关人才最好从本科开始培养,甚至从基础教育阶段开始。他还发表了关于字典词典的看法,认为汉语字典词典给的知识是线性的,而人的思维是非线性的,字典词典不能很好地满足人们的需要,因此应当致力构建三维模型。在人工智能的大环境下,语言研究仍是有重要价值的,关键看怎样研究、研究什么。他还对人工智能的发展对教育、对教师职业和教育公平的影响发表了看法。他认为一般性基础类教育教学有可能慢慢被人工智能所替代,机器可以弥补师资不足,有助于促进教育公平。他强调,应当意识到人和机器的边界,充分发挥各自的作用。针对人工智能对教育的影响话题,引发了不少老师的热烈讨论,多位老师发表了意见。语情中心郭婷婷副教授建议,应当将计算机编程等相关课程纳入本科生必修课程中,以应对人工智能的发展对人才的相关素质要求。
黄晓春老师转述了出差在外的语情中心决策咨询研究室主任阮桂君副教授的书面发言要点。阮老师谈了语言信息处理技术在方言调查研究中的重要作用,他举例说,方言调查语料的转写标注,非常需要相关技术和软件的支持。他期待能有用于方言语料文本转换和自动标注的软件研发。
语情中心的老师们不仅踊跃就研讨中涉及的各种重要问题纷纷表达了自己的看法,而且还结合自己的相关研究和兴趣做了专门发言。黄晓春老师提出用知识图谱方式描写语言学本体知识的想法,也表达了对游戏领域人工智能的关注。李佳老师就方言自动识别等问题发表了看法。王宇波老师重点介绍了网络安全领域的一些情况,并分享了自己开展的基于网络媒体的性别语言差异研究。郭婷婷老师就语言信息处理中的一些问题发表了自己的看法。陈练文老师指出了当前随意解释汉字、解构语言知识的问题,并就建构“三维模型”问题发表了意见。覃业位老师论述了网络空间汉语语法变异问题,也提出了网络语料处理相关的问题。
黄晓春老师最后做总结,充分肯定了这次研讨成果,并提出,为了推进相关研究,助力人工智能发展,一要问题驱动,构建多学科协同的研究范式;二要增强前瞻意识,启动面向未来的重大研究,如有关标准制定等;三要脚踏实地去做研究。
会议确定,今年还将举办该主题的学术论坛。
主任编审: 赵世举
常务编审: 覃业位 编务:胡蓝兮
领取专属 10元无门槛券
私享最新 技术干货