句法分析和深度神经网络在中文问答系统答案抽取中的研究
李超,柴玉梅,高明磊,昝红英
郑州大学
答案抽取是问答系统中的核心内容,问题及答案句的句法和语义充分理解是找出答案的关键.由于中文自然语言句法语义分析复杂,人工提取特征难度较大、主观性较强,使之成为中文问答系统的研究重点和难点.为此本文提出利用深度学习的思想主动学习候选答案深度特征,将答案抽取问题转化为特征学习与分类问题.即用词向量表征问题句和答案句,通过长短时记忆神经网络主动学习其深层语义相关,借助依存句法树分析句法结构特征,构造深度神经网络学习问题句、答案句和候选答案之间的内在关联信息.实验表明,该方法在不需要制定繁琐句法语义特征的条件下,仍具有较好的答案抽取性能,MRR值达到0.71.
小型微型计算机系统
2017, 38(6): 1341-1346
作者简介李超,男,1989年生,硕士研究生,主要研究方向为机器学习、自然语言处理等; 柴玉梅(通信作者),女,1964年生,硕士,教授,CCF会员,主要研究方向为机器学习、自然语言处理等; 高明磊,女,1963年生,实验师,主要研究方向为数据分析、工控系统; 昝红英,女,1966年生,博士,教授,CCF会员,主要研究方向为自然语言处理.
http://xwxt.sict.ac.cn/CN/Y2017/V38/I6/1341
领取专属 10元无门槛券
私享最新 技术干货