在计算语言学国际会议(COLING)上,某中心凭借论文《利用对话系统中的用户改写行为自动收集长尾话语标注》荣获行业赛道最佳论文奖。该研究提出通过分析用户重述失败请求的行为,自动生成自然语言理解系统的训练数据。
研究方案包含三个核心模块:
实验表明,该方法特别适用于处理低频长尾请求。在德语场景取得最佳效果,随着意大利语和印地语模型的持续优化,预计将获得更大提升。该离线方案与现有在线自学习模型形成互补,共同提升对话系统性能。
图示:系统通过最小化词级差异,将成功请求的标签映射到失败改写句
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。