首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >某中心获计算语言学会议最佳论文奖

某中心获计算语言学会议最佳论文奖

原创
作者头像
用户11764306
发布2025-08-16 09:23:52
发布2025-08-16 09:23:52
1430
举报

在计算语言学国际会议(COLING)上,某中心凭借论文《利用对话系统中的用户改写行为自动收集长尾话语标注》荣获行业赛道最佳论文奖。该研究提出通过分析用户重述失败请求的行为,自动生成自然语言理解系统的训练数据。

研究方案包含三个核心模块:

  1. 改写检测器:采用合成数据集训练,通过随机组合载体短语生成正例,轻微调整意图/槽位生成负例,判断连续请求是否构成改写关系
  2. 摩擦检测器:综合语音识别置信度、NLU输出状态码等特征,判断交互是否成功
  3. 标签投影算法:基于Levenshtein编辑距离的贪心算法,将成功请求的槽位标签映射到失败改写句

实验表明,该方法特别适用于处理低频长尾请求。在德语场景取得最佳效果,随着意大利语和印地语模型的持续优化,预计将获得更大提升。该离线方案与现有在线自学习模型形成互补,共同提升对话系统性能。

图示:系统通过最小化词级差异,将成功请求的标签映射到失败改写句

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档