当客户输入查询"防水女鞋"时,她究竟在寻找什么类型的产品?理解客户的使用情境有助于产品发现系统提供更令人满意的结果。
在一篇被ACM SIGIR人机信息交互与检索会议接受的论文中,提出了一个基于神经网络的新系统,用于从客户查询中预测使用情境。例如,从查询"阿迪达斯男士裤子"中,系统预测出活动"跑步"。在测试中,人类评审员平均同意系统81%的预测,表明该系统能够识别出可以改进产品发现算法质量的模式。
第一步:构建使用情境类别列表
由人类专家基于常见产品查询识别出173个类别,分为112个活动类别(如阅读、清洁、跑步)和61个受众类别(如儿童、女儿、男士、专业人士)。
数据准备自动化
使用标准参考文本来创建类别术语的"别名",例如受众类别"母亲"的别名包括"mum"、"mom"和"mommy"。
通过内部数据集,将数百万产品与特定查询字符串相关联。系统扫描产品的在线评论,寻找原始类别术语或其别名。如果任一术语出现在产品的任何评论中,该产品就会被标记相应的类别术语。
使用包含三个数据项的数据集进行训练:查询、带有使用情境类别标注的产品ID,以及查询-产品亲和度评分。训练了六个不同的机器学习模型,每个模型都使用卷积神经网络。
评估指标
该系统识别出的使用情境可以帮助产品发现算法提供更相关的结果,从而改善客户体验。此外,生成训练数据所需的最小人力监督意味着该方法可以相对容易地扩展到新类别。
*相关会议:CHIIR 2020
相关出版物:基于客户评论的主观搜索意图预测*
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。