首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯TMQ在线沙龙回顾|推荐评测

推荐评测 活动时间:2018年1月9日 斗鱼直播分享 活动介绍:TMQ在线沙龙第三十八期分享 ? 本次分享的主题:推荐测试。 共有65位测试小伙伴报名参加活动。 想知道活动分享了啥吗? 请往下看吧!...分享主题 推荐评测测试思路 本次分享,嘉宾给我们介绍了以下内容: 推荐类实例&流程 推荐类模型抽象&评测 白板建设 测试思路 问答环节 1、相同类型的文章怎么测试它们的热度,再推荐给用户?...2、用户多标签情况下,推送的优先级送达怎么评测? 答:我理解你的意思是:比如用户有好几个兴趣点,那现在用户来拉一刷新闻,应该怎么下发新闻。...4、这套推荐评测系统,除了资讯评测,还有应用到其他评测上吗?好移植吗?

1.3K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    软件品质评测系统-评测体系

    2 ● 评测体系的内容 ● 评测体系可大可小,根据评测的内容而有所不同,一个完整的评测体系应包含: 评测对象 评测属性 评测场景 评测指标 在进行评测体系的设计之前,首先应明确评测对象是什么,可以大到一个系统...需要根据被评测对象的特性进行调整 以输入法这个推荐系统举例,假设我想评测输入法打字能力的好坏,首先就需要对打字能力进行一个定义。从上而下的角度出发,最基本的要求打字要准确,打字要快。...怎么样证明打字准确呢,就要根据用户的习惯来,用户有哪些日常输入的场景,每个场景下展示哪些词,词应该排在什么样的位置。基于这样的从顶层出发的角度去看,我们大致能够得出这样的一张评测矩阵。 ?...以打字能力为例,用户实际可能在不同的键盘下进行打字,每个键盘下可以打字不同的长度,输入的时候可以按照全拼和简拼的方式。...比如纠错功能,假设纠对准确率高达99%,但是纠错率高达99%,那对用户打字输入的影响也是无法估计的,因此,单纯靠准确率来评价一个算法模型是远远不够科学全面的,类似的指标还有错误率,精确率,召回率和F值,

    2.4K20

    软件品质评测系统- 数据挖掘处理平台

    1 数据挖掘处理原则 全面性 使用场景 依照不同用户需要的打字环境的差别,结合当前使用频率较高的几种应用,尽可能全面地覆盖用户使用的打字场景,主要分为以下两个类别: 聊天场景:用户聊天的打字内容,例如...对于这些需求,我们将上述使用场景下获取的数据分为:汽车,运动,教育,游戏,影视等10余个类别,以覆盖特定用户的特定打字需求。...客观性 无倾向性 在选择数据时,同等对待所有打字类产品使用的场景,不能只使用在自己产品上表现较好的数据(例如使用输入法自带的词库制作评测数据,而忽视了时下流行的网络热词,导致评测结果很好,实际用户使用却体验不好...理解用户的真实意图 用户在打字的过程中,包含的操作可能有很多种,比如有些词在我们输入法中给出的词库中可能不存在,是用户自己造出来的,这就需要我们在评测时要有组词的场景。...因此我们在挖掘用户打字行为时,除了满足普通打字需求的同时也设计了多种用户可能的行为,包括联想、组词、纠错、退格等。

    73720
    领券