首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

微信读书冷启动用户书籍推荐初探:一个借助微信用户画像的方法

引言 微信读书 App 中的书籍推荐系统,逐渐开始在运营活动中(每周热榜、新手卡片)使用,尝试从技术侧帮助运营侧提高转活动的化率。 对微信读书的活跃用户,我们根据其读书时长、点评书等用户行为,做书籍推荐。对微信读书新增用户,由于缺少用户行为数据,无法使用这种方法做推荐,此类问题常被称为推荐系统冷启动问题。 然而,我们发现微信用户画像,比如基础属性(年龄、城市、性别等)和公众号阅读兴趣等,与微信读书用户的阅读兴趣相关。借助微信用户画像进行书籍推荐,准确率较随机推荐提升约 1 倍。 分析建模 如何评估微信用

03
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深度学习简化总结合注意力与循环神经网络推荐的算法

    互联网将全球信息互连形成了信息时代不可或缺的基础信息平台,其中知识分享服务已经成为人们获取信息的主要工具。为了加快互联网知识共享,出现了大量以知乎为代表的问答社区[1] 。用户注册社区后可交互式提出与回答问题达到知识共享和交换。然而,伴随用户急剧增多,平台短时间内积攒了数目巨大、类型多样的问题,进进超过有效回复数,严重降低了用户服务体验。如何将用户提出的问题有效推荐给可能解答的用户,以及挖掘用户感兴趣的问题是这些平台面临的严重挑战。这种情况下,工业界和学术界对以上问题开展了广泛研究,提出了一些针对问答社区的专家推荐方法提高平台解答效率[2] 。现有工作大多利用基于内容的推荐算法解决该问题[3-6],比如配置文件相似性、主题特征相似性等,匹配效果依赖于人工构建特征的质量。近年来,以卷积神经网络(Convolutional Neural Network, CNN)、Attention 注意力机制为代表的深度学习技术不断収展,幵且已经成功应用到文本挖掘领域。相比于传统方法,深度模型可以学习到表达力更强的深度复杂语义特征。于是,出现了一些深度专家推荐算法,比如DeepFM[7] 、XDeepFM[8] 、CNN-DSSM 等,大大幅提升了传统推荐算法的准确度。虽然以上工作很好地实现了专家推荐,但都是根据用户长期关注的话题及相关解答历史刻画用户兴趣,产生的推荐结果也相对固定。随着时间推移,用户会不断学习新知识,其关注点及擅长解答的问题也很可能収生改变,由此会产生用户兴趣变化,甚至短期兴趣漂移[10] 。这些动态变化会严重影响推荐算法效果,所以如何动态刻画用户兴趣就显得尤为重要。其实,用户历史回答行为具有明显的时间序列关系,通过对已解答问题的序列分析有很大可能感知用户兴趣变化。近年来,循环神经网络(Recurrent Neural Network, RNN)被广泛用来处理序 列 数 据 , 比 如 长 短 期 记 忆 网 络 ( Long Short-Term Memory, LSTM)、门控循环单元(Gate Recurrent Unit, GRU)等,可以根据前面状态输入结合当前模型状态产生当前输出。该类方法可与 CNN结合处理问题内容序列数据,从用户历史解答行为中挖掘长期与短期兴趣,从而动态产生当前兴趣。综合以上讨论,本文提出了结合注意力机制与循环神经网络的问答社区专家推荐算法,能够根据用户历史解答序列动态构建用户兴趣特征,实现推荐结果随时间収展不断调整。 主要工作与贠献如下:(1)基于预训练词嵌入模型分别实现了问题标题与主题标签的语义嵌入向量表示,将 CNN 卷积模型与 Attention 注意力机制结合,构造基于上下文的问题编码器,生成不同距离上下文的深度特征编码。(2)问题编码器对用户历史回答的问题迚行序列编码,利用长短期记忆循环神经网络 Bi-GRU 模型处理编码后的问题序列,幵结合用户主题标签嵌入向量构造用户兴趣动态编码器。(3)将问题与用户编码器产生的深度特征点积运算后加入全连接层实现相似度计算产生推荐结果。在知乎公开数据集上的对比实验结果表明该算法性能要明显优于目前比较流行的深度学习专家推荐算法。

    02

    2020腾讯广告算法大赛方案分享(亚军)

    本届算法大赛的题目来源于一个重要且有趣的问题。众所周知,像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。这背后的假设是,用户对广告的偏好会随着其年龄和性别的不同而有所区别。许多行业的实践者已经多次验证了这一假设。然而,大多数验证所采用的方式都是以人口统计学属性作为输入来产生推荐结果,然后离线或者在线地对比用与不用这些输入的情况下的推荐性能。本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。

    05

    半天实战经历快速让小白明白深度学习增强半监督人脸识别噪声

    1、简介 尽管深度人脸识别从大规模训练数据显著受益,但目前的瓶颈是标签成本。解决这个问题的一个可行的解决方案是半监督学习,利用一小部分的标记数据和大量的未标记数据。然而,主要的挑战是通过自动标签累积的标签错误,损害了培训。在本文中,我们提出了一个有效的对半监督人脸识别具有鲁棒性的解决方案。具体地说,我们引入了一种名为GroupNet(GN)的多代理方法,以赋予我们的解决方案识别错误标记的样本和保存干净样本的能力。我们表明,即使有噪声的标签占据了超过50%的训练数据,仅GN在传统的监督人脸识别中也达到了领先的精度。进一步,我们开发了一种半监督人脸识别解决方案,名为噪声鲁棒学习标签(NRoLL),它是基于GN提供的鲁棒训练能力。它从少量的标签数据开始,因此对一个lar进行高可信度的标签 索引术语-半监督的人脸识别,有噪声的标签学习。

    04
    领券