Item embedding 取平均得到 User embedding，是四不像还是四都像

阿泽 Crz

发布于 2021-12-02 15:33:34

1.4K0

所谓高维空间的诅咒：在低维空间中是四不像，但随着 Embedding 维度的增加，取平均后的 Item Embedding 会和用户原本的 Embedding 越来越近。所以高维下大概率是“四都像”。

最简单的应用便是：当觉得用户的 User Embedding 不太好时，那可以使用用户最近点击过的 Item Embedding 取平均，从而得到新的 User Embedding。

这个用户的 User Embedding 不太好有多个角度：

注意：

最早期有点像 Youtube 2016 年的论文：通过 item embedding 生成 user embedding 的过程。

此外，这里还有一个比较好玩的论文：KDD2020 《PinnerSage: Multi-Modal User Embedding Framework for Recommendations at Pinterest》。大概是说：

其“取长补短”，其思路也很简单：取用户较长时间段内交互过的 Item embedding，聚成若干类，再拿每类的 Embedding 取召回，融合后返回。

至于如何聚类，聚几类，可以去看论文，这里不过多阐述。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2021-12-02，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自阿泽的学习笔记微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度