2024年据说是目前为止这个行业的最大寒冬,大家经历了裁员或者说身边有小伙伴裁员的,举个手
个性化推荐是根据用户兴趣和行为特点,向用户推荐所需的信息或商品,帮助用户在过载信息中快速发现真正所需的商品,提高用户黏性,促进信息点击和商品销售。相当于量身定做。推荐基于海量数据挖掘分析的商业智能平台,推荐主要基于以下信息:
热点信息或商品,用户信息,如性别、年龄、职业、收入、所在城市,用户历史浏览或购买行为记录,社会化关系等等。通过这些独特的个人信息,可以画出一副比较完整的人像。知道需要什么,喜欢什么,偏爱什么,这样就能“对症下药”,大大提高购买率或点击率。
就像我最近研究协作过滤算法一样,我将详细描述这个算法是如何实现的。
协作过滤算法通常如何做?我们来看看图书推荐的做法:
协同过滤(CF)大致可以分为两类:一类是基于邻域的推荐,另一类是基于模型的推荐;邻域法是利用用户最喜欢的现有项目度来猜测用户对新项目的喜爱程度。相反,基于模型的方法使用历史行为数据根据学习的预测模型预测新项目的偏好程度。通常的方法是使用机器学习算法来找出用户 - 项目交互模型,以找出数据中的特定模式。
[基于社区的推荐] - 即构建用户相似度矩阵和产品相似度矩阵
假设用户已经显示了对某些书籍的偏好并相应地得分。不同的书代表不同的维度。得分代表维度中特征向量的投影长度。用户的特征基于用户对不同书籍的偏好而建立。向量,然后根据余弦相似度可以确定用户之间的相似度。相似矩阵可以基于相似性建立。显然,根据用户对历史书籍的评价,用户可以得到他们喜欢的情况。在此基础上,可以构建用户的特征向量,在一定程度上可以确定两个用户在图书风格上的相似程度。可以认为,如果A和B类似,那么可以认为最喜欢的书B也是喜欢的。当推荐A用户使用书籍时,找到相似度较高的其他用户,然后删除A用户看到的书籍,并将相似用户对某本书的偏好与用户与A用户之间的相似度相结合。建议首先推荐推荐指数最高的书。
这应该是图书社区使用的推荐算法之一,例如豆瓣,以便使用用户之间的相似性来提出建议。当然,电影的推荐是一样的。
同理,反过来我们可以按照相似的方位,以用户为维度来构建item的特征向量。 当我们需要判断两本书是否相似时,就去看对这两本书进行过评价的用户构成是否相似,即是使用评价过一本书的用户向量(或数组)表示这本图书;也就是说,如果有两本书的评价中,用户重合度较高,即可认为该两本书相似度较高。其实借用的还是用户相似的基础。
值得注意的是,协同过滤的推荐算法虽然使用得很广且推荐效果也较好,但还是存在一些不足之处:
协同过滤算法(CF)推荐中存在流行性偏差,因为协同过滤算法是基于惯性数据来进行推荐的,流行的物品由于关注的用户多,产生的数据也多,因此可以建立较为有效的推荐机制;而对于小众或长尾的产品(没人用过也没人评分过),则无法有效推荐;
冷启动问题(又叫做新用户问题,或推荐新项问题),同样是由于惯性数据的缺失,导致一开始的推荐算法无法建立;这样的问题可以通过流行性算法进行一定程度的解决,当然也可以利用基于内容的推荐算法来进行解决。