什么是长尾效应?与推荐系统的关系是什么?长尾效应给推荐系统带来的影响有哪些?
什么是长尾效应?
我这里尽量使用最简洁和最通俗易懂的表述来问答这个问题,因为我觉得在你提问之前应该已经搜索过了这个问题。所以专业化表述就无需在提了。其实长尾效应理解起来非常简单,这就好比一条鱼儿一样。有其头部和尾部,头部虽然肉多庞大,但头部的总质量上却往往低于尾部加起来总质量。但尾部的质量密度却没有头部的密度大。这就是长尾效应。而长尾效应往往用来解释现实生活中的商业理论。将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。
与推荐系统的关系是什么?
一定要加上关系的话,其实也非常理解,目前的推荐系统或者推荐算法,很难发现用户的隐性需求,也是目前推荐算法所追求的,目前而言,现在的推荐系统只能发现你的主观需求,比如你上B站搜索一个关键词后,你会发现,发现它会推荐很多与这个词相关的东西,但是却很难发现你目前不想知道,但心里却感兴趣的东西。所以这个是一个很大的攻克难点。但这并不是一个问题,随着深度学习,人工智能的发展,攻克下来,并不是非常困难。
长尾效应给推荐系统带来的影响有哪些?
可以把长尾效应看成是一种“目标”,而推荐系统的发展,个人认为就是朝向这个“目标”去发展的。总结下来就是长尾效应就是推荐系统的发展方向。个人理解,希望可以帮助到你。
我以用户的喜好来简单说说长尾效应。
我们知道,物种具有多样性特征。同样,用户的需求也是多样化的,每个用户都有不同的偏好。一般来讲,少部分需求(20%)可能是共性,单个需求的由于用户量较大,价值相对较高,很多业务或服务都会设法来满足这类单个需求。但可能有超过80%的需求,虽然喜欢每个需求的个体数不多,也就是满足单个需求的价值不太高,但如果设法满足各种个性化的需求,也会创造可观的市场价值。这80%的零散需求,就是长尾。举例而言:书籍的数量可能有过100万种,传统新华书店上架的都是那些热销书,大约10万种;然而,在当当与京东上,有超过50%的销量,却来而于这10万种热销以外的书籍。这10万种以外的书籍就是长尾。
长尾效应显然在互联网时代更有威力,且通过技术更容易满足。因而推荐系统中的“满足个性化需求“就有了发挥的余地。如何发现更多长尾的需求,更好的预测用户的喜好,在不同的时间片段,及时性等等,现在的推荐系统还有很大的提升空间。
长尾效应显然需要收集超大规模的数据量,使用多种维度,以更加精准地描绘出精细个性化需求才发挥更好的价值,这正在推荐系统所需要努力去达到的。长尾效应价值发现是推荐系统发展的目标。