本文作者 桑文锋
神策数据创始人兼CEO,浙江大学计算机科学与技术专业硕士,在百度任职8年,从无到有构建了百度用户日志大数据平台,覆盖数据收集、传输、元数据管理、作业流调度、海量数据查询引擎及数据可视化等。历任软件工程师、高级软件工程师、项目经理、高级项目经理、技术经理,2015年4月离职创建神策数据,针对企业客户推出用户行为分析产品——神策分析,帮助企业实现数据驱动。2017年7月,桑文锋荣获第六届中国财经峰会“2017最佳青年榜样”荣誉。
所谓智能,可以把它归结为这么一种模式:首先要有数据,然后在数据上套用某种算法模型,最后再将结果数据反馈到产品中,这样的产品就具备了一种“学习”能力。数据驱动产品智能模式如下图所示。
数据驱动决策将分析结果用于人的决策使用,而数据驱动产品智能更加强调数据的处理结果是给机器用的,并且这种数据分析的算法往往更加复杂,本身具有可以自我迭代的特点。不管是百度搜索引擎根据用户的点击情况自动调整排序,还是今日头条根据新闻浏览历史推荐相关新闻,都属于这种情况。
有了数据平台,我们就有了数据根基和数据处理能力,接下来就是围绕数据的产品智能应用。具体到用户行为数据,它不仅可用作流量统计和在线的用户行为分析,还可以应用于各种用户智能。下图是挖掘用户行为数据价值的一系列智能应用。
目前常见的基于用户行为的用户智能应用,如下表所示。
应用类型 | 解决的问题 |
---|---|
用户画像 | 描绘目标用户到底是一个什么样的人——目标用户的属性、行为与期待等 |
个性化推荐 | 基于用户画像、短期兴趣、长期爱好,向用户推荐喜欢的内容,如视频等 |
精准广告推荐 | 根据用户以往的浏览和购买等行为,向用户展现最有可能感兴趣的广告 |
精准用户运营 | 根据用户以往的浏览和购买等行为,向用户推送最有可能转化的优惠券等 |
反作弊分析 | 判断用户是否是一个“作弊”用户 |
搜索引擎点击模型 | 基于海量用户检索的点击行为,调整检索结果中高频点击项的排序 |
智能评价系统 | 自动从用户评价中,抽取关键字及情绪化文字,如“大屏幕”、“超长待机”、“老人家喜欢”等 |
流失用户预警 | 提前预警用户潜在的流失倾向,提供优惠券、促销活动,延长用户生命周期 |
导航行程时间预估 | 根据天气情况、实时路况信息、海量用户历史行程记录,预测导航行程时间 |
下面列举我们常见的用户智能的应用。
下图是一个电商 APP 的首页,其中每一个商品,都是根据用户以往的浏览与购买记录做出的具体的个性化推荐,不同的用户,打开App后看到的都是不同的内容,真正做到了“千人千面”。
下图是百度的搜索结果页,每个用户看到的搜索结果一样,然而这些搜索结果的具体排序,是基于不同用户对同一个搜索词的点击情况进行调整的。
例如,在搜索“大闸蟹”的结果页中,如果用户点击搜索结果中第二条的比例要远远高于点击第一条的比例,那么第二条的顺序就调整到第一条之前,因此后面所有用户看到的“大闸蟹”的搜索结果,就都发生了变化。简言之,这个变化,是基于之前所有用户的行为进行的调整,也是一种典型的用户智能应用。
下图是京东上基于用户的商品评价,用自然语言处理技术提取了其中一些具有典型意义的关键性评价。也只有对这些自然语言的评价进行这样一种处理之后,才能够进行后续的汇总、统计与分析,对其他待购买的用户具有参考意义。
下图是一个对特定用户发送特定品类优惠券的实际的例子,例如,一个用户以前经常浏览柯达的产品,就可以给这个用户发送柯达产品的优惠券;一个用户经常买一些药品和保健品,就给他发送某个大药房的优惠券。这就避免了给所有用户发送同样优惠券的粗放运营方式。在如今这个产品竞争激烈的年代,精细化运营是每一个企业战胜对手和最大限度挖掘用户价值的必备手段,也是用户智能应用的一种体现。
当然,除了上述表格中记录的这些应用之外,用户行为数据在用户智能方面,还会有很多其他的应用,这里不再赘述。简单来说,只要是通过收集用户以往的数据,运用强大的工具和算法得出新的结论,创造新的知识,就可以被视为用户智能。
————
本文节选自畅销新书《数据驱动:从方法到实践》。