👆点击“博文视点Broadview”,获取更多书讯
在企业数字化、智能化转型的研发、生产、供应、销售、服务等诸多场景中,如何融合数据与专家知识,协同驱动业绩增长是一个多方关注,且难以解决的难题。
比如:
本文将从上述难点出发,以用户画像分析、用户标签生产、智能平台交互场景为例,为读者在知识图谱的业务落地提供指引。
1
用户画像分析引擎
用户画像分析引擎,可以作为展示用户知识的产品,会基于用户的行为、标签,通过数据产品进行系统化服务封装,提供可视化等相关功能。
用户画像分析引擎目前在各大广告服务商、流量运营方的数据系统中很常见,是大数据管理平台(DMP)、用户数据中台(CDP)、CRM、用户增长分析等产品系统的核心功能之一。
在这些平台上,用户画像分析引擎的核心业务目标是对个体用户及群体用户的行为进行认知和理解,进而帮助营销人员在营销战略制定、广告运营投放等场景中提升战略分析和决策的效果。知识图谱主要通过知识关联、运营经验传承等方式提升广告运营等业务人员对用户画像的分析和理解能力。
图1对广告点击场景中的用户群体分析引擎的基础能力进行了展示。
图1
用户群体分析引擎的核心功能是提供用户标签分布、行为洞察等服务,以辅助产品策划、产品运营等业务人员对用户建立认知与并构建策略。
用户画像分析引擎通常会面向一个业务目标人群,比如对某次广告点击、购买商品的用户群等,都可以运用用户画像的标签进行洞察分析。
如图1所示,在某商品的点击人群中女性居多,且大多处于一线城市,以此为基础,产品运营就可以初步认知到已转化用户是一线城市女性,在后续的运营策略制定中也将围绕一线城市女性的需求来设计。
那么,知识图谱如何提升用户画像分析引擎的能力呢?
(1)知识图谱可以对用户画像中的标签进行扩展,将业务知识、百科知识与标签进行关联。假设如图1所示的是教育广告点击用户群的用户画像报告,那么可以将点击用户群的城市、课程、价格等标签通过知识图谱进行扩展,了解该课程的价格区间、课程类目等相关信息。
(2)知识图谱可以通过聚合,将分散的用户知识、业务知识聚合到同一视图,来提升业务人员的全局认知与分析能力。知识图谱提升了业务人员的数据分析、数据解读能力,标签也可以丰富了数据的维度。在对业务数据有更深层次的关联、对比和分析后,业务人员不仅能拥有超出原有视角的认知能力,还可以通过用户行为、商品特性、行业趋势的深层关联,发现商业机会。比如,用户画像分析引擎通过知识图谱,将用户点击行为中的用户信息、商品信息、促销活动信息、用户产品交互行为、关联好友、业务逻辑关联起来,形成“用户点击行为一张图”。以此图为基础,可以通过规则推理、统计推理、图推理等方式,提升业务人员的推理、分析能力。业务人员还可以将用户的点击序列、运营的策略序列、商品的发布序列形成统一、聚合的知识图谱。然后,数据科学家可以通过归因分析,挖掘出影响用户点击的关键因子。
(3)知识图谱可以为分析报告提供策略关联、搜索、推荐的能力。不同的数据分析师、业务人员,面对用户画像生成的报告有不同的处理策略。因此,用户画像分析引擎可以聚合各数据科学家对用户画像的报告,构建策略集并提供搜索与推荐能力,因此,系统可以根据新的业务场景需求,将相关策略推荐给业务人员;业务人员可以低成本、高效率地获得专业数据科学家的分析能力。比如业务人员在商品的定价优惠、品类选取策略制定中,可以通过知识推理引擎对自己所负责业务的用户画像洞察报告进行解读,根据解读及历史案例、专家知识,自动生成品类选取策略推荐。
这样,业务人员就可以在知识图谱强化的用户画像分析引擎上,提升对用户认知与分析的广度与深度,同时通过策略搜索及推荐,提升对业务场景的决策能力,并最终提升业务效率。
2
用户智能标签引擎
标签生产引擎在业务落地过程中需要理解业务的需求,在用户实时、离线的行为数据上,通过规则、统计、机器学习建模等方式生成用户标签。标签生产引擎认知、理解用户的行为,并打上符合业务场景需求的标签,对业务的需求通过标签体系进行管理,并通过标签生产流水线进行标签生产。可见,用户的标签生产过程和知识图谱生产过程类似。
在企业营销场景中,用户标签体系核心分为人口基础体系与营销业务相关的标签体系。
图2对营销场景中的人口基础体系进行了展示。
图2
人口基础体系主要是以年龄、性别等自然属性,婚恋状态、育儿等家庭属性,学历、专业等教育属性为代表及活跃度、中心度等社交属性的人口学属性。
知识图谱在人口基础体系中的作用有多种,较典型的场景是将业务抽象的需求概念与基础体系进行关联。比如在不同的业务中都会定义青年用户标签,但规则逻辑并不相同,而通过知识图谱进行需求概念管理,就能很方便地将某业务18~30岁的用户标签聚合为“某业务青年”这一符合业务需求的人口学抽象概念标签。
知识图谱对于营销业务的标签体系也有多种建设方式。在用户与商品、内容进行互动后,可以产生用户购车兴趣、用户投资品类兴趣等标签,这些标签的体系建设是非常需要知识图谱的知识体系进行辅助的。
用户的商品兴趣标签体系需要基于SKU、SPU等商品类目体系,以业务场景需求进行细化建设。经过建设的商品知识体系需要先与营销业务场景中的需求进一步结合,再转化为用户的商品兴趣标签体系。
这里的用户商品兴趣标签体系与基础标签体系一样,需要通过知识图谱技术进行业务所定义概念的管理。
同时,目前在广告、推荐等服务场景中,用户标签体系通常以树状的知识体系形态存在。
因此在实践中,以图拓扑结构存在的用户社交图谱体系、商品交互知识图谱体系,需要以用户标签体系的节点进行聚合,比如将用户的社交关联图谱通过抽象的圈层活跃度、领域活跃度等标签体系进行转化,用户标签体系通过知识图谱可以在深度与广度上都得到提升。
在定义标签体系后,标签引擎需要在企业的大数据与智能平台中基于用户标签体系进行标签生产。
表1展示了常见的标签生产任务类型,对其中的生产方法、案例、优点和缺点都进行了说明。标签生产任务可以分为数据清洗与导入类、规则与统计类、模型预测类,知识图谱在不同的标签生产任务中会有不同的作用。
表1
数据清洗与导入类的标签生产任务主要是将业务系统中的原始数据经过正则匹配、异常值过滤、格式变化等数据清洗方法转化为用户标签,从用户注册时所填写的信息中获取性别标签,又或者从用户实名认证数据表中获取生日标签。
在这类标签的开发任务中,知识图谱可帮助开发人员梳理数据“血缘”体系。因此,企业可以对有不同数据来源的基础标签进行关联和管理,提升标签生产任务的管理质量和效率。
规则与统计类的标签生产任务,与知识图谱的规则推理、统计推理相似,主要基于业务经验对数据进行逻辑规则判断或数值统计。
表2展示了规则与统计类标签生产任务的标签体系,这类标签生产任务需要在没有对应原始数据的条件下定义业务规则或者统计方法,通过推理判断或者数值计算得到标签。
表2
规则与统计类的标签生产任务通常以脚本任务模式运行于企业实时、离线的大数据平台中。
企业首先对App、网页、小程序进行埋点,通过SDK对用户日志进行上报。上报的数据在诸如Flink、Spark Streaming等计算框架中,按数据分析师、数据科学家开发的SQL脚本进行实时用户画像标签计算。
规则与统计类标签通常关注用户的活跃度、消费频次及消费金额,业务人员希望通过上述标签对用户的生命周期进行精准预测,以构建精细化的运营策略。
在规则与统计类标签生产任务中,知识图谱的常见应用方法有概念抽象、规则沉淀和策略推荐。
另外,如果想要构建深度的统计模型,就需要从模型层面引入知识图谱的符号与拓扑结构特征。
比如,当对点击用户的行为进行触点归因分析时,不仅可以应用传统的贝叶斯网络、因果假设推理模型,也可以引入知识图谱进行数据关联、规则补充与模型校验。
数据清洗与导入类、规则与统计类,是企业营销信息化、数字化阶段常用的用户画像任务标签生产任务类型,其优点是逻辑明确且容易实施;缺点是对脏数据非常敏感并且场景的迁移能力非常弱。
在企业实践中,以用户的真实年龄为代表的人口属性标签是难以通过数据清洗与导入类、规则与统计类标签生产任务获取的,其中的典型问题包括用户隐私问题、数据质量问题和场景关联问题。
场景关联问题是企业业务实践场景中的问题。比如,一位母亲会在电商网站购买全家人用的商品,因此她的个人年龄、性别并不能完全代表她的状态,可能在不同的时间、场景中表现出不同的年龄、性别偏好。因此,标签引擎需要建设机器学习、深度学习等模型,对用户的状态进一步预测和修正。
模型预测类标签任务是基于用户各触点的行为数据进行推理和判断的。
表3 展示了模型预测类标签生产任务的标签体系,比如用户很难直接告诉企业自己是否有房,但是可以从其购买的装修、家居等商品中推测其有房或者即将有房的事实。
表3
在兴趣类标签建设中,如果用户a的历史购物行为与群体A相似,那么使用协同过滤算法,就可以预测用户a也喜欢群体A都喜欢的某件物品x,因此,用户a就可以获得标签x。
模型预测类标签在传统上会使用机器学习、深度学习模型对用户的行为进行建模、预估,模型会基于标注标签样本,应用逻辑回归、XGBoost、fastText等回归或分类方法进行模型训练与预测。知识图谱可以从多个角度,显著提升模型预测类标签的应用效果,如下所述。
(1)在符号特征方面,知识图谱可以对用户的行为特征进行扩展。在实践中,用户的内容浏览行为、商品浏览行为都会被文本分类等算法打上内容体系、商品体系的标签。通过百科、商品知识图谱,可以获得每个内容、商品的上下位词及关联知识数据。
(2)在结构特征方面,知识图谱可以通过图结构,将从宏观到微观的拓扑特征信息输入标签模型。图3展示了基于图拓扑进行标签生产的方案示例。比如,将用户通过拼团、分享行为形成的人口属性图拓扑结构、职业属性拓扑结构输入模型,可以显著提升标签预测结果的准确率与召回率。因为虽然个体的标签作假很容易,但是群体作假很难。“物以类聚,人以群分”,用户的圈层信息会反映用户的真实标签。
图11
(3)在算法方面,通过图深度学习、贝叶斯网等图推理技术,可以对用户的行为状态序列、知识关联拓扑结构,运用卷积、注意力等机制进行深度捕捉。通过图深度模型,标签模型可以捕捉隐藏的知识结构,理解用户过去、现在、未来的真实状态,大幅提高对用户的认知能力。电商购买行为、视频网站观看行为、新闻应用阅读行为等都是随时间排序的序列。一位电商用户上周购买了一双篮球鞋,那么其这周的注意力就可能转移到其他商品上,比如一个键盘,这个标签的转移概率可以通过序列模型或者图结构模型进行统计。
前面已经讲解了数据清洗与导入类、规则与统计类及模型预测类标签生产任务的方法及知识图谱的落地点,那么在企业实践中能否建设一个端到端的标签生产引擎呢?标签生产引擎能否准确理解业务对用户标签需求的意图,并自动且智能地认知用户的状态,生产高质量的标签呢?
抽象概括上诉需求,一个端到端的智能标签引擎应该可以将业务对用户状态的认知需求,与真实的用户状态进行匹配,并返回最符合业务需求描述的用户群。根据这个技术逻辑,端到端的智能标签引擎解决的是一个根据业务需求匹配用户搜索的问题。因此,可以在传统搜索系统的框架上通过知识图谱与认知智能技术构建一个用户智能标签引擎。
智能标签引擎,是一种融合业务认知与用户认知技术的智能引擎,通过意图理解精准获取业务对用户标签的需求,并在对用户认知的基础上实现对需求与用户的匹配。智能标签引擎可以由用户认知、需求认知、需求匹配三个模块组成,如下所述。
那么,应该如何建设智能标签引擎的三个模块呢?
图4对智能标签引擎的产品逻辑进行了展示。智能标签引擎通过搜索的模式,可以快速满足业务自定义标签的需求,大幅降低标签生产的人力成本,提高数据团队服务业务的效率。
图4
智能标签生产引擎的核心流程是从用户行为日志引擎中获取用户数据,再根据用户的意图对目标人群进行搜索和挖掘。智能标签引擎的需求匹配模式与搜索、推荐系统类似,都是在海量用户中筛选符合业务场景需求的目标。
比如在广告投放场景中,智能标签引擎的输入需求可能为广告文案与运营规则,那么基于广告文案与运营规则对候选用户进行检索这一任务,和根据广告选择曝光用户的广告召回任务是极为相似的。
因此,智能标签引擎可以参考传统的推荐框架,进行召回层、重排层、精排层的开发。在实践中可以基于传统的搜索、推荐的检索框架,融合知识图谱技术,对智能标签引擎做进一步优化。
关于知识图谱与商品搜索、智能推荐的融合方案,在《知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案》一书的9.4节、9.5节有更详尽的介绍。
图5对智能标签引擎的技术解决方案进行了展示。
图5
在智能标签引擎中,知识图谱可以在用户认知模块、需求认知模块、需求匹配模块中发挥重要作用,如下所述。
(1)在用户认知模块中,可以通过知识图谱技术构建内容知识图谱、商品知识图谱、业务专业知识图谱及用户知识图谱,以形成对用户、物、场景的全面认知。在该模块中,知识图谱可以丰富知识并扩展判断空间。
(2)在需求认知模块中,智能标签引擎可以接受多种业务需求的表达形式,比如文本自定义的描述、关键词、转化样本等。在企业实践中,知识图谱可以从需求构建与需求理解两方面提升需求认知的效果。
(3)在需求匹配模块中,智能标签引擎需要实现业务需求与用户状态的精确匹配。典型的匹配方案有正则匹配、关键词匹配、逻辑规则匹配及向量匹配。在向量匹配方面,可以通过向量点积、双塔模型等匹配方法,实现用户查询意图向量与用户向量的精确匹配,并构建深度匹配模型,提升业务意图匹配模型的应用效果。
通过将意图和用户认知进行匹配,可以智能且自动地生成标签。比如,当业务人员提出需要挖掘带宝宝出行的用户时,智能标签引擎会基于对用户标签的意图理解,将需求转化为对童车浏览、出行游玩等标签的搜索需求。智能标签引擎通过用户认知模块,可获得多个来源的用户特征、标签与相关知识图谱,比如用户商品浏览特征、用户过往订单分类标签及母婴育儿知识图谱等,因此,通过对需求与用户的匹配,就可以获得符合“宝宝出行”这一抽象概念标签的用户了。
3
智能用户数据中台
在企业营销服务产业中,用户数据中台是通过收集并处理用户在第一方/第二方/第三方平台的数据,实现用户细分、精准的自动化营销和广告投放系统的。从用户关系管理的角度,用户数据中台旨在挖掘和开发潜在用户,并维系老用户及提升其价值。图6展示了业内用户数据中台常见的产品功能架构。
图6
产业内的用户数据中台通常有以下4项核心功能。
用户画像分析引擎、用户智能标签引擎分别从宏观和微观的角度,对用户进行了认知与理解,这些用户认知与理解能力,是需要具备用户、商品、企业的知识图谱管理能力的平台支持的。
《知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案》一书的第8章已介绍了知识图谱管理平台的相关产品能力,用户画像分析、智能标签引擎都可以作为知识推理应用通过该平台统一管理。而在营销服务这一场景中,知识图谱管理平台可以与用户数据中台进行集成,让其成为拥有知识图谱能力的用户数据中台,也就是智能用户数据中台(Intelligent Customer Data Platform,ICDP)。
那么ICDP有哪些核心能力呢?ICDP是融合知识图谱技术,管理用户全生命周期的数据、知识,为业务应用提供用户认知服务的系统性平台。ICDP通过知识图谱,可以提升业务人员在用户数据中台上对用户认知与决策的效率。
ICDP对用户营销形成从认知到引导的业务闭环方案,在整体上可分为以下5步。
(1)业务认知提升:业务人员在ICDP上通过营销洞察工具,以知识图谱关联营销专家的案例与经验实现对营销任务全面、有效的认知理解。知识图谱可通过可视化、自然语言交互的方法提升ICDP的产品能力。
图7
(2)企业决策优化:ICDP可以通过决策辅助工具提升企业决策优化能力。企业的营销专家、运营人员会在对场景洞察和分析的基础上,做出营销的决策链。决策链通常包括营销计划的流程图、任务流,沉淀于企业的自动化营销工具之上。ICDP可以将专家业务人员的经验规则存储下来,辅助其他业务人员对用户进行认知、分析和理解。通过策略搜索与推荐,业务负责人、产品经理、产品运营人员等不同岗位可以实现知识共享和认知协同,做出合理的决策自动化营销工具,与企业的运营、财务、管理信息系统进行集成。
(3)用户认知触达:营销自动化工具会在线上、线下对用户进行触达。而 ICDP 会通过数据服务接口,为广告投放等营销自动化工具提供用户数据和知识支持。在这个阶段,知识图谱与认知智能技术的主要优化目标是提高营销自动化工具的投放效率。
(4)用户认知引导:经过广告触达,用户会进一步对商品、服务有认知需求。这些认知需求会通过智能搜索、推荐及对话方式与ICDP进行交互。ICDP会通过数据服务接口,将分散的用户数据和知识,通过系统化、标准的方式提供给业务应用使用。
(5)业务认知迭代:企业将营销流程的数据、知识、经验,以报表、案例库的形式回流于ICDP平台中。ICDP通过自然语言交互模式被动或者主动地以策略推荐、风险高亮等产品能力,提升营销人员的认知与分析能力。
更多相关内容可以阅读《知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案》一书!
扫码了解本书详情
如果喜欢本文欢迎 在看丨留言丨分享至朋友圈 三连
热文推荐
郑建勋:代码优化的三重境界
看了这么多Python教程,最香的还得是……
2022精选豆瓣高分技术书
一文理解分布式开发中的服务治理
▼点击阅读原文,了解本书详情~
本文分享自 博文视点Broadview 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!