首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

画像平台人群创建方式-规则人群创建

规则圈选是按照指定条件从画像数据中找到满足要求用户并沉淀为人群一种常见的人群创建方式。所谓规则就是条件组合,比如北京市男性用户,最近一周平均在线时长介于2到10分钟之间中老年用户。...规则圈选实现依赖画像宽表数据或者BitMap数据,其实现逻辑如图5-12所示。...画像宽表进行人群筛选,其实现逻辑是将人群圈选条件转变为SQL语句,借助ClickHouse引擎查询出所有满足条件UserId并构建人群;当ClickHouse执行异常时会再次兜底从Hive表中筛选用户...Hive表中的人群数据主要用于离线数据分析场景,很多业务使用人群之后需要通过人群结果表进行效果分析。图5-13展示了人群结果表表结构设计,人群crowd_id作为分区键,分区下包含该人群所有用户。...每一个人群最终都会存储在Hive表和OSS中,但是不同人群创建方式优先产出的人群存储类型不同,所以画像平台需要支持Hive和OSS之间数据相互转换。

44000
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    画像平台人群创建方式-导入人群创建

    导入人群是将外部数据导入画像平台构建人群,主要有3种实现方式:文件导入、Hive表导入和SQL导入。...文件导入是将TXT、CSV等格式文件导入画像平台;Hive表导入是指定源Hive表及导入字段,将满足条件源表数据导入画像平台;SQL导入是Hive表导入延伸,用户可以自由编写SQL语句,其运行结果最终导入画像平台...图5-20展示了3种导入人群可视化配置页面。...导入人群画像平台最常用的人群创建方式之一,其实现了将各类数据源沉淀为人群功能,支持更灵活的人群创建方式,拓展了画像平台数据范围。...比如运营人员将某次活动中表现良好用户导入画像平台并构建成人群,后续可以进行广告投放或者人群分析;数据分析师离线统计出了一批高价值用户,导入平台构建人群后可以直接提供给业务使用。

    27010

    几张图告诉你什么是人群画像分析

    人群画像分析是对已经创建完成的人群进行画像分析,目的是从不同角度更深入地认识人群用户并挖掘其人群特点。...人群分布分析偏重人群画像标签值占比分析,比如人群中男女占比分别为60%和40%;人群指标分析主要针对可量化标签进行分析,比如人群平均在线时长、平均点赞次数等;人群下钻分析是在某一画像分析维度基础上再次基于其他画像维度进行分析...人群分布分析人群分布分析是计算人群画像标签上分布占比数据,比如分析人群性别分布,常住省分布,兴趣爱好分布等。...人群分布分析只能对人群进行最直观画像分析,比如性别和常住省占比分布。如果业务需要查看该人群中所有男性用户常住省分布情况,那么需要深入到男性用户中进行更深层画像分析。...人群对比分析人群对比分析通过对比两个人群画像分析结果,可以找出人群主要差异。

    88030

    人群创建基础:画像标签BitMap

    ​上文提到了使用画像宽表可以便捷创建人群,本文介绍人群创建所依赖另外一种数据组织形式:标签BitMap。...使用画像宽表圈人逻辑是从明细数据中找到满足条件用户并最终构建人群,而使用BitMap进行圈人会对用户进行预聚合,在人群圈选时直接使用聚合后结果进行计算。...BitMap以上特点都非常适合存储人群数据,也决定了其在画像平台广泛使用。基于Hive标签数据表可以生成BitMap,图5-10展示了性别和常住省标签生成BitMap示意图。...生成BitMap会消耗大量计算和存储资源,如果标签值区分度较小,生成BitMap数据被使用到概率较低,是对计算和存储资源浪费。使用画像宽表还是BitMap要根据业务特点来决定。...业界一般使用混合模式,优先通过BitMap进行人群创建,不适用场景下兜底使用画像宽表进行人群圈选。采用混合模式要考虑对齐画像宽表和BitMap标签时间,这增加了工程实现复杂度。

    93611

    人群创建基础:画像宽表

    ​本节主要介绍人群创建所依赖画像宽表生成方式。为什么要创建画像宽表?基于原始标签数据表进行人群圈选有什么问题?如何生成画像宽表?针对这些问题本节会给出详细解答。...当用户圈选需求涉及任意N天用户行为时,只能通过存储历史标签数据来解决。 支持跨时间的人群分析。...有了标签历史数据便可以实现跨时间的人群分析,比如分析北京市男性用户在过去半个月平均在线时长变化,基于画像宽表可以快速计算出分析结果。 兼容单日期分区。仅保留最新标签数据是多日期数据下一种特殊情况。...ClickHouse是最近几年比较流行大数据分析工具,面对百亿数据量级分析需求可以实现秒级响应。...ClickHouse也比较擅长做宽表分析,基于这一特点可以把其作为Hive表“缓存”使用,从而满足人群圈选和人群分析提速。

    57720

    画像平台人群包常见应用场景

    圈选对军事感兴趣的人群并用于Push应用背景:运营人员每天会整理当前俄乌冲突热门事件并通过Push推送给对军事感兴趣用户,刚开始主要通过手动方式在画像平台创建人群,然后导入到Push平台进行推送。...应用方式:调研人员通过画像平台LBS人群圈选功能找到了几所高校附近出现过用户,并结合用户年龄段等标签提高了用户圈选精确度。生成人群之后,私信平台可以通过接口拉取人群数据并进行私信推送。...基于组合人群赠送优惠券应用背景:三八妇女节当天电商平台会给女性用户赠送商品优惠券,主要通过画像平台规则圈选找出所有女性用户并构建人群,当用户位于人群中时则赠送优惠券。...应用方式:在画像平台上通过规则圈选创建女性用户人群A,通过文件导入方式创建黑产用户人群B,通过组合人群方式创建人群A与B差集人群C。...应用方式:外呼团队在画像平台上创建外呼人群,并借助人群拆分功能将该人群按照25%、25%、25%、25%比例拆分为4个子人群,在外呼平台导入4个子人群并配置不同的话术进行外呼操作。

    35220

    画像平台人群创建方式-明细行为圈选

    规则圈选中所使用画像标签数据是离线计算出来,大部分在计算过程中剔除了很多明细信息,仅保留了最关键画像内容,即某日某用户标签值。...虽然画像数据是浓缩精简后核心数据,但在很多人群圈选场景中依赖行为明细数据,比如运营人员希望找出2022-08-15 10:00:00到2022-08-15 12:00:00之间通过手机客户端点赞了某篇文章用户...HOW: 行为发生方式,比如点击、分享、评论等操作,还包括当时使用操作系统、网络类型等。WHAT: 行为关联相关内容,比如点赞文章ID,评论视频ID,分享直播ID等。...在行为明细圈选时可以结合画像标签数据一起使用,比如找到在某时间段通过手机客户端点赞了某篇文章北京市男性用户,可以直接关联画像宽表进行计算。...----本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    58040

    搜推广遇上用户画像:Lookalike相似人群拓展算法

    在《当推荐系统遇上用户画像:你画像是怎么来?》一文中,我们介绍了怎么通过TF-IDF方式得到用户画像。而在本文中,我们来聊一下在搜索、推荐、计算广告系统中“画像是怎么用?”。...而在数字营销过程中,运营人员或者数据分析同学也是在根据已有的经验,通过用户画像方式,扩展与历史转化人群相似的人群。比如,通过性别、年龄等筛选出化妆品受众人群等。显然,这种方式有些粗糙。...举个广告栗子,对于一个化妆品类广告主,需要对100万人投放自己广告,但是根据经验或者画像只有10万的人群包,那么如何选取这100万,同时满足人群量级和转化(盲目选择可能存在无效用户)两个因素,就需要用到...而Lookalike技术通过大数据分析和复杂模型学习归纳高质量人群的人口特征,然后在更大流量范围内,寻找具有类似人口特征的人,从而实现目标的转化。...另外,做任何业务背景问题,我们都需要关注其背后可解释性:虽然可以通过一系列用户画像、机器学习技术拓展了一批用户,但是拓展途径、人群行为特征等都需要一个直观解释。

    3.9K40

    【Python】数据分析优秀案例&项目经历-用数据分析能力构建高分学生人群画像

    欢迎大家跟我一起走进数据分析世界,一起学习! 感兴趣朋友可以关注我或者我数据分析专栏,里面有许多优质文章跟大家分享哦。 ---- 提问:大家觉得成绩高低都和哪些因素有关呢?...学生成绩分析 3.1 学生整体成绩分布 3.2 不同学科成绩间关联度以及不同学生人群擅长科目 3.3 高分学生人群画像 3.3.1 父母学历 3.3.2 学生性别 结束语 import pandas...3.2 不同学科成绩间关联度以及不同学生人群擅长科目 我们数据集中共拥有三门学科,分别为读写与数学。我们可以分别将其看做**“文科”与“理科”**,并分别查看不同学科成绩之间关联度。...3.3 高分学生人群画像 3.3.1 父母学历 下面我们分析高分(均分高于90分)考生画像,首先我们探究高分与父母受教育程度间关系。...推荐关注专栏 ‍‍‍ 机器学习:分享机器学习实战项目和常用模型讲解 ‍‍‍ 数据分析:分享数据分析实战项目和常用技能整理 往期内容回顾 学习Python全套代码【超详细】Python入门、核心语法

    77530

    互联网人群画像和你所不知道真相

    与之相关说法,哪些可靠,哪些不靠谱?我希望在本文中把这些问题弄清楚。 人群画像经典构成要素 人群画像从字面理解,是把人群情况用数据方式描绘出来。人群画像和个体画像并不完全相同。...人群画像与个体画像有强关联,人群画像必须基于对个体画像,但却高于个体画像,体现为人群作为一个集群整体特征。...例如,iPod生产商的人群画像显然是针对听音乐感兴趣的人,NB运动鞋厂则想对运动时尚人群画像人群画像与个体画像相似之处在于,两者都是对人描述。...第一个是一切前提,第二个是基础,第三个是对前者组合、抽象、分析和加以利用。 后面我们将逐一详细看看这三个组成部分究竟有何玄机。...超出这两种办法数据,就得自求多福啦。 (作者:宋星,网站分析在中国创始人,WAW中国创始人。)

    1.8K20

    一文读懂:画像平台人群包产出进阶之路

    本文将以规则人群为例,完整地描述人群创建耗时从十几分钟降低到秒级响应优化进阶过程。...简单直接解决思路实现上述需求核心是构建如下SQL语句并找到所有满足条件UserId,其中WHERE条件是什么取决于用户在画像平台上标签选择和筛选配置。...在资源有限情况下,首先想到方法是设置人群创建任务优先级,借助任务调度降低查询并发量来减轻集群压力,从而提高高优人群产出速度。虽然这种方式降低了高峰期集群压力,但是增大了所有人群平均产出时间。...ClickHouse支持基于BitMap的人群创建,可以将画像宽表中数据转换成不同标签BitMap数据,灌入ClickHouse中之后可以借助BitMap交并差操作实现人群创建。...图9-8展示了基于BitMap进行人群圈选实现逻辑。本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    48260

    小红书用户画像分析_抖音运营之:用户画像分析方法

    想要服务用户首先要了解用户,今天96新媒体就来为大家介绍一下如何通过用户画像来了解用户。...二、兴趣爱好 在对用户有一个基本了解以后,后续才能对用户数据进行深入挖掘,分析用户究竟喜欢什么然后对症下药,这里可以通过以下两点来进行分析: 1、用户还关注了什么 去了解除了我以外,用户都还关注了哪些人...不仅如此,在了解了用户还喜欢哪些人以后,还可以对竞争对手研究分析,了解竞争对手长处在哪里,自己与同类竞争对手相比起来自己有什么不足地方,自己优势在哪里,取长补短同时放大自己优势,提高自己竞争力...另外,如果用户所关注很多都是跨领域其他人,那么这样来说可以主动与其他主播进行联动,给用户惊喜,毕竟每天用户所能看到信息就这么多,看了你就没法看我,看了我就没法看他,那么当两个用户都喜欢主播进行联动时候...,去分析排行榜上视频用户评论,去从中了解现在用户愿意评论什么样内容,去分析自己视频评论,从中找出自己不足地方加以完善。

    1.4K10

    客户画像聚类分析

    客户画像会用聚类分析 实际工作中,最常使用的当属回归类模型,其次便是客户画像。...即便是评分模型也会涉及到客户画像,由于首富客户违约特征与普通百姓不同,故需进行区分,信用分池即为客户画像。...客户画像使用技术为聚类分析,在营销场景中经常会逻辑回归模型与聚类分析一起配合构建模型。 聚类分析是什么?...可见聚类分析是如此不稳定,因此想做好聚类分析,必须要遵循完整数据分析流程,才能够保证建模数据稳定以及结果可靠。 ? 聚类分析流程?...红楼梦到底谁写? 可以使用聚类分析来判断红楼梦作者,通过分析红楼梦语言风格,将红楼梦120回中每一回视作一个观测,将虚词频次视作分析变量,做聚类分析

    1.7K20

    数据解读“猫奴”的人群画像:都是哪些人在吸猫?

    经常线上云吸猫朋友们可能会产生真的在吸猫错觉,但其实,“为猫消费”的人群才算真正吸上了猫。...▲猫吃jiojio都这么可爱 《2018年中国宠物行业白皮书》显示,真正吸猫的人群中,80、90后占比接近80%,占绝对优势。...▲点击查看大图,下同 那么,吸猫的人吸都是什么猫?是不是和网红博主一样,人均英短、布偶水平? ? 然而最受欢迎猫其实是中华田园猫,比例超过吸猫人群一半。...其次才是英国短毛猫和美国短毛猫,但这两种猫比例合起来仅占不到25%。加菲猫和暹罗猫则更少。 ? 中华田园猫崛起实际上与吸猫人群获取猫方式有关。...首先,猫尺寸更小,占用生活空间较小。狗体重从1磅到99磅(约为0.5-45kg)不等,大型猫体重也仅在25磅左右(约为11kg),更适合单身人群及职场人群居所大小。[3] ?

    3.1K20

    【数据分析】用户画像分析

    为什么需要用户画像 用户画像核心工作是为用户打标签,打标答重要目的之一是为了让人能够理解并且方便计算机处理,如可以做分类统计:喜欢红酒用户有多少?喜欢红酒的人群中,男、女比例是多少?...这也使得用户画像模型具备实际意义,能够较好满足业务需求。如:判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。...制定标签规则,并能够通过标签快速读出其中信息,机器方便做标答提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁方法用于描述用户信息。...数据源分析 构建用户画像数据来源于所有用户相关数据。对于用户相关数据分类,引入一种重要分类思想:封闭性分类方式。...目标分析 用户画像目标是通过分析用户行为,最终为每个用户打上标签,以及该标签权重。

    3.7K51

    受众行为分析人群定向

    于是,以物拟人,以物窥人,才是比任何大数据都要更大前提。明白了这一点,也就触摸到了人群定向天花板–不可能百分之百精准。 如何从广泛受众中提炼目标人群呢? 正是依靠受众行为分析。...下面我们以易传媒广告投放算法为例,浅析一下怎样由预先标注关键词标签,一步步建立完整受众行为分析模型,挖掘出具有相似行为特征的人群,提炼人群属性特征,最终进行最合适广告投放。...人群定向投放 作为人群定向广告正式投放前最后一步,受众聚类和结构化的人群分类将进行匹配映射。这种映射是利用二者标签集合重合度来实现。...易传媒持续大量实践统计结果表明这套受众行为分析方法使得人群定向精准度相比于原始分类标签法提高了30%以上。...并且,易传媒在所有涉及受众行为分析产品中都已推广这一技术方法,包括防作弊监控和人群自然属性分析等。通过搭建这样统一分析平台,能将所有采集到受众信息最大限度地整合利用起来,产生规模效应。

    2.2K70
    领券