Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据上报,你“痛”了么?

数据上报,你“痛”了么?

作者头像
腾讯大讲堂
发布于 2021-07-19 02:10:22
发布于 2021-07-19 02:10:22
9490
举报

作者:黄东庆 团队:微信支付运营支持研发团队  导语| 数据驱动是近年来很火的概念,可以优化产品体验、用于运营增长、发现质量问题,看起来无所不能,但是需要先有“数据上报”。而实际上在数据上报的处理过程中有很多痛点。业界“无埋点”的方案,早在十几年前就有了,但很多业务应用起来并没有那么理想,那么到底如何破局呢?

01

背景

先从两个案例说起,左上角这个本来我们是计划做一个漏斗图,但是因为前面开始刷脸上报的事件缺失,导致出现了葫芦状的漏斗,第二个案例是中间有一段时间数据漏报了,导致出现截断的现象,整个数据就不能用了。类似的问题还有很多,我们统计了一下,发现漏报的问题占比最大,其中有些是产品没提需求,有些是提了需求但是研发忘了埋,当然还有一些是错报、报重,还有一种是是报对了,但是数据同学理解错了,导致开发出来的报表或者分析也不能用。

02

为什么数据上报这么多问题

为什么上报这么多问题呢,我们从整个研发流程来看看。

首先在需求阶段,产品经理需要同步把功能需求和数据需求提给开发,但是产品同学最核心的职责是挖掘用户价值、商业机会,这个时候产品往往比较关注功能,因为数据分析是运营阶段才会用到,我们统计了上报tapd,发现42%的需求都是一句话的,40%的上报需求都是事后补上报。

到了研发阶段,开发同学不止要完成功能的编码,还要做埋点,比较琐碎,而且难以验证埋得对不对,因为埋点不像功能,做出来就可以自测了,要等上线后报表做出来了才能看到数据。

最后到运营阶段,数据同学要做数据分析了,这个时候往往没有数据定义,需要他们到处拉群去问数据的含义,非常低效。

能不能把这个模式转变过来呢?能否通过一种规范化的上报,不需要产品再提需求,研发同学按照一定的模式现自动埋点,产品想用的时候再把这个埋点启用就可以了。另外,数据定义要系统化,数据同学要什么数据直接在系统上查就好了,不用到处去问。

看起来有点理想化,怎么做到呢?

03

规范化:无需提需求

首先要搞清楚我们平时都在报什么数据。数据上报的本质是记录软件变化过程。

我们研究了上千个上报Tapd单,2000多个上报协议,得出我们的上报可以归为几大类,第一类就是行为数据,他是发生在我们系统的UI层,记录用户操作的过程。第二类是系统事件,记录的是系统的操作变化。第三类是业务实体,也就是我们后台数据库存储的对象,比如订单、设备、商户等信息。

我们就可以把这些规律总结成规范,指导研发什么时候该上报,这样我们就可以把所有需要上报的数据预埋到代码中,产品要用的时候只需要按需启用就可以了。

进一步的,如果代码架构足够合理,是可以把上报模式化,把上报自动映射到代码中,实现自动埋点。

04

模式化:自动埋点

自动埋点,其实就是自动化找到正确的位置,插入上报代码,我们基于前面分析出来的数据上报分类和规范,我们通过插桩、切面的方式映射到安卓客户端的代码组件中,比如用户行为,我们会基于一定的规范标准映射到onClick、onShow、onHide等组件,系统事件映射到doFacePay、setProxy、sendMsg等等。这样在通过后期的关联,我们就可以关联到事件图上面。

当然,只是找到事件还不行,还要能自动上报其中的参数字段,那么客户端如何感知需要哪些字段呢?基于上报规范,只告诉我们应该报哪些字段,但程序怎么自动把字段找出来。

对于基础字段,我们可以通过hardcode的方式默认上报,但对于个性化业务字段,怎么识别?

其实无埋点的方案,早在十几年前业界就有了,但实际应用起来并没有那么广泛,我们也去km和知乎上搜索过前人的经验,其中反馈被无埋点折腾到吐血的案例也非常多,核心是无埋点不能描述业务,对于个性化业务字段没有上报,也就无法做自动分析。

经过分析发现,其实客户端需要上报的业务字段,也来自于我们领域建模,不会凭空产生,而领域模型最终会转变成数据模型,会设计成库表存在我们后台,且微信支付所有的后台库表都已经实现了自动入库。

所以客户端只需要上报业务实体的id即可,比如播放海报这个事件,只用上报海报ID这个业务参数,如果要分析不同海报的数据转化,再关联海报实体中的海报类型字段即可。这样就好办了,客户端只需要订一个契约,凡是遇到非空实体ID,都上报上来,数据定义的时候在关联即可,分析时关联后台入库数据即可。

当然,无埋点还要考虑流量的问题,全部乱报会容易把客户端的流量搞爆,所以我们的做法是预插桩,但只有通过下发配置启用埋点才上报。

05

系统化:无需到处问数据

过去理解数据,需要拉一个大群来问,因为一般客户端涉及到多个研发,需要经常要拉10个人以上的群讨论一个小时,有时候研发也不记得报了什么,需要看代码,然后下一人用数据又要再重新讨论确认。

我们做了一个数据上报定义工具,定义出来我们上报了哪些事件,数据同学要什么数据直接通过这个工具查就好了。

另外,因为有了数据定义,我们就可以做自动化校验,把数据问题在开发阶段就暴露出来消灭掉,这样我们现网反馈的数据问题就明显收敛了,最新的版本,数据bug数已经很少了。

06

成果分享

讲了那么多理论,来一点实实在在的成果吧!

成果1:以前上线一个活动之后,需要看转化率,还要紧急提需求可以开发手工跑数据,一天就过去了,有时候发现少了上报只能紧急加上报再采集,啥时候能出数据就不知道了。

现在我们做到了全面的埋点,产品只需按需启用即可,并且由于有路径定义关联埋点,可以自动分析每个路径上的转化,想看哪个环节的转化直接获取,随要随得。

产品同学都很震惊,我们竟然提前预测到了需求。

成果2:数据监控上的应用,我们在升级版本的时候,观测到超时退出的比例飙升,然后活检成功率明显下降,后来反馈给研发是摄像头代码的一些问题,及时做了修复。

07

总结

数据上报,一个看起来很简单的事情,但其中的痛点相信很多做数据的同学深有体会,团队也经历过痛、无奈、迷茫的心历路程,与其去埋怨吐槽,不如当成这正是技术成长的机会,去探索突破。

坦白讲,本文介绍的绝非什么高精尖的技术,但值得一提的是思考顺序上的不同。往往看过有一些误区,即是先拿到一门看起来时髦的技术,然后看可以用到哪些地方,“好比手上有一把锤子,在想可以在哪里敲打敲打”,最后可能哪也不合适。而我们是先会看到底是“啥问题”,再看“用什么”解决,比如数据上报,我们不会一上来就说要无埋点,而先是分析了都在报什么,抽象提炼出了几种模式,然后才是怎么高效的报,高效的用。

笔者在过程中也非常纠结,无数次怀疑这个事情到底能不能做到,是不是太理想化了,是不是应该降低要求。事实证明,探索一个事情,首先要看到他的价值,如果是一个很有意义的事情,不需要一开始就用自己局限性的经验来判断它的可行性,也许经过多轮思考,它会由“不可能”慢慢变得“可能”。

但是,在行动上我们可以更巧一些,虽然长期我们追求很高的要求和目标,但不是说一定等着最佳方案才行动,因为大的突破思路往往是需要花比较长的时间进行讨论、推导,一些明确的实行是可以先并行做的。比如数据测试和数据模型定义,我们一开始就认为很明确,很早就开始并行实施,保证团队定期有进展和价值输出,不至于太焦虑。因为探索的路上很寂寞,很容易迷失自我,需要有一个良好的项目节奏在持续前进。

近期热文推荐

  你“在看”我吗?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大讲堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
产品经理必看:一文秒懂数据埋点
细看产品的内在关联,产品在数据流层面是如何体现,从数据流层面如何反映产品的真实情况。数据埋点是数据流的源头,影响下游数据流使用的效果。
腾讯大讲堂
2023/12/06
5.8K0
产品经理必看:一文秒懂数据埋点
京东科技埋点数据治理和平台建设实践
Tech      导读 本文核心内容聚焦为什么要埋点治理、埋点治理的方法论和实践、奇点一站式埋点管理平台的建设和创新功能。读者可以从全局角度深入了解埋点、埋点治理的整体思路和实践方法,落地的埋点工具和创新功能都有较高的实用参考价值。遵循埋点治理的方法论,本文作者团队已在实践中取得优异成效,在同行业内有突出的创新功能,未来也将继续建设数智化经营能力,持续打造更好的服务。 01  埋点治理背景 在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪
京东技术
2022/08/25
2K0
京东科技埋点数据治理和平台建设实践
数据采集上报之灯塔SDK详解
作者:jackhuali  腾讯PCG工程师 |导语  灯塔SDK当前的日活终端设备数超过10亿,日事件上报量超过万亿条,灯塔SDK是什么,灯塔SDK做了哪些工作来支撑如此大业务需求的呢?灯塔SDK是怎么保障业务客户端事件数据上报的准确性的呢?带着问题我们接下来一步步进行拆解。 灯塔SDK从2011年左右诞生至今,并随着PCG数据治理地持续推进,灯塔SDK逐步被各个业务线所深度使用,灯塔SDK逐渐收敛其余上报通道,成为了公司级统一的数据上报通道。 以下总结了大家日常对灯塔SDK集成、测试、数据验证等使用过
腾讯大讲堂
2021/05/10
4.3K0
用户行为数据采集系统
本文将重点探讨数据采集层中的用户行为数据采集系统。这里的用户行为,指的是用户与产品UI的交互行为,主要表现在Android App、IOS App与Web页面上。这些交互行为,有的会与后端服务通信,有的仅仅引起前端UI的变化,但是不管是哪种行为,其背后总是伴随着一组属性数据。对于与后端发生交互的行为,我们可以从后端服务日志、业务数据库中拿到相关数据;而对于那些仅仅发生在前端的行为,则需要依靠前端主动上报给后端才能知晓。用户行为数据采集系统,便是负责从前端采集所需的完整的用户行为信息,用于数据分析和其他业务。
王知无-import_bigdata
2020/06/05
4.3K0
MTFlexbox自动化埋点探索
跨平台动态化技术是目前移动互联网领域的重点关注方向,它既能节约人力,又能实现业务快速上线的需求。经过十年的发展,美团App已经变成了一个承载众多业务的超级平台,众多的业务方对业务形态的快速迭代和更新提出了越来越高的要求。传统移动端“静态”的开发方式存在一系列问题,比如包体积增长过快、线上Bug修复困难、发版周期长等,已经不能满足高速发展的业务需要。因此,美团平台自研了一套跨平台动态化方案——MTFlexbox。
美团技术团队
2019/08/20
1.4K0
MTFlexbox自动化埋点探索
大数据开发流程及规范
在大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会降低研发效率,增加成本与风险。
大数据学习与分享
2023/09/18
1.2K0
大数据开发流程及规范
《七天数据埋点之旅》第五天 埋点注意事项
关于作者:我是水大人,资深潜水员,一个基于开发、面向分析、走向全栈的饱经摧残的数据新手,爱折腾不爱玩,爱总结爱思考的老兵,错了改改了又错的惯犯。
木东居士
2019/04/24
1.2K0
《七天数据埋点之旅》第五天 埋点注意事项
用户行为数据采集:常见埋点方案优劣势对比及选型建议
数据采集是大数据的基石,用户在使用App、微信小程序等各种线上应用产生的行为,只有通过埋点才能进行采集。没有埋点,数据分析决策、数据化运营都是无源之水,巧妇难为无米之炊。但很多时候,“埋点”两个字却成
数据干饭人
2022/07/01
5.7K0
用户行为数据采集:常见埋点方案优劣势对比及选型建议
案例说|腾讯会议依托TAPD强大的开放能力,保障产品高质量交付!
作为支撑亿级用户的高频协作产品,「腾讯会议」通过深度整合TAPD的智能化、开放平台与插件能力,构建起“TAPD+代码托管+智研流水线+度量”研发效能体系,实现跨平台协同提效、流程自动化与质量强管控。让我们一起来看看腾讯会议如何基于TAPD重构研发效能体系。
TAPD敏捷研发
2025/02/25
1820
案例说|腾讯会议依托TAPD强大的开放能力,保障产品高质量交付!
有赞埋点实践
大数据应用一般会有采集、加工、存储、计算及可视化这几个环节。其中采集作为源头,在确保全面、准确、及时的前提下,最终加工出来的指标结果才是有价值的。
有赞coder
2020/08/25
2.7K0
有赞埋点实践
作为测试,对于数据埋点你知道多少?
Hi,大家好。大数据时代,多数的web或app产品都会使用第三方或自己开发相应的数据系统,进行用户行为数据或其它信息数据的收集,在这个过程中,埋点是比较重要的一环。你知道什么是数据埋点吗?作为测试重点要关注哪些方面?以下就给大伙解析。
可可的测试小栈
2022/03/03
4.3K0
作为测试,对于数据埋点你知道多少?
「经验」数据埋点很重要,这些内容你需要掌握『上篇』
解决痛点:日常分析中的数据是如何采集的?埋点在其中的作用是什么?数分同学又担任了什么样的角色?相信本文可以帮助到你。
小火龙说数据
2022/06/30
6710
「经验」数据埋点很重要,这些内容你需要掌握『上篇』
客户端埋点自动化实践
埋点是在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是运营的数据支撑,包括访问数,点击量等等。
测试加
2023/11/20
5900
客户端埋点自动化实践
产品经理日常数据分析工作
作者:alishayang,腾讯 TEG 数据分析师 我们期望每一次的产品功能上新、功能改版,都可以带来更好的交互体验,项目组所关注的指标都能有大幅度提升。但期望并不代表真实效果,功能上线后带来的真实效果还需要通过数据进行客观描述。在这篇文章中,我们将对产品数据分析日常工作进行剖析,从数据采集到产品分析框架的梳理,进而介绍如何通过数据对产品及运营进行反哺。 产品经理作为产品功能的发起者,在众多需求中挑选出来可做需求时,心中就会有初步的构想,新功能能够帮助产品覆盖哪些增量用户,新功能又能带来哪些指标
腾讯技术工程官方号
2020/11/09
8250
2021 GMTC北京站 - 大前端工程提效分享与总结
2021GMTC一共分为16个专场演讲,几乎涵盖了目前大前端所有领域,感谢公司和秋实提供的机会,在7月4日有幸参加了大前端工程提效专项的分享,本次专场分为以下四个议题:
五月君
2021/08/10
1.4K0
2021 GMTC北京站 - 大前端工程提效分享与总结
数据团队思考:小型数据团队发展的6大建议
总之,这个吐槽内容是挺多的,就不多写了,有过类似工作经历的朋友应该会有很多共鸣。鉴于这些吐槽的内容,居士将从如下几个方面来分享本篇的主题:小型数据团队发展的6大建议
木东居士
2019/11/12
9390
赢天下,技不凡:小赢科技与TAPD奏出最美和弦 | TAPD经验谈
小赢与TAPD的缘分,是从2015年6月项目X5落地开始的,那时的小赢创业不到一年,公司只有50人左右。 随后,TAPD一直陪伴和见证小赢的每一步成长,小赢从不足百人发展到千人,项目也达到了20个。 终于,小赢上市,迈入新历程! 回顾往事,我们与TAPD一起迭代、蜕变、进取,上市也仅仅是新的开始。 那时,我们的业务涉及客户端、前端、后台逻辑,项目过程全部通过个人微信,信息获取及管理、沟通协作变得异常困难。 一开始,我们仅仅希望找到管理需求及缺陷的地方,信息集中存放、来源唯一,让我们不淹没
TAPD敏捷研发
2018/10/29
1K0
赢天下,技不凡:小赢科技与TAPD奏出最美和弦 | TAPD经验谈
数据分析原理:6步解决业务分析难题
读书交流│7期 数据分析原理 6步解决业务分析难题 data analysis ●●●● 分享人:夏宇 大家好,这里是小飞象·数据领地·读书会第7期完结直播总结分享,本次直播的目的有两个,一是我们第7期读书会的总结,给大家梳理一下《数据分析原理》这本书的精华内容,二是为我们,参加这次读书会,并完成全部任务打卡的小伙伴们,进行结业颁奖。分享时间大概在一小时左右,大家要坚持听到最后哦。(可以在公众号留言交流,读书会往期回顾) (夏宇个人公众号) 做一个对世界充满好奇的人!我们在工作中或多或少都会遇到很多的业务难题,有些人在解决问题时会根据过往经验解决,但往往这种凭借经验拍脑袋处理得到的方案并不一定会对业务有增长效果,甚至根本无法真正地解决问题,但是如果你可以具备数据分析技能和思维,找到关键影响的数据源,通过对业务模块的判断,确定分析方法的适用场景,最终推演、验证、分析出结论,并选择最优的分析结果展现方式,让数据分析全过程形成闭环,有助于业务增长和问题解决的。 但是,我们学会了很多数据分析工具和技能,依然做不好数据分析。遇到业务问题时,常常觉得无从下手。如: ▶如何理清业务分析思路?如何成为业务的专家? ▶如何获取行业的数据?基于不同场景的如何选择合适的方法? ▶如何写出优秀的数据分析报告等~~ ······· 所以本期,小飞象·数据领地·读书会的直播总结,就来跟大家一起来品读《数据分析原理》:6步解决业务分析难题,系统地介绍了数据如何始于业务、取于业务、用于业务。既有扎实的理论铺设,又有具体的案例支撑,通俗易懂地回答了数据“怎么来”和“怎么用”的问题。同时,本书总结出了解决业务分析难题的六大步骤。 在这过程中,建议全程认真听,带着思考来听(去看),有任何问题都可以随时交流哦! —▼—
可以叫我才哥
2023/08/28
6500
数据分析原理:6步解决业务分析难题
提升研发质量,元年科技是怎么做的?
元年科技,深耕中国企业服务20年,服务上千家大型企业集团,是国内管理会计、财务管理等专业领域的领导者,对金融、地产、零售快消、装备制造等行业有深刻的洞察和丰富的经验。 本文整理自元年科技研发流程总监周晓芳在TAPD思享汇上的分享,为大家分享元年科技如何通过TAPD标准化、规范化研发流程,如何通过TAPD量化质量管理,高效交付业务价值。 Part 1 元年科技敏捷项目管理背景和管理思路 随着企业数字化转型逐渐深化发展,元年科技的客户规模越来越大,对团队持续交付提出了更高的要求,元年科技开始在研发流程上面临以下
TAPD敏捷研发
2023/04/07
4780
提升研发质量,元年科技是怎么做的?
有赞ABTest系统:数据驱动增长实践
有赞是一个商家服务公司,致力于帮助每一位重视产品和服务的商家成功。随着移动互联网的流量增长红利渐渐褪去,商家获得新的流量越来越困难,帮助商家实现更有效的流量转化与长期目标的增长是有赞SaaS服务的应有之义;同时,随着有赞SaaS功能的不断完善,服务的商家不断增多,而业务场景也越来越复杂,考虑到有限的研发资源,提升产品和技术的迭代效率成为当务之急。
有赞coder
2020/08/24
1.9K0
有赞ABTest系统:数据驱动增长实践
推荐阅读
相关推荐
产品经理必看:一文秒懂数据埋点
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档