00:00
好,接下来呢,我们看一下第八章啊,第八章呢,是你日后工作的时候啊,必备的武器啊,因为面试官最喜欢问的一个问题就是你项目中遇到过哪些问题,然后怎么解决的啊,最喜欢问的就是这个,那如果说你说没遇到问题,那直接凉了啊,那你看给他怕大家这个不会总结,直接给大家列出这么多啊,都是比较经典的,比如说第一个孩子么,当机了。啊,那淡机呢,其实刚才讲过对不对,哎,从这个mmr这个运算的这个mmr内存暴露啊,分配的不合理,就是导致它忘机了,那另个呢,就是这个前一集往这里面写的数据太多了啊,他这个处理不来,那这时候你可以加一个法的缓存啊去处理啊好,那下面呢,就是那个刚刚啊,刚才刚才也说过,其实这些都是一个汇总,总结了,他监控这个母发现这个尝试提交的这个次数大于了这个最终成功的次数。
01:05
那你就要考虑增加内存,增加台数,那增加内存的就在这个因点里面,那提交台数那没的说了啊,加数器就行了啊好还有一个呢,就是这个浮动小文件,你发现你大家配置好这个,呃,机器之后就产生小文件,每天晚上大量的小文件,尤其是浮众往上传的时候,那其实呢,就是这三个参数。你没搞定啊,那第一个参数呢,其实是控制这个文件的时间啊,3600秒,也就说一个小时,那这个呢,是控制文件滚断大小啊,这大小一百八套,还有这个是那个一文的个数,那默认的是零,一般情况下几开中都把它禁止了啊零啊好,那还有一个问题就是哎,卡坏了挂了怎么办?面试官也问,那你卡挂挂了啊,其实挂了没事,跟他解决清楚啊,有辅记录,有日记录啊就OK了,好还有呢,就是港那个数据积压,那你怎么处理啊,刚才其实也讲模了,那一个呢,就是这个增加分区,跟这个现场不一致,那另一个呢,就是这个提高下一级这个消费能力啊,消费及时,还有卡卡中啊,这个数据重复我怎么办啊,可以继续消费,同时还可以可以去重啊,我下一级是不是有里面可以去重啊,啊去八行为也能去重,但是呢。
02:30
这是有个bug的,18个重容易产生OM,尤其数据量很大很大的时候,18里面已经出下了,那这时候最好就是放在里面啊,达成机去处理,像这个凤凰网内部就产生了这种这种方式啊,之前来过老学员也遇到过同样的问题,他就在这个里面去预算了啊,但是呢,内八里面保了内存当中缓存了2亿条数据,直接就OM啊,后来呢,把它放到这个里面就好了,好,那另个呢,就是买S这个刚朋用,也就说你可以说你开始的时候这个MYSQ没天成高朋用,突然间买SQ崩溃了,你的数据没了。
03:10
啊,然后这个风险很高,那后边呢,就把它配置成这个,呃,高用了对不对啊,配成这个重复制配置。集群的话吗。那就得那也是你也得配这个老大呀,他会不会不是你这个,你是集的话,他是集群,它数据量数据都不一致啊,每个人存一点吧,对吧,但是你看你配成集群是这样啊。你你哪个存一点他挂了,那这部还是损失啊,你现在配置的高可用是主成不是我这里面一人一份能懂的意思吗?对吧?啊,他不一样啊啊那这个呢,就是可以配置这个UDF和UDF啊,主要是方便调试,你说在那个呃,用这个系统函数的时候,发现有的时候他各种报错,或者盯到一些呃到一些日志,那这时候你可以用这个自定义utftf把这些这个异常的这个数据抓出来啊,那方便你去调试啊,还有这里面这个坑你们应该不知道,只不过数据导出的时候,呃,导出ADS上的数据是含费的。
04:27
就是A上建表的时候建成那个排位的,那你往外里导的时候导不出去啊,直接就报这个类型转换异常,类似这种,嗯,出错,那这时候呢,你有两种方式,如果是人家已经建完的表,你没法动了,那你就要建一张临时表,是把它先导到一张临时表里面,临时表里面不是的是正常的test啊,就OK,那还有一种,那如果是你有权利改列表的话,那我就把它改成它不就完了吗?这两种结果啊,OK,这个企业当中,咱深圳有个学生,你上班第遇到第一件事是这个。
05:02
啊,导不出去就是这个类型的事啊,啊还有呢,就是导出过程当中啊,涉及到这个的这个存储的性问题啊,导进过程正常情况下出现这种呃乱码啊啊不一致啊类似种啊这个也是要注意一下,可以加上这个这几个参数去搞定。还有呢,导出的一致性问题,那如果你设置这个导出的时候,这个ma多,那你最好加上这个杠杠table,先把它导入到临时表啊,然后临时表再往里面事物去导啊就OK,那后面涉及到的是这个Spark相关的,嗯,Spark相关的什么SPAUR关闭,后面呢,还有什么SPAOM数据细节怎么解决的,其实类似这些问的都是这个。调优嘛,对不对啊,就是如何调优啊,就这些那比较多啊,我理解你们,但是呢,该背还是背是吧,没招行那这是这块啊,也说你遇到过哪些问题,这是列出十堂的,当然你可以再加一下啊,那另个呢,就是项目经验,也就说呃,前面那些属于这个我全覆盖了,那如果从那些通用的武器当中再拎出来一些特殊的。
06:16
啊,能有亮点的那都在这啊,项目经验分成框架部分和业务部分,那框架部分的包括这个这块啊,能拿的出手的,像有那么基准测试啊,做完机群之后测试它的读写性能外标识计算能力测试,那这些都是非常关键有用的。另一个呢,就是一台服务器一般有多少个插槽啊,有一到四个啊,一到一个两个三四个啊都有,那这时候你要配置这个电动的,要配置成多录,直接把你的插槽对应的目录全部配上啊,一会你日后你插上直接就能自动识别啊,就可以存储了。这要注。这不是要感知啊,这那个你只要插上那个盘,那个nu配置一下啊,这个外部挂挂载一个设备啊,那就能找到它,对不用重启,那另一个呢,就是内的啊,这个和内的通讯啊,让它保持正常畅通,那就是20的二倍啊进行的个数啊,进行参数,这个参数还有呢,就是尽量文件和编程式尽量分开,提高动能量,雅安的这块呢,就是服务器单节点雅安上可使用的物理内存默认是八个G,单任务可申请的最大物理内存默认八个G,还有单ma task默认内存一个G,单re task默认运行一个G啊。
07:37
还有一个要注意一个长期性的了解,就是ADS和硬盘的空闲控制要在70%以下,到达70%就要报警了啊,这能什么样?好,这是开动了你能拿得出手的项目件,就是在真正的项目开发时候,这些参数是你需要考虑的啊,必须要看,要琢磨的好,那这个呢,就是那块,这块呢就是内存的配啊,那这个呢,通常情况下你要调到内存啊,通常是4G哈,还有呢,如果你是这个才能优化,那只是把它配成多控啊,而且这个呃,这个检查点和备份检查点让它尽量分开,还有这个小文件啊,附动这个小文件,这三个参数的一个配置啊,3600秒一,一个小时一百八套啊,但是你两个小时也没问题啊好,这时候呢,卡布瓦这块能拿的出手的卡布测试。
08:37
大巴机群是一定要测试的,生产的那个消费能力,同时这里面还有个注意事项,卡布尔的内存最大不能超过六个G啊,超过六个G呢,它这个实际性能已经达不到这个要性了啊,就最大六个G,这是国龙老师腾车了啊,后面呢是这个卡卡数一下啊,就说算多少台卡法数量啊,二的N加一啊,具体的在这它卡法这个里面。
09:06
每分钟多少条数据啊,每秒钟多少条数据啊,以及它这个这种啊,最多呢20兆啊啊,我觉得30兆也没问题啊,每秒钟峰值呢,是这个卡数据积压,这也属于啊相积压问题啊,这个说过多遍了啊。重要东西反复再说,包括原数备份,又说了一遍,探子引擎啊,数据优化石参数纳控值啊,一次性,还有导出时的时间,五分钟到两个小时去数量,还有呢是@卡班,这个是每天执行多少任务啊,那正常就是100~200个指标啊,100~200个指标,那这里边呢,如果是200个指标的话,每一个指标呢,需要六个任务啊,咱从第ods到备数啊,当然也有一些是公用的任务啊,公用的任务那至少也在1000多个左右啊,先走,那每天运行test这块,那你这个task一个也就五到八个左右啊,你再乘一下,因为每个指标它数据量可能不一样啊,数据量越多那基就越多,那这个任务数呢也就多一些啊,那这里面比较常用的是这个任务挂了怎么办啊,其实任务挂了呢,它是无论运行这个成功还是失败,他都会发邮件。
10:26
啊发邮件,那当然还有一些公司呢,是进行了二次开发啊,如果特别重要的任务错了,直接这个邮件就会触发什么呢?呃,处罚电话啊,直接给报警了,把你这个嗯叫醒啊,叫醒之后你就打开你的电脑远程操作一下啊,把这个任务啊,一般那个重启一下啊,或者重新跑一下啊,就差不多了啊。好,这是这块,那后面呢,还有这个业务经验这一块,那这个呢是非常非常重要的哈,项目框架我都不担心,大家都能搞清,但业务那就不好说了。
11:05
好,那下面呢,我们看一下这个业务这块,那第一道题OD面试官问采用了什么压缩啊,而且呢,存储格是什么啊,这呢我们采用的比如说三,当然你可以说拉缩哈,没问题,只不过是胡龙老师他们是三和这个是吧,嗯,他这个压缩比呢,是他当时数据是200G压缩成20G,那咱们呢是100G就可以压缩成10G左右,10G左右,OK,那还有这时候电压层你要记住有压缩和存储,那到了DW历程,他会问你做了哪些事,那这块其实做的事还是比较多的第一件事。记住。啊,这种好,第二件事,过滤核心字段无意义的数据,比如说订单ID中为空的,支付表中支付的ID为空,核心字段不能没有啊,这要注意,那另一个你们最后项目实战是不对手机号身份证号类似这种脱敏呢?哎,敏感数据要脱敏要注意,还有对业务数据传过来的表要进行。
12:08
维度退化和降维啊,就一定要降维啊。将来你像咱们之前是把一级分类,二级分类,三级分类,呃,商品表是不是合并成商品表了,嗯,对好,那在时候这道题你们应该不知道,将用户行为的表数据和业务数据的表的数据进行一个一致性处理,什么叫一致性处理呢?比如说用户行为里面有评论,收藏,点赞。其实在加一里面也有平均成长,简单。两边都去记录这些数据,那就涉及到一个最终我们用谁的。啊,而且还有有有的时候是有的字段,它别空啊,比如说业务表里面这个字段不完整,行为表里面有,那还有行为表里面没有的,右表里没有,你需要对这个数据进行一个整合啊,比如说你看这边看啊,它如果空,那我就用B点为表啊,就把他们两个整个,如果两个都有,那你可以选择一个把它把进阶或者默认我用一个。
13:12
嗯,这是一个真正的开发的时候要做的事情,有这个数据我尽可能要保存下来,方便我去分析好。那在之后,那在里面我们说过用过输入数据清洗,那数据清洗的手段有很多种,比如说有口有有R,有开头有P,对吧,那我们在项目中用的什么,是不是circle口,而且你们项目实战的时候用的SPA吧,啊SPA啊都行啊,其实在真正起当中都有啊,当然也有用开头的开头,其实它他也是写的什么。啊,只不过是这个外部页面是图形化图出来的啊,里边还是用生后实现的逻辑,那还有那就说在这个过程当中,你清洗掉多少条数据上合理啊,那阿里工程师之先给个咱们一个值发射机。
14:04
啊,1万条清理到一条,那就在合理范围内,如果你清理的特别多。那就说明你这个信息规则的问题,另一方面,如果规则没问题,那就是你前一级加一的张数据太多了,你就要找他去谈了。嗯,对,要聊一聊,看什么原因导致这个产生这么重要的数据啊,好,那你看这就是我们DWD层比较重要的东西,那你说你在面试的时候。这些东西都是你要说的,这不是你要干的活。啊,这是你能撑过十分钟20分钟,撑到一个小时,两个小时的资本就在这,那再来达到S层。你看每一层我至少都能说个十分钟知道吧,DW层这里面你要记住有三到五张宽表,这三到五张宽表用来处理100~200个指标啊,用来处理100~200指标。
15:02
啊,那解决的呢,是70个以上,70%以上的需求,比如说具体方面名称,而且名称问具体哪几个宽边,你不说了,有三到五个吗?下一个问题就是你有哪几个,那至少要有一个用户行为宽边。同时还要有用户购买商品行为表,这常数有吗?啊,有吧,用来分析那个复购率吧,商品和表也可以有购物车表,款表也可以有物流的,款表都是注册的,售后的等等都可以,但是你要说出你心目中的那三张五张啊,记在咱们在去哪网就三张表。啊,客户的飞机的,还有这个航班的啊,类似的没有,但是每张单里面六到60~100个值班。嗯,那你想想你的心目当中有多少个面,那每个表每多少个,你看我这样说完第一个你我先问的是你有多少张表,你说哎有三到五张,那下面哪哪五张,说出来之后再现就是哪个宽表最宽。
16:11
哎,那我们就可以说用户行为怎么样。那还用问那这个宽面宽有多少多少我知道。60~100个,那再往后,那这个用户你发现没有具体哪60个字段。嗯,我已经给大家准备好了,差不多这些,你就你就像这些啊,不过60个,但是啊,我都给列在这了,差不太多,这是咱们有学员在企业当中真实的项目。哦,吵起来了,都在那儿。你一口气说出20个来,直接就服了,没什么对不对,但是在这过程当中,你噔噔这个慢慢生的说出来,那意义就不大了啊,我怕你们不会说,我把这东西全弄你这。啊,完全是真实企业当中对吧,他就把一些敏感的字段脱敏了,敏感的你们应该知道也是什么。
17:05
对吧,啊,就用户的一些个人信息呗,手机号啊,啊,身份证号啊,家庭住址啊,但是这些东西干掉了啊,剩下都在这啊,你看吧,就是这些你在脑里当中有没有,如果有这些那就OK了,还有那边什还会问一些实际情况,比如说我们。你这个商品详情到购物车,到订单,到付款。转化率是多少?嗯,尽这种实际问题,你们挂就挂他这种啊,这种问题上你要今天算的话,肯定知道你还不不在意,但是你没干过,你就你就觉得当时就懵了。嗯,当略吗?那其实呢,就商品价庭当品购车,他的转化率会很低的,你想际想你自己你买的东西哪,你逛一下商品你就会买吗?不会吧啊,那这种人就很多,就就会这个率就很低,那在你把这些东西一旦添加到购物车意向就很足了,那往这订单上就会OK,那这个订单再往这付款。
18:05
那就更足了,对不对啊,就越来越多,越来越多属于这种递增的趋势啊,大概是一个范围就OK啊,符合这国,你要你心目中的这个转化率好,那还会问你每天的GMV多少。祝美的郊游。还会问哪个商品卖的最好?每天的下单量多少?都是非常实际的问题,很简单,同时又很难。啊,那看对谁来说对吧,那来吧,那你是每天是100万的日活,那至少每天大概有十万人去购买啊,我估计这应该是一个合理范围啊,但是你说这个五六万也OK啊,这不一样,不同商家不一样,卖的东西不一样,转化率也不一样,那假如说咱就10万个人购买啊,一百万一百毫人篮牛览十个人吗?有一个人买了,平均每人消费100块钱。啊,那一天就相当于是1000万啊,你觉得多吗?其实1000万他挣不了的钱啊,你想想他是个平台,他是抽银红呗,对不对,100块钱都能提多少的利润呢?嗯,而且他有这这么多开发成成员呢,对吧,每个成员一天也也不少钱呢,而且强大的这个运营团队在后面的啊,公司要有运营,运营成本的,所以说这也就能这个处理一个基本的一个运营不亏本是不错。
19:28
啊,这种情况,那还有台湾卖哪个商品卖的最好啊,我随手写了一个面膜啊,我觉得这个,嗯,这个可能是跟女同志买的东西比较多啊,而且平时呢,买东西可能也是女同志比咱们男同事多一些啊,啊那每天问你销售多少啊,我这写了个5000啊,这也差不多啊,销售完了那还会问每天下单量有多少。那我这有十万人是吧,十万人下来,这些问题是你需要认认真真踏踏实实准备的啊,好,这是属于给大家抛砖引玉啊,知道这些,有时候面试官他就会这么抛沫,问你的是问啊,下沉式的逼迫你啊,看你知不知道。
20:09
啊,如果你这时候能扛得住,那就OK了啊,你就想想,你是一个客户,你是一个商品啊,你是一个客户,你去购买这个商品,你是一个什么心态,到哪一步你会拦截多少。那下来之后呢,你要一分钟之内至少说出30个指标,在面试过程中,底线指标。啊,那离开指标呢,有这么几,这是分别别类一个学生写的啊,这不是我写的啊,按照这个不同的分类啊,咔咔咔把页都说出来,这就是你干的活对吧,我就写这些指标,而且每个指标他是怎么算的,你要准备。啊,你要怎么算呢?那多多简单啊,这东西啊,啊太多了,那不难的,那像有些就是一个抗上是不是这些你看你看这金额,那不就求差吗,笔数是不是看的呀,这完了吗?嗯,这都不难啊,包括转化率,那不就是一个相除吗?嗯,好,那这个呢,你可以参考这张图啊,写出你自己的30标,这张图非常非常经典啊,非常经典啊,可以好好看一看,好你看它这里面成的是这个流程分析,用户分析,商品分析,甚至是三个主题嘛,至少是三张画面对吧?好,那这里面还给大家一些参考,那这是又有四个学生的一个参考。
21:31
怕你写不出来,那这会还会问再问什么呢?你说完这些指标降下来了,你分析过哪些最难的指标?嗯,那你至少要准备两个现场,直接能写出来,而且这些题你要主动出击。在面的时候我就说我我之前哎,不经意间是我之前这个在写书上的时候还遇到过啊一些坑啊,分析过一几个比较难的指标啊,像这个什么什么连续,那这时候连什么你感兴趣诶你写一下呗,咔写出来立一刻成功率就高了。
22:04
就这么简单是吧,这个啊,像最近连续三周活跃用户,还有最近七天连续三天活跃的用户啊,你看我这张图已经拆解的非常非常细啊,直接一看就能看得懂了,好,接下来面试官还会问书上当中每天跑多少张表。大概什么时候运行,运行多久?啊,这也是你们蒙的啊,一问就一个蒙的啊,都在这呢,那基本一个项目呢,建建一个项目,建一个库啊,这没问题,库里面有N多张表,那像咱们这种级别啊,70~100张表没问题啊,原始表加上这个分成的表啊,差不多这个这个情况,但是再多一点也OK哈,啊,因为你要指标多的话,你可以再多一些啊,那还有每天什么时候跑啊,这个呢是TCL内部,他们是每天呃,凌晨30点的时候啊,30分去跑,那离线报表控制在多长时间呢?八点之前必须跑完啊,有的公司九点啊,九点之前要跑完啊,八小时之内,八小时之内属于这个类似种行规了,差不多都在这个时间内,把所有任务,不管你多少,不管你有多少任务,必须在这个时间跑完好,那这个呢,顺便把这个实时的实时的时任务呢,一般控制在这个五分钟之内,能把这个结果事当然有长的哈,有长的啊,但是通常情况下是五分钟像。
23:26
战桩呢,是书当中啊,使用了哪些文件存储格式,那你要知道啊,有什么这个T啊,RC orcc反贵的啊,这个少一点。C啊,就这还有一般企业使用的是C和啊这个确实居多啊,尤其是这个C啊,它那个压缩比啊比较高啊,也不说叫压缩比了,这个劣势存储这个占的空间啊会少很多啊劣势存储的。呃,另一个呢,是书上当中啊,之前问过用过哪些有脚本,因为他们干啥了啊,写没写过,那你这里面你看咱们写过的实打实的写过的启动停止呗,对吧,还有这个词付管理书上之间导入导出找本啊,还有乘积之间导入导出对吧。
24:21
好,那面试官他还会问项目中用过哪些报表工具,这个也是比较爱问的,那像咱们这个视据可视化用的就是这个一之前还问是哪个公司开源的,百度啊,百度啊,这是百度的啊,百度的啊,后面呢,还有这个像啊,也是对着ES的对吧?啊ES进行换的,还有再问大家一些问题,测试相关的啊,这个一问一个量,基本上你们就是啊,为什么?比如说你们公司,公司当中有多少台测试服务器?它跟生产服务器是不一样的,对吧?生产服务器比如我们生产网的方向运运行的,你天天能用生产环境,你你去写指标吗?不可能啊,正常情况下这个测试服务器呢,都是那个三台,一般情况下就是三台居多啊,三台对,那这个不算在那个生产环节集群上啊,OK,而且先买的一般都是先买这三台,有的是买一台虚拟三台,跟你的虚拟机理一样,配置都略低一些啊,那还有呢,就是测试数据哪来的,这也不问。
25:33
你怎么来的自己照的对吧,那就有就有问题了,你光自己照的也不行,你光自己照的,你万一这个你这个解我照的数据肯定符合规则对吧,那到生产完全解析不了呢,尤其限于D1DF或者这种这个分类型或者过滤你测试不了的,那什么情况下数据最真的,他就是市场汇率哪来的数据是最真的。是的,哎,那往往情况下呢,就会重生产部,就是你先自己照一部分数据把这东西跑通了,而且测试这个指标要测试的正确性。
26:09
啊,你说你这个日国今年是1万,你怎么能告诉我它就是1万。拿出你什么证据来证明他1万,那这种其实就是我自己照这个数据,我就照1万条,而且按照我的规则照的,那出来它就是1万嘛,是不对吧,那我能证明它正确性,那同时我这个用这个生产数据干什么呢?啊生产数据我能能让这个通道正常的功能畅通。对吧,因为我用这个数据他都能跑得通,那就说明我这个通道各方面解析啊,运行啊,分类行啊,各方面都没问题啊,他设置的这个维度不一样,一个是保证它这个正确性,那正确性呢,你这个数据就要求他必须得是。精确是多少,也是非常清楚的输入源,那像这个要证明这个功能是OK的,那么只要他有数据,而且是生产环境数据就够。
27:03
是吧,所以说他俩的观点不一样,所以说你要准备两份数据啊,一部分是你写的,另一部分是市场环境数据好,那还有那往下测试环境什么样,你说你测试环境什么配置。啊,那你像这个生产环境128G内存,那测试环境呢,一般情况下,这是TCL内部啊,他们是是测试是生产环境的一半配置啊,你说你是那边是6.8G,那我就60G,你是60G,我就32G,因为他跑的数据量呢,毕竟少了一些啊,当然有些这个公司就买了便宜的啊,我遇到过啊,就是那个有的咱学生买三台16G的啊,服务器也就玩了,玩起来了啊,一样跑啊一样跑,甚至有一个别一个个别一个公司啊,特别变态。16G内存,一台服务器,把所有框架全跑起来,要求啊,那根本就跑不动了,我这32G我都跑不动啊,让他去跑,但是他说了每天的数据上两兆,对就很少,就是为了你跑一下,对好,还有测试之后如果上线。
28:12
啊,设置完成程序怎么上线,那上线的时候呢,需要这个将脚本打包啊提交到B呢。啊,然后这是一些大正规公司啊,发邮件操作给经理总监啊运维的之后呢,运维的就会把这东西发现,你要在京东内部的话,直接一个外部页面啊,添加附件直接上传,你根本就看不到集群什么也行呢,啊给人个文进行,人就给你进行。啊,这是不同公司不一样啊,当然这个要运行生在生产环境下要运行程序,那是要有老大批准的,不是你想跑就跑的啊,这要注意行,那后面还有项目实际工作的流程,你说你在这个工程当中,这个项目怎么干的啊,拿过来就干,干啥呀,得有需求啊,那首先是先与产品进行讨论啊,看报表的各个数据从哪里来点取数据。
29:08
因为我要分析这个指标有没有数据。啊,这个呢,是要跟这个呃,产品经理讨论沟通啊,说我们要去什么样的数据,从哪些买点,但具体买点不需要你。你可以找这个前端啊去啊,在产品经理找了跟你没关系,将取得的这个逻辑过程设计好,与产品经理确定后开始开发啊,就需求明确了之后就可以干了。一定要明确需求,否则你干这东西就是白干啊,特别重要,经常有这种事啊,而且啊,要做好记录。只是个需求的东西啊啊整一整就大家都不知道,说我不是我不是你这么我不要开发这个东西啊呃,开发的那个不对,你你之前说的那个不是这个东西啊,这个不要涉机啊,最好落在纸上啊,不知道纸什么开发通报表,最后脚本,并且跑几天历史数据观察结构。
30:05
就拿生产环境以前的数据跑几天,看看这些东西是否功能畅通,这很重要啊,这也是为什么说这个我做一个东西啊,就下面说了哈,需要多长时间啊,需要多长时间,好优试表,好将报表放入到这个调度任务中啊,第二天查看结果啊,这是测试环境啊,好周期线接表结果导出与导入后,后台数据库啊,生传可视化报表啊,这是可视化展示啊一块这边要说的,所以说要先明确需求啊,讨论是否需要这个买点,需要买点产品经理就是找那边那个前端妹子啊,然后之后呢,这边呢,你要确定好你这个方案怎么怎么算好,大概心里有个思路之后,跟这个产品经理沟通好啊,之后再出去干,那干的话也是先要写一些脚本,跑一些历史数据啊,畅通之后准确无误了,然后再正常的上线哈行,那后面就涉及到一个项目中,要想实现一个需求。
31:06
大概多长时间,或者说项目经理给你个任务。给你多长时间啊,你去人家问你,你需要多长时间。那这时候你别拍着胸脯说,十分钟我写完了这个舌头。那完蛋了对不对,你十分钟你洗完之后谁敢用啊,你是不是得测试一下,你那生活是OK的,至少在测试完境让再跑一下啊,啊这要注意,那一般情况下刚入职第一个需求通常情况下要七天左右。这七天的时间有这么几个地方需要遇到,我来说完吧,七天,如果这业务熟悉的话,需要一天啊,一个需求,那主要影响时间因素的就是首先开会讨论。我刚才说了吗,你这个需求讨论完之后,你得跟那个什么是叔沟通一下,我就问对不对啊,这个逻辑是不是你想要的这东西,这有没句好啊,之后呢,是表的权限,你是否涉及到一些建表,是否涉及到读表的权限。
32:03
啊,是否涉及到网表里面插入数据的权限。这些都要申请开,这个申请打开的,而且这个时间是不可控的,因为都是你的老大,你还不好去刚去的,尤其是对吧,再就是这个测试。啊,写完这个指标,你肯定要测试,那包括这个生产环境的这个测试生产数据,你要跑两天数据,那同时呢,还有这个,呃,你要写一些设置代码,生成这个数据。所以说这个时间就会很长,七天你能跑完一个就不创了,那为什么说以后就时间短了呢?因为以后这些东西就熟了,你看表上权限这块你可能已经有了,测试照数据这个脚本你基本也有了。对吧,啊,而且呢,这个跟那个交流上你可能也会更顺畅一些,尤其是你对这些业务表,100多张表,每个表的功能大概的含义也知道了啊,而且不需要花太多时间去熟悉这个字段。啊,这就是为什么说越往后时间越短,那前期七天都不间冷是吧,这这件事啊,那这块就是你要评估说我们要跟领导要多长时间啊这个。
33:13
那还有还会问诶,你项目已经这个在这不是干了三年了,那你项目迭代多少次,你升级了多少次啊,而且怎么迭代。啊,一问优良是吧,啊,差不多一良透了是吧,无所谓了啊差不多一个月啊会迭代一次啊,这是CL的那个老师写的啊,将产品啊或我们提出的这个优化需求,然后进行评估实践啊,就产品啊,产品经理会提一些需求优化升级,其实我们自己有的时候也会自发一些啊,提些需求,每周我们都会这个开会讨论,下一周的或者本周的一些总结啊,这个呢,就是有产品经理发起,有的时候也有我们自己发起的。啊,这也是,有的时候面试的时候,面试官还会问,哎,你你自己对这个需求有什么想法吗?
34:06
啊,其实他就感觉就是你需要做一个有头脑的人,并不是一个产品经理,只盼你干什么,干什么你就干什么,不是这样啊,我就自发的我我这东西对这个公司这个运营啊,对营销部门有作用,那我就做一下啊,提出一个需求啊,这是好的一个程序中。还有这一到项目开发中每天做什么事,这也是你们需的。啊,你不知道你们在干啥啊,对吧,其实就是新需求,比如买点啊,是报表来之后需要设计出的方案,设计完成之后跟产品经理讨论,前面是买点,然后讨论,然后开发,那开发的话那就是简单了,就是你自己去写这个视口,然后测试啊,然后跟这个,呃,项目经理去交流时候,有没有一个表格权限啊,各方面业务的一个要啊出商的任何步骤出现问题都需要调整问题,比如说某个指标,比如说。
35:02
这个活儿最多的。运营找你了是吧,今天的日活下降明显。你给我分析分析原因。啊,就哪些用户他怎么就没了呢?啊,他就不登录了呢,啊突然间哪一类用户不行了啊或者说呢,今天突然间猛增了什么用户,那你要把这一类用户的人群特征给我出来。啊,这种事情做多就跟这个运维相关的,哎,突然间今天G多了啊或者少了。什么原因导致的,包括里面不是有一个同学那个编题吗?是那同学我记得是给一串数据啊,一个是是交易额什么了,现在没化了。日活对不对啊,日活就是一个日活,七七天还是几天,一个月一个月的日活,从这一个月的日活当中分析。你能看出个什么事,那其中那个是中秋节吧,什么清明节那三天啊,清明节那日活天数那个人就多是吧?啊还有这个周末人多,那这就是你你需要掌握的啊,那不管买啥,就是你想你买东西你什么时候买,你是不是在过节,那闲着没事的时候看看手机要买点东西啊,或者是人家搞活动了,我买点东西,但是周末我是不是闲的比较清闲,我那时候哎正好闲着没事买点东西。
36:25
这就是这个产品经理或者面试官想要的,你要捕捉这种敏感信息,每天分析的就是这种运营情况,老板做这个数仓的目的,他也就是为了他对这个公司的一些数据的一个掌控更准确啊,为自己的决策做的这个更准,就是这个目的,所以说这就是我要做市场变形战争,就是那你要发挥你的这个作用啊。行,那就这么说。
我来说两句