早上一上班,大勇就等在老胡办公室门口。
大勇跟随老胡多年,早已成为他的左膀右臂,很熟悉老胡的想法和行动,一般不会专门找老胡的。
果然,大勇遇到棘手事了:小微金融部的嘉总又发飙了。大勇是个实实在在的“IT民工”,嘉总是个彪悍的“女强人”,他俩相遇,屡屡都是大勇败下阵来。
听上去,嘉总发脾气不无道理。之前,按照鲍先生建议的“轻数据”思路,大勇团队帮嘉总整合行业数据,进展顺利,成效显著。不等大勇有喘息之机,问题来了:数据质量完全不行,根本无法满足嘉总所需的业务分析。
老胡已经大概心中有数。但他还是吩咐大勇,去请鲍先生。“外来和尚好念经”,很多时候,他宁愿借用“外来和尚”的嘴。
鲍先生翩然而至。听大勇说完,他浅浅一笑:意料之中啊。
他又开始他的拿手好戏:提问。他问大勇:“当真是数据质量问题么?”
大勇嘟囔说:各种API数据进来,数据乱七八糟的。不是数据质量问题又是什么?
鲍先生追问:“什么是数据质量?”
大勇开始背数据质量的定义。
鲍先生不依不饶:“什么是数据?”
大勇不回答了。他求饶似的看着鲍先生,心想:这样追问下去无事无补啊,不解决嘉总发飙的问题。
鲍先生又换了个角度提问:“按现在的做法,你所谓的大数据平台上面,数据量有多大?”
大勇说:“很少。”他说了个具体数字。
“接入数据的API,大概有多少?”
大勇说:“乱七八糟各种API加起来,一共268个。”
鲍先生抓住了大勇随口用的一个词:“为什么是乱七八糟的?”
大勇解释了一大段。大意是说,按照嘉总的数据需求,与供应商协商之后,基本上能保证API能够调用供应商的所有数据。
鲍先生又问:“这些API之间,有什么关系吗?”
大勇吞吞吐吐地说:“也、也、没、没什么关系吧。有些API之间数据有交叉。”
鲍先生不说话,看着大勇。大勇不太有信心说:“您是说,问题其实在API本身?”
鲍先生说:以你目前的建设逻辑,你的大数据平台,等同于供应商的数据平台,你只是物理上没有把数据搬回来而已。供应商的数据库,并不是按嘉总的需求而设计,你又如何能满足嘉总的需求?
大勇不解。他说:那么,不就还是需要把供应商的数据采集回来,按照嘉总的需求进行数据治理,成为嘉总需要的大数据?
鲍先生看了一眼一直不说话的老胡,摇头说道:“你盖一幢大楼,你从沙子和水开始,还是从砖块、预制板和钢筯开始?嘉总需要大楼,而你要变成制砖厂……”
大勇有点明白了:“API不能是沙子和水,它起码应该是砖块;砖块连接起来,构成大楼的结构。”
鲍先生点点头:“对的,让你的供应商不要卖砂子和水,你要采购的是砖头。它提供的数据,必须成为数据产品。”
领取专属 10元无门槛券
私享最新 技术干货