超越Oracle必须颠覆原有技术体系,数据计算是第一步
爱分析
在数据可视化的概念兴起前,所谓数据的展现主要就是报表,当时中国各行业均处于信息化起步阶段,而中国报表非常复杂、统计困难,很多国际巨头软件厂商都无法解决。
此时,有一家中国厂商横空出世,以其独创的非线性报表模型解决了中国报表问题,实现对国外厂商的超越,这就是蒋步星和他的润乾。
蒋步星曾被称为“数学天才”,是中国首个国际数学奥利匹克竞赛团体冠军成员。从清华毕业后,先后供职于清华紫光和长天科技,于2001年创建润乾。最初靠行业软件养活团队,但蒋步星一直想做的是通用软件,不想做集成商卖别人的产品。
2002年底,蒋步星将报表工具作为切入点,研究了数千张报表,依靠深厚的数学功底,发现其中规律,一举解决中国报表问题,大大提升IT人员制作报表的效率。
蒋步星没有因为报表工具的成功而停止脚步,当时有两条路可以选择,一条路是向前端发展,做BI、可视化工具,很多国内厂商选择这条路,另一条是向后端发展,解决数据计算问题。
蒋步星认为,向前端走又会回到定制化的老路,还是要坚持做通用软件的路线,因此选择了更难的一条路,做数据计算。
过去,数据计算主要依赖Oracle等数据库产品实现,Hadoop的崛起,试图去解决大规模数据计算问题,而中小规模的数据计算问题并没有得到太多的关注,还是需要昂贵的数据库产品来解决。
蒋步星将这个方向作为切入点,一方面这个问题是客户刚需,能够节省大量成本,另一方面也可以与报表产品结合起来,将底层数据处理问题解决好,有助于提升数据展现效果。
经过几年潜心研发,润乾在2015年发布数据计算产品——集算器,解决了数据计算在描述和实施上的效率问题。
对蒋步星而言,集算器只是一个开始,帮助润乾从报表市场切入到数据计算这个更大的市场,替换Oracle等成为企业的数据仓库和数据库,才是终极目标。
近期爱分析对蒋步星进行专访,他分享了自己对报表软件行业、数据计算行业的看法,现将精彩内容分享。
坚持做软件厂商,不做定制开发
爱分析:润乾从2001年创立,到现在也是经历了十几年发展,都经历了哪些阶段?
蒋步星:2001年初我从长天出来,2001年-2003年底,这是一个阶段,这个阶段其实我们在做行业软件,主要是帮助其他高校做信息系统。
我一直想做通用软件,这是在长天、紫光受了刺激,我觉得我们费老劲当集成商,最后都在卖Oracle的数据库,打来打去最后都是人家厂商挣钱,我们不停地在出差。所以我们一定要把自己做到厂商的位置去,但找不到方向。
到2002年底,我们感觉到做报表工具是一个挺好的方向,国外势力没那么强,而且用户有需求。所以,我们从2002年底开始做, 2004年初推出报表3版本。到2005年,这个业务就已经盈亏平衡。
然后我立刻把教务系统那部分业务卖掉了。我的逻辑链在于,一定要做厂商,一定要拿光盘换支票,不要做定制开发,不要到用户那里做项目,产品永远都是标准化的,这样才能零成本复制。
2005年至2010年应该是报表业务发展比较好的阶段,差不多翻了10倍。2011年至2015年,我们内部管理层有业务分歧,这使得公司资源消耗比较严重,业务基本没有增长,而且明显感到竞争对手发展起来了。
2015年底,我们内部做了调整,原来分歧的声音消除掉了。2016年相当于重建了经营队伍,会是一个新阶段。
现在,我们把经营重点主要放在数据计算上了,我们2月份刚做了报表工具的降价,我降了30倍。公司内外要营造一个气氛,润乾现在要开拓新业务,报表这个标签就会产生障碍,我们现在想做数据计算业务。
爱分析:为什么润乾做报表这项业务时,没碰到什么竞争对手?
蒋步星:国外厂商是不会做报表的,几方面原因:第一,中国市场相对全球市场太小,国外厂商不会专门为中国企业开发相关产品的,只会把国外现成产品拿过来用;第二,中国人的报表需求非常复杂。
这个事情之所以被解决,这是我们擅长的,也是润乾这公司的基因。我们自己发明了一套理论体系,研究了几千张报表找规律。
爱分析:整个团队现在有多少人?人员结构是什么样的?
蒋步星:我们现在有70多人,人员还在扩。去年主要是磨合新的经营团队,磨合差不多了,今年就会扩张团队。我们应该主要是两部分,研发和销售。我们研发有25人,销售会多一些。
爱分析:下一步如果扩团队的话,会主要增加哪部分人员?
蒋步星:研发人员今年可能不会增加了,售前人员会增加多一些,因为我们现在这个新产品,需要有足够技术背景才能给客户讲清楚。
爱分析:所以这个产品在研发投入上不需要太多人?
蒋步星:坦白地说,我认为做这些事情都不需要很多人。我们现在20多人研发团队,下半年就可以发布数据库产品,另外我们还做了数据挖掘产品。主要是我们不需要太多交付人员,交付工作都交给集成商伙伴来做,这是我们的原则。
报表工具面向IT人员,更贴近客户业务
爱分析:相比BI产品,报表产品会与客户的业务更加贴近?
蒋步星:有各方面原因,一个是客户没有那么强烈的分析需求,他也不知道具体分析什么,另一个是数据相对混乱,不是那么整齐,要做多维分析,数据质量还是要求很高。还有就是做多维分析要事先建模,但是客户的业务还很不稳定时,就没办法事先建模。
但报表这个产品,客户总需要看他。而且中国人的报表设计得很丰富,一张报表能反映很多信息。所以,业务人员还是乐意看这个,使用比较简单,输入参数后我想看到的信息都在报表上有体现。
我见过很多上BI平台的,有可视化、用户自助出报表,但其实用得最后,久经考验的还是那些固定报表。·
爱分析:国内外企业在使用报表产品方面有哪些区别?
蒋步星:国内大部分用户可以支付得起定制化的成本,花50万就会有人来做项目开发了,可以做出非常适合用户需求的系统。这种场景下,国外BI厂商的产品就比不上这些定制开发的。
因此,国内用户更加需要可集成的工具,比如我们做报表工具,其实是中间件,并非直接面向终端用户,需要开发人员二次开发将我们集成进去,这时候集成商就愿意用我们这种产品。
在国外,由于人工太贵,用户一般支付不起这种定制开发的费用,只能购买这种接近成品的软件,从这个角度来看,国外BI产品就有它合理之处了。
爱分析:其实,报表这个产品一般来说不会直接面向终端用户?
蒋步星:是的,终端用户看报表,但做报表的是集成商的程序员,我们其实是协助开发商,让他更快地做报表。原先程序员写代码做报表可能需要一两周,使用我们的产品可能只需要一天时间,极大提高效率,而且降低对程序员的要求。
爱分析:所以,从收费来说,我们是跟终端用户收费还是集成商?
蒋步星:我们主要收入还是来自终端,我们与集成商配合,将产品做到解决方案中。其实,像数据库这些产品也类似,终端用户可能根本不会安装Oracle,但他却在买单,因为这是整个解决方案体系中的一个环节。
爱分析:现在来看,报表这块儿的市场空间应该不大,几个厂商加起来也就是几亿规模?
蒋步星:这个市场规模不大有很多原因,第一,相比之前,做报表的厂商更多了,竞争更加激烈;第二,移动端快速发展,使得客户对报表的复杂性要求在弱化。这些是我们必须转型的原因。倒不是说,市场需求消失了,但市场的增长在放缓,甚至出现停止增长。
另外,报表可以算是可视化的一种基本技术,现在出现了大量开源的可视化技术,这就使得从营收角度来看,市场规模在变小,用户发现使用开源技术也能实现类似需求,就不愿意再花钱购买报表产品了。
做数据库从数据计算开始,替代Oracle计算能力
爱分析:数据库市场是不是仍然以Oracle为主导?
蒋步星:销售额是这样的,去“IOE”中, EMC是最容易被去掉,IBM的小型机除了大型银行的交易系统外,都可以被替代掉,就是数据库很难去掉。
Oracle的确做得很好,各个数据库的SQL语法不太一样,那些不同的地方虽然不多,但是很关键。因为大量程序是数据处理是用数据库的存储过程来写的,想复制出完全一样的几乎不可能,还不如彻底替换掉,但Oracle的优化的确做得很好,不光是国产数据库,放眼全球也很难比肩的。
爱分析:用新型Hadoop架构开发的数据库有望超越Oracle么?
蒋步星:其实我们就是要做数据库,做新型数据仓库,我们会先从做计算开始,做集算器。
我个人认为国产数据库没什么机会超越,国产数据库厂商的确有不少优秀人才,但Oracle同样很优秀,而且资金雄厚。除非Oracle犯错误,要不然没有机会。
但是,就算Oracle犯错误,顶上来的也未必国产数据库,因为国外还有很多巨头公司,不可能轮到排名10以外的厂商。因此,想超越Oracle必须要颠覆他,跟随技术永远没希望。
想超越Oracle不能再用那个技术体系,那个体系被Oracle做了40多年,怎么可能有机会。
Hadoop这边有一定可能性,但现在说还为时过早。数据库功能大体分为两部分:OLTP,这部分目前还只有关系数据库能搞定;另一部分是OLAP,做计算分析的,这部分Hadoop有一些优势的。
Hadoop优势是建立在比较便宜的PC集群上,不像Oracle需要高端机,Hadoop这个体系相对要廉价一些,而且横扩能力强,很多用户都将Hadoop作为未来方向。
另外,Hadoop设计规模是面向超大集群,而非中小集群规模,但传统数据仓库的用户没有那么多数据,用Hadoop有点杀鸡用牛刀。所以,我们也没用Hadoop体系,选择自己做。
爱分析:那我们做集算器是如何构建的?
蒋步星:我们开始做报表,数据展现的确很头疼,我们用非线性报表模型解决了展现问题。但发现做报表还是很头疼,数据准备比展现还麻烦,原始数据与报表数据相差很远,要写很复杂的运算。当时业界没有什么好办法,大家都是要写程序。
所以,我们打算做产品解决这个问题,数据准备就是数据计算,因此,我们做了一个数据计算引擎,自己设计一套程序语言,能让写这种计算比SQL、JAVA更容易一些,开始作为报表工具的辅助模块。
后来我们发现,计算本身就是更大市场,比数据展现应用面广很多。所以,我们从技术把计算引擎独立出来,在这个基础上我们还可以发展数据库、数据仓库这些业务。
集算器这个产品就是想替代数据库的计算能力,提供不依赖数据库的计算能力。当然,这需要一段时间,目前我说服用户彻底不用数据库是有难度,所以集算器这个产品作为计算引擎出现,是不太涉及存储的,因此原始数据还可以放在原先的数据库,集算器只是解决计算,原先客户除了数据库没有什么特别好的计算工具,现在多了一个选择,不一定非得用数据库。
爱分析:所以集算器与报表服务客群是类似的?
蒋步星:其实是一样的,跟报表也比较容易集成,因为很多时候计算就是为展现而服务的,而且我们现在都不忌讳集算器可以给竞争对手的报表产品提供数据。
领取专属 10元无门槛券
私享最新 技术干货