至顶网报道
来源:邹大斌
“都是被逼的,在成本和技术的双重压力下,我们不得不对现有的IT系统进行调整和优化,最终从传统IT架构走上了开源的、分布式架构。”面对至顶网记者,中国铁路信息技术中心技术支持部部长高明星坦言。
高明星所在的中国铁路信息技术中心承担了中国铁路总公司本地信息系统的建设和运维任务,其中就包括我们所熟知的12306网站的后台保障。随着公司业务规模越来越大,数据中心从一个增加到多个,服务器规模近万台的时候,不管是管理和运维的成本还是对新应用的支撑都给中国铁路信息技术中心带来很大的压力。在这样的背景之下,中国铁路信息技术中心不得不寻求解决之道,IT优化就是其中之一。
实际上,中国铁路信息技术中心这个经历并不是个例,今天的IT已经融入企业日常运营的点点滴滴之中,在不少企业中IT甚至成为企业运营中的一部分,企业业务也越来越离不开IT的支持,持续优化IT成为越来越多公司共同的选择。
压力之下的IT优化之路
作为中国铁路总公司本地信息系统的建设者和维护者,中国铁路信息技术中心的压力主要来自几个方面:一个是企业规模快速扩展。中国铁路总公司的信息化建设经过了40多年,特别是最近20多年的高速发展,机房面积已经扩张到2000多平米,上万台/套的IT设备在运行,新数据中心也在规划之中,这么大的规模给运维带来了很大挑战。另一个压力来自业务对信息系统的要求。现在信息系统和业务的捆绑已经越来越紧,有些信息系统是跟生产过程紧密捆绑的。信息系统如果中断或者发生故障对业务的影响也是非常大。
“12306网站就是一个很好的例子,如果后台运行出现故障,轻的影响旅客用户体验,重的影响旅客购票。那就是一件大事情。”高明星表示。
第三,中国铁路总公司自己目前也是处在一个转型的阶段,从过去的政府部门转变成一个企业,为走好转型之路总公司对IT提出了更高的需求,这也是一个压力。
这些压力传导到IT部门,对IT部门而言核心就是要解决好两个问题,一个是经济上,即要控制成本;另一个是技术上,即要突破技术瓶颈及实现自主可控。“当IT资产从几百万、几千万到几十亿的时候,如果IT的基础架构本身不方便运维管理,如果没有自动化的工具、没有标准化的流程,是很难做的,所以说IT的优化首先是成本的压力。其次,从技术的角度而言,IT要更加敏捷地满足业务上线的需求。另外,国家对安全和自主可控方面现在越来越重视,这些也需要借助IT来落实。”高明星表示。
对于传统企业面临的这些压力,红帽首席解决方案架构师张家驹也是感同身受。作为一名开源技术的资深从业者,张家驹常常接到客户这方面的咨询请求,希望帮助他们更好地应对成本和技术压力。张家驹告诉至顶网记者,过去传统企业面对的是传统业务,年初做预算,什么都规划好了,就按照这个步骤来。然而,今天整个世界变得敏捷了,出现了很多不确定性的因素,在这种背景下传统企业一定要做转变,必须拥抱新的技术,需要对IT系统进行调整和优化。
访谈中,张家驹告诉至顶网记者,传统企业对新技术的态度要比大家预想的积极得多。“我们看到越来越多的传统企业愿意去尝试新的事物,虽然在尝试过程中可能会遇到这样或者那样的一些问题,这个时候可能借助于一些外部的力量,比如说一些厂商的支持,来逐步实现从传统逐渐向新型业务转变。”张家驹表示。
实际上,正如张家驹所言,在中铁信息技术中心的一路前行过程中,就有红帽等多个厂商的帮助和支持,这也是中铁信息技术中心放手投入开源的底气所在。
标准化、自动化与云化
压力之下的中国铁路信息技术中心把目光投向了IT优化,逐步引入开放系统、虚拟化和一些开源的技术,并开启了长期的、持续不断的IT优化之路。其中,2010年时一个关键时间点。
高明星解释说,早期的中国铁路信息化主要基于专有系统,包括大型机和各种小型机。到2010年时,中国铁路信息化出现了重要的变化,从过去面向内部的生产经营管理为主,到面向主动为旅客货主提供服务,此时信息系统面临的压力和需求规模突然攀升,在这种情况下,沿用传统的专有系统从成本上考虑就不可行了。
“从2014年到2015年开始,我们被迫转向x86平台,并从x86平台延伸到基于Linux的开源系统,到后来的云计算,就这么一路走来了。”高明星告诉至顶网记者。
据悉,整个过程中中国铁路信息技术中心学习了很多互联网公司的做法,包括虚拟化、标准化、自动化以及云化等IT优化的普遍做法。以12306网站为例,其最大的压力来自余票查询。因为几乎每个人完成购票之前,都会进行多次余票查询。要保证用户的查询体验,后台就需要很好地应对高并发的查询需求。
高明星介绍说,“刚开始采取的办法是采用关系型数据库,通过增加服务器处理能力来应对,一台不行上10台、上100台,随后发现这种思路仍然无法满足在高峰期查询的需求,后来转向分布式架构,采用了分库分表的办法解决这个问题。”
正是因为中国铁路信息技术中心在满足业务需求时遇到的挑战更大,对此体会更深,所以,相比一般传统企业,它们在开源系统和云计算的道路都走得更坚决、更快。比如,在开源上,不只是选择了红帽的Linux、虚拟化等基础平台,还选择了Ceph,构建了基于Ceph的分布式存储系统。甚至在云计算的道路上,选择的也是基于OpenStack的开源云平台。
“我们希望把命运多掌控一些在自己的手里,多一些自主可控。”高明星谈及这些选择时表示。
要优化,更要可靠
虽然中国铁路信息技术中心一路走来,看起来比较激进,也比较坚决,但实际上每一步走得都非常扎实,并没有急躁冒进。比如,在正式转向开源系统、迁移到x86+Linux平台之前,中国铁路信息技术中心曾对开源平台的安全和可靠性经过了两三年考验期。
“在确定了要走开源路线之后,我们积极进行了各种准备,包括提升自身的能力。我们依托自己内部的力量,包括下属的公司,还组建了一支队伍专门去研究开源,研究云计算。”高明星说,因为采用了渐进的思路,在渐进过程中逐步建立起了信心,现在才有足够的底气宣布要走开源之路。
而值得一提的是,在整个迁移过程,“可靠”一直是中国铁路信息技术中心最优先考虑的。高明星透露,“可靠”是比“成本”等更为重要的考量,在可靠性面前成本位居第二,所有优化的前提是要保证可靠性。基于这个原因,中国铁路信息技术中心做了大量的验证测试工作,包括数据库跑在Linux平台、用Ceph存储来支持Web服务等。
“对于我们来说,开源、分布式计算是有技术挑战的,同时我们的业务是不能出错的。我们要在这个路上走得更稳当,就要做很多的工作,包括测试、验证以及架构的设计。”高明星表示。
基于这个考虑,目前中国铁路信息技术中心核心数据库还是跑在x86物理服务器上,并没有一刀切地采用虚拟化。同时,在架构上中国铁路信息技术中心也做了特别的设计,采用了双平台,即核心业务系统后台采用了开源和闭源平台并举,通过负载均衡系统提供给前端,支撑业务的运行,同时屏蔽了后台的异构。
“目前这个架构资源池比例可能是五五开,后期会随着我们自主研发程度的逐步提升,进一步提高开源架构资源池的比例。这样做的好处是容错能力大大提升了,让我们的转型之路也能走得更平稳性。”高明星表示。
很显然,中国铁路信息技术中心的转型之路走得相对顺利和平稳,与公司在这方面的看似激进实则稳健的工作风格不无关系。颇有意思的是,在长期与传统企业客户打交道的张家驹看来,这其实也是很多传统企业特别是大型企业的普遍做法。
“中国铁路信息技术中心给我们很好的一个例子,应该如何在传统技术和新技术之间,或者闭源和开源技术之间达到有效的平衡,也就是如何随着技术的成熟逐渐会加大我们使用开源的新兴技术的比例,而不是单纯地冒进。”张家驹评价说,“总之,业务优先,只有把业务问题解决了,才能谈IT优化,谈转型。”
领取专属 10元无门槛券
私享最新 技术干货