在海量运营方法论的指导下,运维团队构建了体系化的运维能力,为众多产品保驾护航。
提起腾讯的运维团队,第一个让人联想起来的名词当属“海量”,早在2004年腾讯前 CTO 张志东先生就提出了一套技术运营的方法论“海量运营之道”。
人们形容运维人的工作日常:不是在解决问题就是在解决问题的路上。以至于运维人自己也感叹干的工作是操着卖白fen的心、赚着卖白菜的钱……
最近在做一些运维架构转型的工作,某些思想其实是借鉴了SRE的理念,就和DevOps一样,SRE已经不是一个新鲜的词汇了,尤其是在互联网的行业,无论从组织架构,还是工作属性,都是将SRE,融入其中,成为了软件生命周期中重要的一环。
梁定安, 腾讯织云负责人,目前就职于腾讯社交网络运营部,开放运维联盟委员,腾讯云布道师,复旦大学客座讲师。 前言 运维自动化是我们所渴望获得的,但是我们在一味强调自动化能力时,却忽略了影响自动化落
Mikey金字塔是由美国数字服务公司的Mikey Dickerson设计的。层次结构是为了说明,当尝试提高系统可靠性时需要按部就班,在到达更高级别之前满足每个低别级的要求。
近一年来,嘉维蓝鲸自动化运维解决方案成功在数十个客户处成功落地,同时也和上百家客户沟通了自动化运维的需求,有大量的用户会问我三个相同的问题:
对于企业而言,敏捷意味着对用户需求和市场变化有着快速响应能力,能够针对市场最新变化做出快速反应。因此,近年来云原生、容器、微服务等技术迅速崛起,成为企业数字化转型中关键的技术趋势。
企业构建一站式运维平台的目的是为了提升运维效率。那么一个成熟的运维系统应该要解决哪些问题呢?笔者认为首先是运维对象要被管理起来,然后是监控这些对象,接着是这些对象的自动化运维,最后是所有的运维操作都要有所规范。概括起来对应的系统就是CMDB、统一监控、自动化平台、ITSM,如下图所示。
3月底有幸参加了全球云计算开源大会,并作了一个关于《运维一体之平台一体化》的分享,现将PPT的内容整理成文。
很高兴今天有机会在这里与大家交流,也要感谢普元提供的交流平台和普元CTO焦总的邀请。我今天与大家分享的主题是关于企业级应用的可靠运维实践的这个话题。 本次交流的内容主要包括我对运维工作的认识、运维与架
国家的“十四五”规划里面多次提到数字化相关概念,其背后反映了一种趋势——从数字化经济、数字化生活到数字化国家。近年来产业数字化不断加速,金融业的数字化更是走在前列,银行作为金融业的主要机构也在经历数字化转型的过程,在银行业务高速增长的背后离不开IT系统的支撑与支持,因此对IT系统的依赖与日俱增。IT运维是IT系统自身的运营管理,随着混合架构、互联网应用与传统应用的双模态发展,云计算、大数据、5G、移动互联等技术的应用,一方面对银行的发展带来了极大的助力,同时也对传统的IT运维带来了很大的挑战,智能运维的应用正在逐渐成为银行IT运维的新方向,已经有一些银行开始了智能运维的实践探索。
港华集团为香港中华煤气在内地投资及营运管理的业务组合,自1994年进入内地以来持续深耕燃气市场,业务覆盖天然气上、中、下游,目前在24个省、自治区及直辖市经营逾300个燃气项目,服务客户逾4000万户。
如何接手一个新业务的运维工作?有些东西我们还是要把话说在前面,以免前期不明确造成后期工作的混乱。
上一篇整理了运维组织的“2.1 组织专业化”,在细化横向的专业化分工之前,本章先看看“运维底线保障能力”(由于本人主要工作经验在应用运维与自动化,相关内容以应用运维为主),主要的部份内容是基于公众号另一篇《回归一线应用运维的底线——先做好最基本的事》之上做扩展。下一篇计划是“2.3 可用性保障能力”
腾讯运维十年,最重要的一件事情就是建立规则和次序。 这其中的过程可以分成几个阶段,包括:交付->组件->架构->监控;而这两年最重要的事情就是智能化。 交付 交付:在腾讯SNG可以认为十年前运维主
马哥linux运维 | 最专业的linux培训机构 ---- 在云计算时代,开发和运维的结合变得越来越重要。在DIFF论坛第一期,前新浪SAE运维主管,郑志勇,分享了《一个开发眼中的运维》根据自己从开发人员转型运维之后的心得,谈如何把在开发上的运用抽象思维方式运用到运维领域。 1. 运维不是什么? 运维不是打杂的,运维不是客服,运维也不是服务开发的,但要做好合作。 2. 运维是什么? 运维服务于整个产品,保证架构合理,系统稳定。运维只对业务稳定负责,所有的工作都是奔着这个去的。 3. 你如何写程序,写
“不想当将军的士兵不是好的战士”、“不想当CIO的DBA不是好的运维”。在每天面临如此多的来自工作量、运维安全、技术更新挑战的同时,我们还需要不断的成长与思考:
在上一期《运维专题第2期:警戒哨兵》中,我们介绍的是运维平台中的监控系统——云哨,今天给大家带来的产品是巡检平台,在运维过程中能够跟监控系统一起为客户带来稳定的保障。
分享大咖是陈飞老师。陈飞老师直接列了一张运维成长路线图,也可以用作性能测试必备技能列表。所以如果你想成为一个出色的TestOps,快来看看今天的分享吧。
本文探讨了运维未来的发展方向是智能运维(AIops),并提出了智能运维在故障定位、自动化运维和移动端运维等方面的应用。作者认为智能运维能够提高企业的运维效率,减少人为干预,并有助于企业更好地应对市场变化。然而,智能运维的发展仍面临诸多挑战,如数据质量、算法复杂度等问题。
本文介绍了AI浪潮下的高效运维思考及实践,作者从AI与运维的结合点、面临的挑战、如何解决问题、腾讯SNG的智能化运维实践以及未来展望五个方面进行了详细阐述。
云最难的,就是如何运维了,如何监控指标、告警、报表等信息并提前预判异常?出了故障能第一时间找到根因、路径吗?过程可视化吗?故此,小编找到我们 TCE 的运维产品经理,大家群策群力,倾情打造运维产品力专题,从价值视角,分享运维对云的贡献。
在任何有一定规模的企业内部,一旦推行起来整个SRE的运维模式,那么对于可观测性系统的建设将变得尤为重要,而在整个可观测性系统中,通常我们会分为如下三个方面:
近日,云+社区技术沙龙“高效智能运维”圆满落幕。本期沙龙围绕运维展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务运维的技术实践干货,同时带来腾讯海量业务自研上云实践,推动传统运维向云运维转型。本文是孔令飞老师关于腾讯云 Serverless 的运维能力,Serverless 对运维的影响,微信小程序相册的运维案例等内容的分享。本文首发于「云加社区」公众号。
《苏州市“十四五”数字政府建设发展规划》 指出数字政府将以新一代信息技术为支撑,以数字化转型为驱动,以业务流程再造为核心,以数据高质量赋能为主线,以一体化服务感知为导向,重塑政务信息化业务架构、技术架构、组织架构和网络架构,构建政民互动新机制、政府治理新模式、政府作业新形态。
随着数字化转型的深入,基于中台和PaaS架构的一体化运维建设也在各行各业快速展开,但是如何将运维平台本身的能力与企业已有的工具能力进行中台化整合、工具场景如何联动,是个复杂而庞大的工程。
11月9日,云+社区技术沙龙“高效智能运维”圆满落幕。本期沙龙围绕运维展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务运维的技术实践干货,同时带来腾讯海量业务自研上云实践,推动传统运维向云运维转型。下面是孔令飞老师关于腾讯云 Serverless 的运维能力,Serverless 对运维的影响,运维的案例等内容的分享。
本篇是《数智万物下的运维思考》第4章“平台”的第4节“分析平台”第1小节,主要观点有::
我一直把运维团队的定位是在技术服务团队,个人也要朝着技术服务的方向去发展。单纯的服务定位对整个团队的发展不是非常有利,会逐渐沦为救火队员和保姆的角色,有点高级人员干着低级的活的感觉。
最近小嘉在逛论坛时看到一位朋友提出了这样的一个问题,这与之前沟通的一位客户疑惑一致,为他解答的过程自己也整理除了一些思考,故和大家一起聊聊。
运维人员每天面临很多零碎的工作,有各种渠道而来的问题咨询、多个监控工具的报警,以及各种非计划性和计划性的工作,相比于其它工种,运维人员更需要一个综合性的技术与管理能力,需要掌握大量的方法论与技术栈。
随着微服务、容器化的兴起,云原生带来的应用复杂度呈指数级上升,这种复杂度增加了系统状态可视化的难度,企业对于系统可观测能力提出了更高的要求。
在复杂的IT运维组织事务活动中,如何确定IT运维的目标,对于很多运维组织来说也是一个难点。有些运维组织用的是稳定性/可用性/质量的指标,有些团队用的是效率,有些团队用的成本指标等等。说实话,在以上诸多指标中,能够带来巨大变革力和牵引力的,我个人认为还是效率,或者是性能,就是完成某个事情有多快。但很多时候,需要对这个IT性能形成精确的理解,才能形成真正的作用力。
2.环境管理,包括开发环境、测试环境、生产环境等; 3.部署,将应用或系统部署至不同环境; 4.监控,对基础设施、应用或系统进行监控; 5.告警响应,对告警通知的响应及处理; 6.性能优化,对系统及相关组件性能进行优化; 7.系统高可用,对应用系统中的单点进行高可用升级; 8.SLA保障,保证业务系统的可用性,可根据SLA实现自动扩缩容;
现在全国政务行业都在推行数字政府、数字中国的落地。大部分省市都在进行IaaS资源、PaaS资源、DaaS资源以及SaaS资源的整合;构建基于IPDS架构的云平台数据中心,通过IPDS云平台数据中心,为用户提供各类资源服务。
10月20日,腾讯织云 Metis 智能运维学件平台在 OSCAR 开源先锋日上宣布,正式对外开源。Metis 是AIOps(Algorithmic IT Operations),即智能运维领域的首个开源产品。智能运维主张通过算法从海量运维数据中学习摸索规则,逐步降低对人指定规则的依赖,进而减少人为失误。
中国移动通信集团北京有限公司(下称北京移动)成立于1999年,隶属于中国移动通信集团公司,秉承“正德厚生,臻于至善”的企业核心价值观,紧密围绕“做世界一流企业,成为移动信息专家”的战略定位,以卓越品质锻造一流信息服务,用创新精神努力实现从优秀向卓越的新跨越,着力推动“移动改变生活”。
大名鼎鼎的中国运维社区的狼首赵瞬东相信大家都略有耳闻,江湖人称赵班长,曾在武警某部负责指挥自动化的架构和运维工作,2008年退役后一直从事互联网运维工作。曾带团队负责国内某食品电商的运维工作,同时带领团队创建了自己的运维社区,讲自己多年经验传递给众多学者、运维人员,《saltstack入门与实践》作者之一。
本文主要介绍银行业务的发展趋势、应用架构演进以及在此背景下应用运维面临的挑战和解决方案。文章目录如下,是笔者过去5年作为乙方在多个银行设计和落地应用运维自动化的经验分享,共11000字,阅读时长大约10分钟。
我把制造业的八种浪费模式(左边)映射到我们运维的八种浪费模式(右边),这种浪费模式的整理是一个引子,目的就是让大家观察运维组织中存在的浪费行为,这种浪费行为的梳理可以更大面积的扩大,比如说到IT组织上。
2016/2017年:刚开始做监控的时候,研究了几乎市面上所有监控产品,和相关的技术文章、视频。这个时候,主要是接触了大数据相关的技术,包括:Kafka、Spark、HiTSDB、ELK等。
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够7×24小时为用户提供高质量的服务。 运维人员对公司互联网业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力,通过监控、日志分析等技术手段,及时发现和响应服务故障,减少服务中断的时间,使公司的互联网业务符合预期的可用性要求,持续稳定地为用户提供务。 在安全方面,运维人员需要关注业务运行所涉及的各个层面,确保用
首先祝贺你选择学习Linux,你可能即将踏上Linux的工作之旅,出发之前,让我带你来看一看关于Linux和Linux运维的一切。
应用运维:负责支持线上业务,各自会负责对应的业务线,主要职能是保证线上业务稳定性和同开发共同支撑对应业务,以及线上服务管理和持续优化。
联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。
今天,领先的数字原生企业不断用数字化手段颠覆传统行业,传统行业内领先的企业也在积极拥抱数字化,国家也适时的将“数据”列为生产要素参与分配,推动了以数据为关键要素的数字经济进入了新时代。站在企业内运营后台的运维部门,运维属于数据密集型工作,团队的价值创造都是在运维数字化工作空间中运作。
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。
一个互联网产品的生成一般经历的过程是:产品经理、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。
领取专属 10元无门槛券
手把手带您无忧上云