首页
学习
活动
专区
圈层
工具
发布

腾讯云网络运维平台建设之路

本文是腾讯云专家工程师陈政产老师在腾讯云开发者社区技术沙龙深圳站的分享整理,为大家详细介绍腾讯云网络运维平台的建设。 点击视频查看完整分享回放 一、腾讯云网络介绍 ?...二、腾讯云网络运维平台建设 1. 混沌工程 依上文所述,我们因为想要在网络故障前解决网络隐患,从而引入了混沌工程。那么混沌工程是怎么做的,它又是怎么在腾讯云网络上落地的呢?...三、腾讯云网络运维平台未来思考 如上文所述,在网络排障方面,我们针对网络隐患采用了混沌工程的实验;对于网络变更,我们引入了变更体检;在网络监控方面我们已经比较全面和准确的覆盖了现网问题。...日志打标是比较耗时耗力的工作,但不是说完全不可以做,目前也有团队在做这个事情,会对日志做一些基于规则的打标工作。...比如这个应用没有做好灾备就故障了,事后我要去排查为什么会故障,要去解决这个问题,但是我又想把这个场景复现一下,需要运维团队协助吗?

7.1K23

Smartnet 网络运维

),负责移动云网络运维、运维工具研发、运维场景开发。...海量的设备给网络运维工作带来了极大的挑战。Forward的产生给网络运维工作带来了希望,让网络运维自动化成为了可能。...3、网络的自动化探索 Forward产生后,传统网络运维人员开始自动化运维的探索。日常工作中重复性高的、沟通成本大的工作成为了第一批自动化开发的重点。...4、什么是Smartnet Smartnet是移动云运维团队在长期的运维过程中研发的适用于移动云的自动化工具,它简单理解为是适用于移动云网络运维的网络设备类库的集合,类中根据设备角色的不同,提供了适用于移动云的网络设备查询及配置的不同方法...,他们无法实时获取网络设备的状态、配置等信息,需要网络运维人员手动查询后告知,查询个工作量较小但沟通工作量巨大。

1.7K90
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【运维探讨】RPA落地实践,提升IT运维工作效能!

    RPA应用于运维实践 RPA在运维的地位 在各行业企业中,近几年已经在逐步建设或已经建设了运维管理平台,而RPA技术作为运维管理的基础功能,在IT业务巡检领域里应用得越来越广,并且越来越显现出其RPA的优势...运维场景流程梳理 以下以某运维流程为例,要想通过RPA来实现,先从使用者用户的角度详细梳理整体操作步骤,形成流程图,这个步骤的过程需细化到最小的操作单元,例如点击选取某个下拉框、点击某个按钮、在某个对话框输入指定内容等...RPA在IT运维的优势 RPA应用于IT服务环节的优势: 标准化IT流程以减少人为错误; 自动化工作流,使新员工更轻松地实现同样的结果; 帮助集成来自不同供应商的不同产品以有效管理IT问题; 通过快速响应...总结 总体来看,RPA的技术的诞生突破了用户侧个性化操作而又难以模拟的技术壁垒,对于乐于对新技术的探索和采用的IT人员,尤其运维人员,更是一大福音,对于繁杂、重复、低效的低技术的运维操作,RPA一一解决...,运维人员也从中释放出大量的时间。

    2.7K214184

    私有代码托管平台的搭建与运维

    在我们日常的编写代码过程或者工作中,版本控制显得尤为重要。...其中,Github、SourceForge、Bitbucket、Gitee 都提供商业化的 Git 私有代码托管平台解决方案,只有 Gitlab 提供开源的 Git 私有代码托管平台解决方案,其他平台暂不了解是否有相应的解决方案...相比之下,gogs 或者 Gitea 则偏向于更加基础、精悍的 Git 私有代码托管平台解决方案。...平台运维 升级 升级路线规划   前面已经提到过 Gitlab 的升级实际上是要遵循 Gitlab 官方提供的路线图的,即按版本逐步迭代升级,具体可以查看 Upgrade-paths。...(采用 CC BY-NC-SA 4.0 许可协议进行授权) 本文标题:《 私有代码托管平台的搭建与运维 》 本文链接:https://lisz.me/tech/docker/gitlab.html

    3K20

    腾讯云+运维,助力运维领域技术发展

    在云计算时代和互联网持续高速发展的今天,数据和服务规模迅速升级,传统运维面临着许多新型挑战,如何结合DevOps理念,解决云计算时代的运维难题?...为了更好地推进运维领域技术交流发展,并且让更多的企业能够完成向云计算的转变,腾讯云和织云联合举办“腾讯云运维干货” 系列沙龙。...每期沙龙将会邀请腾讯运维领域专家,分享云计算时代运维的思考和实践,并且为参加沙龙活动的人员提供一定金额的腾讯云代金券,帮助大家0门槛体验腾讯云上各类云产品,而针对企业用户,腾讯云“云+创业”计划更是能给出高达百万的云资扶持...[图片] (腾讯运维技术总监梁定安) 出品人大梁宣布了腾讯云与织云的“6+6运维技术沙龙...《手机QQ 移动网络接入优化之路》技术分享,以手Q运维的故障案例,引出移动互联网时代手Q业务面临的挑战与运维的优化之路,包括业务架构部署优化、海量用户的全局智能调度和运维对移动网络的优化经验,每个技术点

    5.9K10

    改进基础运维工作的思路

    这是学习笔记的第 2076 篇文章 今天整理了下运维方向的一些工作,想了想,其实可以做得扎实一些。 但是我们的工作每天会被各种琐事缠绕,有没有什么好的思路和建议呢。...我觉得你可以把你一整天的工作情况都罗列下来,毫无疑问,你需要是个有心人,你得关心自己的工作情况,把耗时和时间的分配情况都记录下来,便于追溯。...既然日常的事务性工作不可避免,我就以基础运维的工作为切入点,来逐步深入了解一些运维架构和优化的内容,这是一个初版的内容,有了这些信息之后,就可以重新审视现在的工作情况,基础运维方向哪些还需要补充和改进,...出发点大类细类是否具备自动化是否有批量需求引申方向基础运维安装部署单机多实例**** 容量评估 一主多从部署**Y容量评估 分布式集群部署 Y分布式架构选型 高可用部署*** 高可用方案选型 新版本部署支持...资源申请流程接口**Y 服务启停管理 服务配置管理 Y 权限管理新增数据库账号*** 数据库权限变更***Y 系统权限开通****Y 权限总线管理* 权限历史回溯 运维管理对象操作

    1.2K50

    游族网络运维总监:如何运维千台以上游戏云服务器

    作者:李志勇 来源: http://www.csdn.net/article/2016-03-21/2826611 偶然在网上看到游族网络运维总监李志勇先生进行的一次分享,作为一个运维人,对其中的运维思想赞叹不已...本次分享主题为“如何运维千台以上游戏云服务器”。重点是云时代的运维,包括游戏上云部署整体方案、游戏服务器批量运维管理,并对企业选择RDS还是自建MySQL数据库给出了自己建议。...该架构方案运维效率更高,可实现秒级开服同时具备业务高可用特性。 基于第二代架构,游族基于OpenStack自己的私有云,最初目标是为了提高服务器利用率、降低成本和实现分钟级开服。...运维团队以OpenStack G版为蓝本进行调优并修改;整个网络采用的是VLAN模式,保证最大限度与现有网络架构保持兼容;存储方面使用本地磁盘作为存储。...经过评估测验,在高峰时期,整个私有云资源利用率可达到83%。

    9.1K80

    运维工作常用的shell命令

    ###############################3系统全面查看工具:############################################### 11.linux下查看网络流量的命令...: #sar -n DEV 1 4 (查看网络接口,每一秒查看一次,查找4次)  #sysstat包(sar系统活动情况报告) -n 选项提供6个不同的开关:DEV|EDEV|NFS|NFSD|SOCK...|ALL DEV:显示网络接口信息 EDEV:显示关于网络错误的统计数据 NFS:统计活动NFS客户端 NFSD:统计NFS服务器端 SOCK:统计套接字 ALL:统计所有 rxpck/s:每秒钟接收的数据包...:tcpdump #tcpdump -i eth0   监视指定网络接口的数据包 #tcpdump host  IP  指定固定IP 进行获取相应的数据包 #tcpdump host 10.0.0.1.../RH135/RH135-5 网络配置和排错.pdf -n 是显示升序 3.查找一个文件出现频率最高的是个词 cat words.txt | sort | uniq -c | sort -k1,1nr

    2.3K61

    云数据中心网络运维的苦与乐

    由于大家对 SDN 有多种不同的理解,在本文中我想把话题聚焦一下,落到云数据中心的网络运维这个点上,分享一些运维中的实际例子。没有大的篇章,只说说我们遇到的那些苦与乐。...以前运维看到的网络是“租户—数据中心—运营商”,现在看到的网络在数据中心和租户之间多了一个“云平台”——这里增加了一个复杂的拓扑层。...尽管 VxLAN 已经标准化并且很多地方都在用,但实际上网络运维人员并不能看到 HTTP、DNS、ARP 等包头信息。这也给运维工作带来了很大的挑战。 第四个常见的问题略坑。...❆ 云网分析的技术栈 虽然目前运维界都在谈自动化,但我们希望更进一步——要有一个智能的解决方案,这样运维人员才能有一个好的睡眠。...就这样,从一段数据中提取特征、制定规则、下发网络、再观察/采集数据,如此循环。 ❆ 关于大数据分析 我们做了一些基础的工作来解决运维场景的问题。

    1.7K70

    运维分享|安全运维之网络七层模型

    防火墙技术的功能主要在于及时发现并处理计算机网络运行时可能存在的安全风险、数据传输等问题,其中处理措施包括隔离与保护,同时可对计算机网络安全当中的各项操作实施记录与检测,以确保计算机网络运行的安全性,保障用户资料与信息的完整性...,为用户提供更好、更安全的计算机网络使用体验。...无论是在哪个网络中,防火墙工作的地方一定是在网络的边缘。而我们的任务就是需要去定义到底防火墙如何工作。「策略」定义到底防火墙如何工作。「规则」对出入网络的IP、数据进行检测。...「协议」TCP UDP,数据包一旦离开网卡即进入网络传输层3.5 网络层「描述」进行逻辑地址寻址,实现不同网络之间的路径选择。...而又由于我们都需要从防火墙所控制的这个口来访问,所以防火墙的工作效率就成了用户能够访问数据多少的一个最重要的控制,配置的不好甚至有可能成为流量的瓶颈。

    68820

    揭秘腾讯云Supermind智能网络,百万级设备的网络高效运维

    超大规模网络运维的智能化 超大规模的网络数据采集、存储和实时计算已成为网络运维的极大挑战,腾讯云上网络线路几万条,拓扑复杂,但又需要满足多租户海量应用低时延、高吞吐的要求,使用人工评估加传统的路径规划算法的方式已无法根据链路负载的给出实时流量调度...不同于传统数据中心,云厂商内部在物理网络上还存在一层虚拟化网络,在虚拟化网络中每个租户又存在多个私有网络,网络层级多。...云上的虚拟化,热迁移,弹性伸缩,SDN给租户带来了便利同时给网络运维带来了巨大的挑战,如租户云上资源的热迁移和弹性伸缩时,其网络也需随之动态变化,网络运维系统需监控。 规模和复杂程度呈指数级增长。...全覆盖、多维、实时采集必然会造成数据大爆炸,大数据处理对腾讯云网络运维来说仅是基本功,腾讯云这身基本功,是依托15年的网络运营经验精打细磨出来的。...一般问题自动处理,重大故障专业建议 随着用云量和计算量成指数级增长,腾讯云面临的是海量的运维数据和极其复杂的云上网络运维场景,机器学习算法与云端网络运维业务整合是必然趋势。

    4K32

    网络配置——Linux运维基础

    今天把Linux的网络配置总结了一下,尽管并不难可是是个比較重要的基础。然后我也不知到自己以后是否会做运维,可是我知道自己比較喜欢刨根问底。还有就是我很珍惜我以前掌握过的这些运维的技能。...今天突然间问自己,Linux网络配置的那个文件路径是什么。突然间小心脏又绷紧了,我发现记忆已经開始模糊了。尽管陆续有把之前运维的笔记整理上来,可是每次都有种写遗书的淡淡地忧伤在里面。...no:不支持IPv6 IPV6ADDR:IPv6地址/前缀长度 二、献给那些windows运维人员 在我实习的时候,我看到有非常多运维...window的员工适应不了windows运维到Linux运维的转变。...mode=1:表示fault-tolerance (active-backup)提供冗余功能,工作方式是主备的工作方式,当中一块网卡在工作(若eth0断掉),则自己主动切换到还有一个块网卡(eth1做备份

    10.7K20

    「云网络安全」云网络安全101:Azure私有链接和私有端点

    更简单的网络架构:由于流量通过Azure主干网络从VNet资源流到私有链接资源,因此您不需要分配公共IP地址或配置NAT或网关设备。...私有端点支持:私有端点允许来自私有端点的流量访问私有链接资源,而无需公共对等或遍历internet。VPN隧道、ExpressRoute私有对等连接和peered VNets都与私有端点一起工作。...接口端点将你连接到由AWS PrivateLink提供支持的服务,并从相关子网分配私有IP地址,因此流量的来源和目的地都是私有IP。非常像Azure私有链接的工作方式!...然后,您可以选择与私有DNS区域集成,如果您使用默认的azd提供的DNS,这是推荐的,因为Azure会为您处理所有困难的工作。...私有端点必须部署在与虚拟网络相同的区域,但是私有链接资源可以部署在不同的区域和/或AD租户。 私有端点不支持网络策略,比如网络安全组(NSGs),因此安全规则不会应用于它们。

    10.8K10

    RAID原理分析总结-运维工作记录

    磁盘阵列把多个硬盘驱动器连接在一起协同工作,大大提高了速度,同时把硬盘系统的可靠性提高到接近无错的境界。这些”容错”系统速度极快,同时可靠性极高。...硬盘数据跨盘(Spanning) 数据跨盘技术使多个硬盘像一个硬盘那样工作,这使用户通过组合已有的资源或增加一些资源来廉价地突破现有的硬盘空间限制。...RAID 0具有的特点,使其特别适用于对性能要求较高,而对数据安全不太在乎的领域,如图形工作站等。对于个人用户,RAID 0也是提高硬盘存储性能的绝佳选择。...RAID 1结构图解 如图所示:当读取数据时,系统先从RAID 0的源盘读取数据,如果读取数据成功,则系统不去管备份盘上的数据;如果读取源盘数据失败,则系统自动转而读取备份盘上的数据,不会造成用户工作任务的中断...多重的附加驱动可以随时热机待命,提高冗余率和灵活性易管理性:SNMP(Simple Network Management Protocol,简单网络管理协议) 可以让管理员远程监视并实现系统控制按照RAID

    1.1K40

    Linux主流架构运维工作简单剖析

    LVS简单工作原理:用户请求LVS VIP,LVS根据转发方式和算法,将请求转发给后端服务器,后端服务器接受到请求,返回给用户,对于用户来说,看不到WEB后端具体的应用。...运维人员在维护LVS中,需要密切关注LVS当前转发连接数及系统LVS日志。通过监控平台监控VIP、真实IP的情况、连接数的情况。...作为IT运维人员在日常运维中,需要长期的关注网站的整体运行情况,分析网站瓶颈,不断优化Nginx的相关参数,并确保Nginx跟后端服务连接是否有异常等。...在日常的运维中,需要注意后端服务层的监控,及连接数的问题,要实时关注并监控后端服务的正常,配置多实例,冗余案例。...对于IT运维人员在维护数据库时需要密切关注数据库并发数、连接池等变化,关注数据库主从、读写分离状态及日志的变化情况,并制定完整的备份机制完成数据库的备份,有问题及时处理。

    93410
    领券