首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

微软计算服务Azure全球大范围宕机

北京时间8月19日消息,据彭博社报道,微软计算服务Azure的主要组件周一发生全球大范围宕机。...微软表示,Azure服务目前处于中断状态,原因是位于全球多个数据中心的至少6个主要Azure组件无法提供服务。Azure允许企业获取计算资源,通过互联网运行程序。...微软发言人克里斯蒂·莱万多斯基(Kristi Lewandowski)表示:“我们已经发现Azure服务的中断问题,包括虚拟机、服务、网站、自动化操作,正在与工程师团队一起努力,尽快解决这个问题。”...微软Azure主要与谷歌、亚马逊的计算服务竞争,8月份也遭遇过其它宕机问题。不过,计算服务在一个以上数据中心发生宕机并不常见。...这是自2013年2月一些存储工具停止服务以来微软经历的最为严重的Azure宕机事件。

1.2K100

顾问-混沌】服务宕机灾难预防手段:混沌工程

近年来,原生技术已逐渐成熟,越来越多的业务选择上,这不仅有助于降低服务的运维成本,同时还支持跨地域容灾,为服务的稳定性提供更大保障。...腾讯混沌演练平台(CFG),提供对腾讯CVM进行开关机混沌演练,可模拟服务宕机故障场景。...常见的服务宕机场景: 服务器所在机房因地震、水灾出现停电、温度过高、火灾等情况 应用程序Bug 网络攻击 尽管各厂商采取了大量的灾难预案,有着完备的应对措施;但是为保障服务的整体可用性,仅仅依靠厂商提供的灾难恢复能力是不够的...而主动地引入可控的服务宕机故障,进行混沌演练,便是验证服务容灾恢复能力的高效方案。 故障演习原理 执行故障:调用腾讯CVM开放API,发出开关机请求。...状态更新:虚拟机状态发生变化后,虚拟化平台管理组件通知腾讯后端服务。后端服务将更新CVM的状态信息,并将结果返回。 快速开始 可前往腾讯混沌演练平台,选择CVM 关机动作进行CVM主机宕机演习。

23310
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    谷歌多项服务出现宕机

    据国外媒体报道,谷歌公布的信息显示,美国时间周一,有数款谷歌服务出现中断,其中包括即时通讯工具Hangouts、电子制表应用Sheets和另一款即时通讯服务GoogleTalk。...其中Hangouts服务中断产生的影响可能最大,因为该应用目前为大量最新的Android设备所使用,其一大用途是短信通讯。...例如,自服务中断消息在太平洋时间早上9点传出以来,谷歌Nexus 5手机用户就一直无法正常发送短信。...这是继2月25日Gmail邮箱遇到麻烦后谷歌再一次出现服务中断问题。今年2月20日和1月24日也有多款谷歌服务宕机。...根据该公司公布的应用数据,它的邮件存档和安全服务Postini Services在过去一个月也频繁中断。

    72480

    计算宕机时我们该何去何从

    如果你觉得最近服务出现问题的消息不断传出,那么恭喜你还没有被计算冲昏头脑。上个月很多用户都受到了服务宕机的波及。...Nest 谷歌旗下的智能家居公司Nest所提供的智能恒温器和摄像头的服务在9月7日宕机约三小时。这是Nest一周之内第二次出现宕机事件。...现在有很多人使用摄像头来作为安防手段,因此这次宕机时间也引发了摄像头作为安防手段是否可靠的讨论。 计算正日益融入我们的生活,可能有时候我们都意识不到自己正在使用服务。...正因为如此计算宕机的影响才更严重。我想,最近一个月发生的这些宕机事件给我们的启示有三点: 计算不是万灵丹,我们不过是租别人的计算机而已。...可以是另一家服务提供商,也可以是自己后备的数据中心。对于普通用户来说可能就是Skype和Twitter的替代产品了。 真心希望上个月发生的这些宕机事件只是个巧合罢了。

    874100

    公有宕机如何赔偿用户损失?

    11月19日凌晨,微软Azure服务大面积宕机,在8月19日已有宕机先例的情况下,这次的事件让公众对云安全的关注再次攀升到了顶点。...随后,11月24日,微软在向服务用户发出的公开信中表示,将会通过SLA对Azure宕机中相关的受损企业进行相应赔偿。 一直以来,公有宕机后如何向用户赔付都是一个困扰服务供应商的难题。...首先,服务厂商不可能保证自己的服务100%无宕机,即使是号称永不宕机的大型机也同样存在风险;其次,用户的损失难以估量,关键系统与非关键系统、不同行业、不同企业规模造成的损失大小也不同,难以找到统一的衡量标准...由于上述两点,大部分服务提供商都没有提供相应的损失赔付条款,一旦出现宕机状况,用户的使用极易收到影响,甚至造成用户数据的丢失。 微软的SLA协议是对云安全模式的一种有益的探索。...一份合理的SLA能够让提供商、客户,以及约定的第三方监控服务对其进行度量。如果企业的提供商没能遵从SLA,通过预先设置的处罚机制将会补偿由于宕机对于企业业务产生的影响。

    2K130

    企业如何防止服务宕机

    服务器作为数据和网站的载体,其安全性和稳定性非常重要,但如今很多企业的服务器经常出现死机(即宕机)的状况,给企业业务带来很大影响。 为什么服务器会宕机? 1....服务器内存耗尽 服务服务每个请求都需要消耗内存,请求越多内存消耗量越大。一旦网站数据超出服务器空间限制,或者用户访问量过大,造成资源耗尽,都会导致服务宕机。 2....服务器机房环境所致 客观原因,如机房断电、机房温度过高,都可能导致服务宕机。 3....人为不合理应用 一些中小企业为考虑成本,租用较低配置的VPS、服务器等,但同时安装很多与网站建设无关的大型软件,让服务器不堪重负,导致宕机。 4....遭到DDoS攻击 服务器遭到恶意DDoS攻击,攻击者利用DDoS对你的服务器短时间内发起大量请求,使服务器空间消耗殆尽,造成服务宕机

    4K40

    微软服务宕机超24小时 企业关键业务如何避免被“拖累”

    8月,微软的公有服务以及Office365等软件,因为澳大利亚的极端天气,备用方案未能及时响应,导致澳洲用户出现了超过24小时的服务“暂停”。互联网时代对系统的可靠性提出了更高的要求。...国际知名的项目管理软件巨头Atlassian,虽然拥有十多年SaaS服务的运维经验,6年SRE经验,以及上业界标准常见的灾备和恢复计划,仍然在2022年4月出现了影响超700家企业用户的宕机和无法访问事故...作为公有用户,为避免使用的公有服务影响企业业务正常运行,可以考虑增加一些措施,例如:多区域部署、备份和灾难恢复计划、自动化监控和警报、弹性架构、数据冗余、容错测试等,在不同的区域或数据中心中复制关键数据...常见的方法是采用混合策略,结合公有云和私有,以在不同的需求情况下获得最佳的性能、可用性和成本效益。这样可以在降低宕机风险的同时,灵活满足不同业务需求。...国内主流的项目管理软件UniPro,其支持公有、私有以及混合部署,能最大程度满足客户的行业特殊性需求,此外还可根据数据权限等敏感信息,在企业内设置分组等,最大程度上减少宕机带来的损失。

    24520

    Google全球服务宕机50分钟!

    Google在太平洋标准时间(PST)14日凌晨3:45发生全球服务中断事件,其是因其自动化配额管理系统降低了Google内部的全球单一身分管理系统的容量,使得需要用户登入的服务全都出现故障,影响包括Google...平台(GCP)与Google Workspace ,一直到PST时间4:35才恢复正常,整整停摆了50分钟,不过,此事件并未波及Google搜寻。...此次中断的Google服务除了该公司所列出的隶属于GCP服务的Cloud Console、Cloud Storage、BigQuery、Google Kubernetes Engine服务,以及属于Google...Workspace的Gmail、Calendar、Docs、Drive、Meet服务之外,由于出问题的是Google的身分管理系统,因此一般用户的各种服务也同样出现错误信息,包括YouTube、Blogger

    64920

    避免在迁移过程中宕机

    在公共迁移期间,IT团队需要采取谨慎的步骤,以避免听到“系统宕机”这种可怕的提示。 随着组织迁移到基于计算的基础设施,IT团队需要在迁移过程中保持可用性。...但是,考虑到所有复杂性,在计算迁移过程中,防止宕机或最小化停机时间并不容易。计算团队需要考虑数据不一致,监控不同的软件版本,并检查其网络连接是否成功。 如果企业的应用程序崩溃,业务往往会停止。...定制和网络带来迁移的挑战 区分企业服务或简化操作的定制应用程序在迁移过程中创造了额外的挑战。当企业修改应用程序时,通常会创建一个附加组件或编写软件。...如果计算供应商缺乏支持独特功能所需的软件,则此自定义可能会产生问题。 新的提供商服务增加了复杂性 计算提供商服务的快速发展使得一致性更加困难。计算供应商正在从事高风险的竞争,提供新服务。...将工作负载移至计算时,企业面临诸多挑战,但公共供应商提供工具和服务来简化迁移流程。

    896100

    服务应用突然宕机了?别怕,Dubbo 帮你自动搞定服务隔离!

    我们这次宕机的是业务逻辑层,那按照目前使用 Dubbo 轮询的负载均衡方式,不是还会有交易分发到宕机那台应用上,这些交易请求显然会异常。 运气差点,不是会有一半交易请求都会有问题吗?...这是因为 Dubbo 内部会自动帮我们的摘除宕机的应用节点。 小灰: 啥?Dubbo 内部还有这功能啊?黑哥你给我讲讲原理呗!...小灰: 恩,正常应用上下线,Dubbo 消费者可以感知到,但是像服务提供者宕机的情况,消费者是怎么感知到的? 小黑: 这一点,就与 Zookeeper 的自身特性有关了。...Dubbo 服务提供者就是在 Zookeeper 注册了临时节点,如果服务提供者宕机了,临时节点自动被删除,后面的流程就跟 Dubbo 应用正常下线一样了。 小灰: すごい!...小黑: 其实应用宕机这种, Dubbo RPC 框架内部都可以自动帮我们处理,这种故障其实很好处理。

    97740

    TiDB 集群服务宕机怎么办?

    TiDB集群某台服务宕机怎么办? 今天在线上遇到了一个TiDB服务宕机的问题。这里总结下。...01 场景描述 TiDB集群中,某一台服务宕机,这台服务器上部署的集群组件有PD、TiKV、TiDB。 宕机之后,服务器SSH不通了,其他机器无法登陆上去。...02 服务宕机处理方法 正确的姿势是应该先使用scale-in来缩容这个TiDB节点。 你可能会说服务器都宕机了,SSH肯定不通了,缩容不会报错吗?...正确的处理方法如下: 这种情况下,需要借助scale-in操作里面的--force参数来将这个节点强制下线,因为节点宕机之后已经无法修复了。...针对这个服务器,分别执行完TiKV、TiDB、PD的scale-in操作之后,可以发现再次使用display命令查看,标志Down 状态的节点就彻底下掉了。

    2.6K10

    服务宕机,Redis如何恢复数据?

    前言 Redis作为内存型的数据库,虽然很快,依然有着很大的隐患,一旦服务宕机重启,内存中数据还会存在吗? 很容易想到的一个方案是从后台数据恢复这些数据,如果数据量很小,这倒是一个可行的方案。...但是AOF日志也有潜在的风险,分析如下: 由于是写后日志,如果在命令执行成功之后,在日志未写入磁盘之前服务器突然宕机,那重启恢复数据的时候,这部分的数据肯定在日志文件中不存在了,那么将会丢失。...快照只是记录某一时刻的数据,一旦时间隔离很久,则服务器一旦宕机,则会丢失那段时间的数据。...比如在T1时间做了一次快照,在T1+t时又做了一次快照,如果在t这个时间段内服务器突然宕机了,则快照中只保存了T1时刻的快照,在t时间段内的数据修改未被记录(丢失)。...由于两次快照之间是存在间隔的,一旦服务宕机,则会丢失两次间隔时刻的数据,Redis4.0开始使用AOF日志记录两次快照之间执行的命令(AOF和RDB混合使用)。

    36220

    Linux 入门到宕机 4 - 服务器连接

    前言 经过前面的铺垫,相信你对服务器应该有了一定的了解。现在我们可以尝试登陆服务器,一起来探索新世界吧。 准备 这里只介绍 Win 环境的电脑如何登陆(因为手里没有 Mac 设备)。...下载 Xshell 软件,这是 SSH 连接工具,也就是服务器远程连接的软件 下载地址 创建连接 打开 Xshell 软件 点击文件 点击新建 在连接中填写服务器名称、协议(默认就是 SSH)、主机(...最后选中自己的服务器点击连接。 第一条命令 服务器操作全部依靠键盘,所以刚开始会觉得很奇怪。接下来我们输入第一行代码,这是最简单的程序。 # 输入完了回车 echo Hello World!...# 来一场,真男人-俄罗斯方块 # 下载脚本 wget http://zxx.sh/file/bash/game.sh # 运行脚本 bash game.sh 总结 本篇文章介绍了如何连接服务器,并成功执行了脚本...接下来我会介绍服务器常用命令,类似 win 上的编辑文件,创建文件夹,删除文件夹等操作。

    1.6K30

    Linux 入门到宕机 2 - 购买服务

    购买服务器 2020 年 10 月 21 日・Linux 专栏 前言 如果你第一次学习使用,请不要急着买服务器,因为买回来大概率要吃灰。你可以在看完学习完一些教程以后再选择一款便宜的服务器上手。...服务器选购的坑非常多,如果你啥都不懂就去百度搜索《适合小白的服务器》一定是一堆高佣金的 Aff 在等着你。所以购买服务器之前,你务必先了解一下服务器的配置。...服务器配置 服务器的配置包括要选择地区、CPU、内存、硬盘、宽带、流量、系统这些配置,我们一个一个展开说。 地区 地区选择需要注意两个点:域名备案、延迟。...流量是购买服务器最贵的一个环节,所以按你自己的需求购买,够用就行。 系统 服务器可以安装 Linux 系统,也可以安装 windows 系统。这要看你具体需求是什么,要拿服务器做什么用。...有的服务商提供这两个系统安装的时候价格不一样。 ---- 总结 以上内容就跟买电脑的时候一样,我们需要了解购买的配置,根据我们的预算去购买服务器。

    2.6K20

    服务器又宕机了,怎么办?

    还有些或是猎奇,或是谋私的个人和组织,在制造着千奇百怪,匪夷所思的数据包及操作流程来试探你的服务器。这些都曾是我在服务宕机后向老板开脱的理由。...当WOW终于来到中国时,我一边欣喜着终于可以在艾泽拉斯的大陆上自由翱翔,一边却咒骂着9C的破服务器,动不动就宕机。...服务宕机后都发生了些什么? 显然的,宕机后玩家会骂,就像我在玩WOW时那样,骂游戏公司,骂老板,骂GM。非常抱歉,我们可爱的玩家们似乎并不清楚,这个时候最该骂的其实是我们这些程序员们。...一个最简单也最有效的做法是为每一台服务器都配备物理冗余,同步更新冗余服务器上的状态,当宕机发生时,立即将处理切换到后备服务器上。...其实我们想要的只是尽可能的让服务器进程不要宕机,如果实在是没有办法,就尽可能的让宕机后的玩家损失比较小,不需要我们做大量的工作去做善后处理。 很简单的需求,似乎我们纠缠的有些过头了。

    3.7K10

    java检测tomcat宕机_Tomcat意外宕机分析

    先简单说下测试过程,先创建一个web服务启动 test.sh,内容如下: #!/bin/bash cd/usr/software/tomcat/apache-tomcat-7.0.81/bin/..../catalina.sh start tail-f /usr/software/tomcat/apache-tomcat-7.0.81/logs/catalina.out 然后启动该脚本,服务起来了,可以正常访问...这种情况下: 1)、如果我先直接关掉ssh窗口后,Java进程会退出,服务不可用。 2)、而我如果先 用ctrl-c终止test.sh进程,然后再关闭ssh终端的话,这时Java进程不会退出。...服务没有受到影响,仍然可用。 3)、下面我又把最后tail这一行去掉,发现直接关掉ssh终端窗口,Java进程也不会退出,服务不受影响。 #!.../catalina.sh start 4)、最后我再次恢复tail这一行,然后在开头再加上 set -m, 直接关掉ssh窗口Java进程同样也不会退出,服务同样也不受影响。 #!

    1.4K10

    如何零宕机将本地 Kafka 集群迁移上

    的云端托管服务),整个过程是无缝的方式,无需服务所有者参与,且迁移是在正常通信中进行,没有任何停机。...为什么要托管 Kafka 集群? 自管理一个 Kafka 集群并非易事,尤其是在执行一些任务时,例如重新平衡 brokers 之间的分区,或者升级 brokers 版本等,这些必须认真规划和实施。...以下是使用 Kafka 平台,特别是 Confluent Cloud 的 4 个好处: 更好的集群性能和灵活性 其中的 brokers 分区的重新平衡让其不会成为性能瓶颈,可以轻松扩大或缩小集群容量,...我们决定根据不同的服务级别协议(Service-level agreement,SLA)对 Kafka 集群进行分割。例如,在 CI/CD 管道和数据迁移案例中,服务级别协议是有别于生产服务的。...零宕机迁移 在实时流量中执行迁移,就意味着必须进行细致的规划和实施。

    1K20

    Java服务宕机解决方法论

    1.1 定义 向服务器的请求都没有响应或者响应非常缓慢 前端界面的崩溃并非宕机 1.2 分类 进程闪退 内部崩溃 外部终止 线程锁死或者无限等待 内存溢出 下面分别进行详解 2 进程闪退 2.1...比如服务器总内存32G ,同时运行多个程序,程序 A 配了20G的Xmx,其他程序也配了20G Xmx ,Linux的交换空间也没有设置,这时候如果其他程序用满20G的内存那么服务的可用内存必然低于12G...,这时如果Tomcat需要大于12G的内存就很容易发生该错误,直接宕机!...解决方案 减少Xmx值使得所有的综合不超过服务器物理内存 调整 Xms=Xmx 服务器不要运行其他不必要的东西 配置一部分swap空间(虚拟内存) 2.2 外部终止 如果找不到"hs_err_pid"开头的文件那么...2.2.2 SSH注销 检查/var/log/auth.log,/var/log/secure或者对应日期的文件,检查宕机的时间点有没有 ? 时间吻合,那么宕机原因即可确认。

    2.1K42
    领券