首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯丢失数据被索赔1100万!

腾讯方面提出了总金额136,469元的“赔偿+补偿”解决方案,前沿数控则索赔11,016,000元,被腾讯认为过高,双方未达成一致。 ?...现在,腾讯发布了一份关于客户“前沿数控”数据完整性受损的技术复盘,对客户业务所受影响表示诚挚歉意的同时,详细解释了此次故障发生的根源,以及将采取的措施。   ...腾讯经过复盘发现,故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致盘的三副本安全机制失效,并最终导致客户数据完整性受损。   ...当天上午11:57,腾讯运维人员收到仓库I空间使用率过高告警,准备发起搬迁扩容。   14:05,运维人员从仓库I选择了一批盘搬迁至新仓库II,为了加速搬迁,手动关闭了迁移过程中的数据校验。   ...20:27,搬迁完成之后,运维人员将客户的盘访问切至仓库II,同时为了释放空间,对仓库I中的源数据发起了回收操作。   20:30,监控发现仓库II部分盘出现IO异常。

4.1K20

就腾讯与“前沿数控”一事回顾

车祸现场 第一阶段:数据丢失 针对腾讯硬盘故障导致清博数控数据完全丢失一事,腾讯回应称,该硬盘静默错误是在极小概率下被触发。...8月8日,据腾讯微信公众号最新消息报道: 近日,腾讯客户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统盘发生故障,导致该客户的文件系统元数据损坏,我们对客户业务所受影响表示诚挚歉意。...同时,我们也对此次故障过程进行了深入的技术复盘。...(1)索赔一千万:先不说你公司的估值有多少,就一网站数据你索赔一千多万,别人腾讯再大款也不会同意。...因为它操作简单,不需要服务器关机,还免费 1.打开腾讯官网的服务器下面的硬盘,在你的服务器对应的机房,找到你的硬盘。 ?

5.8K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    服务器故障邮件报警

    说到服务器硬件监测,用得最多的自然是Zabbix和prometheus,可是对于一般用户来说,部署要求比较高,而且也没有必要。...只是监测服务器硬件故障,并且发生问题的时候,以邮件形式告警,那么服务器自带的功能就足以。 比如戴尔服务器的idrac,配置硬件故障的邮件告警就非常简单。...如上图所示,首先填写邮件发送服务器的地址,其次就是填写发件人邮件地址,然后就是SMTP端口号,采用SSL协议的话,端口号就填写465;最后填写用户名和密码,就是发件人的邮件账号和密码。...收件人邮件地址,当然也需要填写,不然故障报给谁呢?然后可以“发送”测试邮件,一般都是秒收,如果没收到,就检查SMTP配置。...我比较关注系统运行状况和存储,尤其是存储,重要的数据都在硬盘里面呢,其他硬件故障,相对来说,没那么重要,电源坏了,可以换,内存坏个一两条,也无伤大雅。硬盘要是坏了,那就损失大了。

    24430

    顾问-混沌】 MySQL 主节点故障

    MySQL 主节点故障是指在 MySQL 主从复制架构中,主数据库服务器(主节点)出现问题,无法正常提供数据库服务的情况。主从复制架构通常用于提高数据库的可用性和性能。...若主节点出现故障离线,将会出现存量连接闪断的场景。 MySQL 主节点故障原理 该故障会向实例注入致命错误,来模拟多节点架构实例主节点故障。...因此,当主节点出现故障时,我们需要立即进行故障转移,将一个从节点提升为新的主节点,以保证数据库系统能够继续正常运行,并保证数据的完整性。...数据库主节点故障的原因可能有很多,以下是一些常见的原因: 硬件故障:这可能是最常见的故障原因,包括硬盘故障、内存故障、CPU 故障、网络设备故障等。...可前往腾讯混沌演练平台,选择 MySQL 主节点故障来进行。 进行 MySQL 主节点故障可以让您验证这些方法是否可以保证数据不丢失。在遇到该问题时,您也可以从容地应对~

    24910

    服务器硬盘故障预测实践

    理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响...我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 ? 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。...为了支持我们提供了运营模型设置,主要包括服务器类型,上架年限,服务器健康度,业务模块,预测比,坏块比,性能参数等,系统会根据这个设置表,对满足其中任意一条规则的预测故障盘,自动发起故障流程。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。

    13.6K90

    IDC服务器故障排除思路

    2、备件准备硬盘、内存、CPU、主板、电源模块等备件二、常规检查在不拆机、不断电的情况下检查故障服务器1、检查开机状态下服务器指示灯是否正常2、检查有无明显异味、有无明显异响3、检查外观有无明显磕碰、变形等物理损伤...4、检查电源线、电源开关是否正常5、登录BMC系统,查看设备状态和日志,定位故障服务器部件6、在授权可以关机断电的情况下,重启服务器,查看BIOS信息和BMCSEL信息定位服务器故障部件7、如确定为可热插拔的设备造成...如果最小化可以正常开机,再逐步添加其他部件,通过重启服务器来判断是哪个部件故障。2、替换法当大概知道故障范围时,可以通过1-3个部件逐步替换来查找出具体故障,检查故障现象是否有变化,来确认具体故障点。...通过逐一替换服务器内的疑似故障部件,观察故障现象是否消失,以此定位故障部件。可以先替换比较容易出故障的部件,比如硬盘、内存等。...PS:以上方法,不一定单独使用,可以具体情况具体分析,可以灵活组合使用四、主要配件故障排除思路1、CPU故障1.1、无法开机1)查看服务器的BMC log日志,来定位故障CPU位置2)拆机检查故障位置CPU

    9010

    Linux服务器故障排查基本方案

    服务器架构 服务器系统为Centos7 首先需要知晓系统的对外的架构 一般架构: 1.域名--->服务器(ECS) 2.域名--->CDN--->服务器(OSS) 3.域名--->CDN---...>服务器ECS+数据库RDS+缓存Redis 4.域名--->CDN--->负载均衡--->服务器ECS+数据库RDS(主从)+缓存Redis 5.域名--->CDN-->WAF防火墙--->负载均衡...--->服务器ECS+数据库RDS(主从)+缓存Redis 再根据实际情况出现的问题,一步步排查。...aliyun] XXX监控告警短信 【XXX】尊敬的***,监控-数据库于发生报警,CPU使用率(91.88>=80),持续时间4分钟 3.shell...,是否流量异常 应用层服务器 ECS服务器负载是否正常、cpu、内存负载是否过高,硬盘使用率是否达到100%等 缓存服务器 redis服务器负载是否正常、内存使用率如何 数据库服务器 数据库连接数是否正常

    67510

    顾问-混沌】PodNode CPU 故障注入

    介绍 在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。...本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。 2....验证故障生效 我们可以通过以下命令查看 CPU 负载情况,以验证故障是否生效: 物理机:通过 top 命令查看 CPU 负载情况。CPU 使用率 = 100 - CPU 空闲比例(idle)。...通过以上方法,我们可以轻松地对 Pod/Node 进行 CPU 负载故障注入,从而验证系统在不同负载下的表现,以及监控告警、流量调度、弹性伸缩等能力。 使用腾讯混沌演练平台实施 CPU 高负载。...故障实现原理是预先在混沌演练平台探针管理处安装腾讯自研 Agent 探针。

    27910

    顾问-混沌】Redis故障演练-主从切换

    然而,在Redis中的使用中,会面对一些潜在的故障风险,其中主节点故障,发生主从切换最为常见。 为何需要进行Redis的混沌演练?...腾讯混沌工程实践 Redis 集群是业务存储热数据的重要组件,为保证业务的可用性,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,默认的心跳超时时间 (cluster-node-timeout...如果此故障节点为主节点时,腾讯Redis将采取故障切换机制,将重新从备节点选举新的主节点。...腾讯混沌演练平台基于以上特性,提供手动方式跨过节点故障阶段直接模拟HA策略的故障动作,您可通过该手动故障方式模拟当 Redis 集群发生故障切换机制的短时间内对业务的影响。...优先同可用区切换 模拟主节点发生故障时,腾讯Redis真实HA策略场景:数据最新节点优先提主;数据相同时,优先同可用区其他节点选举 2.

    37210

    顾问-混沌】CPU 高负载故障演练

    为何需要进行 CPU 高负载故障演练? 服务器 CPU 负载的异常升高往往会导致服务响应时长增加、任务堆积甚至系统假死、服务中断等问题。因此,稳定和高性能的服务器对于业务的顺利运行至关重要。...高并发请求:当服务器接收到大量并发请求时,可能会导致 CPU 负载增加。这可能是由于突发的流量峰值、DDoS 攻击或者其他原因。...腾讯混沌演练平台为大家提供了这种故障演习能力。 CPU 高负载故障原理 使用腾讯混沌演练平台实施CPU高负载。...故障实现原理是预先在混沌演练平台探针管理处下载腾讯自研Agent,并安装至CVM服务器上,然后使用tat通道下发命令,启动一个名为chaos_burncpu 的进程,空跑for循环来消耗CPU时间片...快速开始 可前往腾讯混沌演练平台,参照CVM 资源利用率高指引文档进行演习。

    17310

    服务器故障、网络故障能提早知道?教你一招搞定

    在多年的IT外包服务过程中发现,一旦客户的网络或者服务器出现故障,如果我们能比客户先知道,并且迅速响应、解决问题,客户的满意度就会非常高。 那么,怎样才能做到服务器故障早知道呢?...在企业的IT基础设施中,服务器的健康状况是至关重要的,特别是Windows服务器,因为它们通常执行关键的业务应用程序。...3.安装过程中,按照提示设置合适的Hostname,填写Zabbix服务器的地址,注意,我习惯用域名来作为服务器地址,这样,当服务器IP变化的时候,就不用修改很多个客户端了,是个省事的好习惯。...随着你对Zabbix功能的深入了解,你将能够更有效地管理和维护你的服务器。 比如,Zabbix可以直接监测服务器的硬件性能,就算是服务器重启一下,也会收到邮件。...虽然不一定知道重启的原因,但是如果这个时候,客户跟你说断网了,你就能回答:“路由器重启中,估计3分钟内恢复网络,如果还是有故障,我们会第一时间处理。” 是不是很酷?想来客户一定会很满意的!

    13110

    服务器内存故障预测居然可以这样做!

    ​ 作者:vivo 互联网服务器团队- Hao Chan随着互联网业务的快速发展,基础设施的可用性也越来越受到业界的关注。内存发生故障故障率高、频次多、影响大,这些对于上层业务而言都是不能接受的。...然而硬件故障一直以来都是一种普遍存在的现象,由于硬件故障而造成的损失往往是巨大的。在服务器各个部件中,除硬盘故障以外,内存故障是第二大常见的硬件故障类型。...并且服务器内存的数量众多,vivo的内存数量达到40w+条,内存故障造成的最严重的后果是会直接导致系统崩溃,服务器宕机,这些对于上层业务而言都是不能接受的。...EDAC在vivo服务器全量上线过程以来,累计提前发现450+ case的内存CE问题,服务器的宕机数量明显减少。...对满足报修标准服务器业务进行迁移,并更换相应的内存条,避免因服务器突然宕机导致业务的不稳定,甚至因此造成的损失。

    18.2K20

    【鹅厂网事】服务器硬盘故障预测实践

    理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响...我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。...为了支持我们提供了运营模型设置,主要包括服务器类型,上架年限,服务器健康度,业务模块,预测比,坏块比,性能参数等,系统会根据这个设置表,对满足其中任意一条规则的预测故障盘,自动发起故障流程。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。

    1.5K10

    服务器

    腾讯云云服务器简介 服务器(Cloud Virtual Machine,CVM)为您提供安全可靠的弹性计算服务。 只需几分钟,您就可以在云端获取和启用 CVM,来实现您的计算需求。...腾讯服务器地址点击打开 腾讯服务器特点 弹性计算 在腾讯上您可以在几分钟之内快速增加或删减服务器数量,以满足快速变化的业务需求。...CVM 搭载的硬盘提供三副本存储策略,保证了数据在任一副本出现故障时快速进行迁移和恢复。...安全的网络 腾讯 CVM 运行在一个逻辑隔离的私有网络里,通过网络访问控制列表(Access Control List)和安全组,切实保证您上资源的安全性。...服务集成 CVM 与腾讯的大部分业务都可以做到高度集成,比如对象存储 COS,数据库 CDB,私有网络 VPC 等,合力在计算,存储,网络传输方面为用户的各种业务提供完善的解决方案。

    52.1K61
    领券