注册

互联网云缘何故障频出


来源:北京青年报

创业公司“前沿数控”8月5日发文称,公司存放在腾讯云上的精准注册用户以及内容数据全部丢失,并且不能恢复,造成公司平台全部停运的状态。

互联网云缘何故障频出

创业公司“前沿数控”8月5日发文称,公司存放在腾讯云上的精准注册用户以及内容数据全部丢失,并且不能恢复,造成公司平台全部停运的状态。前沿数控表示,公司丢失的数据近千万元级,对此索赔1000余万元。腾讯云对此回应称,该事故是因受所在物理硬盘固件版本bug导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏,仅能赔偿13万余元现金或云资源的额外补偿。截至昨晚,双方未能就赔偿方案达成一致。

事件

创业公司称腾讯云上全部数据丢失

前沿数控日前发文称,“在使用腾讯云服务器8个月后,我们放在云服务器上的数据全部丢失,腾讯云所谓的三备份数据也全部离奇丢失!”据其介绍,前沿数控是一家从微信公众号起家的创业公司,2014年创业,精准定位于数控、模具、机械行业,随后垂直行业精准粉丝突破了40万人。在2016年获得投资,公司业务也从微信公众号转型为打造行业的一站式平台,开发了包括网站、H5、小程序产品,并与全球高端装备制造企业建立合作。

“为应对迅速增加的流量趋势以及安全可靠的需求,前沿数控技术选用了腾讯云服务器。而灾难就发生在2018年7月20日,我们近千万元级的平台数据全部丢失,包括经过长期推广导流积累起来的精准注册用户以及内容数据,这瞬间将一家创业公司摧毁。”

前沿数控表示,此次事故,平台丢失的数据包括PC网页、H5、小程序共用的核心数据。平台注册的精准用户数据全部丢失、数十万条用户帖子全部丢失、行业品牌库数据及所有录入的资讯全都丢失。从7月20日20:00起,平台已全部停运,广告主在平台的广告投入已不能正常展示,面临退款赔偿及老客户丢失,公司融资计划也被中止,“这关系到一家创业公司的生死。”

有专业人士表示,“数据在腾讯云上因为硬盘挂了就丢失了,实在不可思议,即使一家公司使用自己的服务器,硬盘故障导致服务器宕机都能恢复数据,这个技术并不难,更何况云是有副本的,他们应该有容灾机制和数据完整性检验,以保证数据可恢复;即使全部损坏,只要硬盘没有物理毁灭也能恢复出数据……”

回应

腾讯称文件系统元数据损坏

对此,腾讯云称,该问题是“因受所在物理硬盘固件版本bug导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。”

腾讯云表示,腾讯云监控到异常后,第一时间向用户告知故障状态,立即组织文件系统专家并联合厂商技术专家尝试修复数据;但虽经多方努力,最终仍有部分数据完整性校验失败。“经过分析,该硬盘静默错误是在极小概率下被触发。我们随即对固件版本有bug的硬盘全部进行下线处理,确保相关隐患全部排除。”

腾讯云表示,基于云计算特性,为了杜绝概率极低的意外事故发生,我们在做好云平台数据备份保障外,也按照行业惯例在相关协议中提醒用户对自身重要数据,尤其是客户信息、程序代码、网页素材等进行数据本地备份。“遗憾的是,在这次故障中,‘前沿数控’也表示目前没有任何本地备份数据可以用来恢复业务。”

争议

双方就赔偿金额产生分歧

在数据确认无法找回后,双方争议的焦点在如何赔偿上。“前沿数控”基于自身评估,就此次故障对腾讯云提出了高达11016000元的索赔要求。

不过,腾讯方面提出的赔偿方案只有136469元。“腾讯云向‘前沿数控’接口人伍先生说明情况并表达歉意,同时安排专人积极与接口人沟通,也在第一时间制定如下‘赔偿+补偿’方案。”赔偿部分,“前沿数控”在平台上(自2017年12月份开户至今)产生的实际消耗共计3569元,依据腾讯云相关服务协议、规则和行业惯例,腾讯云将按照赔偿条款中的上限以现金形式全额返还这笔费用;补偿部分,本着帮助用户迅速恢复业务的目的,腾讯云承诺为“前沿数控”提供132900元现金或云资源的额外补偿。“‘赔偿+补偿’总金额达到136469元的解决方案,这其实也是其在腾讯云平台中用云金额的37倍。”

不过,目前双方仍未就金额达成一致。前沿数控表示,“我们也并非执意索赔一千万!”但质疑,腾讯云给出的132900元是怎么评估出来的?

关注

云设备稳定性差已成行业问题

北青报记者了解到,目前国内几大云服务商常常被曝出发生故障。有业内人士表示,相比通信设备等专业性设备,云设备造价偏低、稳定性也较差,这是整个行业发展的技术问题。

腾讯云表示,目前其产品可靠性已经可以达到“7个9”,也就是99.9999999%的稳定性。按照这样的概率计算,上述事件的发生概率为十亿分之一。不过,包括其他服务商在内的云服务商每年都会发生“宕机”事件,去年,亚马逊的AWS云服务就发生意外宕机,美国突然遭遇大面积断网。在7月25日,腾讯云广州区域部分用户出现资源访问失败、控制台登录异常等情况。经排查,确定该故障是因腾讯云广州一区的主备两条运营商网络链路同时中断所导致。

而在腾讯云官网,也有相应的“补偿政策”:“由于腾讯云故障导致您的云服务器等产品无法正常使用,我们将提供100倍的故障时间赔偿,让您使用舒心。”

[责任编辑:郝嘉玥]

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考

热点推荐

专题推介

凤凰新闻 天天有料
分享到: