|
|
|
|
|
|
f********t 发帖数: 6999 | 1 【 以下文字转载自 Seattle 讨论区 】
发信人: huduo (huduo), 信区: Seattle
标 题: 亚马逊史前最大宕机事件的启示
发信站: BBS 未名空间站 (Sun Apr 24 23:17:44 2011, 美东)
由于亚马逊在弗吉尼亚州(Virginia)北部的云计算中心宕机,包括回答服务Quora、新
闻服务
Reddit、Hootsuite和位置跟踪服务FourSquare在内的一些网站受到了影响。这些网站
都依靠亚马逊
的这个云计算中心提供服务。亚马逊服务页面显示Virginia北部的数据中心中断。具体
如下:
问题似乎从太平洋时间21日1:41开始:我们正在调查由于ESB卷引起的延时和错误,以
及US-EAST-1区
地EC2实例连接失效问题。
最晚的一条更新出现在早上6:09:EBS的API错误和卷延迟在受影响的区域任然存在。我
们正在继续寻找
解决办法。
这次事件可以说是Amazon史上最严重的宕机事件。
亚马逊没有表示它将在什么时候修复这个故障的具体时间。北弗吉尼亚州云计算中心是
亚马逊经营的许多
云计算中心之一。不过,这些系统的设计通常 是一个中心宕机不会中断其它的云计算
中心,也不会影响使
用那个服务的用户。亚马逊没有解释它为什么没有绕过北弗吉尼亚州云计算中心的故障
把工作量转移到许
多其它的云计算中心。
亚马逊拥有4个不同区域的不同数据中心提供云服务
截止4月22日,由于技术原因导致亚马逊计算服务中断事故已经持续了两天,业界分析
师表示这次事故将
会
导致许多公司重新斟酌对远程的、没有控制权的计算机的依赖程度。
“这是给云计算提了一个醒”,IDC的分析师Matthew Wastwood表示,云计算是指通过
因特网来访问位
于远程大型数据中心的服务和信息,这些服务和信息是位于不确定的任何位置,就好像
是位于云中。“它将
引发业界对云计算的重新思考。”
他说,这场思考将很可能会聚焦于什么数据和计算操作应该放到云上,什么是需要放在
公司的防火墙内
的。
Eastwood认为,这次事件还将会导致重新审查自己的云服务契约是否合适
是否需要实现备份和恢复服务,包括为不同位置的数据中心支付额外的费用。这是为什
么呢?分析师表示,
很明显,在本次实践中受打击最大的是一些创业公司,他们为了追求快速发展,没有选
择昂贵的备份和容
灾服务,从而导致数据不可恢复。
Amazon五年前创建了它的副业务:通过网络为企业提供数据中心先进的计算资源。今天
这家公司成为飞速
增长的云计算业务的早期领导者。
在企业当中,云计算模型快速流行起来,因为它能够让企业把计算工作外包出去,从而
避免了成本问题和
令人头疼的数据中心运维只需按需使用,通过网络来获取计算机处理器和存储,而不用
去拥有自己的机器
或这是操作软件。
亚马逊有成千上万个企业客户,包括Pfizer和Netflix等,也有大量的创业公司,它们
的业务经通常依
赖于AWS。收到本次事件影响的 包括Foursquare,一个本地社交网站;Quora,一个问题
和答案服
务;Reddit,一个新闻分享网站;和BogDoor,一个专门为网络出版 商做游戏工具的公司。
这些公司所报告的问题不尽相同,但是都包括了不能访问数据、服务中断和网站宕机等。
分析师说,一些已经选择了在Amazon计算机上进行关键操作大公司,倾向于选择付与计
算实例同样的钱。
视频网站Netfix已经成为Amazon云的大客户,其网站技术的大多数用户电影队列、搜素
工具和喜好等都
运行在Amazon数据中心。
Netfix表示平安渡过此次事件,“那是因为Netfix能够充分利用AWS的冗余云架构”,
这防止了任何位置
的技术故障,Nstflix的发言人Steve Swasey表示。
BigDoor是位于西雅图的一个20人左右的创业公司,因为Amazon的失误而受到打击。它
有着Amazon的
备份和恢复服务,该公司的 CEOKeith Smith表示,但是仅限于Amazon位于Virginia的
数据中心。
“总有要有一个权衡”,Smith说,注意到费用和开发者的时间将被要求来做更 多的事
情。
直到星期五早上,BigDoor的大部分用于支撑游戏和奖励功能的在线出版商的服务已经
备份,但是站点任
然不可用。
IDC预测,云计算将会以25%d的年增长率增长,到2014年将会到达555亿美元。主要技术
供应商积极推出
不同的云产品一些强调公用模式的服务,如 Amazon,还有一些更集中于向企业出售硬
件和软件,以帮助
企业实现海量计算工作负载的高效性。后面一种情况,企业除了使用云计算,还必须拥
有这些基础 架构,
因此称为私有云。
Rackspace公司的首席战略官和数据中心服务专家Lew Moorman说,亚马逊的中断事故跟
坠机差不多,
属于普遍事故中的一种。他指出,然而,飞机旅游比开车旅游还是安全一些的就好比云
计算比公司私有的
数据 中心要安全。“从世界范围内来看,每天,公司内部都会出现宕机事件。”
Moorman表示,“每一段
时间都很小,但是他们加起来就是更长的中断时间、金钱 损失以及业务损失”。
Amazon的挫折将给我们一些很值得借鉴的经验,“我们都有兴趣看到亚马逊处理好这件
事情的方
法,”Moorman表示,Moorman所在的公司Rachapace在云计算领域是亚马逊的竞争对手
。 | w******s 发帖数: 16209 | 2 这件事情让我的云方面的投入增加了50%到100%。。。
某种意义上说是对他们revenue的boost。。
【在 f********t 的大作中提到】 : 【 以下文字转载自 Seattle 讨论区 】 : 发信人: huduo (huduo), 信区: Seattle : 标 题: 亚马逊史前最大宕机事件的启示 : 发信站: BBS 未名空间站 (Sun Apr 24 23:17:44 2011, 美东) : 由于亚马逊在弗吉尼亚州(Virginia)北部的云计算中心宕机,包括回答服务Quora、新 : 闻服务 : Reddit、Hootsuite和位置跟踪服务FourSquare在内的一些网站受到了影响。这些网站 : 都依靠亚马逊 : 的这个云计算中心提供服务。亚马逊服务页面显示Virginia北部的数据中心中断。具体 : 如下:
| f********t 发帖数: 6999 | 3 就是说周一AMZN还要继续涨喽?
【在 w******s 的大作中提到】 : 这件事情让我的云方面的投入增加了50%到100%。。。 : 某种意义上说是对他们revenue的boost。。
|
|
|
|
|
|