联系我们: 0755 26906860
您现在的位置:首页 > 新闻中心 > 《惊魂260小时》--讲述我们的机房“双路市电全停、柴发供电260小时”的经历
《惊魂260小时》--讲述我们的机房“双路市电全停、柴发供电260小时”的经历
发布时间: 2018-6-27 15:38:42


  • 该运营商对外宣称该数据中心为T3+标准,供电为双路市电,但事故后官方给出的答复为:“由于两路市电的两个分界室临近,一路出现故障,另一路因存在极大隐患,被强行切断”。

  • 运营方面,在数据中心双路市电全停、柴油发电机带载的情况下,时隔24小时才开始通知客户,官方说法是,虽然市电全停,但是柴发带载可以保障正常运营,他们认为风险很小,24小时后开始通知客户是因为两台柴发故障,需要减少负载,所以通知客户要关停一些机器。这样的处理过程和方式,存在隐瞒事实和未尽到及时告知的义务。

  • 事故发生3天后,市电何时恢复仍然没有时间点,一个如此规模的数据中心、一个承载如此多互联网公司业务的数据中心、一个承载如此多关键客户业务的数据中心,就这样跑在柴发上,就好比万丈悬崖走钢丝一样危险。


多年承担运营责任,使我对任何一丝风险都不轻易忽略。此次事故的经历再次刷低了我的“底线”,几乎没有了抱怨、骂人的动力,于是驱动了我把整个事件背后的真实情况分享给更多从业者的想法。



2010年左右,随着互联网和移动互联网应用的爆发增长,国内IDC行业也进入快速增长期,数据中心建设热潮随之而来。正是由于快速但无序的发展,使得数据中心市场暴露出了一系列的问题:


  • 数据中心从规划建设到正式运营至少要2年时间。当需求高涨的时候,从业者大批量开始投入数据中心建设,而2年后,市场上同时出现大批量可用的机柜,从而造成了大量数据中心资源的闲置。

  • 云计算的崛起,让IDC企业的中小客户基本上流失殆尽,这并不代表着客户需求的消失,而是中小客户已经全部上云,市场上的小颗粒用户越来越少,所以,但凡有个几十个机柜的需求出现,市面上的IDC企业马上就蜂拥而至。

  • 因为数据中心本身属于重资产、长周期的建设项目,以及政策方面的限制,于是近几年,运营商开始采取与第三方IDC运营商合建的模式,由运营商为数据中心提供带宽并负责机房的对外售卖,从而赚取差价。由于运营商合作的数据中心非常多,所以在售卖进度上,第三方IDC运营商是完全无法掌控的。


于是乎,在种种行业内外压力下,以及缺少有效地市场监管,IDC市场的恶性价格竞争、同行相互揭短的现象越演越烈。



“等我XX机房建成,看我手起刀落,杀他个一半江山(北京市场)”当众多的IDC运营商老板都在比谁家的数据中心“高大上”的时候,还有多少从业者能踏实下来聚焦到数据中心运营上呢。


数据中心的可靠运营,其实在设计建设和运行维护两个阶段的努力都不可缺少。很多数据中心在设计阶段,出于节约成本的“小聪明”,出于“怎么会那么巧出问题呢”的侥幸心理,设计上就先打了折扣,我在现实中见到过相当多机房都存在这样的问题,例如“同路由双路市电供电”,导致上述惊心动魄260小时的事故;例如“空调系统不在UPS带载范围内”,导致停电后数据中心温度飙升而宕机;例如什么防雷系统设计缺陷导致整机房遭雷击停电;这些都给数据中心后期运营埋下了“定时炸弹”。


数据中心日常运行维护过程中的精雕细琢就更重要了,而很多数据中心运营者只是聚焦打价格战,没有人重视后端运营、没有人重视增值服务。那些日常点点滴滴的巡检、面向客户的便捷性措施、客户零现场服务等等,在这些人眼里就纯粹是浪费时间和精力了。


然而,话说回来,作为数据中心的客户也理应练就火眼金睛,在选机房的时候就进行全面评估,把风险消灭在萌芽状态。理应在日常运维过程当中深入到风火水电的管理当中去。


虽然有很多的抱怨成,但我还是把这些年的经验整理并列出来,适当呼吁,以展示更多正能量:


  • 数据中心的数量需求,随着互联网、物联网、大数据等发展,仍然处于爆发期,甚至北上广深等一线城市会出现供不应求的状况。只是不要那么任性地说“到老板的老家去建数据中心”、“到某某山洞/湖里去建数据中心”,因为数据中心能否被使用,关乎到客户部署的是什么类型的业务、关乎到网络/光纤是否通达。

  • 专心聚焦在数据中心自身的发展,是一条不错的路,海外成功案例如Equinix,但这模式追求量、追求坚持标准。另外一条路是横向、向上拓展,不断丰富自己的服务和产品,满足客户变化的需求,例如向上打造自己的云平台、横向拓展基础网络等业务领域,市面上的成功案例也不少。

  • 虽然有云计算的冲击、合作机房模式的挤压,数据中心对客户来说,仍然是基础设施中的基础,数据中心运营者应该聚焦在打造运营精品上,至少像我这种踩过坑的老司机,还是相当认可这样的机房、这样的从业者的。


唠叨了这么多,很多观点可能漏洞百出,禁不住老司机们的“口水”,但我本意还是希望数据中心行业能健康发展。


再回到这260小时的事情上,如果我们只把眼光放到停电的260小时里,还是应该给这个机房运营商点赞,最起码有担当,估计要是一般的IDC企业可能早就跟客户讲“我们用柴发供电,一天耗油就近100万,承受不起,您关机得了”,而这家企业还是有责任心地坚持住了。而且这品牌的柴油发电机的确禁得住考验,也同样需要给点赞。


不过为什么最后才赞一下,我是真心的想对数据中心运营商呼吁,我们把工作做到前面,在设计建设阶段不打折、在运营维护阶段精细化,这样的数据中心,作为客户一定会喜欢,一定能过上“你好我也好”的好日子。