在云计算大规模进入传统行业之时,云安全、云故障以及云稳定性维护等成为云服务提供商面临的主要问题。近年来,国内外企业不断发生宕机、速度变慢乃至服务中断现象:2013年7月23至26日阿里云连续三天出现RDS故障和SLB故障;亚马逊于2011年、2012年、2014年分别发生多次宕机事故,致使多个网站服务中断;2013年8月21日,苹果iCloud大规模宕机波及300万用户;刚刚过去的11月2日,腾讯云出现短暂速度变慢引起大量用户投诉……这些看似并不重要的小问题,恰恰成为云计算发展的新阻碍,而问题根源在云计算基础设施的维护。
在具体建设及运行中,云计算基础设施面临四大挑战。
一、能源利用率(PUE)恶化。众所周知,虚拟化可以大幅降低服务器能耗,减少不必要支出,这也是云计算价值所在。基础设施建设中,供电和制冷设备的虚拟化是一大挑战,在非虚拟化状态下,会导致PUE恶化。解决方案是采用可扩展的供电制冷系统,对其进行“按需规划”,可显著提高能源利用率。
二、功率密度增加。在云计算环境中,虚拟服务器经常成群成组排布,形成高功率密度区,进而带来散热难问题。比较有效的方法是将较高功率密度的设备迁移至特定机柜行,与较低功率密度的设备交叉布局,在散热同时,还可确保每个机柜利用率最大化。
三、宕机风险。云计算数据中心的负载因时间和空间不同而变化,经过高度虚拟化的云计算数据中心负载波动更大,更易发生宕机风险。这时,使用可预测的管理工具、实时配合虚拟机管理器是保持数据中心精简、高校的有效方式,且可确保供电量、制冷量与动态负载高效匹配。
四、不必要的冗余等级。一般而言,云计算数据中心配备高级别IT容错系统,虽可提高系统稳定性,但可能会降低供电和制冷设施的冗余需求,发生故障时,自动应对能力有所损耗。解决方案是以物理基础设施冗余配合虚拟化云计算环境容错性,实行按需规划,可有效降低成本。
CMIC认为,以上四大挑战虽有相应解决方案,但往往实际情况复杂多变,100%无故障基本不可能实现,云计算底层建设能力的提高,不仅需要服务商长期努力,还需要广大用户及基础设施提供商通力合作。
(责任编辑:安博涛)