UPTIME M&O运维管理体系和运维实践
中科仙络陈高平29,Mar,2017
目录
●现有运维管理标准介绍
●UPTIME M&O运维管理体系简介
●UPTIME M&O体系建设流程
●运维实践分享
2014年8月发布中国数据中心工作组(CDCC )2017年5月发布国家标准化委员会2015年3月发布中国数据中心产业发展联盟2010年5月UPTIME INSTITUTE
数据中心运维行业标准
指导数据中心服务能力构建、监视、测量和评价
外部评价机构对数据中心服务能力成熟度进行测量
和评价数据中心运维人员指导从安全、人员、设施、运行四个方面界定
运维实践推广数据中心运维体系建设数据中心服务能力评价
基于故障防范的数据中心管理及运行体系,以保持“业务持续性”结果为导向
Uptime M&O 运维管理体系和标准,是全球数据中心领域权威的第三方研究机构Uptime 研究所提出的,用于指导和验证数据中心基础设施的管理及运营水平。
Uptime Institute 创始人-Ken Brill UPTIME M&O 运维体系✓提出较早,体系成熟。经过近几年推广,得到业界广泛认可✓系统、完善的运维服务能力构建及评价标准(M&O 人员认证和场地认证)
数据中心事件的几个重要定义
事件(Incident):
任何机房设备的异常动作,定义为事件。故障(Failure):
导致IT系统中断的,定
义为故障。故障是事件
的子集。
拯救(Save):
因为人员的干预,或者
系统冗余,没有导致故
障的事件,称为拯救。
–数据中心的事件不可以避免,从运行管
招行信用卡申请进度理人员的角度来看,就是多研究事件的
原因,尽量减少事件转化为故障的可能。