数据及信息业务系统多级别维护及评价指导系统.doc_第1页
数据及信息业务系统多级别维护及评价指导系统.doc_第2页
数据及信息业务系统多级别维护及评价指导系统.doc_第3页
数据及信息业务系统多级别维护及评价指导系统.doc_第4页
数据及信息业务系统多级别维护及评价指导系统.doc_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成果上报申请书成果名称数据及信息业务系统多级别维护及评价指导系统成果申报单位 北京 省(自治区/直辖市)公司成果承担部门/分公司 数据业务部 部门 / 分公司项目负责人姓名项目负责人联系电话和email项目完成人成果专业类别*数据业务所属专业部门*数据线条成果研究类别*其它省内评审结果*(按填写说明4)关键词索引(35个)深度维护 重要性 等级 标准应用投资0万元(指别的省引入应用大致需要的投资金额)产品版权归属单位中国移动北京公司对企业现有标准规范的符合度:符合规范本项目制订中国移动北京公司数据及信息业务系统组网规范如果该成果来源于研发项目,请填写研发项目的年度、名称和类型(类型包括:集团重点研发项目、集团联合研发项目、省公司重点研发项目、其他研发项目),可填写多个:本项目为北京公司数据业务部总经理专项项目成果简介:简要描述成果目的和意义,解决的问题,取得的社会和经济效益。当前数据及信息业务正以“爆炸式”的速度增长,对比2010年和2009年中国移动业务发展数据,数据业务比例同比增加近150%,业务种类也逐年激增,从06年数据增值业务16种,到现在的200多种。为保证数据及信息业务的可持续发展,中国移动总裁李跃指出“数据业务产品运营要量质并重;要创新客户服务手段,深化分层分级服务,提升重点客户感知;要深化拓展,持续推进运维标准化建设;回归基础,持续提升维护人员知识和能力;要提升高效低成本运营能力,快速响应客户需求”等战略措施,而比对数据及信息业务系统运维工作现状,仍存在如下问题:1. 业务系统“功能小而多”,系统维护涉及到网络、数据库、操作系统等多种it技术,目前尚未明确规范各业务系统的维护内容、维护标准及执行方法;2. 新兴应用服务不断涌现,业务种类呈多样化发展,针对数据及信息业务产品数量多、增长快、业务构成灵活多变、产品规模及影响度差异大等特点,对各业务系统采用一套系统维护标准将会造成公司维护资源的浪费。为合理调配维护资源,以达到提高维护效率,降低维护成本的目的,迫切需要建立一套灵活有效的多级别差异化的系统维护标准及方法。通过进一步提高对重要系统的维护标准及执行深度,确保重要系统获得更多的优势资源保障,关键风险得到合理控制,而对非重要系统可以适当降低维护标准,以降低维护成本,最终做到以最佳的资源配置做最恰当的维护,快速响应前端需求,推进公司数据及信息业务的持续快速发展。针对上述问题,本项目建设了一个数据及信息业务系统多级别维护及评价指导系统,该系统通过系统重要性定级并制订分级别、分模块维护标准及方法,明确规范了各重要性级别数据及信息业务系统维护工作内容、工作标准及方法,可以指导系统维护人员高效规范开展系统维护工作;通过搭建实践环境并制订实践案例,指导维护人员进行能力提升;通过开发前后台用户系统并实施维护效果评估,跟踪各业务系统维护执行情况,及时发现系统潜在隐患,提升系统稳定性。首先,参考中国移动北京公司集团业务网络服务等级保障体系,总结归纳多年的维护经验,并结合业务系统发展特点,建立业务系统的重要性等级评估方法,该方法综合考虑系统承载客户重要程度、服务范围、客户数量、直接或间接承载业务收益、品牌业务和战略重点、有业务支撑关系的系统数量及业务故障带来企业责任的影响程度几个维度进行系统重要性评级。目前该方法已通过北京公司评审,并作为公司级流程及方法发布和推广使用。然后,针对不同重要性等级,制订分层级的维护标准及方法,打造规范化、标准化系统维护能力接口,解决了目前无标准和标准无法统一的问题。之后,针对制订的维护深度标准体系,搭建实践环境,制订实践手册,指导维护人员进行实践和提高,提升维护人员能力。同时,为使此套深度维护标准更好地落地,本项目开发了数据及信息业务系统多级别维护及评价指导用户系统前后台界面,前台页面面向最终用户(系统维护人员)开放,实现自动跟踪业务系统重要性等级,根据业务系统重要性变化,自适应的适配维护深度标准及方法,并将维护“工作内容”、“工作流程”、“深度标准”、“维护方法”、“效果评估”使用web界面统一管理和呈现,界面友好,使用性和推广性强,有效实现维护标准和方法固化,方便知识转移,且新人可以通过系统的学习,快速适应维护工作。后台页面面向管理员开放,实现对前台页面及各种维护资料的统一管理和维护,通过与数据库连接,使零散的文档建立了关联,并成功实现了集中化控制与发布,使得维护资源能够进行可持续性管理。 图1前台页面 图2 后台页面最后,建立业务系统多级别维护执行效果统一考评机制,使系统维护质量可评估可量化,并推进将维护标准纳入综合网管平台,实现定期对业务系统维护执行效果进行检查,目前已实现cpu、内存、进程、日志等基本维护项目运行情况检查,自动输出巡检结果,下一步将逐步扩充自动巡检项,达到及时发现系统潜在隐患并跟踪问题改进情况,提高系统稳定性的目的。省内试运行效果:描述成果引入后在本省试运行方案、取得的效果、推广价值和建议等。一、 本省试运行方案目前已经应用于北京公司数据业务部维护的数据及信息业务系统中,共计30套业务系统,运行方案如下:1、 作为业务系统组网规范,对系统冗余性进行梳理按照本项目制订的中国移动北京公司数据及信息业务系统组网规范,可为系统建设、交维及变更操作时系统组网提供依据。通过对北京公司数据业务部所辖30个业务系统进行梳理,完成edsmp、移动城市、mgroup、手机支付4个系统的网络组网整改立项,排除了重要系统数据文件等单点隐患,提高了系统可用率。2、 自适配系统维护标准及方法,日常维护参照执行按照本项目业务系统定级方法,收集数据及信息业务系统基础数据,录入系统,自动生成等级评估和对应的维护标准及方法,业务系统日常维护按照生成的维护标准及方法开展;3、 业务系统维护效果跟踪定期对各业务系统执行结果进行检查,建立业务系统多级别维护执行效果统一考评机制,及时发现系统潜在隐患并改进,对发现问题定期跟踪解决进度,闭环处理;4、 实践环境中实操练兵提供实践环境和最佳实践指导手册,维护人员登陆实践环境进行学习实践,提升维护人员能力;5、 维护人员知识共享使用数据及信息业务系统多级别维护及评价指导系统前台界面进行项目推广,实现维护标准和方法固化,方便知识转移,且新人可以通过用户系统的学习,快速适应维护工作。二、 取得效果数据及信息业务系统多级别维护及评价指导系统在北京公司数据业务部的应用,取得了良好的社会效益和经济效益。具体收益如下:1) 节约维护成本,缩短维护时间数据及信息业务系统多级别维护及评价指导系统明确规范了各重要性级别数据及信息业务系统维护工作内容、工作标准及方法,不但节省了高级别维护人员的教学时间,还节省了入门级维护人员的学习时间。同时,多级别维护定义差分化的维护标准,使得维护资源能够得到有效的分配,节约了中、高级维护人员相对简单、重复的劳动时间,还能够使入门级维护人员得到有效的锻炼。此外,模块化维护实施,使各业务系统只需制定业务层面维护作业计划,而无须关心系统层面维护标准及方法,并且通过综合网管平台实现业务系统维护效果自动巡检,大大缩短了维护作业计划制定及维护效果检查工作耗时。通过在北京公司数据业务部30个业务系统中试行数据及信息业务多级别维护及评价指导系统,每年每系统可降低维护成本约33万元,试用期间合计每年维护成本节约990万元/年=33(万元/系统)*30(系统数),统计数据如下:一级指标二级指标单位效能值计算方法成本节约学习成本节约万元/系统.年1.76万元/系统每人独立维护时间节约22天/每系统*800(人工费/天)=1.76万元/每系统人工成本节约万元/系统.年31.28万元/系统系统日常维护作业计划及指导制定时间每系统节约16小时/8(节约天数)*800(人工费/天)=0.16万元/每系统每系统每天节省人工维护时间8小时/8(节约天数)*365(天/年)*800(人工费/天)=29.2万元/每系统维护效果检查工作每系统节约16小时/次*每年执行12次(每月1次)/8(节约天数)*800(人工费/天)=1.92万元/年2) 及时发现系统隐患,提高系统可用率部署数据及信息业务系统多级别维护及评价指导系统前,各业务系统缺乏统一的维护执行标准及方法,且紧急业务故障时,无故障案例指导。部署后,实现维护工作有标准可依,有指导手册指导执行,系统发生紧急故障有故障案例指导,并且有评估手段进行效果跟踪,有效的推进了维护工作向深度延伸,及时发现系统隐患,提高了系统可用率。通过对30个系统的部署实施,效果如下:一级指标二级指标单位效能值计算方法网络质量提升故障处理及时性百分比提高了16.7%((现在)故障平均处理时长-(原来)故障平均处理时长)/(原来)故障平均处理时长)=(2.5-3)/3=16.7%系统无故障率百分比提高了0.002%2011年上半年系统无故障-2010年系统无故障=99.994%-99.992%=0.002%3) 建立完善的实践及考评机制,提高维护人员能力通过搭建实践环境,制订实践手册,指导维护人员进行实践和提高,并使用考评体系,提高了维护人员的专项技能水平。数据业务维护中心2011年获得中级认证人员占维护人数30,获得初级认证人员已超过60。同时,为更好地实现人员成长评定,本项目制定了辅助的“人员考核评定”办法,并整合了与生产技术相关的测试题库。在项目运营初期,我们对一定范围的维护人员进行了测试。测试结果表明,中高级人员比例只能达到13%,在学习实践深度维护一段时间后,我们再次抽取题库对维护人员进行测试,测试结果表明,中高级维护人员达到一半以上。4) 实时跟踪业务系统发展变化,快速响应前端需求通过部署多级别维护评价系统,打造统一的基础维护能力接口, 系统维护人员只需在多级别维护及评价系统中录入系统重要性评级参数取值,系统即可自动核算系统重要性等级,并根据重要性等级自动匹配相应级别维护标准及具体执行方法,完成维护资源的合理配置。当前试用的30个业务系统重要性等级分布情况如下:区间i区间iii区间ii上图中:根据业务系统等级l的不同分布象限,自动匹配不同级别的维护标准及方法:a) 针对区间i(1l1.2)的业务系统:选择1级维护标准,共包括8个业务系统。b) 针对区间ii(1.2l2)的业务系统:选择2级维护标准,共包括13个业务系统。c) 针对区间iii(2l3)的业务系统:选择3级维护标准,共包括9个业务系统。通过以上多级别差异化系统维护标准的自动适配,对重要系统采取高级别维护标准及执行方法,而对非重要系统采用低级别维护标准。当业务系统重要性变化时,通过本系统实时快速完成维护标准及方法的调整,始终保证以维护资源的最佳配置,提高维护效率,达到快速响应前端需求,有力支撑前端部门的目的。三、 推广价值和建议本次应用的业务系统的业务年收益达几千万,通过提升系统运行质量,间接的保障了公司收入。同时,由于系统可用率的提高,也提升了公司在公众心目中的形象,提高了中国移动的品牌价值。此项目与经验值得进一步在其他业务系统和其他省份推广。在实际推广过程中,各省公司可以根据维护经验对该成果进行不断完善和补充,使维护经验达到全国范围内的共享,进一步提高系统运行质量。文章主体(3000字以上,可附在表格后):根据成果研究类别,主体内容的要求有差异,具体要求见表格后的“填写说明6”。详见表格后。项目内容目录成果上报申请书11.项目背景92.实现方案92.1.制订业务系统重要性等级,实现业务系统分级管理102.2.根据不同级别业务系统,制订分级维护深度标准及方法112.3.搭建实践环境,制订最佳实践手册,指导维护人员实践提高132.4.开发多级别维护及评价指导用户系统,方便维护标准及方法的管理和使用163.应用效果173.1运行实施方案173.2系统应用效果184.主要创新点204.1.针对业务种类多且功能小的特点,提出业务系统等级评价方法204.2.针对不同等级业务系统,建立多层级维护深度标准及方法214.3.动态跟踪业务系统重要性,自适应的适配维护标准及方法234.4.建立自动检查机制,实现对深度维护执行效果的监测评估254.5.开发界面友好的用户系统,方面维护资料的学习、查阅和管理265.总体效益和推广265.1.推广的基本条件265.2.推广的基本步骤265.3.推广产生的效益27数据及信息业务系统多级别维护及评价指导系统1. 项目背景当前数据及信息业务正以“爆炸式”的速度增长,对比2010年和2009年中国移动业务发展数据,数据业务比例同比增加近150%,业务种类也逐年激增,从06年数据增值业务16种,到现在的200多种。为保证数据及信息业务的可持续发展,中国移动总裁李跃指出“数据业务产品运营要量质并重;要创新客户服务手段,深化分层分级服务,提升重点客户感知;要深化拓展,持续推进运维标准化建设;回归基础,持续提升维护人员知识和能力;要提升高效低成本运营能力,快速响应客户需求”等战略措施,而比对数据及信息业务系统运维工作现状,仍存在如下问题:3. 业务系统“功能小而多”,系统维护涉及到网络、数据库、操作系统等多种it技术,目前尚未明确规范各业务系统的维护内容、维护标准及执行方法;4. 新兴应用服务不断涌现,业务种类呈多样化发展,针对数据及信息业务产品数量多、增长快、业务构成灵活多变、产品规模及影响度差异大等特点,对各业务系统采用一套系统维护标准将会造成公司维护资源的浪费。为合理调配维护资源,以达到提高维护效率,降低维护成本的目的,迫切需要建立一套灵活有效的多级别差异化的系统维护标准及方法。通过进一步提高对重要系统的维护标准及执行深度,确保重要系统获得更多的优势资源保障,关键风险得到合理控制,而对非重要系统可以适当降低维护标准,以降低维护成本,最终做到以最佳的资源配置做最恰当的维护,快速响应前端需求,推进公司数据及信息业务的持续快速发展。为解决上述问题,本项目建设了一个数据及信息业务系统多级别维护及评价指导系统。通过系统重要性定级、制订分级维护标准及方法、搭建实践环境、开发前后台用户系统,并实施维护效果评估五项工作,将维护向深度延伸,最终实现提升系统稳定性、及时发现系统潜在隐患并提升维护人员能力的目的,进而通过此维护的标准能力接口高效支撑前端市场需求。2. 实现方案本项目结合考虑数据及信息业务系统收益、客户重要性、支撑接口数等多维度,确定业务系统重要性等级,并根据不同业务系统重要性,建设数据及信息业务系统多级别维护及评价指导系统,最终指导维护人员有效开展不同系统的维护工作,并对工作效果进行科学有效的评价。1.2.2.1. 制订业务系统重要性等级,实现业务系统分级管理1) 制订业务系统重要性评级标准:根据数据及信息业务系统的特点,综合考虑系统承载客户的重要性、平台服务范围、客户数量等内容,制订数据及信息业务系统重要性评级标准。说明如下: 是否承载a类/内部重要客户:a类客户判断标准参见“集客2011311号-关于下发集团客户基础管理规范v1.2的通知”;内部重要客户包括北京公司进行业务运营的各职能部门,如品质保障部、市场部等;北京公司进行业务运营的各生产中心,如数据部、客户服务中心、信息系统部等,根据是否承载a类/内部重要客户确定取值: 承载:赋值为3; 不承载:赋值为1; 服务范围:根据平台服务的范围,确定取值: 服务范围涉及全网:则赋值为3; 服务范围是部分省:赋值为2 ; 只服务于北京本地:赋值为1; 客户数量:根据平台服务的客户数量,分别针对个人用户和企业用户数,确定取值: 个人用户大于100万或企业用户大于1000家:则赋值为3; 个人用户大于10万或企业用户100家:则赋值为2; 个人用户小于10万且企业用户小于100家的情况:赋值为1; 直接或承载的业务收益:根据公司每年的收入报表,核算当年年收益,确定取值: 如果年收入大于1000万:赋值为3; 年收入在100万1000万之间:赋值为2,; 年收入小于100万:赋值为1; 品牌业务和战略重点:数据业务部每年根据承担的业务指标,会明确是否为品牌业务和战略重点,属于以下三类之一的业务即为品牌业务和战略重点(属于公司的战略业务;属于公司的粘性业务;承担收入kpi的收入型业务): 属于公司重点业务或战略:赋值为3; 一般:赋值为2; 规模维持现状,停止进一步扩大:赋值为1; 有业务支撑关系的系统数量:如果该平台同时为其它业务提供支撑,根据支撑业务数量,确定取值: 支撑业务数量5:赋值为3; 支撑业务数量介于1-5之间:赋值为2; 无支撑业务,赋值为1; 业务故障带来的企业责任:根据业务故障带来企业责任的严重程度,确定取值: 如果业务故障会影响到客户的人财物安全:赋值为3; 如果业务故障影响到客户通信或生活生产:赋值为2; 如果业务故障只影响客户感知,客户可等待重试:赋值为1。综合以上因素,平均取值,计算出业务系统的重要性评级。2) 确定业务系统维护标准: 业务系统维护标准与业务系统重要性评级的对应关系如下:(假设计算出业务系统的重要性评级得分为l) 1l1.2:1级维护标准; 1.2l2:2级维护标准; 2l3:3级维护标准。2.2. 根据不同级别业务系统,制订分级维护深度标准及方法考虑到各数据业务系统的重要性不尽相同,针对不同重要性等级,制订分级别、分模块维护标准及方法。1) 明确维护工作内容,分为以下几个部分:根据对数据及信息业务系统服务现状的调研、与行业内领先的服务商讨论、咨询、以及对iso20000运维标准规范的对比,本项目确定维护对象为:网络链路/网络设备:指保持数据中心内部各系统间、数据中心与外部互联的网络及网络设备,包括内部局域网、互联网、专线、拨号网络、vpn及路由器、交换机、防火墙、入侵检测及负载均衡等;服务器:为用户提供高性能计算的设备,包括pc服务器、小型机、主机等硬件及其操作系统;数据库:为实现用户数据搜索、管理的应用软件;中间件:为实现特定需求的应用软件;存储设备:提供高性能存储的设备,包括磁盘阵列和磁带库等。2) 针对每一服务对象,确定服务类型为:预防性检查:为保证服务对象的持续正常运行,根据运行条件和运行情况进行趋势分析,及时发现脆弱性,并进行解决;常规检查:对服务对象的例行、定期的健康检查,如配置备份、数据备份/恢复等;安全配置及维护:根据集团公司安全规范,对服务对象的安全配置进行检查和维护;维护资料及报告:根据系统维护需要,定期进行维护总结、质量优化、投诉分析等。详细可见下图。共计完成117项维护作业计划梳理(其中网络链路/网络设备36项,服务器53项,数据库及中间件28项)。3) 针对每一项内容,逐一制订差分化、模块化维护标准及方法:对已明确的维护工作内容,逐项明确1至3级别系统维护标准及执行方法,分模块(网络链路/网络设备、服务器、数据库及中间件)输出相应级别维护作业计划及对应维护指导手册,共计完成9套深度维护指导手册,详细如下:序号模块维护作业计划设备类型维护指导手册1网络链路/网络设备36项cisco深度维护指导手册(cisco)2华为/h3c深度维护指导手册(华为/h3c)3netscreen深度维护指导手册(netscreen)4f5 big-ip深度维护指导手册(f5 big-ip)5服务器53项windows深度维护指导手册(windows)6redhat linux深度维护指导手册(redhat linux)7suse linux深度维护指导手册(suse linux)8数据库及中间件28项oracle深度维护指导手册(oracle)9sql server深度维护指导手册(sql server)以下以网络设备“网络连通性测试”工作项为例,说明差分化、模块化维护标准及方法:其中1级维护项由初级管理员完成(oca),2级维护项由中级管理员完成(ocp),3级维护项由高级管理员完成(ocm)。通过上述分级维护,既保障了维护工作的执行力度,又能够实现维护资源的合理配置,进而实现提升工作效率、节约维护成本的目的。2.3. 搭建实践环境,制订最佳实践手册,指导维护人员实践提高为提升维护人员能力,实践深度维护方法,项目组搭建了实践环境并制订最佳实践指导手册,指导维护人员学习实践。1) 实践环境考虑到项目成本及功能实践最大化两方面要求,实践环境使用了物理及虚拟两种环境。物理环境利用利旧设备搭建,可以帮助维护人员最大程度的了解设备物理性质、带外管理等知识点;而虚拟环境则通过高仿真的模拟,来实现对网络协议、操作系统和数据管理等技能点的了解。2) 实践内容:项目组分模块(网络链路/网络设备、服务器、数据库及中间件)编写物理环境和模拟环境实践内容100余项,涵盖日常维护各项操作,详细如下:序号模块环境类型实战案例1网络链路/网络设备物理环境aaa案例2asa案例3交换案例4模拟环境aaa案例5asa案例6vrrp案例7服务器物理环境日常操作_linux8数据备份_linux9模拟环境日常操作windows10冗余测试windows11数据库及中间件物理环境数据库安装案例12备份与恢复案例13表空间管理案例14性能测试案例其中,以网络实践案例中的交换案例为例,该案例可指导维护人员针对以下工作进行实践:工作项工作描述协议测试测试指定网络协议是否正常运行二层冗余协议关键选项测试,如(广播网络|stp|rstp|mstp|pvst+);三层冗余协议关键选项测试,如(hsrp|vrrp|glbp|failover);接口检查检查接口状态接口工作模、速率、mtu值、可达性、网络类型接口流量检查接口入流量、出流量、错误、队列冗余状态检查检查生成树状态生成树根和vlan划分 检查trunk链路状态封装方式 检查热备份冗余工作状态3) 实践方法通过制订最佳实践指导手册,指导维护人员实践,并对实践结果进行检验。以网络实践案例中的交换案例为例说明,实践环境如下: 实践步骤:步骤一:配置vtp域,设置当前设备为server模式,由此设备向其它vtp提供vlan信息维护。命令描述corea(config)#vtp domain bmcc创建vtp域corea(config)# vtp mode server配置server模式corea(config)# vtp password cisco配置密码,提供认证步骤二:当前设备建立实验所需要的vlan 结果验证:命令描述switch# show vtp statusvtp operating mode项显示server表示交换机的vtp运行于server模式switch# show vlanvlan以及接口划分 排障思路:故障1:由于密码配置、域名不一致问题导致vtp无法正常建立 注意交换机配置时的vtp domain 和vtp password配置。故障2: 由于vtp区域设置问题导致无法正常学到vlan信息2.4. 开发多级别维护及评价指导用户系统,方便维护标准及方法的管理和使用为更好的推广、使用数据及信息业务系统多级别维护指导及评价系统,本项目开发了“数据及信息业务系统多级别维护及评价指导用户系统”。该系统面向最终用户(系统维护人员)开发前台界面,通过前台页面呈现分层级深度维护标准、维护指导手册及实践案例。前台页面如下: 前台界面具备如下功能: 系统分级:实现自动跟踪业务系统重要性等级,根据业务系统重要性变化,自适应的适配维护深度标准及方法; 标准分级:可查阅各级别系统对应的维护标准,及各项维护工作的分工界面; 维护方法:可查询各项维护工作对应到各类型设备上的具体执行方法; 实践案例:提供实践案例及指导手册,指导维护人员在实践环境中练习,提升技能; 效果评估:可检查各业务系统深度维护工作开展效果。同时,用户系统面向管理员开放后台界面,实现对前台页面及各种维护资料的统一管理和维护,后台页面如下:通过前后台功能界面的协同工作,用户系统实现了将维护人员、管理人员、维护文档、维护内容、维护标准、维护方法与指定业务系统的整合,使维护人员在既定范围内获取有价值的指导信息,实现维护标准和方法固化,方便知识转移,新人可以通过系统的学习,快速适应维护工作。同时后台页面为管理人员提供了简易的管理接口,通过连接数据库,使零散的文档建立了关联,并成功实现了集中化控制与发布,使得维护资源能够进行可持续性管理。3. 应用效果3.1 运行实施方案目前已经应用于北京公司数据业务部维护的数据及信息业务系统日常维护工作中,共计30套业务系统,运行方案如下:1、 作为业务系统组网规范,对系统冗余性进行梳理按照本项目制订的中国移动北京公司数据及信息业务系统组网规范,可为系统建设、交维及变更操作时系统组网提供依据。通过对北京公司数据业务部所辖30个业务系统进行梳理,完成edsmp、移动城市、mgroup、手机支付4个系统的网络组网整改立项,排除了重要系统数据文件等单点隐患,提高了系统可用率。2、 自适配系统维护标准及方法,日常维护参照执行按照本项目业务系统定级方法,收集数据及信息业务系统基础数据,录入系统,自动生成等级评估和对应的维护标准及方法,业务系统日常维护按照生成的维护标准及方法开展;3、 业务系统维护效果跟踪定期对各业务系统执行结果进行检查,建立业务系统多级别维护执行效果统一考评机制,及时发现系统潜在隐患并改进,对发现问题定期跟踪解决进度,闭环处理;4、 实践环境中实操练兵提供实践环境和最佳实践指导手册,维护人员登陆实践环境进行学习实践,提升维护人员能力;5、 维护人员知识共享使用数据及信息业务系统多级别维护及评价指导系统前台界面进行项目推广,实现维护标准和方法固化,方便知识转移,且新人可以通过用户系统的学习,快速适应维护工作。3.2 系统应用效果数据及信息业务系统多级别维护及评价指导系统在北京公司数据业务系统日常维护工作使用前后对比如下:1)差分化、规范化维护标准及方法,及时发现多项系统隐患,提高了系统可用率:以m-group为例:m-group是承载集团客户无线ddn业务的ip传输平台,网络平台的边缘分别连接gprs核心网络及客户内部网络。m-group平台依托ip,gsm及gprs等核心协议,服务于客户内部网络与专用无线终端之间,使集团客户业务数据的无线传输成为可能。数据及信息业务系统多级别维护及评价指导系统应用后发现如下隐患: 望京及菜市口平台互联链路隐患:在该系统实施后,维护人员加大对望京及菜市口平台互联链路连通性测试的力度,发现了互联端口中存在crc error增长速率过快的问题,后来协调了传输部门重新制作了专线,并辅以冷备份专线,目前该隐患以完全排除。 客户报文转发隐患:在进行客户拨测时,维护人员加大了连通性测试力度,发现某客户链路进行较大报文传输时会出现明显的丢包,后维护人员仔细检查了骨干链路的中继封装,并进行适当的优化,目前隐患排除。 网管系统运行健康度隐患:m-group平台主要以网络设备为主,网络设备运行较为稳定,但平台内部仍存有其他辅助设备(网管系统网管服务器、日志服务器、acs服务器和流量监控服务器)在日常维护作业方面执行深度欠缺。通过数据及信息业务系统多级别维护及评价指导系统的指导,m-group网络维护工程师能够较为清晰的对服务器进行日常维护作业,发现了内存及磁盘利用率等多方面隐患,目前所有隐患已消除。以上隐患的排查,有效提升了m-group平台的可用率,2011年m-group平台未发生一起故障,可用率达到100%。2)模块化维护实施,各业务系统只需制定业务层面维护作业计划及指导,大大缩减工作耗时通过划分网络设备、服务器53项、数据库及中间件几个模块,并分别制定了各模块维护标准及方法,使得新交维业务系统时,只需要明确业务层面维护作业计划执行标准及方法即可(如检查哪些业务日志,日志检查标准如何?如何进行数据备份及备份情况检查,如何进行业务拨测,而系统层面的检查项、标准及方法能够按照系统重要性自动选择对应的维护标准及方法执行,无须进行人工干预),维护作业计划及指导制定工作耗时大大缩减,由原来的24小时缩减至8小时。3)由网管系统自动化检查各业务系统维护执行效果,实现对维护效果的监测评估本成果实施前,各业务系统维护执行效果检查工作由维护质量控制人员人工完成,平均每个系统完成一次检查需要24小时,考虑到维护质量控制人员还同时负责其他工作,因此每个月只能完成5个系统的检查工作,全部30个系统完成一次检查需要历时6个月。本成果实施后,通过将数据及信息业务系统维护及评价指导系统与综合网管平台自动巡检结合,实现了部分维护项目执行效果的自动巡检,并产生巡检报告,平均每系统维护效果检查时间缩短为8小时,维护质量管理员可以保证每月完成15个系统维护效果的检查和跟踪,工作效率大大提升。4)前后台用户系统的有效指导,新增维护人员可独立工作时间缩短1个月在传统维护实践中,入门级的维护人员在执行作业时,需要高级别维护人员予以反复指导。本项目用户系统地开发将维护标准和方法固化,方便知识转移,新人可以通过在用户系统中自学,快速适应维护工作。新增维护人员可独立工作时间由原来的4个月缩短至3个月。5)实践环境中实操结合考评机制,有效提高维护人员能力通过搭建实践环境及实践案例库,指导维护人员在实践环境中进行实操联系,并制定“人员考核评定”办法,定期进行人员能力评估测试,有效提升了维护人员能力。第一次测试结果,中高级维护人员比例仅为13%,学习时间三个月之后再次进行测试,结果表明,中高级维护人员达到一半以上。4. 主要创新点3.4.4.1. 针对业务种类多且功能小的特点,提出业务系统等级评价方法参考中国移动北京公司集团业务网络服务等级保障体系,总结归纳多年的维护经验,并结合业务系统发展特点,建立业务系统的重要性等级评估方法,该方法综合考虑系统承载客户重要程度、服务范围、客户数量、直接或间接承载业务收益、品牌业务和战略重点、有业务支撑关系的系统数量及业务故障带来企业责任的影响程度几个维度进行系统重要性评级。目前该方法已通过北京公司评审,并作为公司级流程及方法发布和推广使用。承载:3不承载:1全网:3区域:2本地:1100万以上:31万以上:21万以下:1重要业务收益来源(年收入1000万以上):3普通业务(年收入100万以上):2业务收益很小(年收入100万以下):1公司重点业务或战略:3一般:2将退网业务:1关联接口5:3关联接口为1-5:2无关联接口:1影响到客户的人财物安全:3影响到客户通信或生活生产:2只影响客户感知,客户可等待重试:1级别(l)将上述因素加权计算通过上述等级评价方法,统一了目前种类繁多、发展迅速的数据及信息业务的重要性等级,建立了数据及信息业务系统重要性评级标准接口,对指导不同种类的数据及信息业务系统确定维护标准、组网方式、服务等级等内容提供了依据。4.2. 针对不同等级业务系统,建立多层级维护深度标准及方法将业务系统划分等级,目的是让不同等级的业务系统对应不同深度的维护标准。通过进一步提高对重要系统的维护标准及执行深度,确保重要系统获得更多的优势资源保障,关键风险得到合理控制,而对非重要系统适当降低维护标准,以降低维护成本,最终做到以最佳的资源配置做最恰当的维护,快速响应前端需求,推进公司数据及信息业务的持续快速发展。以网络设备“连通性测试”工作项目为例:该项工作的执行标准共分为三个级别,较高级别的标准建立在较低级别的标准之上。如果某试用级别的业务系统完成某两台网络设备间的连通性测试工作,各级别执行标准如下:对于1级别业务系统,维护标准为:检查ping命令返回的输出内容,通过ping测试即可。下表中的测试结果表明192.168.12.0/24网络成功通过1级别的连通性测试。sw1#ping 192.168.12.2type escape sequence to abort.sending 5, 100-byte icmp echos to 192.168.12.2, timeout is 2 seconds:!success rate is 100 percent (5/5), round-trip min/avg/max = 31/31/32 ms对于2级别业务系统,维护标准为:通过ping测试的同时,丢包率1%,下表中的测试结果表明192.168.12.0/24网络成功通过2级别的连通性测试。sw1#pingprotocol ip: target ip address: 192.168.12.2repeat count 5: 100datagram size 100: timeout in seconds 2: extended commands n: sweep range of sizes n: type escape sequence to abort.sending 100, 100-byte icmp echos to 192.168.12.2, timeout is 2 seconds:!success rate is 100 percent (100/100), round-trip min/avg/max = 20/30/32 ms对于3级别业务系统,维护标准为:满足1级、2级标准的情况下,延时128ms。下表中的测试结果表明192.168.12.0/24网络成功通过3级别的连通性测试。sw1#pingprotocol ip: target ip address: 192.168.12.2repeat count 5: 100datagram size 100: timeout in seconds 2: extended commands n: sweep range of sizes n: type escape sequence to abort.sending 100, 100-byte icmp echos to 192.168.12.2, timeout is 2 seconds:!success rate is 100 percent (100/100), round-trip min/avg/max = 20/30/32 ms指导方法:1级业务系统:登陆sw1|sw2,并向对端发起ping测试(catalyst 3560,icmp协议测试),方法如下:命令描述sw1# ping 192.168.12.2测试到达sw2的连通性2级及3级业务系统:则按照如下方法执行:命令描述sw1# ping开启扩展ping测试对话选项protocol ip:选择测试协议(缺省为ip)target ip address: 192.168.12.2输入目的ip地址(192.168.12.2)repeat count 5: 更改icmp报文数量(缺省为5)datagram size 100:更改报文大小(缺省100)timeout in seconds 2: 更改超时时间(缺省2000ms,2s)extended commands n: 选择是否开启扩展命令(缺省关闭)上述分级维护标准匹配了不同重要性等级的业务系统,实现了按照业务系统重要性需求来进行分级维护,对维护工作具有较强的指导和实践意义。4.3. 动态跟踪业务系统重要性,自适应的适配维护标准及方法数据及信息业务目前种类丰富,且根据实际市场需求和推广情况,不断进行业务应用服务的新增、停止、扩展、变更等工作,使得业务系统的重要性等级也在随之变化,通过开发数据及信息业务系统多级别维护及评价指导系统,可以定期跟踪业务系统重要性动态变化,自适应的适配合适的维护深度标准及方法。如下图所示,选定某业务系统,按照系统重要性等级评价方法填写系统以下参数:系统系统重要性定级(结合考虑系统承载客户、服务范围、客户数量等内容定级,平均计算得出系统重要性级别)是否承载a类/内部重要客户(承载:3;不承载:1)服务用户范围(全网:3;区域:2;本地:1) 客户数量(个人用户/企业用户:100万/1000家以上:3;10万以上/100家以上:2;10万以下/100家以下:1) 直接或承载的业务收益(业务年收入1000万以上:3;业务年收入100万以上:2;业务年收入小于100万:1)品牌业务和战略重点(公司重点业务或战略:3;一般,稳定增长:2;规模维持现状,停止进一步扩大:1)有业务支撑关系的系统数量(关联接口5:3;关联接口为1-5:2;无关联接口:1)业务故障带来企业责任(影响涉及客户人财物安全:3;影响客户通信或生活生产:2;影响客户感知,客户可等待重试:1)级别eg.*系统31212322数据及信息业务系统多级别维护及评价指导系统即可自动产生该系统的重要性评级,并自动匹配出适合该重要性等级的维护标准及系列维护方法。 step1:选定某业务系统: step2:自动产生系统重要性评级 step3:点击对应标准,自动匹配该重要级别维护标准,如下: step4:点击对应标准工作项,可查阅详细维护标准,如下: step5:点击维护标准工作项,查阅出该项工作具体执行方法,如下:4.4. 建立自动检查机制,实现对深度维护执行效果的监测评估将数据及信息业务系统多级别维护及评价指导系统与综合网管平台自动巡检结合,对部分深度维护工作项执行效果进行自动检查评估,一方面提供了有效、自动且科学的的检查机制,另一方面,也明确了监控的深度和力度,有利于及时发现系统隐患和潜在问题,提高系统可靠性。目前已实现cpu、内存、进程、日志等基本维护项目运行情况检查,自动输出巡检结果,下一步将逐步扩充自动巡检项。4.5. 开发界面友好的用户系统,方面维护资料的学习、查阅和管理前台用户系统呈现分层级深度维护标准、维护指导手册及实践案例。后台界面实现对前台页面及各种维护资料的统一管理和维护。前后台功能界面的协同工作,实现了将维护人员、管理人员、维护文档、维护内容、维护标准、维护方法与指定业务系统的整合,使维护人员在既定范围内获取有价值的指导信息,实现维护标准和方法固化,方便知识转移。5. 总体效益和推广5.5.1. 推广的基本条件对数据及信息业务系统目前尚无统一的分层级维护标准及评价方法的省公司,我们推荐采用数据及信息业务系统多级别维护及评价指导系统。本成果可直接引入,推广仅需准备一台利旧服务器,用于部署数据及信息业务系统多级别维护及评价指导系统,无其它投资成本。5.2. 推广的基本步骤建议推广采取局部到整体的推广的顺序,推广的具体步骤:1) 准备1台服务器,直接部署数据及信息业务系统多级别维护及评价指导系统;2) 根据本项目业务系统定级方法,收集数据及信息业务系统基础数据,录入系统,自动生成等级评估和对应的维护标准;3) 按照生成的业务系统对应的维护标准,执行日常维护,并对效果进行跟踪。此外,为进行实践学习,可以准备2台利旧服务器、2台2层交换机、2台3层交换机、2台防火墙搭建实践环境,按照本成果中的范例,搭建实践环境,以提高人员能力(此步骤可选)。基于数据及信息业务深度维护指导及评价系统在北京移动数据业务部维护的数据及信息业务系统维护工作中的应用取得的良好效果,可以将成功的经验应用到其他省份数据及增值业务系统维护工作中。5.3. 推广产生的效益通过对北京移动数据业务部业务系统的推广情况,解决了生产中的实际问题:1) 业务系统“功能小而多”,系统维护涉及到网络、数据库、操作系统等多种it技术,目前尚未明确规范各业务系统的维护内容、维护标准及执行方法,2) 新兴应用服务不断涌现,业务种类呈多样化发展,业务系统重要性等级差别较大,一种标准很难适用于所有的业务系统。通过对目前北京移动数据业务部维护的数据及信息业务系统的使用情况,取得了良

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论