信息化建设解决方案之运维篇
1、组织IT运维服务面临的问题
【导读】 随着组织信息化建设的不断深入,信息化的重点从
度不断增加、IT运维成本不断上升、 造成了一定的困扰,那么根源是什么?
IT建设转向IT运维,IT运维难
IT管理者
IT运维服务水平参差不齐、突发事件频繁发生给
1.1 IT 运维服务面临的困惑
随着IT建设的不断深入和完善
,计算机硬软件系统的运行维护已经成为了各行各业各
IT运维服务占到
IT部门工
单位领导和信息服务部门普遍关注和不堪重负的问题,据统计, 作量的80%左右。国内企事业单位的
(1) IT运维工作忙而不受重视 IT运维服务人员工作的一个普遍现象是
“很忙碌,坐不下
“救火员
IT运维普遍存在以下现象:
,每个IT运维服务人员都
虽然如此忙碌,但业务
很忙碌,到处在各个业务部门间解决和处理问题,就像 人员还是经常抱怨“找不到人” 到业务部门的认可,
、“解决问题太慢”等等。 IT运维服务人员的工作始终得不
运维或信息部门作为单位的业务支撑部门,
更谈不上决策权,
往往是项目建设完成
在
而且工作量也难以量化。
信息系统的战略规划项目立项等工作中话语权较弱, 之后才介入系统的管理和维护,等到发现问题为时已晚。
(2) IT系统复杂,维护难度高,风险压力大。 随着组织信息化的不断投入, 在一定程度上增加
组织的硬件设施、
软件系统不断增加, 软硬件设备的增加
IT运维的复杂性,包括各类开发系统、各类应用架构、不同品牌厂商设
备等等,需要不断增加人力投入, IT运维成本居高不下。对业务连续性要求较高的单位, 系统一旦宕机损失是巨大的,运维部门压力可想而知。有的单位由于缺乏系统的资产管理, 运维部门很难准确了解公司到底有多少 在年底审计时全团队奋战多日才能完成单位的
IT资产,公司是否需要购置新机也缺少数据支撑。
IT资产清查工作,然而来年又会因为设备报
废,或员工离职而发生很多变化,还是无法做到实时掌握准确数据。
(3) 技术人员难培养,流动性大。
大多数时候, 运维人员都在进行着简单重复的工作,
且很难得到最终用户的肯定,
他们
私下用“碌碌无为”、“穷忙族”来形容自己,人心涣散,自我认可度低,团队人员流动率较 大。情况往往是某人好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提 出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一段时间内出现波动。
(4) 服务商难管理,技术水平参差不齐,服务不及时,有问题不能及时解决
IT运维服务外包存在一定风险,关键在于对于 具体体现在招标环节疏于审查、 在招标环节加强对供应商资质、
IT运维服务外包供应商的管理不到位,
以及事后评价环节疏于考核。
通过
过程监督环节疏于监管、
能力水平、案例等考察可以有效包括准入关; 通过在服务过
程中加强监督可及时发现供应商服务提供能力的异常; 机制,保证供应商提供优秀的服务。 1.2 IT 运维服务问题分析
从以上现象可以看出,
通过事后评价可以建立供应商的退出
IT运维服务的所有问题的根源都不是技术问题, 而是管理问题,
包括流程管理的问题、评价管理的问题、应急管理的问题等等。主要包括:
(1) IT运维服务管理方式缺乏创新。
IT运维服务管理方式包括自营管理和外包管理,随着
IT系统复杂程度的增加,对于
IT运维能力的要求也越来越高,自营服务的成本已远远大于外包服务的成本,在某些非关 键的领域,应该引入
IT运维服务外包这一创新管理模式以降低服务成本,同时将组织自身
的IT运维人员解放出来,做更有价值和意义的工作。
(2) IT运维服务管理不规范。
IT运维服务人员很忙碌却得不到业务部门认可的根本原因是双方缺少 的基本语言, 也就是IT运维服务管理规范不明确,
导致业务部门对于
IT运维服务沟通 IT运维服务部门提供
IT运
哪些服务不清晰、提供服务的流程不清晰、对于服务的评价指标不清晰,同时也导致 维服务人员工作职责不清晰、人员间工作交接不顺畅、服务过程缺少监督等。
(3) 工作分工设计不合理,忽视梯队建设。
人员管理问题,根源在于运维工作分配不合理,业绩无法考核。若将运维人员分成一、 二、三线支持, 不同运维人员各司其职,
能使有限的运维力量得到合理利用,整体工作效率
再据此制定相应奖惩措施,
将明显提升; 同时也方便对各自的工作业绩进行评估。 同岗位提供不同服务技能培训,
或针对不
亦能提高员工工作积极性。 同时,加强运维团队内部知识系
统的建设,有利于沉淀内部知识积累,快速培训新员工,减少核心员工离职带来的冲击。
(4) IT运维服务供应商管理不到位。 IT运维服务外包存在一定风险,关键在于对于 具体体现在招标环节疏于审查、 在招标环节加强对供应商资质、
IT运维服务外包供应商的管理不到位,
以及事后评价环节疏于考核。
通过
过程监督环节疏于监管、
能力水平、案例等考察可以有效的对供应商的资格进行把关;
通过事后评价可以建立
通过在服务过程中加强监督可及时发现供应商服务提供能力的异常; 供应商的退出机制,保证供应商提供优秀的服务。
2、科学的IT运维服务管理之道
【导读】 解决IT运维服务问题,需要借鉴国内外优秀企事业的最佳实践,建立适合自身的
IT运维服务管理体系,并引入
成本之间的矛盾。
IT外包等先进管理模式,来解决 IT运维服务能力、质量、水平、
2.1 IT 运维服务管理概述
根据国家标准 GB/T 28827,IT运维服务定义为:采用信息技术服务和手段,依据需求提供 的服务级别要求,对其所使用的信息系统运行环境、业务系统等提供的综合服务。
IT运维服务包括自有运维、
的管理进行阐述。
外包运维、 自有与外包相结合的方式。 下面将对两种不同模式下
1.3基于最佳实践的 IT运维管理
2.2 ITIL 概述
IT运维管理作为
IT服务管理的主要范畴,目前国际上的研究和论证比较成熟,主要成果包
括IS020000系列的国际标准以及 ITIL最佳实践方法论,两者从理论基础上是一致的,区别在于 标准和标准的实践。下面以
ITIL为例介绍IT运维管理的最佳实践。
ITIL(IT Infrastructure Library) 诞生于 1980 年,由英国政府发起
,委托 CCTA(Central Computer
专门负责英
and Telecom muni cati ons Age ncy) 组织, 后成立 OGC(Office of Gover nment Commerce)
国政府和其它公共事业组织对
IT资源的有效及低成本利用。目前 ITIL已经成为IT行业服务管理
的理论基础。在此基础上建立的非赢利性 公认的ITSM的权威性社区。
ITSM论坛(itSMF-IT Service Man ageme nt Forum) 已成为
ITIL是基于流程的方法论。
户交付所需的
IT部门可用其检查是否用一种可控的和训练有素的方法为最终用
可适用于几乎所有 IT组织,无论其规模
IT服务。ITIL合并了一套最佳的实践惯例,
大小,或采取何种技术。 统管理工具所简化。
ITIL被用来建立和交付服务管理流程;这些管理任务可被某些服务及系
ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析 (checklist)、任务、程序、责任等与任何
大多数IT服务组织的主要行为。
,包括全面的检查清单
IT服务流程。
IT服务组织密切相关的问题。这些概念的定义也涵盖了
ITIL的指导建立和拓展自己的
IT服务组织可以借助
ITIL V3的核心设施是基于服务生命周期的
,服务生命周期框架下图所示 ,服务战略是生命周
基
期运转的轴心;服务设计、服务转换和服务运营是实施阶段;服务改进则在于对服务的定位, 于战略目标对有关的进程和项目的优化改进。
2.3 ITIL五大模块
ITIL V3包含的各模块内容如下:
(1) 服务战略(Service Strategy)
导。该部分内容提出了服务管理实践过程中整个服务生命周期的策略、
服务设计、服务转换、服务运营和服务改进的基础,它的主题包括了市场开发、 服务提供、服务资产、服务目录,以及整个服务生命周期过程中战略的实施。
(2) 服务设计 (Service Design)
服务设计描述了对服务及服务管理过程设计和开发的知道, 资组合和服务资产的原则和方法,
服务设计的范围不仅限于新的服务,
服务的连续性,
它包括将战略目标转变成服务投
它还包括为保持和增加客 服务水平的满足,
以及对
指南和过程。 服务战略是
、内部和外部的
户价值而实行服务生命周期过程中必要的变更和改进,
标准,规则的遵从性。它指导组织如何开发设计服务管理的能力。
(3) 服务转换(Service Transition)
服务转换为如何将新的或变更的服务转换到运营过程中有关能力的开发和改进的指导, 战略需求通过服务设计进行编码,
而服务转换则是探讨如何将这种编码有效导入到服务运营的体
服务
系中,与此同时,还应控制失败的风险和服务的中断。
(4) 服务运营( Service Operation) 服务运营包含了在服务运营方面的实践,
它对如何达到服务支持和交付的效果与效率,
确保
客户与服务供应商的价值提供了指导,并最终通过服务运营实现战略目标。
(5) 持续服务改进(
Continual Service Improvement )
服务改进为创造和保持客户价值而用更优化的服务设计、 量管理、变更管理和能力改进方面的原则、 务连续性方面的不断提高和改进意识。
实践和方法。
转换和运营提供指导。 它结合了质
组织要学会在服务质量、运营效率和业
服务设计和
此外,它还为改进所取得的成就与服务战略、
服务转换之间如何建立关联提供指导,为基于戴明环( 的建立提供思路。
PDCA )形成计划性变更的闭环反馈系统
2.2.3 ITIL关键流程
在IT运维服务体系中,
ITIL是一套基于流程的方法和规则。在组织信息化建设中, ITIL可以
指导信息化部门向用户提供更为高效可靠的服务。下面对这些关键流程进行简要的介绍。
(1) 服务台 服务台是用户与
IT部门进行沟通的唯一平台。服务台为用户提供了服务联系点,利用这个
IT
联系点促进组织业务流程与服务管理基础架构的集成。服务台的主要设计目标是加强用户与 服务部门之间沟通,为组织的信息化建设服务。
(2) 事件与故障管理
事件与故障管理的主要功能包括对事件与故障进行记录,
全过程。事件与故障管理的目标是在避免影响客户和用户业务的前提下让 到安全级别。
(3) 问题管理
问题管理流程是指通过事件发生的原因进行分析,
制定问题的解决方案以及预防措施,
分类,并安排专家管理故障处理的
IT系统能够迅速恢复
降低
因问题和事件而产生的消极影响。与故障管理单纯强调故障的处理速度不同
心功能是找到事件发生的深层次原因,并相应的提出合理的解决方案防止问题的再次发生。
,问题管理模块的核
(4)配置管理
配置管理模块负责识别和确认系统配置项、
记录和报告配置项状态和变更请求、
检验配置项
的正确性和完整性等活动。设置配置管理的主要目的在于为组织提供 变更管理和发布管理提供有效的支持。
(5) 变更管理
变更管理是在最短的时间内完成系统架构,
IT基础架构的逻辑模型
,对
并在服务的任一方面发生变更时对其进行控制的
服务管理流程。 该模块的设计目标是确保在变更实施过程中使用标准的方法体系并提高变更的效 率,并降低由业务变更导致的业务中断对组织产生的影响。
(6) 发布管理
发布管理流程负责对经过测试后导入实际应用的新增或修改的配置项进行分发和宣传。 管理之前进行的是软件的控制和分发,该过程由变更管理流程进行管理。
(7) 服务级别的管理
该项管理的目的在于为签订服务级别的协议而进行一系列活动所组成的服务管理流程, 主要的活动包括协议的计划、
草拟、以及签订服务级别等方面。
有效的服务级别管理可以保证
其中 发布
IT
服务质量在不提高成本的前提下能够稳步提高。
(8) IT服务财务管理
IT服务财务管理模块主要是指 IT服务过程中所需的成本进行预算和核算,根据预算情况向
客户收取相应的费用。所涉及的费用主要包括投资预算、服务成本的核算以及服务计费三部分。 合理的财务管理以及计费方法可以通过量化服务成本降低开销, 理行为。财务管理流程产生的预算和核算信息可以为
(9) IT服务持续性管理
避免风险的发生并引导客户的合
IT服务提供有效的辅助决策信息。
IT服务持续性管理指当系统发生故障时有可靠的技术、财务和管理资源保证组织的
能够正常运行。
保持IT服务持续性的关键在于当故障发生时,
系统仍可以提供预定级别的服务,
IT服务
从而确保系统的业务可以稳定持续的运行。
(10 )能力管理
能力管理既考虑运营成本也考虑业务需求,对服务能力进行合理配置从而达到 最大效能的目的。该流程包括服务能力管理、业务能力管理和资源能力管理等方面。
(11)可用性管理
可用性管理流程通过分析用户和业务方的可用性需求并以此为依据来优化和设计 构的可用性,有效的可用性管理可以在控制成本的前提下提高系统的可用性。 可以通过定位业务以及对用户的可用性需求进行分析,从而使
IT资源发挥
IT基础架
有效的可用性管理
IT服务的设计能够满足用户的需
求,并且可以避免
IT服务运作中可用性级别过高的情况发生,这一设计思想对于降低 IT服务的
运作成本具有重要意义。
1.4风险可控的 IT运维服务外包
IT外包是指组织为了实现自己的目标
能交由外部的服务提供商提供的一种管理模式。
,通过合同或协议的方式将部分或全部的信息技术职
IT外包一般还伴随着组织的
IT资产、人员、租
赁资产交由IT服务商管理
选择IT外包有以下好处: 专业公司提供的外包服务, 专业;利用第三方的资源和技术优势,
比组织自身服务部门的工作更为高效、
组织自身则集中精力发展其核
降低组织管理与运行成本;
心业务,增强核心竞争力;以组织业务特点定制的解决方案,完全人性化的集成及服务;单一的 联系点,全面支持客户众多品牌的软硬件产品,避免多厂商
IT设备条件下的协调成本等。
231 IT运维服务外包的基本阶段
对于外包的客户方组织而言,要成功实施 (1) 组织的内部分析和评估(准备阶段)
在这一阶段, 组织的高层管理者主要工作是确定外包的需求并制定实施的策略。 获得效益,组织的最高决策层必须米取主动的态度, 的视角和推动变革的力量。
(2) 选择合适的外包商(选择阶段) 在选择外包商时,
要先将自己要求的底线与外包商所能提供的服务进行比较。
通过识别潜在 要从外包中
IT外包服务,主要经过以下几个阶段:
因为只有最高决策层才具有外包成功所必需
的外包商,向外包商发布信息并邀请竞标,接收和分析外包商的标书,审阅外包商的证明文件, 验证他们在提供外包服务上的经验与能力,甄选最终外包商并进行合同谈判。
(3) 完成内部服务向外包服务的过渡(过渡阶段)
该阶段涉及到人事过渡、资源移交、工作场所变更、系统切换等过程。 (4) 外包的实施和管理阶段(整合阶段) 这一阶段对外包关系进行管理,
并就任何外包关系的维护与变化进行协商或者谈判,
并及时与外包商交换意见,
加以实
保证
施。客户在这一阶段要保持对外包业务性能的随时监测和评估, 外包工作的顺利进行。
2.3.2 IT运维服务外包风险管理
IT外包风险是由许多不确定因素造成的。
其中可能涉及配合外包服务提供商的需求进行一些
这些可能导致实际成本远高于预期
如果条款说明不明确或者
额外工作,包括协调成本、签约金和监督外包商进展的支出,
成本。另外,还有一些合同风险一一在与外包服务提供商订立合同时, 漏掉重要条款,都可能会让组织遭受极大的损失。
由于外包必然会涉及风险,
因而在外包决策前必须对风险进行管理,
考虑如何才能消除或减小风险,
进行风险评估, 要辨别、 同时还要考虑在外包协
分析风险并按照优先次序对其进行排序, 议生效期间产生的管理费用。
IT外包风险管理是指根据信息资源对于组织的价值,对风险进行预测、识别、评估、分析,
识别、评价组织的信息资源的威胁和脆弱性, 水平。主要包括以下几个步骤:
并在此基础上有效地处置风险,
从而使风险达到可 接受的
风险识别:识别和评估潜在的风险领域 风险分析:分析外包关系可能会产生的风险 风险排序:对风险的优先级进行排序
风险控制:考虑采用什么样的方法对它们进行管理与控制。
1.5 IT运维服务外包合同管理
外包合同管理是外包服务管理的一个重要组成部分。 大,而且外包服务对于组织的高效运营非常关键,
由于外包项目经常涉及到的交易金额庞
因此需要专业的法律文件支撑。
合同应该灵活
而又能够解决交易中真正问题,使客户和外包商双方均受到保护,能
对价值的创造和风险的管理起到支持作用。 外包服务合同包括服务水平协议 年。合同条款是外包服务中最重要的环节,
(SLA - Service Level Agreement)。外包合同一般为
合同条款制定的详细程度和明确性直接影响合同的履
5年、10
行。合同条款涵盖的内容非常全面,包括:合同的适用范围和预期客户资源需求、合同条件、基 准及衡量办法、有效期、终止原因、知识产权、合同转让、关键项目实施人员及补救办法、未来 价格灵活性、未来服务的灵活性、 付款方式和时间、 风险管理以及其它法律规定的合同必备条款。
好的外包合同条款对合同中的工作有清楚的界定,能够在双方出现分歧时成为解决争端的依据。
1.6 IT运维服务外包关系管理
在IT服务外包中,合同是要求双方履行承诺的主要约束力。然而仅靠合同并不能保证外包 的成功。由于外包合同在多数情况下是不完善的, 中不可能对外包服务需求的所有环节都做出具体的规定, 求,而且需求在合同中没有做出具体规定,就无法靠合同解决。
在这种关系下,
客户方需要与外包商建立起相互协作和相互理解的关系,
这样外包商才会对
合同是逐步实施并且不断变化的,
所以在合同
如果客户在外包职能范围内出现新的需
变化与额外的需求做出善意反应。 因此,外包商和客户之间的稳固关系显然是长期业务外包关系
成功的关键,也是解决外包中分歧的有效方法。
要正确维系与外包商之间的关系,
需要进行关系管理。
外包关系管理是指一整套能够使外包
关系运营的人事、流程、工具和系统。外包关系管理是组织确保实现合同价值的最重要的工作。
实践经验显示,成功实施外包关系管理的组织通常非常关注以下几个关键成功因素: (1) 双方协商的、可测量和可检验的客观绩效标准 成功的外包关系焦点在结果而不在手段。 度量性。只有通过与绩效的客观标准相比较, 务,外包商才知道他们正在满足顾客期望的需求。
(2) 正式的关系管理结构
需要制定客观的绩效度量标准,
能够保证结果的可
顾客才知道他们正在接受的服务正是期望获得的服
正式的、多层次的关系管理结构可以将客户和外包商连在一起。 理结构去替代以前内部的管理系统,
外包关系要求用它自己的管
管理团队或大 议程、会议
这种新型结构通常采用联合管理团队的形式。
每个团队的职责、
型合同的多个管理团队负责日常的、战术和战略方面的关系管理。 频度以及与其他团队的关系都有明确的界定。 制,能够实现问题的及时上报、处理和解决。
(3) 基于绩效的定价标准
基于绩效的定价可以确保不断地激励外包商去达到或超越设定的绩效标准。
这种关系管理结构建立起识别、 解决问题的重要机
当绩效超过标准
时,就给予奖励;当绩效低于标准时,就给予处罚。对处于外包关系中的双方的员工来说,这些 激励也可转化为绩效标准。 把所有的基于绩效的风险和收益转换成个人的绩效标准时有利于双方
关注焦点的适当调整
(4) 关于商业目标和关系管理的内部培训及交流 负责为顾客管理外包关系的员工应接受专门的职业培训,
包括全面理解合同的商业目标,
双
方认可的具体的绩效标准,以及他们个人的角色、职责、权力和报告结构。此外,最终用户也应 该接受适当的培训,以理解商业的总体目标、问题的识别和解决方式、 流也可以减少客户可能存在的不满或抵制情绪。
(5) 知识和技能持续不断的交流 两个组织之间持续不断的、 们自己的特长,
自由的知识和技能的交流是成功的外包管理的标志。
它不仅对双方关系的成功有所贡献,
每方都有他
而且对己方的成功也 沟通的渠道等。
培训和交
当这些特长被共享时,
有所贡献。培训计划、岗位经验、与专家交流、技术和工序都是有助于实现交流的具体方式。
3、MaxValue IT运维服务
【导读】 作为专业的IT运维服务供应商,我们向客户提供包括咨询、服务外包、工具一系 列的IT运维服务,帮助客户
实现
IT运维的高效管理。
1.7 MaxValue IT 运维服务总体框架
IT运维咨询服务为先导
实现IT运维的
完整的IT运维服务框架包括管理咨询、外包服务以及工具服务,以 进行顶层设计,
规范组织内部 IT运维和IT外包业务; 以IT运维外包为过程环节,
专业化和高效化;以 效率。总体框架图如下:
IT运维服务工具为支撑,实现流程的固化和实时监测,提高 IT运维服务的
IT运维外包 •IT运堪外包眼务憧
1.8 MaxValue IT 运维服务内容
针对客户的实际需要,我们将提供如下服务项目:
2.4 IT运维管理咨询服务
IT运维管理咨询服务就是以
IT治理思想为指导,
以推动 IT与业务的动态融合为出发点,基
于ITIL最佳实践经验,为客户建设以服务为导向的 务流程,建立信息部门和业务部门之间沟通的桥梁, 工具。
IT运维管理体系;帮助制定规范化的
辅助信息部门选择或开发规范化的日常管理
ITIL服
具体内容包括:
IT运维现状评估:
体系进行评估;
通过现状、 访谈、研讨等形式了解客户
IT运维现状, 并基于IS020000
IT运维体系设计:基于 IT服务外包管控设计:设计
通过咨询,帮助企业梳理现有的 织职能,通过引入服务台、 建立IT与业务的沟通 提高业务满意度,提高
ITIL最佳实践,搭建组织
IT服务外包的管理体系。
IT运维组织职能和流程;
IT运维业务流程,建立基于 ITIL最佳实践的运维流程和组
服务水平管理等最佳实践, “语言”和沟通桥梁,平衡
有效提高IT部门对业务需求的响应速度,
IT与业务的关系,平衡 IT服务质量与服务水平,
IT资产价值利用率。
3.2.2 IT运维服务外包服务
针对IT运维工作量大,技术繁琐,专业性高等特点,提供专业的基于
IT全生命管理工具平
台的MaxValue IT运维外包服务,帮助用户实现以花费更少、历时更短、风险更小、更为专业的 服务维护信息技术应用。
桌面管理服务
帮助用户解决桌面级管理运维工作繁锁且占用大量工作时间的困惑, 件维护及设施维护等专业运维服务,专业的人做专业的事, 节省。
基础设施维护
提供基础设施相关的档案、 基础设施正常运行,
物理环境、 计算机网络的运维以及应急救援服务,
同时根据日常维护的数据和记录,
保证用户现有
提供用户基础设施整 提供基础档案维护、
更迅速,效率更高,使组织总成本更
软
降低整体管理成本,
体建设规划和建议,更好地为用户信息化发展提供有力保障。
系统软件维护
提供系统软件相关档案、主机存储设备、应用软件、系统数据的运维以及应急救援服务,保 障用户系统软件正常运行,降低整体管理成本。同时,协调各业务应用系统内部运作,提高系统 可用性。
信息安全维护
提供信息安全相关档案维护、监测预警、风险评估、安全加固、
应急救援的运维以及信息安
全意识培训服务,及时掌握网络安全系统资源现状和配置信息,全面提高系统信息安全性。
3.2.3 IT运维应急救援服务
针对机房中物理设备、计算机网络设备、服务器存储设备、应用软件系统突发的重大事件, 包括信息安全事件,
以最快的时间进行故障排查定位和应急处理,
帮助客户实现事件发生后控制
事态,限制影响,避免或减少次生灾害的发生。
主要内容包括:
基础设施应急救援:包括网络故障、设备宕机等故障救援 软件系统应急救援:包括系统不可用、系统性能差等故障救援 信息安全应急救援:包括网络受攻击、病毒攻击、系统被篡改、泄密等故障救援。
1.9 IT运维服务辅助工具
MaxValue IT全生命周期管理平台作为运维服务辅助工具,具有全面的运维监控分析管理功 能,全面覆盖 IT运维工作的
各个阶段。
运维信息收集
IT全生命周期管理平台的机房中心、
监控中心、 网络中心、 安全中心能够全面收集运维过程
中出现的各种事件、告警、问题、变更等信息。能够全面地收集各种资产的监控指标,并根据客 户实际业务系统整合监控指标和组合算法进行核心业务的监控。
量估算等可视化数据实时推送到用户端。
统一分析和告警机制
系统采用统一的事件分析规则引擎。 范围分析等手段,根据事件的影响范围、破坏性、 据分级结果对事件进行处理。
运维管理
运维中心是运维系统的管理平台。系统采用全球
事件综合分析包括事件关联分析、
逻辑关联分析、 影响
根
将系统的可用性、
性能情况、容
可恢复性等风险评估结果对事件进行分级,
IT运维最佳实践的 ITIL作为管理流程设计
的依据。运维中心包括服务台、服务级别管理、事件管理、问题管理、配置管理、变更管理、发 布管理、日常运维管理等功能模块,全面覆盖运维管理的整个过程。
报表和展示 报表中心能够对
IT系统运行状况信息进行汇总,
并以图表的方式为管理人员提供直观的分
析结果,帮助更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为决策提供 支持信息。 报表支持多种格式的导出与自动发送功能, 的内容和格式。
展示方面系统支持 支持大屏幕的展示。
辅助运维工具
根据不同角色人员的需要,
灵活定制报表
PORTAL平台形式的可定制首页功能, 更能支持手机、PAD等终端的访问,
资产管理。资产管理问题是
IT运维工作的核心问题。 IT全生命周期管理平台提供全面的
。 不仅能够帮助运
IT
资产管理解决方案,能够对资产的购进、使用、变更、处置等全生命周期进行管理
运维知识库。运维服务人员处理问题的工具库。 维运维查询知识解决一线支持问题,
系统提供的运维知识系统,
还能够培训考核新员工, 加强内部交流。 运维知识系统能够
提高问题解决效率,降低运维人员的工作强度,提高服务满意度。
手矶APP ■
IT规划 项目管理 运维中心 知识中心 报表中心 网络中心
E3BI u OS
MaxValue IT全生命周期管理平台架构图
4、最佳实践介绍
【导读】 针对IT运维服务管理,国内外的大量实践已经为我们提供了优秀的经验。
1.10借助第三方咨询力量可有效实现
很多客户都希望加强自身内部的
IT运维服务管理最佳实践落地
IT运维服务管理或者加强对
IT外部服务的管控,但是苦于
没有经验,在实际建设过程中出现设计不完善、不能落地的现象。
实践证明,通过引入第三方咨询服务可以有效解决此问题。
实践和成熟的实施方法论,可以帮助客户在最短时间内实现适合客户自身特点的 理体系的设计, 佳实践的功效。
并能辅导客户实现管理体系与日常管理的有效融合,
第三方咨询服务依靠大量的服务
IT运维服务管
帮助客户最大程度上发挥最
1.11 IT运维服务外包可实现
在IT运维服务过程中,
IT运维成本与质量的平衡
很困扰客户的一个问题就是业务对于
IT运维服务质量的要求与 IT运
维服务能力和服务成本间的矛盾。伴随着组织 质量,IT运维服务成本激增,如何来解决?
IT系统复杂程度的不断增加,为保证 IT运维服务
通过引入IT运维服务外包,将部分或全部 IT运维服务交付给专业的第三方 商,可有效解决
IT运维服务提供
IT运维成本与运维质量的矛盾
专业公司提供的外包服务,
比组织自身服务部门的工作更为高效、
组织自身则集中精力发展其核
选择IT外包有以下好处:
专业;利用第三方的资源和技术优势, 心业务,增强核心竞争力。
降低组织管理与运行成本;
1.12应用自动化巡检工具能够降低运维工作强度,提高巡检效率
信息系统的运维工作,涉及对网络、业务应用、桌面、安全、告警、运维服务模块等上百个 指标的检查, 对于这些指标的检查如果通过人工巡检的方式进行, 检、重检的情况。
自动巡检时, 巡检中心按照巡检表要求定时启动巡检;
巡检指令由适配器接收并执行,
并将
巡检效率低, 并且可能出现漏
检查结果反馈到巡检中心;巡检中心实时展现当前巡检过程执行情况,发现异常情况即以工单、 告警等方式及时通知给应急维护人员;
有历史巡检结果报告,
针对每次巡检过程,
支持按照多种查询条件进行快速检索。
能够自动产生巡检结果报告。
自动巡检系统还能够根据设定,
对于所
定
期自动产生统计分析和趋势分析报告,支持高层领导决策。
相对于人工巡检,
自动巡检系统由中心和适配器分工协作实现自动巡检。
运维中心负责执行
实现对资产
巡检计划、分发指令、人机交互等;适配器通过调用资产数据接口或执行命令脚本, 信息状况的检查。自动巡检很好的解决了上述这些问题,是运维巡检的最佳实践之一。
1.13应用服务水平协议有助于提升服务质量和服务认可度
服务水平协议 (Service Level Agreement ,SLA)是一种由服务供应商与用户签署的法律文件, 其中承诺只要用户向服务供应商支付相应费用,
定义服务提供者和用户之间关系的一个文件。
服务水平协议内容一般包括提供的服务、服务水平、 的义务和责任、安全、知识产权和机密资料等。
有效的应用服务水平协议,
将有助于确定并界定用户需求、
提供便于理解的框架、
简化复杂
问题管理、 法律适用和解决争端、
客户
就应享受到服务供应商提供的相应服务质量,
是
问题、减少冲突范围、在发生争议时加强对话、消除双方不切实际的期望等。 立服务双方共同的愿景和考量标准, 提供方服务水平和服务质量的认可度。
实现对服务水平的统一理解,
服务水平协议将建
有助于改善服务接收方对服务
1.14持续监测有助于防患于未然,降低
持续监测就是通过部署监测工具对 标出现异常,将自动通过邮件、短信等方式提醒
IT故障发生几率
IT系统的关键指标进行 7*24小时不间断的监测,
IT运维服务人员进行关注并分析。
一旦指
通过持续监测 IT系统的关键指标, IT运维服务人员可以在故障发生前提前介入并进行调查
避免故障发生给业务造成的影
分析,并将故障在萌芽阶段予以排除,实现提前预警、提前处理, 响,降低客户损失,提高
IT系统的可用性。
1.15定期巡检是一种比较经济的故障预防手段
由于持续监测需要部署专业工具, 对于可用性要求比较高的
还需要IT运维人员24小时的驻场服务,
总体投资比较大,
IT系统是必须的。 如果客户所应用的 IT系统并不要求非常高的可用性,
持续监测这种服务方式就显得昂贵了,此时采用定期巡检的方式不失为一个好的选择。
定期巡检就是周期性地对 系统可用性的要求。
IT系统进行一次全面的健康检查,周期的频率取决于客户对于
通过规定项目的定期检查和
IT
定期巡检的检查项目与持续巡检检查项目一致,
日志分析,可以判断 IT系统的健康状况,查找系统漏洞和安全隐患,并采取措施进行加固。由 于定期巡检不需要一次性的工具和人员投入, 较高的故障预防手段。
也能取得较好的故障预防效果,
是一种投入产出比
1.16配置管理数据库是
配置管理数据库(
IT运维管理工作的基础
Con figuration Man ageme nt Database
, CMDB )是用于存储配置项及配置项
关系的数据库。在数据库中,配置项及其关系利用关系数据库的方式对客户 进行了描述,包括
IT服务的整体架构
IT服务、IT基础设施、IT应用系统、IT人员、IT文档等。
IT运维服务工作开展的基础。通过配置项的上下级关系将帮助
IT运维人
配置管理数据库是
员实现由故障点上下快速定位;通过配置项的横向关系将帮助
快速确定; 通过配置项的属性信息实现配置项关键信息的信息存储和检索。 数据库是IT运维服务工作快速、高效、准确的利器。
IT运维人员实现故障影响范围的
总的来说,配置管理
1.17运维知识库能够加强知识积累和内部交流,提升效率
运维知识库是系统知识积累的重要方式,
是员工日常工作的重要工具。
通过对知识库维护和
使用,不仅可以在故障自动处理和人工处理的过程中从知识库中得到相关故障维护的分类和快速 定位,找到匹配的处理案例,便于处理人进行借鉴,
而且知识库具有的业务帮助功能,
能使相关
人员可以通过关键字查询业务帮助、产品、市场活动、发生过的处理流程、电子文档等。
运维知识库一般具有的功能有知识的录入和查询、
知识的分类展示、
知识的转移和版本管理。
知识的录入一般支持多种方式,手工录入、模版导入、批量导入、事件关联等。在知识查询上一 般支持多种搜索方式,关键字搜索、条件搜索、高级搜索、附件全文检索等。版本管理能够管理 不同版本的知识,做到知识可追溯,修改有依据。
运维知识库系统还能具备个人知识的学习、 运维工作的支持效率,加强了内部交流和知识积累
员工的在线培训和考试、
知识问答等功能,
提升
因篇幅问题不能全部显示,请点此查看更多更全内容