欢迎来到优发表网

购物车(0)

期刊大全 杂志订阅 SCI期刊 期刊投稿 出版社 公文范文 精品范文

运维管理范文

时间:2023-03-08 15:35:31

序论:在您撰写运维管理时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。

运维管理

第1篇

关键词:运维管理;ERP;安全策略;SLM;客户主数据

中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)18-4281-02

Introduction of Operation and Maintenance Management

LI Yong-gang, JIN Wen-ting

(Petrochemical Company of Petro China Automation Institute, Lanzhou 730060, China)

Abstract: The article introduces the operation and maintenance work purpose, through the analysis of the system architecture, from safety strategy on the application of guaranteeing the smooth operation and maintenance work。It puts forward the problem of operation and maintenance work and gives reasonable solution and optimization opinion. The implementation of effective operation and maintenance management in the operation of the system, which can solve all kinds of problems, make operation and maintenance work more effective.

Key words: operation and maintenance management; ERP; security strategy; SLM; customer master data

中国石油销售公司ERP系统已经全部上线使用,ERP的工作重心转为运维,如何做好运维管理工作,如何减少运维的负担,是我们需要深化考虑的问题。我们首先要了解运维的目的,进而认识到SAP在销售公司实施的基本架构、系统安全及优化,最后运维的实现方法。

1 运维目标

对于SAP应用系统维护的目标,我们给出了基本的定义:

第一,系统要满足用户合理的需求,什么是合理的需求?用户的需求,要看合理性,不合理的需求,我们提供建议,变成合理的需求,以系统实现,合理的需求,即使系统不能直接实现,我们就是开发报表程序也要尽量满足用户需求。目前系统基本满足通用的业务流程需要,合理的个性化需求只要不违背板块的总体要求,不影响到别的销售公司的正常业务,作为运维人员就要尽量满足用户。

第二,改善成易学易用的系统。SAP的系统界面在销售公司的实施已经经过了一次客户化设计,本身比较简化,一些不需要的操作都不作显示。但是销售公司人员广泛,各阶层掌握的层次不一致,针对销售公司岗位化操作的特点,每个岗位相关操作的事物代码不是很多,把常用的事物代码添加到收藏夹的方法就很实用,简单的操作用户就可以更加方便的对系统操作。

第三,稳定性。保证用户正常操作和使用,尤其是月末月初,月结的时候对系统地操作人员增多,但据数量也大量增长,对系统地要求就更高,如果系统不稳定,影响到日常操作或者月末结账,就成运维事故了。

第四,提升系统的性能。销售ERP因为和多个系统进行接口,为了满足不同销售公司的个性化需求开发了很多ABAP和BW报表,这些开发虽然满足了各个公司的要求,但是不可避免的降低了整个系统的性能,我们不断提升硬件的系统性能和进行开发程序系统、接口程序的优化,来保证系统能够满足用户不断变化的正常的使用。

2 SAP系统架构及安全策略

下面我介绍一下销售公司SAP系统的架构,按照SAP的标准,首先是有开发系统、测试环境然后正式环境这三套系统。整个的系统基础平台都已是Netweaver平台,ERP系统我们现在是7100.4.14.3136版本,全部系统的数据库都是在适合大型企业的ORACLE下建立起来的。

下面我简单介绍一下我们使用的SAP系统安全策略,首先就是操作系统的安全,它包括了防病毒系统、操作系统的监控和我们的监控人员的日常作业。它保证了我们的各系统的正常运作,特别介绍一下SAP应用系统的策略,例如∶用户口令、用户帐号的安全策略,用户口令安全我们制定了一系列的安全策略,有口令长度的控制、例外控制、使用时间控制等,对于用户帐号的问题,我们设置连续输入三次错误密码自动锁定帐户的机制,防止他人猜测密码进入操作;还设置密码三个月自动重置,加强了安全性。

然后数据的备份策略,为了在系统出现故障时能及时恢复系统,我们从正式系统拷贝出一份,定时备份,以防系统出现意外情况,及时恢复。

系统的安全问题处理,实际上我们主要是从四个方面,一是网络安全、系统安全、数据安全、机房的安全,这四个方面都有专门人员作日常值班。每天值班人员监控系统,对于系统发生异常状况时,都能及时的发现、及早处理,并且对各种异常我们都制定了一系列的处理的流程,比如SLM系统提报机制,根据问题级别,分类处理。然后对于用户的问题处理,用户是能使用系统还是不能完全使用,可以根据不同情况处理作不同的处理。最后还要总结这些问题,制定策略一方面是以后如何避免该问题的发生,一方面是制定以后再出现类似的问题如何处理的流程,以便及时处理好这些问题,提高用用户的满意度。

3 运维的问题以及解决方案

目前主要存在的运维问题有以下几点:

第一、新客户主数据申请时间较长,新开发客户销售业务无法及时开展。

目前,新开发的客户申请流程如下:申请FMIS7.0编码MDM平台申请ERP编码ERP编码扩展财务对照表维护财务对照表审核财务责任中心对应。由于FMIS7.0编码和ERP编码申请均需要经过股份和项目组相关人员审批,流程较长,后续流程属于我公司可控范围。目前完成客户申请提报到财务责任中心对应至少需要2个工作日的时间,在此阶段该客户发生的业务无法按照正常业务流程在线运行,导致新增客户困难,影响市场开发。

尽量优化申请流程,尤其是要保证ERP系统内这部分可控范围内的效率,这至关重要,其他系统的操作我们可以电话联系相关人员进行沟通解决。

第二、由于系统流程设计原因,发生的非正常数据,系统考核未剔除。

销售公司对于ERP系统的使用进行考核,一些停用的加油站在系统内并未删除,基数过大导致考核成绩差。

系统内停用的站点都是以冻结客户的形式暂时不允许使用,并不是真正删除,所以导致考核时统计并未刨除这部分加油站。这一点的改进需要调整考核的策略,按照客户数量进行统计在用的加油站客户。

第三、结账时系统速度太慢。

月末结帐时,用户登录系统数量增大,导致系统数据交互频繁,速度减慢。

增大服务器内存,优化程序,提高服务器响应速度。

第四、应用问题。

由于销售公司实行岗位轮换,人员变动频繁,第一批参加ERP系统上线的关键用户大多都不在原岗位上,接手人员由于工作交接、缺乏业务知识等原因,操作不熟练,造成一定的错误。

由于每个销售公司都有专门的运维负责人,各个运维负责人可以根据该公司情况制定出专门的培训手册下发,大家通过看材料自学,在线提问解答的方式尽快完成知识转移。

4 运维流程的优化

目前的运维流程为,分公司用户提出问题给他们的关键用户关键用户提报SLM至运维中心并发传真运维中心收到传真转问题给运维负责人运维负责人转问题给相应负责人在测试系统处理完毕运维负责人测试运维负责人发起传输到正式系统的申请运维负责人在传输完毕后转移问题给提报人提报人关闭该问题。

优化流程需要从各个环节做起,首先要求提报人把问题写清楚、要求提明确,减少运维中心和运维负责人进行问题分类和分析的时间;完善测试系统,使测试过程简化;提报人经常提完问题就不再关注,这一点需要纠正,时刻关注邮件提醒,问题转移回来及时通知各分公司用户。

5 结论

运维管理是提高ERP系统顺畅运行的必备保障,已经成为中石油信息化建设的重要组成部分。运维管理可以有效解决实际系统运行中的各类问题。运维工作是一项长期、重复性较多的工作。运维人员要做好预防性的工作,做到防微杜渐;尽量减少人为因素对运维流程造成的不及时性,使运维工作更加有效率。

参考文献:

第2篇

关键字:集中帐号管理、集中认证、集中授权、安全审计

中图分类号: G250.74 文献标识码:A

随着信息化技术的日新月异,信息化建设也取得了飞速发展,系统核心业务大多应用采用集中化的数据处理中心运行模式,设立相对集中的数据处理中心,伴随信息化的不断推进,业务应用、办公系统不断被推出和投入运行,大量的服务器主机来运行关键业务,提供业务应用、数据库应用、运维管理等服务。

由于运行着大量的网络设备、主机系统、数据库系统和WEB中间件,它们分别属于不同的部门和不同的业务系统。目前各IT系统都有一套独立的认证、授权和审计体系,并且由相应的系统管理员负责维护和管理。当维护人员同时对多个系统进行维护时,工作复杂度成倍增加。另外管理员给用户分配权限,缺乏集中统一的资源授权平台,无法严格按照最小权限原则分配权限。随着用户数量的增加,权限管理任务越来越重,系统的安全性无法得到充分保证,给业务系统带来重大的安全隐患,甚至影响业务系统运行效能。具体体现在如下几个方面:

1、账号共用问题

网络中网络设备、主机系统和数据库系统众多,有些帐号多人共用,不仅在发生安全事故时,难于确定帐号的实际使用者,而且难于对帐号的扩散范围进行控制,存在安全隐患。

2、资源使用问题

系统的增多,使运维人员经常需要在各个系统之间切换,每次从一个系统切换到另一系统时,都需要输入用户名和口令进行登录,给运维人员的工作带来不便,影响了工作效率。运维人员为便于记忆,会采用较简单的口令或将在多个系统间使用相同的口令,弱口令和相同口令危害到系统的安全性。

3、授权力度问题

在这种复杂异构的支撑体系中,IT运维最佳实践是用户最小权限分配原则,由于各系统单独授权,无法严格执行,同时,随着业务系统的增加,用户的增加,用户授权管理工作也变得相当复杂,系统安全性受到威胁。

4、资源审计问题

由于各IT系统独立运行、维护和管理,所以各系统的审计也是相互独立的,不但各个系统单独审计,即使同一系统中的每个网络设备,每个主机系统都要分别进行审计,缺乏集中统一的访问审计平台。无法对IT系统进行综合分析,不能及时发现内部破坏和外部入侵行为。

如何提高系统运维管理水平,满足相关标准要求,防止黑客的入侵和恶意访问,跟踪服务器上运维人员的操作行为,降低运维成本,提供控制和审计依据,成为一个单位或公司越来越关心的问题。

可信运维管理技术作为目前内网安全最前沿、最核心和最全面的技术趋势,可以针对核心服务器、数据库等资源的运维,提供了最核心的监控和保护,通过部署该技术进行运维管理,实现了运维人员集中的账号管理,提高了管理的有效性;实现了集中认证与访问控制,提高运维安全性;实现了集中授权、安全审计,规范运维过程。

1、集中帐号管理,提高管理有效性

通过可信运维管理会建立一套新的用户体系,完全替代原有各系统独立管理的用户体系,前端用户直接对应到维护人员,后端用户直接对应到原各个系统用户,提供集中可实名的用户管理机制。通过统一用户信息维护入口,保证各系统的用户帐号信息的唯一性和同步更新;

2、集中认证与访问控制,提高运维安全

集中认证实现用户访问信息系统的认证入口集中化和统一化,并采用高强度的认证方式,使整个信息系统的登录和认证行为可控制及可管理,从而提升业务连续性和系统安全性。

集中访问控制为维护人员提供统一的系统和设备入口,提供访问控制功能,有效的解决运维人员的操作问题,降低相关信息系统的安全风险。

3、集中授权、安全审计,规范运维过程

第3篇

对企业管理层而言,如果每年的IT运维管理成本预算不断增加,又不能清楚看到这些成本投入到哪里,会带来怎样的价值,加之时不时出现的IT故障和业务部门的投诉等。这些问题积攒在一起, IT部门不仅会让人觉得“虚”,更可能留下“花钱惹麻烦”的印象。表面上被认可,但实际价值却难以落“实”的企业IT运维管理已成普遍现象。近期刚刚收获“2012年IT运维管理最具价值品牌”荣誉的锐捷网络,正在改变这一局面。

“看、说、做” 的新角度

锐捷网络IT运维管理业务部总经理冯晋阳认为:“IT运维工作无法抛弃为业务部门服务的本质,如果缺乏展示手段,IT在企业中的价值就有可能被冲淡。IT运维部门想要得到认可,必须把工作价值体现出来,并让别人发现。”传统的IT运维管理产品经过多年发展,虽然已经有了相当规模的应用基础,但在体现IT系统价值方面还存在缺陷。这些缺陷首先体现在给企业管理层提供决策的“看、说、做”上。

首先是“看”:保证企业的IT系统能够保持一个高效稳定的运行状态,提升企业应对市场的能力,这是IT运维管理的重要价值。但是,传统的IT运维系统却很难直观地让管理者看到这种状态。其次是“说”:当年终领导询问下一年的经费预算时,IT运维主管领导往往左顾右盼,只能说“大概”怎样。在需要IT运维部门“说实在话”的时候,由于没有科学的证据,IT部门的主管往往难以获得公信力或者说服力,这也是传统IT运维管理工具的缺陷。最后是“做”:IT运维部门如何去描述自己的工作价值?虽然现代企业的发展离不开IT技术的有力支撑,但IT投入的最终目的依旧是为了使业务系统发挥功效,实现利润与收益。在这条价值链上,IT运维管理在做什么呢?如果我们还停留在设备、网络、服务器的底层监控阶段,运维管理是无法与业务有机融合的。在企业的价值链中,IT运维的价值也会在无形中被抹杀。

“站在业务的角度去做运维,站在科学的角度上去说运维,站在企业价值的角度去呈现运维,这三点就是锐捷RIIL能够帮助运维部门把价值落实的关键。”冯晋阳谈到。用RIIL激活IT价值

对于IT运维管理部门来说,采用锐捷网络的RIIL激活IT价值,要做到有章可循,可以分为三个具体的阶段性操作来实现。

第一阶段:用RIIL搭建基础架构管理中心,通过多种协议方式完成所有设备的采集,形成物理和逻辑拓扑图。帮助IT运维部门实现IT基础设施管理的可视化和自动化,降低管理复杂度,从而提高对IT基础架构的主动监管能力。

第4篇

关键词:IT运维管理;稳定运行;维护工作;设计与实现

中图分类号:TP311.52

20世纪90年代以来,随着英国政府电信管理中心及其下属的中央计算机研发中心对IT服务管理实践指南,即ITI信息技术基础设施库的正式,IT服务的质量由此开始有了一个质的飞跃。自此,作为IT管理模型的杰出代表,ITIL技术被广泛采用,在很大程度上发挥了现代信息化资源的优势。随着近些年IT业的不断地快速发展和市场应用信息化处理技术的发展日趋成熟,IT管理系统在整个部门工作中的地位显得越来越突出。当前形势下我国国内的IT运行管理体系仍旧以分散管理为主流系统,随着我国经济的不断壮大与发展,传统的IT运维管理已经不能满足这种高工作量的工作,各单位内部事物的工作效率成为了高层管理着很伤脑筋的难题;由于现在国内对于IT运维管理要求的不断提高,使得上述问题日益突出,对于运行维护部门而言要求资源进行支持的加强化已成为必然;因此,为了保证当今形势下我国网络的稳定性和安全性,对于整个IT行业的运维管理就必须改变以往的分散式管理运维制度,进行强化集中管理,加强以ITIL为主导的新一代运维系统的建设工作。以前,信息部门在处理相关故障方面并没有一个统一规范的处理标准和处理步骤,同时也缺少对出现的相关的问题的记录工作。自从基于ITIL为理论基础的新型IT服务管理平台投入运行之后,通过对整个发生的事件管理和配置管理两个主要流程的记录与处理,实现了整个IT运维管理的流程化和标准化的处理过程后,企业员工可以很方便的通过多种途径对IT中出现的各种故障报告或者提出与之对应的服务请求。

1 ITIL简介

作为IT服务管理的核心框架,ITIL是一套能够协同整个运维流程通过服务级别协议(sLA)来提高IT服务质量的一种新型理论。它融合了系统管理、网络监测以及系统开发管理等现代管理活动,以及对信息变更处理、资产管理和问题管理等许多流程理论与实践的IT服务管理理论;整个IT管理主要分为两大部分,即服务支持和服务提供;ITIL把整个IT管理活动归纳为一项管理功能和十个核心流程的处理工作;IT服务支持和服务提供又各包含五个流程,主要有事件管理和问题管理等环节;通过介绍我们不难发现,ITIL是通过对整个IT运维服务中的服务支持来进行事件管理的,事件管理对整个IT服务中遇到的故障能够做出应急处理,通过对管理方法的变更、和配置管理来保障整个IT处理过程的记录和管理工作的顺利进行,从而达到对整个服务系统影最小化的目的。ITIL的根本目的就是为改善一系列IT服务质量不佳的状况而不懈的努力。在整个IT处理的业务流程的改进过程中,ITIL能够支持包括对现代企业组织机构不同形式和不同构成要素工作的全面支持与处理工作。并且可以做到根据机构、部门、工作组、所处岗位对不同人员进行灵活的模式分工。

2 IT运维管理系统的设计与实现

2.1 IT运维管理系统流程与运维管理

为了适应不同运维环境的需求,IT运维管理系统就应该对事件故障的发生以及相应流程标准处理机制全面考虑。使系统能够根据使用者的需求功能(问题管理、事件管理以及管理等)进行高效的管理与预处理工作。所谓问题管理简而言之就是当整个设计运维管理系统自动发现机制中,一旦出现故障信息,能够迅速的以IT系统维护的关系作为依据对整个IT信息进行自动筛选并且发送给相关的运维管理人员,系统将收集到的信息进一步向系统工作台进行转发,以提醒相关人员对故障进行进一步的处理工作。事件管理,顾名思义,就是对已经产生的事件进行筛选,然后判断是有相应的错误存在;一般而言,在具体条件下系统对做出处理反馈或者交由相关工作人员进行处理的事件有一定的记忆能力,这对于系统能够最在有效的条件下解决故障事件的能力有了更好地保障。当前,随着网络协议发展的日趋成熟,整个计算机服务管理系统的资源模块的不断升级,以TELNET、SSH、SNMP等多个协议为代表的新型资源管理模块能够完成对信息的自动提取、发现设备故障和对设备故障进行监控等任务;一旦设备出现故障,运维管理人员处就能够对故障进行及时有效的处理,在运维管理模块给出故障分析的具置并就故障进行处理的过程。另外,为确保整个系统的的正常运行,运维管理模块在对相关事件日常管理的基础上还增加了专门针对于日常运维管理机制的设计工作,在各个配置模块上添加了日常任务管理的功能,保证了每天系统对全套设备进行安全检查的质量与效率。

2.2 资源管理

作为整个IT运维管理系统的基础,资源管理系统能够实现对全套系统的所有资源进行清楚的记录并且有效地对管理效率有所提升,当前资源管理手段还是主要建立在对相应资源的电子或者纸质文档的管理上,但是这种传统的资源管理模式一旦出现资源的种类以及数量稍有增减的现象,便会使整个资源管理的工作变得十分繁复。因此在整套运维管理系统平台中,运维管理人员须首先对各种资源进行分类,然后按照固定的格式和要求完成对各类资源相关信息的录人工作,最后还要对整个管理流程配置自动监管设备,以保障在故障产生时系统能自动进行提醒。

2.3 服务台与服务台各功能的实现

服务台是客户向系统提交相关操作请求的一个窗口,而作为客户提供的服务请求,说白了其实就是业务部门与整个信息中心之间进行信息交流的一个接口,但这个接口特殊是因为它具有唯一性。因为整个来自服务台业务的客户投诉和服务台系统的监控系统发出的告警信息都是通过这个借口来传递的。服务台业务流程是:根据客户投诉或者监控系统发出的告警填写服务请求工单,服务台值班人员根据请求的严重程度判断是否需要马上处理或者现场处理,如果需要直接进入事件管理流程的入口(升级为事件);如不需要就分配给相关人员立即处理,处理完毕后填写请求处理工单,该服务请求流程结束。

3 小结

提高整个IT运维管理部门工作效率的最为行之有效的方式就是从整个IT系统的扩展性能、实用性能和集成性能方面出发以全局的眼光来提高整套IT设备的管理从而完成以ITIL理论为基础的全套运维管理系统的设计工作,成为当下相关信息中心研发部门进行研究和改进的重点。

参考文献:

[1]张瑞冉.IT服务管理在运维管理中的研究与应用[D].首都经济贸易大学2012

[2]杨小晔.IT运维管理平台的设计与实现[D].北京邮电大学2011

[3]林碧芬.基于信息类型的信息网站设计模式研究[J].福建电脑.2009(11)

第5篇

设计基于IT运维的设备管理平台时,可以在遵循上述需求分析的情况下,进行数据库、中间代码以及前端等的设计,设计后同时进行数据库、中间件及客户端的部署。考虑到以后的管理及维护成本,可以采用B/S架构;数据库选择Mysql,其高性能及高并发性会给设备管理平台提供高效的数据引擎支持;为提供报表管理功能,设备管理平台也会提供数据导入导出工具。基于IT运维的设备管理平台能够对设备管理的全过程进行动态管理,不论是进行设备的采购、维修还是报废等工作,都需要根据设备管理的操作流程进行,而且设备管理流程的每个步骤都要能够根据操作人员的角色进行业务处理,从而快速、高效的管理设备。作为平台的核心功能模块,设备故障处理要经过故障申报、故障处理以及处理结果等步骤,每一步骤完成后会显示步骤的操作人员和处理时间。

2IT运维管理平台的功能模块

缺陷管理模块中可以创建关联的变更单,此时有缺陷的被管理设备的状态被标记为“搁置”,缺陷问题被创建后,一旦缺陷问题被成功关闭,则可以根据缺陷的解决状态进行设备的状态变更,解决的缺陷其状态被变更为“已解决”。缺陷的记录一般由发现缺陷的人员进行,缺陷验收合格后,设备管理平台的运维人员需要注明缺陷处理的相关信息,并注销缺陷。IT设备经常会遇到变更关联设备的情况,如果某设备有关联的设备存在,那么此设备的关联关系在被关闭前,此设备不能被移除。其中,用户接入指的是用户提交设备变更单,对于处理完成的变更单,如果其达到预期目标,那么此变更单相关的设备变更流程即可关闭,否则此变更处理流程需要被返回。检修人员作出的检修申请形成变更申请单,如果此变更申请单涉及到的是通信的检修或停退,需要判断此检修过程是否存在检修计划,目的是让用户明确的知晓,从而指导设备管理。安装人员提交安装调试的变更申请,只有当所有变更资料都提交完后,才去验收安装调试过程是否合格;如果安装调试过程达到预期目标,则可以关闭此变更申请单。配置管理变更申请一般是由用户提出,配置管理人员会判断是否需要备份处理。日常巡检管理模块根据巡检的设备来执行不同的标准,巡检记录可以根据不同的预定义规则生成。设备管理平台的运维人员根据巡检标准、巡检周期等进行设备的定期巡检,并记录相关的巡检日志。相关设备的维护人员对此巡检日志进行分析,并给出是否正常、是否有缺陷等结论,如果发现设备的缺陷,则依据前文介绍的缺陷管理模块进行处理。

3基于IT运维的设备管理平台

第6篇

【关键词】企业;SAP系统;运维管理

很多企业已经实施或正在实施SAP系统,多数企业SAP系统实施过程中关注的重点是如何满足业务和管理的需求,目标是通过SAP提升企业管理水平,因此在这方面投入了更多多的时间和精力。SAP上线后企业关注的是系统的性能和不允许间断作业。于是SAP系统的日常管理及安全也提出了大量的挑战。而企业的SAP多数是兼职人员来管理,能力有限,企业更多的时间是为了满足和保证系统的高可用性。因此,他们的主要工作是为了满足不断增多的用户,不断增涨的业务需求。安全性成了重中之重,企业也往往只关注SAP系统的性能和不间断来满足业务需要。安全方面任何行为或操作都不允许影响业务。

SAP系统,它在企业中的位置绝对是最重要的和最关键的,任何闪失都不允许出现的。企业花费大量的人力和物力来打造SAP系统,看重就是业务功能的实现。功能在业务部门眼中绝对排第一位,任何可能影响SAP系统正常运行的行为都会被扣上一顶影响生产,影响业务的帽子。造成了SAP后台管理人员害怕、也不敢提出对SAP系统的任何变更和调整。因为谁也禁不起这顶大帽子。这就造成了后台管理人员工作明显倾向于稳定、性能。可是,稳定和性能是非常耗时耗力,在努力解决SAP系统稳定和性能的同时,安全往往被忽视。

企业只重业务,轻视安全的事例比比皆是,这是多数企业的通病。出了安全问题才会亡羊补牢的事件也时有发生。SAP系统能够影响业务,影响生产,如此重要,企业更应该重视其,安全不要被遗忘,不要被忽视。

本文重点讨论SAP系统安全容易被忽视的方面,任何方面对安全而言都是重点。

其一,权限。SAP实施之初就会规划和设计用户权限,SAP系统本身的权限设计也非常到位,非常精细,可以看出SAP公司重视安全管理。多数企业初期把权限管理的都比较好,但随着企业的运行,业务人员感觉对权限的需求永远满足不了其实际业务的需求,于是业务人员的权限会申请更大的权限。造成的结果就是权限形同虚设,到处都是权限过大的用户,一旦发生泄密事件,系统管理人员无法排查。因此,建议企业不要因为业务需要而放任权限的审核。即使很麻烦,即使效率低,也要进行严格的管理,使之防患于未然。

其二,操作系统。是最容易被企业忽视的SAP系统安全的一部分。SAP系统所有数据在数据库里,数据库在操作系统下,因此取得操作系统权限就相当于获得了整个数据库,进而取得了整个SAP。因此操作系统安全不容忽视。

其三,备份。SAP系统备份是必须的,虽然它可能永远也用不上。备份是运维管理人员的定心丸,也是SAP系统管理工作最重要的组成部分。但企业往往只重视备份,而忽略恢复。备份不是主要的,定期的恢复测试才是备份的意义所在。

其四,接口。企业中同SAP系统集成的系统越来越多。这方面的安全容易被忽视,SAP系统集成需要有一定权限的用户,用户创建后,授权限,接口开始使用,需要慎重管理这些用户和密码,这是一个非常危险的入口。因此,建议管理这些用户,或实施接口尽量减少这些用户的权限。

其五,数据库。也是最容易被企业忽视的SAP系统安全的组成部分。SAP系统安装过程中要求配置了多个数据库的用户和密码。上线后,这些用户将被彻底遗忘。SAP早期版本system的密码是Oracle数据库的默认密码,后期几乎不会被用到,当然也无人管理。多个用户设置成同一个密码,而且很可能非常简单,能否记住创建的哪些用户,实施顾问可能也无法说清楚。关注这些被大家遗忘的用户能够降低系统的风险。

第7篇

经研究,在整个IT产品的生命周期中,采购和建设阶段只占全部时间和成本的20%~30%,而运营阶段则占了整个时间和成本的70%~80%,由此可见IT系统运营管理的重要性。然而,在过去相当长的一段时间内,医院的IT信息部门更关注信息系统的建设和应用,而对该系统的运维管理则缺乏相应的重视和研究。大多数医院虽然设立了信息中心或计算机中心来负责系统维护,但维护手段仍停留在较为初级的被动受理和解决故障阶段,缺乏完善的维护管理流程,没有设立明确的运营维护工作的考核指标。部分医院甚至仅委派一名或两名技术工程师负责全部IT系统的维护工作,管理者很难真正了解其IT维护管理水平的高低,进一步改进的方案也就无从谈起。这种停留在初级阶段的系统维护方法,显然无法适应医疗IT应用系统日新月异的建设水平。

IT服务管理领域的标准ITIL

谈到IT运维管理,我们先来了解一下有关ITIL的基本知识。在上世纪80年代末,英国政府商务办公室OGC(Office of Government Commerce)开发出了ITIL(Information Technology Infrastructure Library)的最初版本,ITIL在面世之后,迅速从英国扩展到了全球许多国家。目前,ITIL已经取得了全球IT服务管理领域的广泛认同和支持,成为了IT服务管理领域事实上的标准,目前全球有数万家企业在应用ITIL。

从实践中总结而来,是ITIL最大的特点,最初的ITIL版本就是一系列IT最佳实践的总结。因此,ITIL不是采用先设计整体框架再细化各部分这种“自上而下”的方式开发出来的,与其他的标准有很大的区别。ITIL的最初版本中包含了十个以上的流程组,而后,OGC通过对最初版本的整合,消除了重复和不一致的地方,了ITIL v2版本,共包含7个体系:服务支持、服务提供、实施服务管理规划、应用管理、安全管理、基础架构管理及ITIL的业务前景,这就是被广泛引用的ITIL框架(见下图)。

由于本文讨论的是医院的IT运维管理,不可避免地借鉴了ITIL体系中的许多概念。但需要说明的是,ITIL仅仅是为IT服务管理提供了一个框架和准则,而其本身并非产品,应用ITIL也无需系统支持。参考和借鉴ITIL体系,建立和健全适合医院自身实际的IT运维管理体系,才是我们的目的。本文的重点在于讨论对医院IT运维管理体系的建立,对ITIL本身就不再多介绍了。

当前医院IT运维工作存在的问题

当前,医院的IT系统运维工作通常由信息科或计算机中心等部门来负责。在部分信息化建设步伐较快的医院,已经有专职的技术人员来负责IT系统的运营与维护,部分大医院维护人员人数已经不少,但以下问题仍在医院的IT运维工作中普遍存在:

1. 维护工作以“被动式服务”为主

主要体现在对IT系统的维护往往是在问题发生后,IT维护人员类似“救火队员”一样赶去抢修故障,缺乏主动性的预防式服务,这种维护模式下IT维护部门往往依赖一些技术水平高的“救火英雄”,而忽视了如何从管理的角度去预防问题的发生,结果就是一些本来可以避免的故障反复发生,给医院的业务带来阻碍。

经研究数据表明,IT系统发生的故障,只有20%是因为软件、硬件或环境(网络、电力等)因素造成,而有40%的原因是缺乏管理流程造成的。例如未经测试的变更,或是系统高负荷运转等原因造成,另外40%的原因是由于人员操作失误、备份或安全方面的疏忽所导致。也就是说在IT系统发生的问题中,大多数的问题是可以通过管理来避免的。

2. IT部门与业务部门的沟通不畅

对于使用IT系统的业务部门来说,关心的是业务不中断,IT系统能够安全稳定的运行,而IT管理部门往往是以技术为中心,这样如果在业务部门产生对IT系统的使用需求或者是发生故障时,IT部门往往会将注意力放在技术环节上,而忽略了对方的业务目标。一个简单的例子是,当业务部门由于设备故障(例如台式机)而影响业务时,IT运维部门首先要做的不是解决故障,而是需要清楚恢复业务的时限,如果是恢复时限要求很高的问题,那么IT维护部门可能首先要做的可能不是去解决故障,而是更换一台备用电脑来保障业务在最短时间内恢复。做到这一点就要求IT部门与业务部门有一套共同的沟通语言,这一点在后面讲到服务级别管理时再详细讨论。

3. 不能量化评估IT部门工作的绩效

IT运维部门的绩效往往难以考核,产生的原因是由于未能制定有关IT运维工作的考核指标,日常的IT运维工作通常都由繁琐细微的事情组成,如果没有对关键事件进行记录,没有对各项工作的目标进行事先约定,那么对IT运维工作的评价只能够凭感觉,没有业务部门与IT部门都认可的标准,既谈不到准确评估,更谈不到改进与提高。

建立IT运维管理体系

以上提到的一些问题,在许多医院中都普遍存在。想要解决这些问题,提高医院的IT运维管理水平,需要做的工作很多,需要医院IT部门有计划、分阶段地进行,逐步建立适合医院自身IT水平的运维管理体系。

建立医院IT运维管理体系,至少应该包括四项基本内容:IT运维考核指标(KPI,Key Performance Index);服务台;服务级别协议(SLA,Service Level Agreements);IT基本服务流程。

1. IT运维考核指标

IT运维考核指标是医院IT运维管理体系的核心,只有建立了科学的考核体系,才能对IT运维工作的结果进行量化评估与考核,发现不足,进行改进。IT运维考核指标是针对整个IT运维部门而制定,考核的是IT运维部门的整体绩效,指标的设定应该包含对IT运维工作结果、部门及人员发展、财务等几个方面的考核,我们在这里重点讨论一下应该如何设定IT运维工作结果的考核指标。

IT运维部门的主要职责一方面要对IT设备及系统进行维护管理,保障其良好运行,另一方面要响应业务部门的需求,解决业务部门提出的问题。因此对IT运维工作的KPI设定主要分为IT系统运行水平和IT技术支持水平两大类。在这里对这两大类的常见考核指标做一些介绍,供医院IT部门参考。

(1)IT系统运行水平KPI

通过对IT系统运行水平KPI的考核,可以考察IT运维部门的维护水平,这类指标常见的有:

系统中断时间,指由于软硬件或外界环境原因引起的关键应用系统的业务中断时间,考核周期通常以月或年为单位,而具体目标的设定可根据各自医院应用系统的数量、运行水平来制订,例如:系统中断时间

故障发生次数,指IT系统的故障发生次数,考核周期通常以周或月为单位。例如:故障发生次数

网络安全性,保障网络信息安全是运维工作的重要目标,对网络安全性的简单考核可以用考核周期内网络信息安全问题的发生次数来进行,如果要做更科学的考察,可以根据不同等级的安全问题设立网络安全性指数。

故障业务影响率,这一指标是考察发生的所有故障中,影响业务的故障所占比例,计算公式为影响业务的故障总数/故障总数。

(2)IT技术支持水平KPI

与第一类指标不同,技术支持水平KPI主要考察的是IT运维部门的技术支持和服务水平,重点考察IT部门是否能够及时响应业务部门的申告与要求,服务水平是否达到了业务部门的期望。

故障解决达标率是指在目标时间内解决的故障数/全部故障数。对于不同级别的故障,事先都设定好了目标解决时间,这一指标考核的是在预计时间内解决故障的比例,这比简单考核故障解决率更能反映IT运维部门对业务部门的支持情况。

平均故障解决时间是指所有故障的解决时间之和/所有故障次数。这一指标反映的是IT运维部门解决故障的能力,与第一个指标组合使用,可以更全面地反映IT运维部门的技术服务能力。

客户满意度是指IT运维部门的客户是业务部门,对医院来说就是使用信息系统的各个科室,服务水平的高低最终要反映到用户的主观感知上,因此设立一个主观感知指标是非常必要的。这一指标可以通过对业务部门的满意度调查问卷来实现。

以上3个指标是对IT运维支持水平最常见的考核指标,这类指标还有很多,例如故障响应及时率、故障解决超期时间、重复故障发生率等等。如何设定考核指标,关键是要符合医院的IT管理战略目标和IT管理重点,合理设定不同指标以及所占权重,使得KPI考核能够达到促进IT运维管理的目的。

2. 服务台的职能

对建立IT运维管理体系来说,服务台在其中扮演了非常重要的角色,是建立IT运维服务体系必不可少的一环。我们这里说的服务台并非是一个简单的设立了热线电话的值班员,它有几项最基本的职能:

服务台为用户提供了IT部门的单一联系点,确保用户通过服务台可以找到支持人员,也就是说确保了服务的可达性。

服务台对所有用户请求进行记录,并监控后续处理过程,直到问题解决。这就保证了前面提到的IT运维指标体系中,所需要的数据都有权威依据,如系统中断时间、故障解决达标率等。

服务台作为IT部门的首次联系点,可以过滤掉不相干的问题,并处理掉常见问题和简单问题,而将处理不了的复杂问题再转给IT后台部门,这样就保证了IT的技术支持部门不会被简单的问题所打扰,可以集中精力处理专业性的问题。

建立服务台遇到的常见问题是业务部门在遇到故障时,都习惯于直接找自己熟悉的IT工程师解决,而不愿意找服务台帮助,解决此问题要求IT部门向业务部门大力宣传服务台的好处,同时也要大力改进服务台的服务能力,比如服务台直接服务的水平,响应的时间等。

3. 服务级别协议

服务级别协议(SLA,Service Level Agreement)的含义是IT部门对业务部门的服务承诺,定义了各种服务类型所要求满足的服务质量。SLA的特点是用业务语言描述,而不是用技术语言进行描述。例如,对于故障处理,在SLA里可以将故障分为三类:影响业务的紧急故障、对业务使用存在隐患的严重故障及普通故障。然后分别对这三类故障定义响应时间和解决时间,例如紧急故障要求10分钟响应,1小时解决,而普通故障则要求30分钟响应,3个工作日解决。

只有在有效的服务级别管理被建立的条件下,IT部门才能更加清楚他们被期望提供什么和可以提供什么,因此才能够更好地计划和管理所提供的服务。

4. 建立基本运维管理制度流程

IT运维部门应该建立一系列基本运维管理制度和流程,以确保IT运维部门的基本任务得以实现。IT基本运维制度流程主要包括故障支持流程、IT变更流程、IT日常维护管理制度、重大事件应急管理流程以及IT安全管理制度等。这些基本运维管理流程的建立,是确保SLA能够实现的制度保证,可以使IT部门在向业务部门提供服务时,能够按照标准流程进行,从而保证服务的确定性,并能够比较容易地发现服务中存在的问题,进行改进和提高。

IT运维管理外包的基本情况

以上简要介绍了建立IT运维管理体系的基本概念及方法,最后再介绍一下关于IT运维管理外包的基本情况。

IT运维管理外包是近年来的新生事物,在欧美许多国家,将IT系统的运维工作外包给专业的公司已经比较常见,在国内,部分行业也已经开始进行这方面的尝试。实际上IT运维管理外包这种模式非常适合于医疗行业,主要原因在于:

1. IT运维管理是一项非常复杂和专业的工作。对于医院来说,IT管理并非其所擅长的领域,即使投入很多精力,也很难在短时间内见到成效。而专业的IT外包公司则具有丰富的经验,可以在短时间内帮助医院把IT系统的维护管理工作提升到较高的水平。