一天,电脑提示收到一封事件警报邮件,同时,另外三封事件报警邮件也发到了夏忙的信箱。桌上的电话刺耳地响起,另外两位同事的电话声此起彼伏。 销售部的同事反映无法接收邮件。夏忙刚刚扑到销售部查问题,不多久,人事那边也找夏忙,人事部的PC系统崩溃了,夏忙指挥同事去人事部处理这一问题。事情还在处理中,忽然又接到一个报警,说财务的机器上不了网,现在是月底要报税,事情紧急。于是IT部门最后一个人去了财务部。夏忙忙乱得一头大汗,他不知道假如再来一桩突发事件,他该怎么办。此时,一直有人在找夏忙,有的机器中毒,有的机器蓝屏了等等。夏忙只好不停地说,“稍等——,稍等——”,一位急脾气的同事不耐烦了,“我急着要一份数据,硬盘却坏了,能不能先给我看看?” “手边有紧急的事没处理完呢。” “那你得分个轻重缓急啊。”夏忙一听,觉得有理,层出不穷的技术故障让IT部门的人疲于奔命,成了“救火队”。可状态不能老这么持续下去,需要有一套流程和方法来有序地处理。他决定把手边的事情忙完之后,好好思考一下。 经过紧张的排查,夏忙得出的结论是,网络中心的一台交换机出了故障,夏忙迅速联系网络中心并启用了备用的交换机。20分钟后,网络恢复正常。 趁着尘埃暂定,夏忙赶紧翻资料,能给目前无序的忙乱状态理出一个解决思路。他发现,对于突发事件,最重要的是避免业务中断。对此,首先要确定突发事件管理流程,通过区分突发事件的优先级来确保流程的有效执行。显然,每个人都会认为自己故障是最紧急的,因此必须理清是火烧眉毛还是常规慢性病。 夏忙反思,网络中心那台出故障的交换机上连接着公司的销售部邮件服务器、库存数据库服务器、人力资源服务器,这一事故将直接影响到公司内关键部门的正常生产,应该属于紧急一级,如果不尽快处理将发生一级生产事故;而急脾气同事的事件则属于一般级别。因此先处理网络中心交换机问题是对的。 但是自己在紧急事件的处理工时上把握不够,刚才用了大约3个工时来处理交换机的问题。那么如果当自己在规定的时间内不能解决或没有解决某个突发事件时,又该怎么办?一般来说,如果不能在规定时间内解决,需将处理任务交给更有经验的支持人员。这叫突发事件升级,通常有两种方式:一、职能升级,安排更多的专家或授予更多的特权以解决事故;二、层次升级,出现在所需的权限和资源不够的时候。
突发事件管理可以帮助IT部门更加系统、快速地处理突发事件,但是只是规范处理过程,以尽快恢复故障。好比是急诊抢救,治标不治本。 要使突发事件管理有质的提高,治标也治本,一种切实有效的方法就是问题管理流程。 小贴士: 当IT服务台必须同时处理数个突发事件时,由于受时间、资源和人力等的限制而无法实现时,首先要排定处理的先后次序,针对不同的优先级处理。 确定突发事件处理优先级,需要综合考虑突发事件的影响、紧迫性、大小、范围、复杂程度和当前可供资源。 3 问题管理 主动预防没风险 解决了突发事件,正赶上十一放长假,夏忙去了趟华山,彻底休息了一下。 10月8日一大早,夏忙的电话就响个不停。也难怪,一上班大家就忙着收邮件,积累了几天的邮件把服务器搞得巨慢;许多节前已经预约的客户需要尽快联系,可邮件一遍一遍就是发不出去;网络更是不知犯了什么病,很多机器死活上不去网......一整天,夏忙都在忙来跑去解决问题,面对抱怨,连解释的时间都没有。 晚上10点,总算有点头绪。夏忙坐下来,才想起自己几乎一天没吃饭、没喝水了。其实想象得到,每次长假后的第一天对IT人员来说都是黑色的,这和过节一样已经成为惯例。 中国.网管联盟 喝了一杯水、吃了点面包、点上一支烟,夏忙回忆起这一天所干的事。长假过后,收邮件高峰会有网络堵塞,南方潮湿闷热的天气也会使得本来条件就差的机房服务器出现接触问题。
本新闻共 6页,当前在第 2页 1 2 3 4 5 6
|