提高电信级呼叫中心可靠性的策略

    |     2015年7月12日   |   行业要闻   |     评论已关闭   |    1295

||2006-05-11


  呼叫中心是一个高度集成的复杂系统,集成了众多第三方的硬件、系统软件和应用软件,先进软硬件设备和技术的引入,大大提高了系统平台的处理能力和效率,提升了系统平台对服务的支撑能力,但同时也增加了系统出现故障的概率,任何关键软硬件设备的失效都将导致灾难性的后果。

  电信级呼叫中心要求系统具有提供7×24小时不间断服务的能力,因此对系统的可靠性要求非常高。电信级呼叫中心可靠性的提高,不但需要系统集成商具有坚实的技术实力、大型电信级呼叫中心的成功实施经验、严格规范的项目管理体系,而且需要有严格的系统可靠性分析和保障能力。

一、呼叫中心可靠性分析的目标

  呼叫中心可靠性分析的目标是:网络关键设备和呼叫路径不存在单点故障;预防为主,通过有效的监控、维护最大限度降低故障风险;建立故障处理的应急预案,保证有效收集数据并减少故障处理时间。因此,呼叫中心可靠性分析将首先考虑设计上的可靠性(包括设备/链路冗余备份),从系统设计上保证关键路径不存在单点故障,并能在关键设备失效时,提供保证人工呼叫接续的能力。

  关键设备可靠性不可能达到100%,因此为了避免设备失效情况的发生,设备的监控和预防是首要的工作,通过有效的系统监控和日常维护,80%的故障隐患是可以预先发现并消除的。

  在系统的监控、维护以及可靠性措施均得到有效执行时,设备失效的概率大大降低了,但设备失效的可能性仍然存在,在设备失效时如何采取快速有效的措施,收集足够的分析数据,减少故障历时,快速恢复系统,使故障造成的损失降到最低,将变得尤为重要。

  呼叫中心系统本身的高集成度决定了每个设备都与其它设备有着紧密的联系,因此某个节点设备的失效,可能影响到其它关联的设备,从而使故障恢复要涉及到除故障点外的其它设备。

二、呼叫中心的可靠性模型

  呼叫中心可靠性分析对于提升呼叫中心系统的稳定性,建立系统故障的主动预警监控体系,保证在故障发生时呼叫的正常接续,缩短故障处理时长,收集故障数据,从而持续改进呼叫中心的可靠性具有非常重要的意义。

  呼叫中心系统的高集成性和复杂性,对呼叫中心进行系统的可靠性分析,带来了很大的挑战。现有呼叫中心系统的可靠性多建立在解决方案提供商实践经验的基础上,目前仍缺乏相关的系统理论模型来确保高可靠性目标的实现。

  根据多年的实践经验,对电信级呼叫中心提出如下高可靠性分析模型,如图1所示。该模型将电信级呼叫中心可靠性分析分为四个维度:网络可靠性、呼叫路径可靠性、边界可靠性、非呼叫路径可靠性。

1.网络可靠性

  呼叫中心集成了大量的软硬件设备,不同的软硬件设备通过网络进行信息的交互,协同完成呼叫的接续和处理。网络系统作为呼叫中心信息处理的载体,其稳定性和可靠性是整体系统稳定的基础。网络可靠性包括:网络设备的可靠性、网络传输链路的可靠性、防御网络外部攻击的可靠性。

2.呼叫路径可靠性

  呼叫中心的基本功能是实现呼叫的接续和处理,一个呼叫的接续过程涉及到不同设备的协同处理,呼叫信息的接续过程定义为呼叫路径,呼叫路径的任何节点/链接失效,都将导致呼叫接续的中断。因此,呼叫路径可靠性对整个系统的可靠性具有举足轻重的意义。

3.边界可靠性

  呼叫中心需要与其它外部系统进行信息的交互,要保证呼叫中心的可靠性,同样要考虑与呼叫中心交互的外部系统对呼叫中心的影响,包括网络的隔离、信息有效性的验证、外部系统故障的影响、呼叫量的雪崩效应,以提高呼叫中心系统自身的免疫力和抗干扰能力。

4.非呼叫路径可靠性

  呼叫中心系统集成的软硬件产品,除呼叫路径上的关键节点设备外,还包括了实现辅助支撑功能的设备,这些设备的失效不会对正常的呼叫接续和处理造成影响,但会影响呼叫中心辅助功能的实现,在此将这些设备定义为非呼叫路径设备。非呼叫路径设备包括:消息服务器、监控服务器、接口服务器、接口链路。从呼叫中心的投入和产出角度考虑,非呼叫路径设备一般不提供备份功能。

三、呼叫中心的可靠性分析方法

  呼叫中心可靠性模型的每个维度都有一些设备/软件节点组成,每个维度的可靠性需要通过组成节点以及节点之间链路的可靠性来实现,节点可靠性的实现可以抽象为3个层次:设计可靠性、主动预警能力和应急预案。通过对所有节点3个层次的可靠性分析,可以实现可靠性模型每个维度的可靠性,从而实现系统可靠性。根据图2的可靠性分析矩阵,可以建立呼叫中心可靠性分析方法。

  对于呼叫中心而言,客户从发起呼叫到呼叫中心服务人员接听呼叫的路径,是呼叫中心提供服务能力的关键路径,因此呼叫中心可靠性分析的核心即是如何保证呼叫路径的可靠性。网络作为呼叫中心系统赖以运行的基础,其可靠性不言而喻,鉴于网络可靠性方面已经具有大量的理论和实践指导,因此本文不做详细分析。对于呼叫中心可靠性模型的非呼叫路径可靠性和边界可靠性,限于篇幅原因,本文也不做详细介绍。

  在客户向呼叫中心发起人工服务的呼叫请求时,电信网的信令数据、客户的按键选择数据、呼叫的路由选择数据以及客户信息数据等,在多个设备节点之间进行交换,从而协同实现呼叫的接续过程,构成了呼叫中心的呼叫路径。

  呼叫路径上的每一个节点(设备或软件系统)都是呼叫路径的关键节点,任何节点的失效,都将直接中断或影响正常的呼叫接续。因此,企业必须对呼叫路径上的每个节点进行全面系统的可靠性分析,以确保呼叫路径的高可靠性和高可用性。

  呼叫路径的节点可靠性分析包括以下3个层次,即节点的设计可靠性、节点主动预警能力、节点的故障应急预案。

1.设计可靠性

  节点需要支持双机热备,保证不存在单点故障,同时必要时还可以设置一台独立的冷备份系统,以应对双热备系统同时失效的小概率故障事件。

2.主动预警

  节点应具备主动预警监控模块,从而改变传统的由维护人员被动响应故障的局面,实时对系统的运行数据进行监测(如CPU、内存、硬盘容量、网络通信、节点负载等),对超过预警阀值的参数进行主动预警,通过短信、呼叫等手段主动通知维护人员,以利于维护人员提前发现故障的隐患,为故障隐患的排除争取宝贵的时间。

3.故障应急预案

  即使在设计上已经保证了系统的可靠性,并且设置了系统运行主动预警模块,故障的出现还是不能100%避免的。根据故障处理的指导原则,以最短的时间完成故障的处理和系统的恢复,最大限度地减少故障造成的运营损失,必须建立节点的故障应急预案,包括故障点的快速确认方法、故障数据收集、处理和恢复的详细步骤,从而保证在故障处理时能够游刃有余。

责编:admin

转载请注明来源:提高电信级呼叫中心可靠性的策略

相关文章

噢!评论已关闭。