客服中心话务预测模型应用实践

panjl | 2016年6月12日 | 行业要闻 | 评论已关闭 | 3688

一、课题背景

客服中心运营管理主要包括话务预测与排班、应急管理、运营现场秩序管理、监控管理等内容。可见做好话务预测，是客服中心现场运营管理中的第一环节，也是最重要的一个环节。只有准确的话务预测，才能精准地进行客服专员需求测算和排班工作，从而保证服务水平，提高人员利用率，降低人力成本。话务预测可以从小时、日、月、年等多时间维度进行预测，细化调整人力资源的分布，同时年度话务预测，对下一年度人员招聘计划起到较大的指导作用。如客服中心年度人员缺口、特殊需求时间点等。总之，提高话务预测准确性，才能保证现场运营平稳、有序，其重要性凸显于运营管理的各个环节。

二、影响话务的几个因素

笔者所在的电力行业客服中心分中心服务13家省公司，服务范围大，影响话务的因素多，主要包括天气情况、业务特点、电力突发故障、电网建设差异、特殊日等。

（一）天气情况

1、恶劣天气：雷雨大风、冰雹、暴雪、强降雨等；

2、特殊季节：如在七、八、九月份的迎峰度夏、一、二月份的迎峰度冬期间，除恶劣天气的影响外，客户使用空调较多,用电负荷大，容易导致电压过低，为避免电力设备超负荷运行，保护系统会自动切断电路，导致停电。故每天负责话务预测与排班的人员要关注次日省公司天气情况，进行异常天气信息预警，为客服部话务预测、现场排班提供有效数据支撑。

（二）业务特点:因一些省公司具有先用电后付费的业务特点，每月底至次月初，部分供电公司实施欠费停复电，期间客户查电费、缴费后复电等咨询类电话较集中。

（三）电力突发故障：电力设施作为自然体，出现故障是不可避免的，不可抗力对电力设施的破坏影响了设施的稳定运行。故障停电后，为了避免大面积停电现象的发生，供电公司需要停电消除故障。

（四）电网建设差异：国家电网公司战略目标中提到要建设成“电网坚强”的现代公司。为了提高电网运行能力，供电公司需要对电网设备进行月度、季度检修。季度检修在每年的春季、秋季进行，主要对电网设施的运行、维护、检修工作，涉及变电站全站停止运行，由该变电站供电的线路同步进行检修，故春季、秋季检修影响范围较广。

（五）特殊日：节假日或非工作日，例如春节、国庆、重大政治类活动等，期间供电公司进行保电优质服务，不安排计划停电检修，相对话务量较低。

剖析完影响话务的因素，在结合历史话务曲线进行预测时，对趋势波动的原因就清晰自明了。下面详细说明话务预测过程。三、话务预测数据清洗

（一）基础数据选择

1、时间周期选择。笔者所在的电力客服中心在2014年底实现了全网全业务统一集中运营，所以2014年前数据不够完善，本次进行话务预测分析时选用2015年度数据作为数据源。在年度、月度、周等维度选择中，因年度和月度的基础数据较少，本次预测使用“周”维度进行预测。

2、地域选择。因各省存在天气情况和业务特点的差异，故话务预测以单个“省”为单位进行，所有服务区域省预测量叠加即可得到分中心预测总量。本次选择的某省份是2014年6月实现了全业务集中，经过半年的磨合和沉淀，2015年的数据趋于稳定，且该省迎峰度夏话务数据特征明显，有代表性。

（二）数据清洗

话务预测的目的是为人员排班提供支撑，故数据源应为人工服务请求量，不包含自助话务量。

图一为某省2015年度周人工请求量（原始数据），图中出现了几个话务量的峰值点（如第32周左右），这些峰值点被考虑为离群值，根据影响话务的因素，经核实，第32周左右为7月底8月初，是迎峰度夏的高峰期，造成话务量突增，从图中也可以看出数据具有明显的月周期性。

图一：某省2015年度周人工请求量

数据清洗是对数据进行重新审查和校验的过程，目的在于纠正存在的错误，并提供数据一致性。这里需要注意几个细节问题：

1、清洗规则。因话务量受季节性因素影响较大，所以在年度数据清洗时，先计算出每月话务量均值，高于均值50%（这个比例不是绝对的）的数值利用条件格式进行筛选清洗，由其前后数据均值进行替换，进而求出每周话务量和。这样做可避免舍弃月份差异导致话务量波动的参考数据，符合话务特点。

2、统一口径。在日期转换为周时，利用weeknum函数时，这里把周一作为每周的第1天，故选定第二参数为“2”。2015年1月1日至4日为第1周（如表1：年度首周天数），2015年12月28日至12月31日为第53周，均为4天。这里折算时让该阶段的话务量除以实际天数4再乘以7，实现数据的统一口径，如下表1：统一口径数据清洗。

四、话务预测数据模型应用实践

本次使用三种预测模型，分别为最小二乘法、移动平均法和指数平滑法。下面分别从原理、公式和不同参数试算验证准确性进行阐述。

（一）最小二乘法

原理：寻求与给定点(i=0,1,…,m)的距离平方和为最小的曲线，通过最小化误差的平方和寻找数据的最佳函数匹配，采用残差平方和最小的准则。

公式：y = a + b x

参数关系：最小二乘法是从清洗后的数据中寻求变量之间的依赖关系，由得到折线图和散点图计算出预测值与实际值产生的偏差，称之为残差，用R表示，当然偏差越小越好, 但由于其可正可负, 因此总偏差不能很好地反映了变量之间的关系, 因为此时每个偏差的绝对值可能很大，为了改进这一缺陷, 就考虑用残差的平方R²来代替。但是由于绝对值不易作解析运算, 因此, 进一步用来度量总偏差，因偏差的平方和最小可以保证每个偏差都不会很大，于是问题归结为确定其中的常数和使残差平方为最小。

利用LINEST函数计算出直线的斜率a和截距b，添加趋势线，见图二，得出

y = 242.79x + 41614，R² = 0.1357。

图二：最小二乘法趋势线

通过数据分析-回归得出拟合图和残差图

图三：散点拟合图

图四：残差图

从图三中可以看出这些点大致散落在某直线近旁,可以认为变量之间的关系为线性一元函数。但话务量月度变化趋势较明显，比如第31至33周即7月27日至8月10日之间，迎峰度夏的高峰期，残差较大，如图四。经计算得预测准确率在±15%范围的数值占比为69.23%。

（二）移动平均法

定义:根据时间序列逐项推移，依次计算包含一定项数的平均，以此进行预测的方法。

1、一次移动平均法

公式：Ft=(At-1+ At-2+ At-3+…+ At-n)/n

式中，Ft –对下一期的预测值；

n—跨越期数；

At-1—前期实际值；

At-2、 At-3和 At-n分别表示前两期、前三期直至前n期的实际值。

可见：各元素的权重都相等。

分别取n=3、n=5、n=8计算出预测值、预测准确率、误差平方，预测准确率按照“（实际值-预测值）/实际值”计算得出三条预测准确率曲线（见图五），经计算，预测准确率在±15%范围的个数占比分别为66.00%、62.50%、46.67%，准确率都较低(见图五)。

图五：一次移动平均法话务预测准确率

图六：一次移动平均法话务预测准确率占比图

2、二次移动平均法

原理：一次移动平均计算完毕后，形成一个新的时间序列，对它再求二次移动平均值，做出一次移动平均数和二次移动平均数的差值，将差值加到移动平均数上，并考虑趋势变动值。特点：考虑趋势变动值，突破一次移动平均法的局限性，加大了预测范围。

公式：Ft+T =at + btT，

at= Mt’ + （Mt’- Mt’‘）=2 Mt’– Mt’‘

bt=（Mt’ –Mt’‘ ）

Ft+T— t+T的预测值，

t—本期

T—本期到预测值的间隔数

Mt’ —一次移动平均数

Mt’‘ —二次移动平均数

图七为n=3 、n=4时运用二次移动平均法的计算结果，经计算，预测准确率在±15%范围的个数占比分别为61.70%、60.00%，准确率较低。

图七：二次移动平均法话务预测准确率

3、移动平均法小结

由一次移动平均法和二次移动平均法得出的预测准确率对比图，可见，在项数n的选择上，n越大对预测的平滑影响越大，滞后于实际数据的偏差也越大，n太小不能有效消除偶然因素的影响。移动平均法预测在该次数据试算中预测准确率表现不佳。

（三）指数平滑法

原理：因时间序列的态势具有稳定性或规则性，所以可被合理地顺势推延。最近的过去态势，在某种程度上会在未来持续，所以将较大的权数放在最近的资料上。

特点：指数平滑法兼容了移动平均所长，不舍弃过去的数据，其包含的信息量是全部的历史数据，但是仅给予逐渐减弱的影响程度，即随着数据的远离，赋予逐渐收敛为零的权数。

1、一次指数平滑法

原理：任一期的指数平滑值都是上期实际值与当期指数平滑值的加权平均。

公式：St+1= αXt+（1-α）St

a–平滑常数，其取值范围为[0,1]；

下图为α=0.3 、α=0.5、α=0.8时运用一次指数平滑法的试算，见图十。其中S1用X1代替，故序号1中α取任意值，该点的预测准确率均为0.00%，不计入试算点的占比中。由图可见，α取不同值时，预测准确率差异不大，计算得预测准确率在±15%范围的个数占比分别为66.67%、70.59%、76.47%，准确率相对前两种方法有改善。

图八：一次指数平滑法话务预测准确率

2、二次指数平滑法

公式：Ft+T =at + btT，

at= Mt’ + （Mt’- Mt’‘）=2 Mt’– Mt’‘

bt=（Mt’ –Mt’‘ ）

运用二次指数平滑法，分别取α=0.3 、α=0.5、α=0.8时计算，结果见图十一。其中S1仍用X1代替，该点的预测准确率均为0.00%，不计入试算点的占比中。由图可见，相对一次指数平滑法，α取不同值时，二次指数平滑法预测准确率三者差异较大，经计算，预测准确率在±15%范围的数值占比分别为61.54%、78.85%、88.46%，准确率整体较高。

图九：二次指数平滑法话务预测准确率

五、结论三种预测公式在不同参数情况下的预测准确率对比，如表3。

表3：一次指数平滑法话务预测准确率

由表3可见，三个话务预测模型在本次数据试算中，相对来说指数平滑法的预测准确率较高，对比一次和二次指数平滑法，二次指数平滑法预测率更高一些，在α=0.8时，预测准确率在±15%范围的数值占比能达到88.46%的较好水平，拟合度较高，见图十。

图十：指数平滑法预测准确率对比

需要特别说明的是，不同行业适用不同的预测模型，根据预测维度的不同预测模型的准确率也可能有不同，每种模型式有它的适用范围，不能一概而论地认定某种预测模型好用或者更准确，各种公式需要我们不停地去试算、验证、分析，才能更深层次地挖掘出各种公式的精髓，找出适合自己现场运营特点的最优预测公式。在此感谢周逸松老师的指导，为笔者对话务预测进一步研究奠定了基础，同时希望更多现场运营人员对话务预测这块“敲门砖”倾力研究和探讨。本文若有不妥之处，敬请批评指正。

本文应《客户世界》邀约而专门撰写；版权作品，欢迎转载并标明作者出处；本文作者郭海燕，作者单位国家电网客服中心北方分中心总值班经理。