数据分析杂谈——数据的可视化
客户世界|高威 白文腾|2012-09-24
p>
p>
大数据时代已经到来,一个客户服务中心最重要的财富就在于其掌握的大量数据,客服中心要利用好这笔财富就必须学会如何让抽象的数字形象化地展现并实现价值。
从一个客户服务中心(尤其是现在备受关注的多媒体呼叫中心)每天可以产生的数据来看,数据来源渠道丰富、形式各异、数量惊人,如何运用好这些海量数据显得越来越重要。怎样让决策者第一时间能够领悟到数据分析的结果或者说数据的本质,最直接最简单的方式就是让数据自己说话。
按照数据分析的基础理论,任何分析都是有其目的。同样,数据展示也许要搞清楚展示的方向:展示的目的是什么?数据展示的重点在哪里?能否有足够的亮点引导观众关注重点?是否能够完美揭示数据背后的本质?这几个问题成为数据可视化研究中首要注意的问题。
同样的数据不同的展现能有怎样的不同?展现角度引导着思维方向。例如某呼叫中心各班组通话时长情况(如图1),数据分析人员则可以从这样两个角度确定要表达的主题。从纵向来看,可以表达各班组通话时长随着时间的变化趋势,总体来看通话时长有增加的趋势;从横向来看,可以表达各班组之间的通话时长情况,总体来看各班组之间通话时长并无较大差异。不同的展示维度能够让观察者看到不同的问题或者说感受到不同的变化。
图1
任何一个主题的表达,也就是通过数据强调的内容,我们借用麦肯锡的《用图表说话》中总结的五种数据关系来分类:成分关系、项类关系、时序关系、频率关系、相关性关系(如图2)。这里需要说明的是,不同数据关系的图表选择并不局限于这样的分类,不同的数据状况下可以有多种选择,这里的展示是日常运用较多的分类及基本的应用。
图2
图3
一、成分关系
成分关系,顾名思义就是表示内部比例及组成。一般我们选择饼图来展示是最佳的,饼图虽然使用频率相对不高,但对数据的展示精准而形象。饼图可用来表达某一部分在总体总所占比例的情况,例如某呼叫中心各地区话务量分布情况,可以强调C地区话务量最高(如图4);用同样的方式也可以强调E地区话务量最低。使用饼图时需要注意的是,其中的各个成分不宜过多,如果出现很多的情况则可以使用复合饼图或者是复合条饼图(如图5)。若想要比较两个总体(或者两个以上总体)之间的差异,最好选择柱状图或者条形图(如图6)。
图4
图5
图6
二、项类对比关系
项类对比关系是客服中心比较常见的数据关系,它表现出较强的适用性。一般情况下我们可以选择条形图作为项类对比关系的展示方式。横纵轴的意义变换能够从不同维度、不同重点挖掘到数据本质。例如按照质检成绩进行降序排序,在5个班组中,一班的质检成绩位居第一(如图7)。为了表现条形图表的多样性,可以对条形图做一定的变形,列出6种不同的条形图(如图8)。
图7
图8
三、时间序列关系
时间序列不单单是为了展现时间轴上发生或产生的数据,时间序列更多的是代表按照某种固定发展趋势而产生的数据。一般情况下柱状图和折线图是展示时间序列关系比较好的方法。这两种图表的选择取决于数据差异性及波动性,直观的就是最好的。柱状图表注重程度和数量,适合在一个时间段内的活动数据,比如话务量数据更适合用柱状图(如图9);折线图侧重变化和变化趋势,因此在表达数据的发展状况时更适合使用折线图,例如各产品业务客户增长率情况(如图10)。在使用折线图时需要注意折线不宜过多,如果折线之间出现交织在一起的情况,整个图表会显得非常混乱。针对柱状图我们也可以进行一定的变形(如图11)。
图9
图10
图11
四、频率分布关系
频率分布的数据是最能够展示客服中心数据集中趋势的展示方法。频率分布关系选择的图表形式和时序关系一致的,比较范围数量(即数组)比较少时,可以使用柱状图,反之使用折线图更为合适,当然两者也可以结合使用(如图12)。此时,图表垂直刻度表示项类的数量(频次)或事件发生的概率(频率),水平刻度表示各个数组的分布情况。再例如观察质检成绩根据工作年限的分布情况,可以发现入职三年以内的员工成绩跨度比较大,三年以后的员工成绩跨度相对较小(如图15)。
图12
图13
五、相关性关系
相关性关系通常我们选择散点图或者是条形图来展示。用散点图来解释满意度与质检成绩之间的关系。如果两者存在相关性的话,那么数据点应该散落在图表某一条直线附近,为了更直观我们都会添加这条趋势线,观察各个数据点的分布情况(如图14);如果使用条形图来解释的话,可以根据不同的质检成绩作为依据,绘制出满意度的镜像图(如图15),若两者存在关系,则应表现出一致的变化趋势。从图表中可以看出满意度与质检成绩的关系并不强。
图14
图15
六、未来的数据可视化
互联网时代的发展导致了海量数据出现在我们面前,能够把大量咨询、信息、行为轨迹转化为能够直接感官接受的印象也越来越成为数据可视化研究的方向。通常情况下互联网及类似数据展现出离散性较大、数据模型不可预测等特点,在上述介绍的基本图形展示基础上进行交叉使用,也许能为数据展示带来更大的发展空间。例如社交媒体产生的转发与评论数据展现(如图16)
图16
数据可视化的极致远不止上述几种方法能够满足,但是能够精通使用这些基本的数据展示及图表能够让我们掌握的数据实现他们的基本价值。本文基于excel操作环境下对数据的处理及展示,在能够熟练地掌握这些方法并融会贯通、协调展现的基础上还有更多的展现形式需要学习,例如:箱线图、气泡图、PP图、神经网络等等通过其他软件实现的图表也是相当不错的工具。
总而言之,作为一个数据分析人员始终要清晰的知道数据展现只是过程,更多的是要借助图表工具将抽象的数据形象化,从而发现本质并实现价值。
本文刊载于《客户世界》2012年7月刊;作者单位为北京鹈鹕咨询信息技术有限公司。
转载请注明来源:数据分析杂谈——数据的可视化
噢!评论已关闭。