运营数据可视化技术的发展及应用

    |     2015年7月13日   |   2014年   |     评论已关闭   |    2000

客户世界|石云|2014-08-26

现代的数据可视化(Data Visualization)技术指的是运用计算机图形学和图像处理技术将数据转换为图形或图像在屏幕上显示出来并进行交互处理的理论、方法和技术,它涉及到计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互技术等多个领域。数据可视化概念首先来自科学计算可视化(Visualization in Scientific Computing),科学家们不仅需要通过图形图像来分析由计算机算出的数据,而且需要了解在计算过程中数据的变化。

近年来随着网络技术和电子商务的发展,提出了信息可视化(Information Visualization)的要求。大型企业往往拥有大量的数据隐含着重要信息,通过数据可视化技术,企业可以发现大量金融、通信和商业数据中隐含的规律,从而为决策提供依据,这已成为数据可视化技术中新的热点。

但不幸的是,挖掘、评估和讨论这些数据往往颇具挑战性,庞大的数据量也许足以让最坚定的数据分析师望而却步。另一方面,数据通常分散在不同的系统中,需要大量专业人员的协助。一旦数据被挖掘,下一个挑战便是理解隐藏在其中的涵义、模式和趋势,并将这些发现传达给其他人。

企业拥有大量含有丰富信息的数据,收集、监测、分析和处理这些数据往往并不简单,但今天的数据可视化工具和仪表盘软件完全能够将数据中隐含的信息直观地展现出来。对于拥有较小数据量的企业来说,数据表和报表工具非常有用。对于拥有不同数据源和庞大数据量的企业来说,商务智能变得更具挑战性,他们需要一个更好的解决方案:数据可视化软件。有了合适的工具,企业就可以迅速理解数据的意义。

一、数据可视化技术
数据可视化技术主要分为两大类:可视化报表和可视化分析。

可视化报表(Visual reporting)。可视化报表使用图表和图形来描述企业的运营情况,通常由指标和时间序列信息定义。可视化报表的主要类型是仪表盘和记分卡,向用户提供经营业绩的可视化快照。优秀的仪表盘和记分卡能够让用户向下钻取多个层面,查看某个指标的详细信息。

可视化分析(Visual analysis)。另一方面,可视化分析能够让用户直观地探索数据,洞察新的知识。可视化报表根据事先定义的指标结构化数据导航,可视化分析则提供了更加高级的数据间相互作用。通过可视化分析,用户可以快速直观地过滤、比较、分析数据。可视化分析工具通常包括预测、建模、统计、假设分析和预测分析。

二、可视化分析方法论
不断增长的数据规模和数据可用性为预测公共政策、科学发现、企业战略甚至是我们的个人生活,提供了庞大的数据资源。我们曾经试图通过表格数据来发现的复杂模式,现在能够清楚方便地通过图表来展示。可视化分析方法论涵盖了三个高级领域:源数据识别——选择数据和视图;信息发现——操作这些视图;协同分析——记录、分享和解释。

源数据识别(Source Data Identification)

可视化表示(Visual representation):首先需要选择一种可视化的方式。系统可能会提供用户一组视觉模板供其使用以及图形供其选择。可视化选择的形式文法可能会增加效果,但需要用户具有一定水平的编程技能。

数据过滤(Data filtering):一旦数据已经选择并可视化,它通常需要过滤。例如如果相关的数据点在65和75之间,用户就需要校准在0到100之间的初始值。

数据排序(Data sorting):可视化的数据同样也需要排序,包括简单的数据排序、数组平均值排序、社交图的节点模式排序。

派生新数据(Deriving new data):初始数据通常被用来派生新的可视化数据,例如归一化和对数标尺。提供更加强大的数据派生是数据可视化技术的主要前沿研究。

信息发现(Information Discovery):

选择特定的数据(Selecting specific data):一旦数据被直观地展现出来,用户必须能够选择特定的数据作进一步分析。这种交互式的选择过程类似于过滤。通过查询条件进行数据选择能够提高选择的效果,但它的代价是更高的复杂性。

导航视觉场景(Navigating the visual scene):用户必须能够导航可视化数据,在视图中使用如平移或滚动、放大或缩小的功能。

协同多个视图(Coordinating multiple views):数据可视化视图并不是独立存在的;用户必须能够协调不同的视图,例如在某一视图中选择的数据能够自动跳出另一个视图中的相关数据。

组织多个工作区(Organizing multiple workspaces):此外,用户必须能够组织多个工作区和窗口,例如提供一个主窗口,其他窗口都平铺在另一边,这个过程经常能够自动缓解工作区之间的切换。

协同分析(Collaborative analysis):

保留记录(Preserving a record):可视化数据必须同步在时间和空间上进行管理,至少撤销和重做按钮必须是可用的。

注释(Annotating work):用户必须对他们的工作进行注释,这里可以采取文本注释或高亮突出。

协同(Collaboration):可视化数据分析师并不是独立工作的,用户必须能够分享他们的工作。至少要有导入导出的功能,发布到网页也是一个重要的协作工具,应用书签功能可以让分析师从上次保存的地方继续工作。

提供指导(Providing a guided tour):最终,可视化数据分析的结果必须能够被广泛的数据客户访问,而这些客户必须受过相应的指导和培训来使用这些工具。

三、未来发展方向

首先,可视化技术和数据挖掘技术将会更加紧密地结合。对于目前在数据挖掘中的数据可视化技术和数据分析功能,我们往往难以使用数据挖掘的公式和算法,同样也难以掌握和确定数据可视化的结构和特征。对数据可视化技术和数据挖掘技术的整合研究对于提高数据可视化功能来说十分重要。

其次,数据可视化系统需要提高可视化的交互功能。人机交互的数据可视化系统不仅需要提供更加有效的数据查询条件,同时也需要配置灵活的数据库管理系统用以进行分析、评估查询条件和查询结果。

最后,数据可视化系统可以针对特定领域进行开发。针对特定类型的数据例如银行信用数据、股票数据来开发相应的数据可视化系统,能够更加全面地展现和分析相关数据,此外也可以考虑开发一系列相应的数据应用程序。

本文刊载于《客户世界》2014年8月刊;作者为CC-CMM标准组织常务理事、研发总监;

转载请注明来源:运营数据可视化技术的发展及应用

相关文章

噢!评论已关闭。