关于数据分析的思考

    |     2015年7月13日   |   会议会展   |     评论已关闭   |    2212

|沈晨岗|2010-09-18

最近看到一些新闻,说美国一些广告客户的网页上有几十种不同的追踪代码在追踪用户的行为,并记录相应的数据。从一个积极的角度来看,那就是网络营销的用户数据可追踪性已经被发挥到极致了。正如前面一些文章已经提到过的,网络营销的一个最大优势是可以积累大量用户的数据。但数据离转化为有价值的信息还有很长的距离。

首先,要收集有分析价值的数据。有些人不管三七二十一,说要把数据都收集下来。要知道收集数据是有代价的。包括在数据结构设计时的考虑,对系统性能的影响以及数据量所产生的对硬件的要求。象Google那样将每次用户点击的相关信息都详细记录下来,同时保证自己运行的速度,这个成本是非常惊人的。因此每个企业都需要根据自己的需要,选择性价比最合适的数据采集粒度和密度。

其次,要对数据进行有效的整理和管理。有些管理者,当他了解到相关数据都保存了以后,就想当然的认为他想要的一些分析和结果就可以随时得到。结果恰恰相反,对数据进行整理和分析的过程和成本往往要比预计要复杂很多。数据的保存形式,数据表的设计,数据结构的设计都会对数据分析造成很大影响。为此,产生了数据仓库的概念和形式,目的是为了把“以运行存储为目的的原始数据结构”,调整成为“以分析为目的的存储结构”。同样的原始数据,经过调整就有了本质的应用差别。比如:分析一个用户的来源和最终行为的交叉分析,在原始数据集结构上要跨越多个相关的数据表,从而形成一个关联。如果需要对大量这类数据进行查询并形成统计结果,在原始数据结构上的效率是非常低的。往往一个查询需要几个小时,甚至更长。但在一个调整后的数据结构上,相同的查询可能只要几分钟甚至几秒钟。

对数据进行分析和解释,这个最重要的环节,需要分析者具备很强的营销理论概念和逻辑思考能力。很多企业和公司的分析人员往往从数据记录的技术人员开始发展,这就造成了很大的先天不足。需要对营销数据分析的应用能力达到一个较高的层面,需要业务营销人员和相关技术人员的知识有足够的融合,最终才能获得理想中的分析能力。

中国的互联网发展已经超过10年了,大家对数据的重视程度也与日俱增。有些人会对此过于兴奋,找到一些数据就提出要“数据挖掘”,要建立“数据模型”。先不说这些人是否真正了解这些概念,也不说是否找到合适的人员来执行,就目前阶段的现状而言,期望得到类似美国的数据加工价值是很不现实的一件事情。这里有几点原因:

1.  中国互联网发展的变化节奏要比美国快很多。一个业务还没有成熟,新的业务已经从美国copy过来了。业务的不稳定,造成获得的数据在很短时间内前后的意义就已经不一致了,破坏了数据模型需要的稳定性,也无法分离出众多因素中的显著性变化的原因。比如:搜索引擎中关键词的流量,价格和质量,一旦百度的功能出现频繁变化(这在2009年以前是司空见惯的,包括智能匹配模式的变化,价格变动等等),数据中的波动差异都无法得到有市场意义的解释。

2.  其次,中国用户使用互联网的娱乐性质和美国人的理性差异较大。用户行为存在很大的随意性,在很多时候一定要用理性理论来解释一些非显著的差异(有些人往往热衷于深入分析这些),会显得非常牵强,并且往往会得出自相矛盾的结论。

3.  数据统计的人才匮乏。中国目前掌握数理统计能力的往往是一些学习数学,统计的理科生。他们往往对营销,市场非常陌生。能结合两者的非常少。而要进行高级的数据模型建立和应用,需要的正是这方面知识结构复合的高级人才。在这方面,海龟可能更有机会符合这方面的要求,但他们往往因为缺少对本地用户的理解来对数据作出更正确的解读,有时会陷入误区。

说了以上这些,不是说在中国无法进行有效的数据分析,而是为了说明一些期望和现实差距的原因。一些现实的企业可以用那些看起来只有60分,70分质量的数据,照样可以形成有效的分析能力和业务竞争力。关键是看我们怎么来用。再有个几年,在用户成熟度,市场规则的稳定度以及人才积累上都更上一个台阶时,我们的网络营销一定会在数据应拥能力上有更大突破。

以上个人见解可能有很多局限性,仅供参考。

作者沈晨岗(Charles Shen)为中国网络营销和电子商务方面的资深专家,Darwin Marketing (达闻营销)的创始人之一。

责编:foxnn-1100

转载请注明来源:关于数据分析的思考

相关文章

噢!评论已关闭。