SAS认证与数据挖掘、商业智能职业发展

    |     2015年7月12日   |   文库   |     评论已关闭   |    1438

||2004-09-13


何为数据挖掘和商业智能?

与数据挖掘相关的词汇有例如数据仓库,数据装载(ETL),数据挖掘(Data Mining), 客户关系管理(CRM),SAS,PeopleSoft, SAP等。到上个世纪九十年代,以数据存储为目的的联机分析处理系统(OLTP)已经发展得相当成熟,关系型数据库的应用已经非常普及,大型企业或部门积累了大量原始数据。这些数据是按照关系型结构存储,在更新,删除,有效存储(少冗余数据)方面表现出色,但在复杂查询方面效率却十分低下。为充分利用已有数据,提供复杂查询,提供更好的决策支持,出现了数据仓库(Data Warehouse)。数据仓库与数据库(这里的数据库指关系型数据库)的区别在于,数据仓库以方便查询(称为主题)为目的,打破关系型数据库理论中标准泛式的约束,将数据库的数据重新组织和整理,为查询,报表,联机分析等提供数据支持。数据仓库建立起来后,定期的数据装载(ETL)成为数据仓库系统一个主要的日常工作。

在数据仓库发展的同时,一项从大量数据中发现隐含知识的技术也在学术领域兴起,这就是数据挖掘。数据挖掘也称为数据库知识发现(Knowledge Discovery in Databases, KDD),就是将高级智能计算技术应用于大量数据中,让计算机在有人或无人指导的情况下从海量数据中发现潜在的,有用的模式(也叫知识)。最初的数据挖掘应用一般需要从组织数据做起,经历算法设计(建模),挖掘,评价,改进等步骤。其中组织整理数据占据大部分时间,大约占到整个数据挖掘项目80%的时间。数据挖掘的真正普及是建立在数据仓库的成功应用之上。一个设计完善的数据仓库已经将原始数据经过了整理和变换,在此基础上再进行深入挖掘就是顺理成章的事情。

数据挖掘是近年来信息爆炸推动下的新兴产物,是从海量数据中提取有用知识的热门技术。传统的交易型系统,九十年代兴起的互连网技术及ERP系统在越来越廉价的存储设备配合下,产生了大量的数据。但与之相配合的数据分析和知识提取技术在相当长一段时间里没有大的进展,使得存储的大量原始数据没有被充分利用,转化成指导生产的“知识”,形成“数据的海洋,知识的荒漠”这样一种奇怪的现象。

数据挖掘(Data Mining)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。因为与数据库密切相关,又称为数据库知识发现(Knowledge Discovery in Databases,KDD)。数据挖掘不但能够学习已有的知识,而且能够发现未知的知识;得到的知识是“显式”的,既能为人所理解,又便于存储和应用,因此一出现就得到各个领域的重视。从80年代末的初露头角到90年代末的广泛应用,以数据挖掘为核心的商业智能(BI)已经成为IT及其它行业中的一个新宠。当前数据挖掘应用主要集中在电信(客户分析),零售(销售预测),农业(行业数据预测),网络日志(网页定制),银行(客户欺诈),电力(客户呼叫),生物(基因),天体(星体分类),化工,医药等方面。当前它能解决的问题典型在于:数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等,在许多领域得到了成功的应用。如果你访问著名的亚马逊网上书店(www.amazon.com),会发现当你选中一本书后,会出现相关的推荐数目“Customers who bought this book also bought”,这背后就是数据挖掘技术在发挥作用。

提到数据挖掘,就不能不提商业智能(Business Intelligence),简称BI,就是将智能计算技术应用于传统商业领域,从而提高数据分析能力,优化业务过程,提高企业竞争力。虽然商业智能的普及仅仅是最近几年的事情,但已经渗透到金融,电信,零售,医药,制造,政府等各个行业和领域,成为大中型企业经营决策的重要组成部分。

数据挖掘是一项技术,由许许多多的算法构成,如决策树,聚类,关联算法,分类算法,神经网络等,这些算法可以有多种实现方式。数据挖掘渗透到某些行业,产生了一些特定的应用,比如现在经常会听到的客户关系管理(Customer Relationship Management, CRM)。客户关系管理的概念由来已久,但现代的客户关系管理一般指以客户数据为处理对象的一类商业智能应用。通过挖掘客户信息,发现潜在的消费趋势或动向。比如电信公司通过分析用户通话模式(通话时间,时段,通话量等),制订不同的计费方案,满足用户的同时也提高自己的利润。

据IDC对欧洲和北美62家采用了商务智能技术的企业的调查分析发现,这些企业的3年平均投资回报率为401%,其中25%的企业的投资回报率超过600%。调查结果还显示,一个企业要想在复杂的环境中获得成功,高层管理者必须能够控制极其复杂的商业结构,若没有详实的事实和数据支持,是很难办到的。因此,随着数据挖掘技术的不断改进和日益成熟,它必将被更多的用户采用,使更多的管理者得到更多的商务智能。

数据挖掘和商业智能职业发展前景

规划个人职业发展的时候,在众多考虑因素中有两个是非常重要的:所要投入的技术所处的发展阶段和能否结合已有专业知识。

每种技术从提出到广泛应用(或失败被抛弃)有一定的发展周期,称为科学技术的生命周期(Technological life cycle)。该周期大致分为创新(Innovators),早期成长(Early adopters),分歧点(Chasm),早期流行(Early majority),晚期流行(Late majority)和衰退阶段(Laggards)。对于应用型技术人员来说,早期流行阶段是进入一个新技术领域的最佳时机, 因为该技术已经通过分歧点的考验,又处于上升阶段,风险最小,竞争最少,更容易脱颖而出。数据挖掘技术现在就处在这样一个早期流行阶段。

数据挖掘的对象是某一专业领域中积累的数据;挖掘过程是一个人机交互、多次反复的过程;挖掘的结果要应用于该专业。因此数据挖掘的整个过程都离不开应用领域的专业知识。“Business First, technique second”是数据挖掘的特点。因此学习数据挖掘不意味着丢弃原有专业知识和经验。相反,有其它行业背景是从事数据挖掘的一大优势。如有销售,财务,机械,制造,call center等工作经验的,通过学习数据挖掘,可以提升个人职业层次,在不改变原专业的情况下,从原来的事务型角色向分析型角色转变。

Gartner在2000年的报告中列举了在3-5年内对工业将产生重要影响的五项关键技术,其中KDD和人工智能排名第一。同时,这份报告将并行计算机体系结构研究和KDD列入今后5年内公司应该投资的10个新技术领域:宽带、无线、Linux、内容管理、实时分析、数据挖掘、安全、中间件、认证技能、商业智能以及知识管理。

根据IDC(International Data Corporation)预测说2004年估计BI行业市场在140亿美元。现在,随着我国加入WTO,我国在许多领域,如金融、保险等领域将逐步对外开放,这就意味着许多企业将面临来自国际大型跨国公司的巨大竞争压力。国外发达国家各种企业采用商务智能的水平已经远远超过了我国。美国Palo Alto 管理集团公司1999年对欧洲、北美和日本375家大中型企业的商务智能技术的采用情况进行了调查。结果显示,在金融领域,商务智能技术的应用水平已经达到或接近70%,在营销领域也达到50%,并且在未来的3年中,各个应用领域对该技术的采纳水平都将提高约50%。现在,许多企业都把数据看成宝贵的财富,纷纷利用商务智能发现其中隐藏的信息,借此获得巨额的回报。国内暂时还没有官方关于数据挖掘行业本身的市场统计分析报告,但是国内数据挖掘的在各个行业都有一定的研究。据国外专家预测,在今后的5—10年内,随着数据量的日益积累以及计算机的广泛应用,数据挖掘将在中国形成一个产业。

众所周知,IT就业市场竞争已经相当激烈,而上述数据处理系列的就业则一枝独秀,数据处理的核心技术—数据挖掘更是得到了前所未有的重视。数据挖掘和商业智能技术位于整个企业IT-业务构架的金字塔塔尖,目前国内数据挖掘专业的人才培养体系尚不健全,人才市场上精通数据挖掘技术、商业智能的供应量极小,而另一方面企业、政府机构和和科研单位对此类人才的潜在需求量极大,供需缺口极大。如果能将数据挖掘技术与个人已有专业知识相结合,您必将开辟职业生涯的新天地!

获得SAS全球专业认证将帮助您

SAS公司在全球设有269家办事处,SAS的客户遍布全球112个国家, 包括2003年财富500强中的96%企业以及2003年福布斯100强中的98家企业,在世界范围内有四百万用户。根据IDC的统计数据,SAS已经在2001年统计分析和数据挖掘软件领域占有36.4%的市场份额。

SAS被誉为全球数据分析专家,具有被广泛认知的权威性,多次赢得行业顶级大奖:SAS公司和其用户Bayer CorpScience 共同获得2003年度DM Review(美国最具权威的数据挖掘领域的杂志)世界级解决方案奖;SAS被Forrest and Sullivance 授予2004最佳商业智能厂商大奖;在《财富》杂志” 最愿意为之工作的百家企业排行榜”2003年度评选中,SAS再次名列前十名;赢得Customer Inter@ction Solutions杂志颁发的’2003年度产品奖’;Software Magazine 2003 ” 500强软件”榜上有名,并在数据仓库类名列第一;CIO杂志将SAS列为最高投资回报的商务智能解决方案提供商,成为此类调查中入围前十名的唯一商务智能软件供应商;在最新的Giga Research的评测报告中,SAS屡次获奖的SAS Enterprise Miner被评为市场上最全面的数据挖掘解决方案;在IDC“年度全球数据仓库工具预测与分析工具”评比中,SAS从2001至2004年连续四年稳居领先地位…………

SAS 一直被公认为是具有行业优势的、分析标准软件的首选。在过去的二十八年中,SAS公司始终保持着销售收入的两位数增长,SAS公司2003年全球收入13.4亿美元,占全球70亿美元商业智能软件市场的19.1%,其数据仓库,数据挖掘软件产品具世界领先地位。

SAS全球专业认证是数据仓库、数据挖掘、商业智能领域中的权威认证,目前全球仅有3000多人通过SAS全球专业认证,在欧美等发达国家,获得SAS认证并有丰富经验的人才在职场上供不应求,因此,在欧美等国的职场上流行一句话,“If you have a SAS certification, You will never lose your job ”。有笑话讲甲乙两人共赴米国,乙怀揣某知名数据库认证,历经半年,寻寻觅觅,终觅到一年薪5万美刀的工作;而甲游山玩水一周即得到年薪12万的Offer,两人机遇何以如此不同?无他,皆因甲拿的是SAS的认证。虽然是笑话,不过可以从中看出SAS认证人员的薪情走向和职业发展空间。

目前我国BI市场刚刚兴起,人才供需缺口极大,谁能抓住这个机会尽早考取SAS认证,积累起丰富的SAS应用经验,谁就能在未来的职场拼杀中独占鳌头,笑傲群雄。

SAS全球专业认证, Help you to deliver “The Power To Know”。

责编:admin

转载请注明来源:SAS认证与数据挖掘、商业智能职业发展

相关文章

  • 没有相关文章!

噢!评论已关闭。