数据挖掘技术的商业价值及其在金融行业的应用

    |     2015年7月12日   |   会议会展   |     评论已关闭   |    1537

|石勇 张悦|2007-11-11


  随着科学技术的飞速发展与计算机技术的广泛应用,在人类生产生活的各个领域产生了大量数据,由此催生了具备强大储存查询功能的数据库技术。但是面对每分每秒不断产生的数据,人们不再满足于对这些数据单纯的查询功能,进一步要求“用数据说话”:利用数据提取有益信息,形成知识为决策服务。这一要求就数据库技术而言已经显得无能为力了,同样,传统的统计科学也面临了极大的挑战。于是,一种依托于统计学、数据库、机器学习等科学的交叉学科——数据挖掘技术应运而生。

  “数据挖掘”(Data Mining)是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘与传统的数据分析,如查询、报表、OLAP(联机应用分析)、统计分析等数据分析技术的本质区别在于,数据挖掘是在明确假设的前提下去挖掘信息、发现知识。

  作为一门应用技术,数据挖掘可谓涵盖广泛。尤其在发达国家,数据挖掘技术的触角已经伸向了各行各业,尤其是在银行业。典型的例子就是信用卡,用数据挖掘技术来分析银行客户的信用等级和资产发展趋势,用以规避银行风险。现在,由于各行业业务信息化的实现,商业领域产生了大量的业务数据,这些数据或是为了分析的目的而收集,或是通过纯粹的商业运作而自然产生。分析这些数据不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的支持信息。目前所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少。因此就要求通过数据挖掘技术的使用对大量的数据进行深层分析,获得有利于商业决策的信息。

  数据挖掘作为信息技术发展的关键技术正显现出其巨大的商业价值,在金融领域尤其如此。经济的全球化和我国加入WTO,使中国金融行业在市场竞争中面临着前所未有的机遇和挑战。随着中国经济的腾飞,居民个人和家庭逐渐成为社会财富的主体,这使得零售业务成为中国金融行业的主战场。中国金融企业,特别是商业银行,迫切需要将市场营销理念从“产品导向”迅速转变为“客户导向”。在这场划时代的金融改革中,数据挖掘技术将成为协助中国金融行业成功转型的一把利刃。

  客户概况:对症下药 提高客户的潜在价值

  美国北达科他州第一国民银行发现,10%的客户提供了银行几乎所有的利润。旧金山的美国银行也发现,一小部分客户,大约在20%左右,他们决定了银行的盈利情况。美国银行收集了其高端客户的资料来进行研究以决定提供的服务。在数据挖掘中,客户概况的意义就在于帮助企业识别出最具价值的客户群,对症下药,对不同客户施以不同管理方式。客户概况也是客户关系管理(以下简称CRM,Customer Relationship Management)中的核心部分。

  企业客户大体可分为机构客户和零售客户。中国传统的金融业务侧重在对机构客户的关系维护与拓展上,缺乏对零售客户的管理。而在发达国家和地区的金融企业中,零售客户业务的比重通常都在50%以上。由于零售业务涉及居民的生活、消费、投资等方方面面,与证券、保险、基金等多个金融市场有着非常强的交叉性、连带性,业务创新的空间广阔。正如国务院发展研究中心金融研究所副所长巴曙松所说,2006年底中国入世5年保护期满,主流外资银行将正式在中国展开与国内商业银行的激战,而竞争的焦点将是人民币零售业务。

  数据挖掘技术正是在管理零售客户这一领域具有强大的技术优势。例如,中国工商银行正在同中国科学院虚拟经济与数据科学研究中心开展合作,应用该中心所独有的数据挖掘技术方法与模型对其客户群进行科学分类,对个人客户群行为特征以及个人客户贡献度分布规律数据进行深度挖掘、分析和提炼,发现蕴藏在复杂数据中的反映顾客风险特征和客户忠诚度的知识和规律,以便为中国工商银行的个人客户分类、风险管理、市场营销等提供科学依据。

  CRM应用相应的技术来监控客户服务,通过数据挖掘技术可以有效地增强这一功能,了解每一个客户对公司的价值,使得决策者可以更合理地决定为保留某个客户支付更多的费用是否值得。银行业中的数据挖掘有很多种机会。Deloitte咨询发现只有31%的银行曾经确定它们现有的费用分配是反映了客户需求的。Kathleen Khirallah,The Tower集团的分析师,预测美国银行界在CRM系统上的支出将以每年11%的速度增长。

  而在中国的金融领域,CRM及其相应技术的应用水平相比于西方成熟金融市场,还有很大的成长空间。以信用卡客户为例,自上世纪90年代前期开始,中国境内个人信用卡业务以井喷的态势发展(如图1所示)。然而截至今日,实现信用卡业务盈利的国内商业银行寥寥无几,根本原因在于银行对持卡客户并不了解,缺乏量体裁衣式的客户管理。实践证明信用卡行业利润是相当丰厚的。它吸引了很多境外银行进行发卡,并且很多持卡人都拥有4到5张信用卡。大通曼哈顿银行分析部副总裁Michael Eichorst声称,发卡行如果想提高利润率,除了将数据库营销作为自己的核心竞争力之外,别无他法。

  渣打银行是国际零售银行业的领头羊之一。其信用卡业务的成功秘诀在于:把客户数据提炼成客户知识,利用数据挖掘技术成功进行CRM管理,使客户使用该行信用卡的时间延长、次数增加,关联销售业绩上升,从而使利润率整体提高。如何做到这一点呢?如图2所示,首先渣打银行利用已有数据库,按照客户特征(包括购买行为、主要服务需求、人口学特征、产品使用情况、客户关系、价格敏感度等等考核项目),对客户进行分类(Customer Segmentation)。针对不同的客户类型(例如大客户类型,潜在价值高,但是忠诚度很难保持)设计出量体裁衣的产品组合、沟通方式,以及客户服务,从而达到提高客户忠诚度、实现关联销售、最优化定价、产品直销、产品再设计,以及渠道管理的目的。而这些目标的实现,致使客户管理总体成本降低,客户关系得以改善,最终成功实现零售业务块利润率的提高。

  评分技术:给客户直观量化的分数

  银行界广泛使用的另一种数据挖掘工具就是评分技术。这些评分包括风险评分、行为评分、收益率评分,征信局评分,行业评分以及客户评分等。评分技术将顾客的海量信息数据以某种权重加以衡量,针对各种目标给出量化评分。

  以征信局评分为例。要达到建立征信局评分的目标,首先要建立起集中的数据仓库,其中涵盖了申请人的各种特征,银行提供的所有产品,包括存款、贷款、信用卡、保险、年金、退休计划、证券承销,以及银行提供的其他产品,甚至包括水电煤气、电话费、租金的缴纳情况等。

  信用评分通过由数据挖掘模型确定的权重来给每个申请的各个指标打分,加总得到该申请人的信用评分情况。银行根据信用评分来决定是否接受申请,同时也通过信用评分来确定信用额度。过去,信用评分的工作是由银行的信贷员完成的,他们只考虑几个经过测试的变量,比如就业情况、收入、年龄、资产、负债和贷款历史。专业的征信机构应用数据挖掘的方法则能够增加更多的变量,同时提高模型的精度。

  为推动征信业发展,中国人民银行1998年开始筹建银行信贷登记咨询系统,通过政府投资建立数据库,先后将全国1000多万企业和5.6亿自然人的银行贷款信息纳入其中,于2005年实现全国联网运行,满足银行监管和商业银行贷款查询的需要。

  目前,中国人民银行正在联手中国科学院虚拟经济与数据挖掘研究中心对该征信系统进行升级:在个人征信数据库的基础上,以足够大的样本量,运用具有独创性知识产权且国际领先的数据挖掘方法和手段,建立一个能适合于中国现状并且具有实际运用价值的个人评分模式。

  这个评分模型将运用500多个衍生变量,对数据库内的个体进行评分,预测该个体未来的风险系数。分数越高坏账风险越低,分数越低风险越高。这一评分系统将帮助信贷员快速准确地做出放贷决定,同时也可以保证银行系统内部放贷标准的统一。这一评分系统具有涵盖面广、使用成本低、建设速度快等特点,它与各银行已有的客户评分相辅相成,为商业银行实现更完善的风险控制,并为客户管理奠定坚实的基础。

  购物篮分析:关联营销的有力工具

  购物篮分析的意义在于确定并预测消费者商品购买行为,这些信息有助于产品定位和关联销售。购物篮分析主要调查顾客倾向于如何购买产品,一般是怎样的产品组合。这包括同时所购买的商品,如牛奶和饼干,或者面包、黄油和果酱。当然也包括序列关系的购买,如购买房子后接着买家具,或买车后一年或二年买新轮胎。顾客的购买趋势信息以及购买时间信息对于零售业非常有价值。例如,星期一晚上足球赛一般可以刺激星期一下午的销售,所以商家应该保证有充足的啤酒和土豆片存放在货架上。ACNielsen-US主席史蒂夫斯密特描述了购物篮分析的一些好处:“购物篮分析在宣传和推销战略的有效选择方面是非常重要的。它能揭示消费者的隐含消费模式,识别促销产品的有利机会。”数据挖掘分析过程不仅包括识别这些关联,还包括寻找这些关联的原因,以及提出增加总利润的方法。

  购物篮的技术已经被广泛应用在西方金融行业企业中,它可以成功预测银行客户需求。一旦获得了这些信息,银行就可以改善自身营销。现在银行天天都在开发新的沟通客户的方法。各银行在自己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。当客户打电话咨询的时候,数据库可以有力地帮助电话销售代表。销售代表的电脑屏幕上可以显示出客户的特点,同时也可以显示出顾客会对什么产品感兴趣。

  数据挖掘与保险行业

  近年来,中国保险业持续高速增长,尤其是人身保险呈现井喷态势。尽管近期中国保险业增长强劲,但相对来说仍处于发展初期。2003年,中国保险深度达到3.33%,保险密度达到287.44元。但与同期全球平均保险深度8.06%,平均保险密度469.6美元相比,我国保险市场的密度和深度都处于很低的水平。

  数据挖掘技术在西方保险行业有多年成功的运作实践,可以协助保险业公司解决保险产品开发、定价、保单审核、欺诈检验、破产预测、客户管理分类等多项复杂业务。

  例如,保险公司都会有一个大型数据仓库系统,记录每项交易和索赔细节。分析的目的就是准确地预测索赔的平均成本及频率,并且检测收益率的价格影响。特定的决策是设定保险产品的价格,达到增加市场份额、保持现有的客户以及增加收益率。保险业的成功定价需要预测多少顾客有可能重新更新他们的保单(policy),测算他们的风险水平以及他们对价格上涨的敏感度。数据挖掘技术的应用将会协助中国保险企业完成健康、高效和可持续性的发展。

  目前,中国科学院虚拟经济与数据科学研究中心正与中国再保险(集团)公司合作开展研究,制定在中国全面开展再保险业务的商业战略政策。

  (作者石勇为中国科学院虚拟经济与数据科学研究中心常务副主任,中国科学院研究生院管理学院副院长、教授、博士生导师;作者张悦为中国科学院虚拟经济与数据科学研究中心助理研究员)

责编:admin

转载请注明来源:数据挖掘技术的商业价值及其在金融行业的应用

上一篇:

下一篇:

相关文章

噢!评论已关闭。