国内语音技术产业的现状与未来

    |     2015年7月13日   |   2013年   |     评论已关闭   |    2367

客户世界|母质文|2013-12-27

在比尔•盖茨卸任微软董事长后的一场巡回演讲中,有人问他 “您对未来IT最看好什么?”这位IT巨擘列举的第一项技术就是语音。

语音是一门集合数字信号处理、人工智能、心理学、计算机软硬件工程、概率统计学和自然语言处理的交叉学科。一直以来由于极高的技术门槛,使得这项技术只为少数几家专业公司掌握。随着移动互联网的迅速发展,语音输入成为智能终端发展的一种必需,苹果适时推出SIRI,给智能语音技术带来突破性发展,语音市场变得炙手可热。众多商家纷纷涌入,争夺这块巨大的蛋糕。

一.国内语音技术发展现状:

目前国内语音行业经过长期的发展,在自然语言理解及语音研究方面取得了一定成就。具体而言,首先在不需要理解句子的前提下,机器能将语音自动准确地转化为文字;第二步辅以逻辑、自我学习能力,使其正确理解语义并作出反馈。在PC时代,实现上述两点非常困难。原因在于语言样本收集非常复杂,这一过程不仅需要麦克风等外部传感器,还需耗费专门的人力物力。而移动端的兴起则改变了这一切。首先是硬件支撑,以往数据的采集多基于实验室内安静环境,而移动环境下数据则来自四面八方,随时随地均可收集;其次,移动场景下输入输出相对麻烦,用户由此对语音的需求大大增强;第三,人工智能算法需要强大的计算能力,性能大幅度提升的智能手机满足了这一要求;第四,人工智能系统依赖数据而生,移动端所提供的海量数据可令机器模拟学习。

语音技术的发展使得机器更加友好,人机对话大大改善了交互体验,而基于互联网大数据形成的巨型知识库则支持机器具备更完整的人类知识体系和逻辑推理能力。若要对智能语音技术的发展现状做一个总结,引用“出门问问”创始人李志飞的一句话:“如果从用户的角度来看,人工智能好像真的实现了一点儿,虽然这离严格意义上的人工智能还差十万八千里。”

二、国内技术厂商大盘点:

目前,国内现有的语音技术提供商分为两类。一类是独立的语音公司,以语音技术起家,如科大讯飞、云知声等公司;一类是互联网巨头公司,以百度、腾讯、搜狗为代表。

1、科大讯飞

科大讯飞是目前国内的知名度最高的语音技术厂商。自创立15年来,科大讯飞有着大量语音数据资料积累,这一优势是同业竞争者短期内难以企及的。

2012年3月,科大讯飞发布了新一代“语音云”平台及示范性应用产品“讯飞语点”,语音云用户呈现快速增长,截至2012年底,使用语音云的移动应用下载和激活数量超过1.2亿,讯飞语音输入法等自有应用数量超过4000万。去年12月5日,中国移动联合科大讯飞后推出首个移动互联网产品“灵犀”。它结合了中国移动庞大的用户优势和科大讯飞的语音技术,为广大用户提供智能语音服务。据悉双方后期的合作内容或将引发新的企业Call Center的升级换代:中国移动在客服10086平台将采用讯飞的智能语音技术,用户可以直接说出需求,客服的声音也会采用语音合成技术,这是科大讯飞的优势,其语音合成甚至可以支持主流方言。今年5月,继牵手中移动、中联通后,科大讯飞成功拿下中国电信,成为唯一一家与国内三大运营商均有战略合作的语音技术企业。

2、盛大语音院

谈到国内语音产业的发展,不得不提盛大语音院。因为它确实是从无到有,花了三年时间,突破了语音产业的技术“护城河”。2009年,盛大语音院成立。但好景不长,因盛大资金不足而解散了其上级机构——盛大创新院。在这场动荡中,一部分员工离开了盛大语音院,成立了“云知声”。2013年,盛大语音院从盛大正式独立,成立了“灵声科技”。

3、云知声

云知声成立半年之内就推出了业界第二家语音识别共有云,并立刻获得了搜狗等用户的青睐。公司成立不足9个月就研发出与科大讯飞的讯飞语点功能相当的“云知声语音助手”。在公司成立一周年之际,云知声不仅在语音技术的性能指标上已经杀到了业界领先地位,同时其业务触角还伸向了智能电视、手机应用以及一些传统行业的新兴领域。今年5月,云知声更是将其智能语音与语义技术全面整合到了乐视发布的超级电视中,为智能互联网电视提供一站式的人机语音交互解决方案。

4、灵声科技

灵声科技于2013年2月正式成立。其前身是盛大创新院语音主题院,语音核心成员均来自原语音团队。如今灵声科技已与91、搜狗、云城、盛大游戏及起点中文网等知名企业展开业务合作,为其提供优质的语音服务。在移动互联网领域,为知名应用墨迹天气、智能360、起点读书、云中书城等提供语音引擎,实现语音增值服务,并将“听书”功能做成读书类应用标配,获得良好赞誉。

5.小i机器人

与其他厂商不同,小i机器人更多出现在商用领域。他们主要提供智能机器人开发平台和工具,根据客户需求将语音技术与后端的语义解析进行整合,为包括金融、移动、电商等在内的各领域提供智能机器人的解决方案。而从目前来看,这也是智能机器人技术应用比较成熟的商业模式。

6.互联网巨头

自从盛大投资了语音产业,几家互联网巨头也紧随其后开始了语音技术的研发与投入,腾讯、百度、阿里、搜狗相继成立了各自的语音部门。

百度于2010年成立了语音部门,主要服务于百度的语音搜索业务和语音助手业务。腾讯从2010年左右开始投入语音技术,主要服务于微信业务。搜狗2012年投入语音技术,阿里的语音部门2013年才成立。互联网巨头公司的语音部门虽然有很大的发展平台,但是其目标基本只服务于公司的整体战略。

三、大数据推动下的智能语音技术发展

智能语音识别技术在近几年出现革命性变化,除了移动互联网的崛起外,最重要的推动力在于大数据的兴起。以语音云为例,它需要大量的语音语料来支持语音识别算法,这在以往很难做到。还有作为移动端应用的“出门问问”,需要获取大量用户原始声音素材(即生语料,通常面临的是十亿到千亿级的训练样本),再为其进行人工处理和标注,例如有无噪音、口音、性别等,形成可自动理解和训练的基础数据,并以这些语料去组建训练模型,从而满足功能需求。

因此,“深度学习”作为人工智能的一项重要技术,只有在大数据技术的推动下才有可能出现突破性的进展。

在语音方面,利用深度学习技术改进的声学模型和语言模型使得语音识别精度得到明显改善。百度、搜狗都是这项技术的获益者,百度语音识别的错误率曾藉此降低了20~30%。在语义方面,互联网大数据的深入挖掘可使得知识库不断更新,而人工智能未来的发展方向在于在特定应用领域对语音语义识别进行整合优化。

语音功能的提升亦带动搜索市场的发展。2002年初,百度语音搜索占移动搜索的流量仅为1%,但到2012年底,这一数字已升至8%,预计今年会达到20%。百度的语音团队在很短时间里能够迅速地达到业界一流水平,其优势在于大数据,以技术主导、技术驱动的搜索公司特别具有这样的“基因优势”。

写在文末

苹果Siri的推出,将语音作为移动互联网的入口,给了我们无限的想象空间,让所有人都为之心动了一把。对于国内做智能语音技术的企业而言,要想挑战半个世纪前就涉足人工智能领域研究的美国,仍有很长的路要走,中文智能语音研究领域仍有诸多困难尚待克服。不过,大数据时代已经来临,智能语音市场将如何发展,让我们拭目以待。

本篇文稿部分内容、数据来源于网络,参考文献如下:

1、CSDN,《语音技术现状:四千万突破语音产业的技术壁垒?》,作者:角宿

2、环球企业家,《科大讯飞:做中文语音市场产业链的主导者》,作者:滑明飞

3、赛迪网,《从“音”到“义” 智能语音即将迎来曙光》,作者:xj

4、科学网,《智能语音技术是道坎》,作者:沈春蕾

5、搜狐网,《语音巨头时代来临!谁将是中国Siri?》,作者:罗超

6、安徽广播网,《科大讯飞打造中国语音技术创新国家队》,作者:马骏

本文刊载于《客户世界》2013年12月刊;作者单位为四川移动多媒体呼叫中心。

转载请注明来源:国内语音技术产业的现状与未来

相关文章

噢!评论已关闭。