拥抱人工智能,从智能语音合成开始

    |     2016年5月3日   |   2016年   |     评论已关闭   |    2041

2016年开年就发生了一件大事,Alphago和李世石的围棋大战可谓引爆了全球的目光。“人工智能”这个被称为21世纪最有前景的技术,已吹很久,而这次事件的火爆,是因为它把人工智能结结实实地砸到了各位观众的面前,让人大跌眼镜、纷纷赞叹。事实上,在几年前人工智能就已渗入客服行业,如微软的小冰、苹果的Siri,又如在国内服务行业的各大机器人,可以确定的是,人工智能理论已出离“纸上谈兵”的阶段,已被真正地应用到各个领域。

 

人工智能是一个复杂的系统工程,“机器学习”作为其中的必备环节之一,采用了大量前沿的技术,TTS(智能语音合成)就是其中重要的技术,常使用基于DNN、LSTM的机器学习算法来模拟声音的停顿、语气、韵律、口型等声学参数,以协助机器学习的输出部分。笔者在接触到这种新技术的初期,就在思考TTS与我们客服中心的传统自助语音服务之间的融合问题,我们找到了一个很小但是很贴切的切入点,在这里分享,以供大家探讨。

 

传统热线渠道中的自助语音服务(也就是常说的IVR),它作为用户使用量最大的一种自助服务模式,存在语气冰冷、时常卡顿的问题。卡顿的原因是,目前的语音录制多采用“人工录音+简单拼接”的录制方式,自助语音服务要如何带给客户更好的体验?我们就尝试在这里切入TTS技术。

 

自助语音服务传统的录制方式主要存在三点问题:一是语音效果生硬不连续,语音风格差异大,影响客户一致性体验;二是对紧急业务难以提供快速、及时的响应;三是维护录音文件的流程复杂,日常运维工作量较大,运营成本高。而我们的尝试说明了智能语音合成是传统自助语音服务通向智能自助语音服务的桥梁,借助智能语音合成技术可以有效地解决这三个问题,我们将带给客户“体验一致、响应及时、运维高效”的自助语音服务模式。

 

TTS简单来说,就是将文本转换为自然度较高的语音进行播放,让计算机能够像人一样“开口说话”。那么,TTS是如何解决原来的自助语音服务体验不一致、响应不及时、运维成本高的问题呢,我们从以下三个方面来探讨:

 

一、高精度文本分析,一致性服务体验

 

“人工录音+简单拼接”的录制方式,采用人工座席结合数字录音回放,号码、时间、数字、金额和一些文字等重要信息均是以单音报读,播放出来的声音比较生硬、不连续、不自然,语音风格与其他语音制作方式会有较大差异,用户必须高度集中注意力才能听懂,影响了客户的一致性服务体验。

 

TTS技术对文本字符串进行了断句、多音字选择、节奏分析等处理,智能拼接语音单元,得到语音数据,为客户提供更友好、个性化的服务。

举个例子,改造前,1356XXXXXXX的陈先生使用10086自助语音服务进行话费查询,听到的语音播报内容为“您的当前余额为(停1s)五(停0.5s)元(停0.5s)九(停0.5s)角”,由于系统调用录音字段拼接,数字金额报读不连续。 

 

而改造后,话费查询的语音播报内容为“您的当前余额为(停0.5s)五元(停0.3s)九角”,整个服务过程中保持语音风格一致,根据语法断词,停顿合理。

 

特别要说的是,改造中尤为重要的一步是文本分析,针对行业特有的业务特点,定制专业的语音资源包,在语音合成中优先调用该资源包进行语法分析和处理,播报文本更加符合行业的业务需求,再通过智能拼接技术避免了人工拼接的语音风格差异化,打造统一音色、统一播报风格的自助语音服务流程。

 

二、快速响应上线,保证信息无误

 

由于笔者所在行业的业务特点,业务种类多、更新快,往往无法在短期内完成录音,且在录音量大时出现人为错误的几率也随之增加。如发生了紧急故障,传统的录制方式要经过三步,第一步是准备好语音文本,第二步是协调资源,安排录音员进行录制,一条语音录制的完成最快也要3个小时,若录音员出现读错读漏的现象,重新录制时间会更久,而且成本更高。而在这种情况下,我们使用TTS智能语音合成技术,只需在系统输入相关的文本内容,系统自动将其转换为语音,30s能完成录制,及时上线告知客户,且保证信息100%正确。

 

三、信息自动更新,降低运维成本

 

对于各个客服中心而言,业务信息的语音录制是提前录制好的,比如资费介绍、服务网点、使用方法等,按照一定的业务更新需求,每年需要提前录制的语音可能有上万条,采用播音员录制的传统录制方式,需要不断重新投入录音费用,且日常维护这些录音文件的流程复杂,维护人员需二次检查语音正确性后再修改文件格式和路径上传,需要消耗大量的录制资源和人力资源。而在自助语音服务中应用TTS技术,在业务更新时,维护人员只需要通过文本方式更新业务内容,系统就会自动合成为语音实时播报给客户,整个录制过程无需人工干预,有效地节约了录制成本,可以大大降低了运维成本。

 

不断追求客户感知提升是做好服务的出发点,而TTS技术作为刚刚起步的人工智能技术之一,从语音制作、语音发布、语音管理三方面采用的智能化自助语音服务确实好处多多。但在应用的业务范围上还有待拓展,语音录制的准确性、流畅性也有待进一步研究提升,如何实现业务标准化与信息个性化,提高服务水平与效率,也期待同业者一起探索研究。希望这些尝试能成为一个起点,从智能语音合成开始,让客服从业者拥抱人工智能时代。

本文刊载于《客户世界》2016年4月刊,版权作品,欢迎转载并标明出处;作者任亚龙 王媛,作者单位为广东移动客服中心

转载请注明来源:拥抱人工智能,从智能语音合成开始

相关文章

噢!评论已关闭。