科大讯飞新一代语音合成系统Interphonic5.0介绍
客户世界|科大讯飞 |2006-06-24
p>
p>
随着2006年科大讯飞与NUANCE语音技术解决方案全国5个城市的巡展在5月的完美谢幕。6月初,科大讯飞的新一代重量级语音技术产品正式登上舞台,为客户带来更多更好的选择,以及更加新鲜的语音技术体验。
目前伴随着新业务的不断涌现,企业,运营商或是系统集成商都越来越多的关注语音技术的发展及应用,以期望将先进的语音技术作为新一代呼叫中心和电信增值业务的核心动力引擎,打造全新的自助语音服务,并使其应用在各行各业创造源源不断的价值,带来便捷,个性的应用效应。
随着越来越多的客户认识到蓬勃发展的语音应用所带来的显著价值,领先的语音合成技术领导者科大讯飞与全球语音识别巨头Nuance公司强强联合,基于在核心技术研发上的不断探索以及和应用每年都会为客户带来不断升级的新一代技术产品。此次发布的新一代语音合成系统——InterPhonic5.0的推出标志着科大讯飞的优质语音服务又迈上了一个新台阶。合成效果超过一般自然人发音,在多语种、多音色方面又迈出了重大步伐,可以充分满足用户的个性化需求。粤语效果更趋自然,数字、数值发音更加清晰饱满,短语合成更加流畅,资源管理更加方便,完全可以适应各种类型的专业化要求。系统结构更加灵活开放,稳定性和可用性经受了众多大规模实际应用的检验,能够确保7×24小时不间断自动化语音服务。我们相信该产品一定会赢得更多新老客户的支持和认可。我们期待在语音应用的崭新时代与您分享技术进步的丰硕成果。
新一代的语音合成系统InterPhonic5.0是目前业界最优秀的TTS产品,相比于之前的产品有多方面的改进和提升:
多语种
多语种的语音合成解决方案是InterPhonic系列语音合成系统的重要目标,目前InterPhonic系列语音合成系统已经能够支持中文普通话、粤语和英文三个语种,并在纯中文、中英文混读、粤英文混读方面达到了很好的效果
InterPhonic 5.0系统在此基础上着重改进了:
(1)纯英文文本的合成效果——Sherri音库。该音库选用以英语为母语的发音人,其发音为标准美国英语,朗读风格流畅自然。
(2)新增台湾普通话合成效果——小琳音库。该音库发音为带有台湾地区方言特色的国语,音色甜美柔和。
上述新增音库均沿用了科大讯飞先进的语料收集算法,大幅度扩展了英文语料的数量,保证了语料的覆盖面,并且针对英文的特点加入了大量优化规则,可以很好地适应当前各种应用语境。
多音色
InterPhonic 5.0系统增加了三种全新的音库——小倩、小琳和Sherri音库。新音库的制作采用了全新的录音语料,并增加了数字、娱乐、体育等其他领域的语料文本。新音库将提供给用户听感上最直接的效果改进。
至此,本系统可以提供小静、小燕、小美、小宇、小倩、小琳和Sherri七个不同发音人录制的音库,能够支持中文、中英混读、英文、粤英混读和台湾国语,每种音库分别提供6K、8K、11K和16K四种不同采样率的音库安装包。在合成过程中,如果安装了多个音库,用户可以根据需要实时切换并测听不同音色、不同采样率的合成效果。
粤语口语化
粤语是一种口语风格很强的语种,为了更好的提高粤语的合成效果,InterPhonic 5.0除了进一步优化口语化规则之外,还在现有小美粤语库的基础上补充了一部分口语化关闭的语料,并提供将口语化关闭的功能,这些改进使得粤语合成效果更符合实际应用的需要。
预录音改进
InterPhonic 3.0语音合成系统实现了预录音的统一管理和处理的功能。用户可以将预录音添加到系统中作为资源,并调整预录音的语音特征,使预录音和合成语音衔接更加自然。
InterPhonic 4.0在InterPhonic 3.0可设置预录音属性的基础上,增加了匹配条件功能和批处理功能。
InterPhonic5.0用预录音智能匹配的方法,最大限度地匹配提示音;用合成模板的方法,改进定制领域合成效果,简化定制流程,加快定制速度。这些改进使得预录音的使用更自然、更灵活,满足更广泛的应用需求。
数字短语改进
针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic 5.0在数字数值、姓名短语等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强。
系统版本增加
InterPhonic5.0语音合成系统提供了简体中文、繁体中文和英文三种版本,每个版本都配备了相应的安装包,工具界面以及文档。
责编:admin
转载请注明来源:科大讯飞新一代语音合成系统Interphonic5.0介绍
噢!评论已关闭。