解放双手!科大讯飞推出轻量级智能语音识别系统

    |     2015年7月12日   |   标杆展示   |     评论已关闭   |    1309

客户世界|科大讯飞 |2008-07-23

随着手机、MP3/MP4、导航仪等嵌入式设备体积越来越小,键盘手动操作变得越来越不方便,特别是走路、驾车时更是无法完成,应用智能语音识别系统,上述问题就可迎刃而解。科大讯飞最新推出的轻量级智能语音识别系统Aitalk2.0,能够方便的应用在嵌入式设备上,让用户解放双手,通过语音命令操作设备、检索信息。

Aitalk2.0是一个非特定人命令词语音识别引擎,可为第三方提供开发接口,提供语音识别功能。针对嵌入式系统资源受限的特点,Aitalk2.0对搜索算法作了针对性改进,在资源占用、可移植性等方面取得了突破性进展,在提高识别速度的同时,保持了良好的识别率。语音识别功能利用系统本身的运算、存储资源,以软件模块方式实现,客户在此基础上开发各种具体的应用,不增加额外的硬件成本。同时,该系统还针对主要应用领域作了更细致的优化,使应用效果进一步提高,如手机上语音拨号、语音操控、语音查找,导航仪语音设置目的地,电子词典、MP3的语音搜索等功能。

全面完善的功能特性

►支持中文、英文、中英文混读识别

Aitalk2.0 支持中文、英文单词、英文句子的识别;同时,也支持中英文混合词条或者句子的识别。如,歌曲名“yesterday once more”、“my heart will go on”,人名“Tony黄”、“张David”等,Aitalk2.0 均能准确处理和识别出此类词条。 

►支持动态识别命令词条

Aitalk2.0的识别词条可以以文本形式动态添加。如手机中的联系人名、MP3播放器中的歌曲名称等,都可以添加到引擎的识别集中,识别引擎可对加入到识别集中的所有词条进行识别,无需用户进行录音训练。

针对用户实际的使用场景,如联系人名的增删,歌曲的更新等操作,Aitalk2.0 支持识别词条的动态更新,只需要应用程序将更新后的识别词条加入或替换识别集合即可进行识别。 ?

►支持含有数字符号的词条识别

Aitalk2.0 可准确处理和识别出含有数字及符号的识别词条。

类似的歌曲名称,如“2002年的第一场雪”(读作“二零零二年的第一场雪”),恋曲1990(读作“恋曲一九九零”),以及“20%”、“3/4”等都可以被引擎接受并识别。 

►支持多种识别灵敏度

Aitalk2.0 的识别灵敏度可以进行设置,满足不同场景下的需求。

灵敏度设置较高级别,则识别引擎的识别标准较宽松,适合在安静的环境下使用;

灵敏度设置为一般,适用于办公环境。

灵敏度设置较低级别,引擎的识别标准较严格,适合在嘈杂的环境中使用。 

►准确的语音端点检测

Aitalk2.0采用先进的语音端点检测算法,能在复杂的应用环境中,准确地检测出语音信号的开始及结束,在检测到语音信号结束后自动给出识别结果。 

►超时控制

用户在使用语音识别功能时,往往需要在规定的时间内进行语音输入。传统的识别引擎需要用户在开发时针对不同的应用场景设定允许识别的时间,Aitalk2.0 内置了识别的时间控制,内置的时间控制能够很好的适应用户的使用习惯,且能有效的减少第三方的开发工作量。另外,用户还可以自定义识别时间的长短。

责编:admin

转载请注明来源:解放双手!科大讯飞推出轻量级智能语音识别系统

相关文章

噢!评论已关闭。