SPCE061A在语音遥控器中的应用
这三种压缩算法的区别在于压缩率不同、音质也不同。SACM_A2000压缩率相对较小,音质较好,相应的资源占用较多。SACM_S240的压缩率最大,音质相对较差。SACM_S480介于这两者之间。每种算法都有完整的库函数供程序调用,软件编写非常方便。本语音遥控器采用SACM_S480算法。
语音识别分为特定发音人识别(Speaker Dependent)和非特定发音人识别(Speaker Independent)两种方式。
特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而其他人的语音命令识别准确率较低或不识别。非特定发音人识别是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。语音遥控器就是采用非特定发音人识别方式。
语音识别分为语音样板训练和语音识别两个过程。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“样板”。所谓语音样板训练,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。语音识别的过程就是提取语音命令的特征参数,与词库中的样板比较,取相似度最好的样板命令序号作为识别结果。凌阳科技公司提供语音样板训练工具和语音识别库函数,每次可以识别30条语音命令,命令较多的话可以分多组进行,语音识别流程见图4所示:
上面介绍了采用SPCE061A来完成红外遥控、语音识别、语音报温、报时等综合功能的语音遥控器,系统只用了单颗芯片来完成语音处理和控制功能,与专用的语音处理芯片相比,具有结构简单、成本低、易实现的特点,并且凌阳科技公司提供了丰富的C函数库和语音处理函数库,供用户调用,缩短了开发周期。本品稍作改动,就可用来控制空调机、录像机等电器;利用SPCE061A的语音处理优势可组成语音应答系统、语音合成系统、互动式玩具等,具有广阔的市场前景。
《SPCE061A在语音遥控器中的应用(第2页)》