基于DSP的声控电子记事本的设计与实现
摘要:一种基于DSP芯片的语音识别和数字录音系统。在该系统中,DSP(单片ADSP2185)完成语音识别和数字录音功能,MCU完成用户界面处理。该系统可以实现语音名片(电路号码、工作单位、地址等)存储及声控查询、记事录音及声控回放、日历、简单计算器等功能。
关键词:ADSP2185语音识别数字录音
语音识别及语音编解码技术经过几十年的发展,已经日趋成熟,步入实用化阶段。语音识别技术已开始应用于电话查询服务、智能玩具、PDA、家用电器、通信、工业控制、语言学习等应用领域;其于码激励线性预测(CELP)技术的语音编解码算法也因其音质好,压缩比大而在通信和数字录音设备中获得了广泛应用。
语音输入方式与手写输入方式相比,具有操作简便、查找方便、识别准确率高等优点。省去了大量的输入时间,降低了信息检索的复杂度。本文所介绍的声控电子记事本系统将语音识别和语音编解码在同一片DSP芯片上实现,用语音方式代替其它方式进行信息输入,提高了系统的灵活性。
1系统功能
·可存200张语音名片,每张语音名片包含四条信息:姓名、电话号码、工作单位、备注;声控查找语音名片信息,用户只需口述所要查找人的姓名,即可获得电话号码、工作单位、备注等信息,同时电话号码显示在液晶显示屏上。
·具有双音多频(DTMF)拨号功能,用户用声控查找到电话号码并显示在液晶屏上之后,只需轻触一个拨号键,即可通过普通电话机的话筒实现快速自动拨号。
·数字录音,每段录音加语音标识;声控放音,在放音时只需口述所要语音段的语音标识即可自动找到该段录音并加放,累计录音时间达两个半小时以上。
·具有方便的编辑功能,增加、删除语音名片,增加、删除数字录音段。
2系统构成
本文所介绍的声控电子记事本系统,是在定点16位DSP芯片上实现的,它包含特定人孤立词语音识别算法和代数码本激励线性预测(ACELP)语音编解码算法数(MFCC)为语音特征、以动态时间规划(DTW)为模板匹配算法,对于普通词条,识别率达到了99%以上。用于“录音”功能的ACELP算法是该码率下性能优异的编解码算法,虽然算法复杂度较高,但共重建语音质量的平均主观评测分数(MOS分)达到了4.0,非常接近于压缩前的分数4.3。
如图1所示,系统由MCU实现总线控制,接受外部键盘输入,并在液晶屏上显示信息。在本系统中,语音充当大部分人机界面的角色,尽量省去复杂的键盘操作,而且用语音提示或语音回放代替一部门液晶文字提示。由于语音要经过DSP处理,所以MCU需要与DSP经常交换信息,以便实现友好的操作界面。
2.1DSP
DSP(ADSP2185)是整个硬件系统的信号处理中心,完成语音识别、训练、编解码,进行片内RAM及外部FLASH存储芯片的数据管理与调度,并向主控芯片MCU提供简洁的命令与反馈信息。ADSP2185是AnalogDevices公司的产品,其主要性能如下:
·运算速度为50MIPS,且均为高效的单周期指令。
·提供了80Kbyte的片内RAM,其中32Kbyte为数据RAM,48Kbyte为程序RAM。
·最大可支持4Mbyte的外部存储区,用于存储数据或程序。
·提供对字节存储 《基于DSP的声控电子记事本的设计与实现》
本文链接地址:http://www.oyaya.net/fanwen/view/168514.html
关键词:ADSP2185语音识别数字录音
语音识别及语音编解码技术经过几十年的发展,已经日趋成熟,步入实用化阶段。语音识别技术已开始应用于电话查询服务、智能玩具、PDA、家用电器、通信、工业控制、语言学习等应用领域;其于码激励线性预测(CELP)技术的语音编解码算法也因其音质好,压缩比大而在通信和数字录音设备中获得了广泛应用。
语音输入方式与手写输入方式相比,具有操作简便、查找方便、识别准确率高等优点。省去了大量的输入时间,降低了信息检索的复杂度。本文所介绍的声控电子记事本系统将语音识别和语音编解码在同一片DSP芯片上实现,用语音方式代替其它方式进行信息输入,提高了系统的灵活性。
1系统功能
·可存200张语音名片,每张语音名片包含四条信息:姓名、电话号码、工作单位、备注;声控查找语音名片信息,用户只需口述所要查找人的姓名,即可获得电话号码、工作单位、备注等信息,同时电话号码显示在液晶显示屏上。
·具有双音多频(DTMF)拨号功能,用户用声控查找到电话号码并显示在液晶屏上之后,只需轻触一个拨号键,即可通过普通电话机的话筒实现快速自动拨号。
·数字录音,每段录音加语音标识;声控放音,在放音时只需口述所要语音段的语音标识即可自动找到该段录音并加放,累计录音时间达两个半小时以上。
·具有方便的编辑功能,增加、删除语音名片,增加、删除数字录音段。
2系统构成
本文所介绍的声控电子记事本系统,是在定点16位DSP芯片上实现的,它包含特定人孤立词语音识别算法和代数码本激励线性预测(ACELP)语音编解码算法数(MFCC)为语音特征、以动态时间规划(DTW)为模板匹配算法,对于普通词条,识别率达到了99%以上。用于“录音”功能的ACELP算法是该码率下性能优异的编解码算法,虽然算法复杂度较高,但共重建语音质量的平均主观评测分数(MOS分)达到了4.0,非常接近于压缩前的分数4.3。
如图1所示,系统由MCU实现总线控制,接受外部键盘输入,并在液晶屏上显示信息。在本系统中,语音充当大部分人机界面的角色,尽量省去复杂的键盘操作,而且用语音提示或语音回放代替一部门液晶文字提示。由于语音要经过DSP处理,所以MCU需要与DSP经常交换信息,以便实现友好的操作界面。
2.1DSP
DSP(ADSP2185)是整个硬件系统的信号处理中心,完成语音识别、训练、编解码,进行片内RAM及外部FLASH存储芯片的数据管理与调度,并向主控芯片MCU提供简洁的命令与反馈信息。ADSP2185是AnalogDevices公司的产品,其主要性能如下:
·运算速度为50MIPS,且均为高效的单周期指令。
·提供了80Kbyte的片内RAM,其中32Kbyte为数据RAM,48Kbyte为程序RAM。
·最大可支持4Mbyte的外部存储区,用于存储数据或程序。
·提供对字节存储 《基于DSP的声控电子记事本的设计与实现》