IC卡电子语音书
2 语音码文件的形成
ISD4004语音芯片是按段存放声音的,每段一个音,每个音300ms。但应注意到有许多字具有相同的发音(如ye3:也、冶、野);而有些发音并无汉字(如:wai2、sai3、ka2等)。对于每一个不同的音,又有5个基本的发声(即阴平1、阳平2、上声3、去声4和轻声5)顺序。只要有汉字与之对应(相同发音只取一个),则赋予其一个编码,如此即可得到全部语音码。汉字现有发音共计1311个。设计时,把所有不同的音按英文字节和发声顺序排列,共有1337个(1311汉字+26英文字母)语音码,亦即1337个语音。用1.5个字节可存储一个语音码(亦即1个汉字读音),则4M位的IC卡可存储近349500个汉字语音。语音码确定后,即可将1337个语音按语音码的顺序写放ISD4004语音芯片中。
首先按GB2312-80给出两级汉字的内码与语音码的转换表,参见表1。对于给定的文本文件中的每个字,只需查出其区位码,然后通过查表即可得到其拼音码,最后将拼音码写入大容量IC卡。对于标点符号,将其处理为停顿(不发声)。值得注意的是,有些汉字(如:和,he2、he4、huo2、huo4、hu2)有多种发音,对于这些汉字将有多个语音码与之对应。究竟转换为哪个语音码,则需参考该汉字的前一汉字或后一汉字。仍不能确定时,应取出现概率为最大的音(如和,取he2)。
表1 区位码与拼音码的转换表(片段)
采用VB程序将电脑中的文本文件转换成本文的语音码,并将其写入IC卡中,从而形成了"电子语音书"。不同IC卡装有不同的内容,即不同的"书"。注意到IC卡的内容是可以改写的,一本书听过之后,还可以到特约的服务点换一本新的"书"来听。
按照本文给出方案所设计的IC卡电子语音书(第2页)插放装量的体积约为120mm×80mm×14mm。本装置的语音发音略显生硬。如能进一步引入智能处理算法,使各汉字发音之间的连接变得柔和一些,发声效果将得到改善。
《IC卡电子语音书(第2页)》