RSC-4x系列是新一代嵌入式语音识别处理器集成电路,它具有集成度高、外围电路简单、功耗低、不怕掉电、使用方便等特点.一个完整的语音识别系统仅由RSC-4x系列芯片及少量外部元器件(扬声器、麦克风、音频输入/输出电路、存储器和电池或整流稳压电源)等组成.R S C-4 x系列芯片适用美国SENSORY公司的7.0语音识别技术.
SENSORY 7.0语音识别技术充分利用RSC-4x系列芯片新增的硬件电路,它包括一个带有双向直接存储器的向量处理器、16位A/D转换器、10位D/A转换器、主晶振锁相环、带自动增益控制的麦克风前置放大器、低电池干扰的PWM扬声器驱动电路、两个独立的计时器加单独的看门狗电路、4个比较器输入及24个I/O口.
RSC-4x系列芯片语音识别微处理器内嵌入一套先进精确的识别算术运算法,支持第七语音,能运用在复杂的神经网络技术中,增强了识别率的正确度,对于单独语音识别的sI识别率超过97%以上,对于多路语音识别的SD识别率也超过99%以上.RSC-4x系列芯片可允许同时连续接收5个sI或者10个sD命令.
RSC-4x系列芯片具有精确和高质量的语音识别能力,外部存储器总线为20位地址和8位数据线,无须通过ROM存放功能实现代码安全,语音识别速度加快,高抗噪性能及低电磁干扰设计,低数据率语音合成以及更多智能化控制特征.
RSC-4x系列应用领域广泛,目前主要针对消费电子电器产品,如声控玩具(会说话的娃娃、儿童学话玩具)、家电语音遥控器(遥控玩具、TV、空调遥控器等)、声控语音拨号电话、语音拨号录音电话等.图1是RSC-4x内部逻辑电路原理框图.
RSC-4x系列芯片通常采用48P/64P/100P-LQFP封装.
工作原理RSC-4x是一种交互式智能语音识别电路,通过执行内嵌的马尔可夫链和神经网络去处理语音识别.说话者需要在芯片的外部存储器(如sRAM、EEPROM、闪存等)存储语音识别信息,识别过程中需要ROM去存储要被识别的字.RSC-4x有如下几个独创的识别特性:
1、语音识别无须训练.在一个活动单元内可识别16个字(单元存储的字由内部ROM和外部存储器限制).
2、连续接收每一个特殊的字.由于这个功能,所以此产品可以用在一般的场合和对一些特殊的字时需要安静的环境.
3、字定点测量允许芯片一次可连续接收达5个SI或10个SD,在该字定点方式下,无须保持安静的环境.RSC-4x系列可在芯片的sRAM中存储6个sD字或在外部存储器中存入更多的字.
RSC-4x利用巧妙的频域规则提供高质量语音合成,典型的数据率小于5k/s.语音合成需要片内或片外ROM去存储所要合成的语音数据.RSC-4x提供4种高质量音乐/语音合成手段.RSC-4x独到之处还有可使用计算机网络系统产生具有128种音色、47种真实乐器声的高档音乐MIDI.
RSC-4x可以在不同的采样比率下对声音进行录音和重播,采样比取决于对语音时长和音质的要求,数据率在14k/s时,一般就可以获得较高音质的效果.RSC-4x还可以消除静差以提高声音质量和减少存储容量.
当供电电压为3v,且系统时钟频率在14.32MHz时,典型工作电流为10mA.
虽然语音识别需要14.32MHz的时钟频率,产生的标准电流小于5μA.但低的时钟频率可以减少功率消耗.
RSC-4x指令集中有60个指令.其中包括13个M0v指令、7个循环指令、11个分支指令、22个算术指令和7个混合指令.
RSC-4x有24个通用I/O口(PO.0-P0.7、P1.0-P1.7、P2.0~P2.7),每个I/O口内部虚上拉一个200kΩ电阻;或实上拉一个10kΩ电阻;或没有上拉电阻,或作为一个输出口使用.RSC-4x有外部存储器接口,可在外部扩接存储器,以用来存储说话者的识别语音样本、声音录制与播放、延长语音和音乐合成的时间长度.RSC-4x有8个数据线和20个地址线,用来连接外部存储器的接口控制信号,RSC-4x有两个独立的晶体振荡器,一个是系统时钟振荡器,另一个是3.27682Hz的保持时钟振荡器.
RSC-4x内部的两个独立的振荡器,用以产生时钟供给3个内部定时器.每个定时器都有一个8位重载寄存器和一个4位译码寄存器.寄存器的重载由微处理器的读写信号控制.为了防范电压波动,芯片提供了一个1 7位的看门狗计数器,它由振荡器提供的32768t{z时钟频率控制.
RSC-4x有6个由软件选择的中断源,每个中断源都有IMR、中断与位和请求.RSC-4x的模拟前端有一个增益为26dB的前置放大器,用以放大麦克风电信号.片内的带宽参考电路为传声器、前置放大器和模拟调节器等提供一个标准模拟供电电压,同时也产生低电压探测参考电压.RSC-4x的前端为16位模/数转换器,所有的电路都能适应掉电状态,以保护电池的寿命.
RSC-4x提供两个独立的模拟量输出.DAC提供一个通用的10位数/模转换输出端,可用于语音输出或其它模拟波形输出,如作为语音输出应用还需要相应的辅助音频放大器以驱动扬声器工作.PwMl、PwM2端直接驱动8-32Ω扬声器.
RSC-4x片内有两个模拟比较器,在软件控制下使外部的模拟信号产生电平信号.每一个比较器能独立使能.输入为"0"电平时比较器掉电,比较器不使能,输入信号将被隔离.输入接"vREF"电平时比较器得电,比较器使能,输入信号将获通过.
RSC-4x系列芯片包括RSC-4000、RSC-4128、RSC-4256.RSC-4000没有片内ROM,但有地址线和数据线,可以外接存储器(RAM、ROM、EPROM或闪存).RSC-4128和RSC-4256片内分别有128kB和256kB固定存储器.图2所示是RSC-4128(100P-LQFP)应用原理图.
IC1为数据存储器SST28VF040;IC2为程序存储器27C010;IC3为主控制芯片RSC-4128;外部接3.58MHz晶体振荡器.
应用举例1.多功能语音识别声控电话机该电话机是一款功能强大的新型电话机.
除了具有传统电话机的所有功能外,还结合了先进的语音识别技术,使该机集语音查询、来电语音播报(显示)人名或电话号码、语音自动查询拨号、个性化MIDI音乐铃声、IP电话、计算器、智能语音提示、掉电保存资料、密码保护和长时间数码录音等功能于一身,大大丰富和扩展了电话机的功能,给使用者带来极大的便利.
2.语音控制电视遥控器语音控制电视遥控器能识别主人的语音命令并完成相应操作,令家电遥控变得人性化,给使用者带来极大方便.
该遥控器不仅具有一般遥控器的全部功能,而且具有独特的语音控制功能.
该遥控器的语音控制功能主要分为语音训练和语音识别两个方面,也就是用户需要该遥控器能识别某个语音命令,并完成相应操作,必需先进行该命令的训练,并输入相应按键,按键可以是单个的,也可以是连续操作.
3.宠物狗"语言"翻译器 这款电子小装置是非常有趣的语音识别应用方案.挂在狗项圈上的是一只无线话筒,通过它收集狗发出的叫声,然后把这些叫声发送给主人手中的FM收音机,翻译器的语音识别电路自动将接收到的叫声信号进行分析处理,然后翻译成"快乐"、"伤心"、"饿了"等不同的语句,并在液晶屏幕上用一些特定的图案字符显示出.
更有趣的是,翻译器还会用语音把这些感情表达出来,如"好喜欢你呀"、"心里真高兴啊"、"主人,我饿了"等.有了这种装置,不懂狗的"语言"也可以"明白"狗的意图,让人与小狗之间实现"零距离接触".
本宠物狗"语言"翻译器采用sI识别方式,即与被识别对象的声音(狗的叫声)无关,sI识别方式不需要现场的语声训练,就能识别目标狗群中的每一种叫声.为了生成适合sI识别方式的识别向量,每种狗叫声需要采集上百份声音样本记录.预先训练过程需要相当多的资源和技巧来完成,它包括收集欲被识别的所有狗叫声的记录.这些记录被输入到用计算机运行的一个识别向量生成软件内,然后再将由此产生的专用识别向量储存在单片语音识别IC的ROM中,用于识别匹配的数字化语音标本.
4.智能语音报时系统目前常见的语音报时系统,大都是通过人工触压报时按键来实现语音播报.这种报时系统由于需要人为触发,其实并没有实现真正意义上的自动语音报时功能.本系统是在现有语音报时钟表电路的基础上,仅仅增加了语音识别电路,使得开发后的系统能够具有对话应答报时的功能,实现语音报时真正自动化、智能化.
智能语音报时系统具有对话应答报时的功能.使用之前应对其进行"语言训练",通过麦克风录入"现在几点啦?",使系统能够认知这句话,这里认知的这句话可以是特定的一句话.训练完成后,当用户再次说出这句话时,系统就会自动应答出当前时间,通过扬声器准确报出当前时间.本智能语音报时钟特别适用于夜间工作人员、残疾人以及老人和儿童等,具有一定的推广价值.
5.电子情侣娃娃"情侣娃娃"电子玩具是基于红外遥感技术和语音识别芯片,实现两个玩具间的互动对话.该情侣娃娃对话玩具,对话距离最长使用范围可达3m,在上下左右30度锥角内有效使用;使用方法非常简单,只要将其放置于红外管可相互感应的有效范围内,开机即可触发对话;具备错码重发功能,即当红外光被阻挡后,约20秒后会自动恢复对话功能,且接着原来对话内容.恢复时问可设定;对话内容随机,可制定几段随机对话台词,在对话时随机选择一段进行对话,使对话更具趣味性;支持语音和音乐,播放wav格式的语音文件以及mid格式的动听音乐,可设定为不对话时播放音乐;24个I/O控制端口,方便实现各种控制;支持多对话对象,采用ID识别,能自动排除其它红外信号干扰.除了一对一对话外,还可根据需求进行多对多,多对一等对话方式.在TsH-8芯片上开发的语音识别模块可作为玩具机芯植入玩具体内,使得人们可以通过语音与玩具对话,以及用语音控制电动玩具的各种动作.可广泛地应用于各种毛绒类玩具、电动类玩具、遥控类玩具.增加了玩具的娱乐性、趣味性,提高玩具的科技含量和市场竞争力.
6.智能语音台灯本产品应用语音识别技术控制语音报时电子万年历及台灯的开/关.首先将使用者的语音命令存储到存储器中,当使用者发出语音命令时,主CPu将语音命令与事先存储的语音命令进行比较,然后做出确认或否定的判断.如语音命令正确,发出相应的指令来控制万年历报时及台灯的开或关等.
本产品可存储三组命令语音,可分别录入3个人的命令语音,也可1人录入三组命令.建议一般情况下最好选用后一种,三组命令相同,第一组面向台灯(1m左右)学习,第二组侧向台灯(1m左右)学习,第三组面向台灯(3m左右)学习,这样便于在不同的情况下对台灯进行语音控制.
7.语音识别声控车模 遥控模型是应用语音识别芯片作为系统核心的新颖声控汽车玩具产品.将语音识别芯片做在遥控器内,可通过语音命令控制车的所用动作,比如前进、后退,支撑脚的伸长和收回,云梯的伸长、收回、左转、右转等等,同时保留原有的手控操纵方式,为车模玩家提供更多的选择与增添了更多的乐趣.
可定制训练使声控车模只听命于某一具体人;无需训练声控车模可识别多达30句不同的词条,即可听懂30个无论男女老少的声音;可实现各种不限次动作,并可同时伴有语音播放;遥控器具有LCD显示功能;具有同步/异步串行通信功能;可外接按键输入等功能.
上述方案可以扩展应用到其它电子电器系统或机器上,例如直接与现有的汽车电器设备嵌套,原本用手操纵汽车的多种设备,如音响、空调、车窗、座椅等,此时的驾驶员只需开口发布:"开空调"或"音乐台"或"座椅后移"等命令语句,即刻就能让这些设备执行您的要求运作,而无需劳驾您操作烦杂的开关键盘,极大地提高了行车安全系数,充分享受科技给人类带来的便捷和愉悦.除了可对汽车电器设备进行语音控制之外,还可以实现对多媒体课室、家居电器的各种智能化控制.