车载小秘书是一款高科技的车载免提语音拨号电话,驾驶者在车上可以随心所欲的接听、拨打电话,全过程有语音控制、语音提示,真正能解放驾驶者的双手,享受驾驶的乐趣。
【具体功能】
手机进入汽车,蓝牙模块会自动和小秘书无缝连接,连接成功后会:
1、小秘书会把手机中的电话本拷贝到车载小秘书中;
2、如果需要拨打电话,就说“打电话”,小秘书会语音提示“请说要拨号的姓名或号码”,你只要说出电话本中的姓名或者数字电话号码,正确识别后自动把号码拨出去,车载小秘书中有抗噪模块,在汽车高速行驶过程中识别率在90%以上;
3、有电话打进来时,车载小秘书会提示“**的电话”或者把号码报出来,你只要说接听,双方就可以进入通话状态,对方的声音可以连接到汽车的音响中播放,也可以用小秘书配备的无线耳机接听;
4、手机由短信进来,小秘书会播报“**的短消息”并询问是否需要阅读,您回答是,小秘书会把短消息的内容通过语音播报出来;
5、通话过程中,如有重要内容需要记录,只须按一下录音键,就录下来了;
6、带有mp3功能,用户可以将歌曲拷在SD/MMC Card中,然后将存储卡插进小秘书的存储卡的插槽里,小秘书可以播放卡中的音乐文件,声音可以在无线耳机中播放,也可以在汽车音响中播放;
7、小秘书带有液晶屏,可以显示来电号码、拨出号码、未接号码等;
8、小秘书带有按键,按键可以配合液晶屏来察看信息或者录音、拨号、挂断等;
9、小秘书带有音频输入输出接口,I-POD、MP4、MP3、CD-Player、Walkman等随身或移动型影音播放设备的声音都可以通过此接口在汽车音响中播放。
【功能特性说明】
l 蓝牙手机免持扩音功能,支持各品牌具Bluetooth功能的手机,最多可适配5部已注册手机,可FM调频发声或无线耳机发声,具有静音、音量大小调节等功能;
l 语音拨号功能,支持将手机电话本拷贝到产品中,300个姓名非特定人语音拨号,在汽车高速行驶过程中识别率达到90%以上;
l 语音提示功能,操作按钮时有语音提示、来电时都有语音报姓名和来电号码、语音拨号时有语音提示识别的结果等;
l 液晶显示汉字和数字,有电量提示,歌曲播放的曲名,来电号码、未接号码、已拨号码及各操作的时间,同时产品保存有10组已拨号码存储,10组来电号码存储和10组未接号码存储,通过按钮实现查询;
l 具有USB-HOST功能,可以进行MP3歌曲的播放,同时USB端口可直接读取MP3、MP4内置歌曲并对其充电。
l 具备AUX音源输入输出孔,可无线转播I-POD、MP4、MP3、CD-Player、Walkman、、等随身或移动型影音播放设备;
l 具SD/MMC Card读卡功能,可无线转播下载于卡内的MP3格式音乐,支持市面上绝大多数厂牌、型号之卡;
l LED灯号显示面板,清楚显示各种工作状态,触控按钮;
l 录音功能,在通话过程中,按下录音键可以对通话录音,支持五分钟录音和回放。
l 点烟器DC12V—24V供电。
【指示灯说明】
T1表示电源灯
T2表示USB与SD工作指示灯,播放时灯会闪烁,转换到"AUX"输入时T2灭, T3亮
T3表示播放的音乐从外部输入,转换到"HOST"输入时T3灭,T2亮
T4表示车载免提与汽车音响跨接
T5表示车载免提配备的耳机进行播放
【关键技术】
语音处理技术包括语音识别、语音合成、语音压缩编解码等很多方面。
在本系统中,基于连续隐含马尔可夫模型(HMM,Hidden Markov Model)的中大词汇量语音识别技术被用来进行电话号码本的搜索。由于使用了子词模型,系统可以省略繁琐的训练过程,直接从下载得到的电话本构造出需要识别的网络进行识别。识别的结果通过语音合成反馈给用户校核确认,该合成方法同样用于拨入号码查询后的结果反馈。系统还提供了大量的提示语音,并且可以对通话过程中的语音数据进行记录和回放,这部分功能通过ITU-T G.723.1语音压缩编解码完成。
【系统硬件框架】
本系统包括蓝牙模块和语音处理模块两个相对独立的部分。
语音处理部分的硬件平台基于华镇电子WS-300芯片。 该芯片为语音处理领域提供了一个低成本,高可靠性的硬件平台。以WS-300芯片为核心,辅助以少量的外围器件,包括FLASH、键盘、语音输入输出接口等,就构成了在结构和功能上也都相对独立的语音处理模块。
本系统的无线终端采用爱立信公司开发的蓝牙无线耳机模块,它以一颗ARM9芯片为核心,完成基带信号处理和流程控制的功能,加上射频芯片、FLASH、天线等外围设备组成。之所以选用蓝牙模块作为语音识别模块和手机的接口,有如下几个原因:
1. 蓝牙技术是一种无线数据与语音通信的开放性全球规范,它以低成本的近距离无线连接为基础,为固定与移动设备通信环境建立一个特别连接。把蓝牙技术引入到本拨号系统中,就可以去掉移动电话与本系统之间的令人讨厌的连接电缆而通过无线使其建立通信。这种方式对空间狭小且操作要求安全有效的车载环境尤其重要。
2. 蓝牙的数据传输速率高,可达到1Mb/s。它工作在全球通用的2.4GHz ISM(即工业、科学、医学)频段,采用了特别设计的快速确认和跳频方案以确保链路稳定。与其它工作在相同频段的系统相比,蓝牙跳频更快,数据包更短,这使蓝牙比其它系统都更稳定。它还包含一套完整的加密和认证机制,因此具有很强的安全性。
3. 蓝牙作为一个标准协议,具有统一的特点。支持蓝牙协议的手机都可以使用本拨号系统,这大大提高了系统的通用性。
语音识别平台和车载无线终端需要在数据接口和音频接口两处进行信息交换。数据接口用于相互之间的控制命令和数据传输;音频接口用于将车载终端的语音数据下载到语音平台上,进行通话过程的录音和回放。
这两个模块本身都支持异步串行通信协议,因此使用标准的AT指令集作为两个模块之间的接口,传输速率为115200bit/s。通讯的协议使用AT命令集,包括设置命令、执行命令和响应事件三部分。
【系统功能及实现】
利用语音识别进行人名检索
本系统最主要的功能之一就是对手机电话本进行语音检索。目前手机电话本的容量越来越大,多数手机的电话本存储量为几百个甚至上千个人名。这对识别任务提出了很大的考验;同时,由于手机电话本时常更新,这就要求识别系统能够在线构建识别词表,简单的基于整词的语音识别算法由于需要事先训练而无法满足这样的要求。在本系统中,使用了基于子词的连续HMM语音识别算法处理这一具有高难度和高复杂度的问题。
本系统提供了两种方式进行电话号码本的更新:一种是通过蓝牙模块将手机中的电话本传入语音处理模块中;另一种为通过我们提供的PC机电话本编辑软件,将编辑好的电话本通过串口写入语音处理模块的FLASH中。
识别结果经用户确认后,语音识别模块就将识别结果对应的电话号码发送给蓝牙模块,通过它与手机交互完成拨号过程。
利用语音合成进行结果反馈由于车载的特殊环境,对于识别结果,系统要求给予语音反馈。同时对于拨入的号码,根据来电号码要求在本地电话本中进行搜索,找到对应的人名并语音反馈给用户,如果是陌生号码则反馈给用户号码信息。
当需要结果反馈时,提取每一个结果对应的汉语拼音信息,然后依次通过系统的音频接口进行合成放音。对于人名和号码,这样简单的合成方法已经可以取得令人满意的效果。
利用语音编解码进行录放音和提示为了接口的人性化和易操作性,系统提供了大量的语音提示,帮助用户按照流程进行操作。同时系统要求能够对通话过程进行记录,并可以回放录音内容。
由于这部分的数据量较大,为节省系统资源,本系统采用ITU-T G.723.1语音压缩编解码算法进行语音提示和通话过程中的录音、回放,编码速率为5.3Kbit/s。