语音识别部分
语音识别部分面临的主要问题是如何在3米以外过滤掉背景噪音和其他不相干声音,准确地识别出的语音。为了解决这个问题,微软的研究小组亲自进入250多个家庭实验,用16个麦克风在不同的设定下录音,以找出最佳的麦克风位置设定。
最终的最佳设定是四只开口朝下的麦克风(为了让Kinect正面简洁,没有可见的开口),左边一个,右边三个。事实上,这些麦克风的位置安排是Kinect本身做得这么宽的原因。
这个麦克风组最擅长在远距离上识别人的语音。但是麦克风组还不是全部,Kinect内部有处理芯片来过滤噪音和其他不相干的声音。系统还包含一个叫 Beam Forming 的软件来配合摄像头识别的位置,以便准确地把语言识别范围控制在身上,同时压制身边的别的人发出的声音。
艾普森(中国)光电科技有限公司
电 话:0527-88065808
联系人:施经理
QQ:1041891211
手 机:15152853998