曾经作为一名电子领域的发明专利实质审查员,每天都面对大量的专利技术文献,从技术和法律层面进良部或重培行剖析、整理、拆分和筛选,从而确定用以申请专利的技术创来自新点和技术方案。在淘宝等电商平台购物时,经常犯职业病。尤360问答其是给媳妇儿买东西时,更不敢含糊。因此,白象主要针对当下养但继规示举达流行所有智能音响核心技术进行技术挖掘和梳理,并结合自己身需求和市场价格进行甄选。
当下比较流受把队同结布千为术某行的智能音响基本上都包括一个核心技术-麦克风阵列,它是决定一个智能音响品质的关键因素之一。
1、什么是麦克风阵列呢?如何决定智能音响的品质呢?
前几年,语音交互应用最为普遍的就是以Siri为代表的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语殖客音识别需求的声音信号有和待湖。但若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射领早笑和混响,导致拾取信号的质量下降,这会严重影响语音识别率。
为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构摆放的麦克风组成,对较员采集的不同空间方向的声音信号进行空时处理,实现噪纸风营探清声抑制、混响去除、人声干扰抑制、声源测向、声这研民认毫丰货钟土缺质源跟踪、阵列增益等功能,进而提举类要皇控简先高语音信号处理质量,以提高真实环境下的语音识别率。
现在的麦克风阵列的麦克风数量包括2个、4个、6个以及6洋制效棉路皮车饭银环东+1个。按麦克风阵列的维数,可分为一维、二维和三维麦克风阵列。
一维麦克风阵列,即线性麦克风阵列,其阵元中心位没于同一条直线上。典液察才型的智能音响包括出门问问WF6018/6028、古古美美E2以及杆侵尼特德士DS-1831/1828。
二维麦克风阵列,即平面麦克风阵列,其阵元中心分布在一个平面上。根据阵列的几何形状可分为等边三角形阵、T型阵、均匀圆阵、均匀方阵、同轴圆阵、圆形或矩形面阵等。平面阵列可以得到信号的调行杆水平方位角和垂直方位角信息。典型的智能音响包括天猫精灵的M1/X1宪获干全/X1施华洛世奇版、小米AI音响、Rokid的Pebble止已相紧冷效长。
三维麦克风阵列,即立体麦克风阵列,其阵元中心分布在立体空间中。根据阵列的立体形状可分为四面体阵、正方体阵、长方体阵、球型阵等,如图4所示。立体阵列可以得到信号的水平方位角、垂直方位角和声源与麦克风阵列参考点距离这三维信息。典型的有喜马拉雅念阶教脱艺受别述烈用的XY1。
2、是不是麦克风个数越多,语音识别的效果就越好呢?
事实上,语音识别的效果其实与智能音响使用的环境有关系。大体上,使用环境设计两个主要因素,环境杂声和人机对话距离。麦克风阵列有两个主要的功能是抑制噪声和增强语音。比如智能音响在卧室,想在门口就可以唤醒,则麦克风数量越多,唤醒灵敏度越高;而在厨房,周边有炒菜和油烟机的声音,则越有必要使用多个麦克风以更好地抑制杂声。
智能音响可以大大添加日常生活的趣味性。如果你在挑选智能音箱的时候,充分考虑麦克风阵列这一核心技术,并结合生活场景,相信一定可以购买到一个更懂你生活的好帮手。
具体可以参考网页链接导购方法,仅供参考。