您好,欢迎访问

商机详情 -

江苏自主可控麦克风阵列设计

来源: 发布时间:2022年11月24日

    而且受使用时长以及室内复杂环境等多种复合因素的影响,导致麦克风阵列接收信号的频率响应特性与理论值存在较大偏差,这些偏差会使定位精度下降,因此,对麦克风阵列频率响应的校准对于室内移动声源定位精度的进一步提升具有重要意义。技术实现要素:本发明的目的是针对上述缺陷,而提供一种基于不同麦克风阵列拓扑结构分析的室内声源定位方法。该方法利用设置不同拓扑结构的麦克风阵列获取语音信号,进行基于相位变换加权的可控相应功率的定位算法,加上随机区域收缩的优化算法,从定位结果上分析了各个麦克风阵列性能的优劣,并且针对在真实室内环境中,麦克风阵列与说话人(声源)之间存在干扰的情况下,声源定位能力不足的实际问题,提出一种多通道低通滤波与多通道自适应滤波融合的阵列校准方案,使定位结果具有较高的精度。实现本发明目的的技术方案是:一种基于不同麦克风阵列拓扑结构分析的室内声源定位方法,包括如下步骤:(1)设置麦克风阵列室内声源定位系统,该系统由顺序连接的麦克风阵列拓扑结构分析模块、阵列自适应滤波校正模块和声源定位算法及分析模块构成;(2)提取语音信号:在室内布置合适的麦克风阵列,说话人发声,录下说话人的语音。至于麦克风阵列的阵元数量,也就是麦克风数量,可以从2个到上千个不等。江苏自主可控麦克风阵列设计

江苏自主可控麦克风阵列设计,麦克风阵列

    5)整理出,使得≪;6)根据收缩当前的搜索空间,更新搜索空间和新的区域边界;7)如果,或者并且,则确定该点坐标位置,保存结果并输出;8)如果只有,则舍弃结果;9)在中找到一个子集,使得中的任意值要大于的平均值;10)重复步骤3)和步骤4),在当前的搜索空间中随机选取个点,计算它们所对应的的值;11)将中的点放入子集中,并选取中值大的个点放入子集中,保存,放入下一次迭代时使用;12)令,进行下一次迭代,返回步骤5)。本发明的优点是:本发明提出了一套基于不同麦克风阵列拓扑结构分析的室内声源定位方法与多通道低通滤波与多通道自适应滤波融合的阵列校准方案。该方法能够在改变麦克风阵列拓扑结构时,进行对声源的定位,并且分析出其误差并与其他类型阵列作对比。同时使用基于随机区域收缩的相位变换加权可控响应功率定位算法,在室内高混响条件下能够较好地得到定位结果。用户可以通过自己的需求选择相应的麦克风阵列拓扑结构进行分析。在选择符合自身需求的麦克风阵列后,可以使用多通道低通滤波与多通道自适应滤波融合的阵列校准方案对接收信号的幅频特性进行校准并提高定位精度。为本发明实施例麦克风阵列室内说话人定位流程。福建自主可控麦克风阵列内容麦克风阵列的兴起得益于语音交互的市场火热,主要解决远距离语音识别的问题,保证真实场景下的语音识别率。

江苏自主可控麦克风阵列设计,麦克风阵列

    实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。事实上,靠麦克风阵列也很难保证语音识别率的指标。麦克风阵列还是物理入口,只是完成了物理世界的声音信号处理,得到了语音识别想要的声音,但是语音识别率却是在云端测试得到的结果,因此这两个系统必须匹配在一起才能得到好的效果。不如此,麦克风阵列处理信号的质量还无法定义标准。因为当前的语音识别基本都是深度学习训练的结果,而深度学习有个局限就是严重依赖于输入训练的样本库,若处理后的声音与样本库不匹配则识别效果也不会太好。从这个角度应该非常容易理解,物理世界的信号处理也并非越是纯净越好,而是越接近于训练样本库的特征越好,即便这个样本库的训练信号很差。显然,这是一个非常难于实现的过程,至少要声学处理和深度学习的两个团队配合才能做好这个事情,另外声学信号处理这个层次输出的信号特征对语义理解也非常重要。看来,小小的麦克风阵列还真的不是那么简单,为了更好地显示这种差别,我们测试了某语音识别引擎在单麦克风和四麦克风环形阵列的识别率对比。另外也要提醒,语音识别率并非只有一个WER指标。

    语音识别技术领域,具体为一种基于麦克风阵列的智能语音转文字及同声翻译系统。背景技术:在现在的国际化背景下,我们与国际友人沟通的契机越来越多,然而不同国籍的人的母语不同,不同的语言是沟通中的一个巨大障碍;尽管翻译软件、同声翻译软件都已经出现,但是在嘈杂环境中,因为竞争声源的存在,低信噪比(snr)的声源使得语音转文字的效果、同声翻译软件的翻译效果一直不是很理想。国内已经有了一些相关的发明、以及相关的应用软件。在前端去噪方面,该方法构建了一个基于时频掩蔽的mvdr波束形成器;由于该方法采用的四元麦克风阵列的硬件电路比较复杂,占用空间大,因此并没有小型化和便携性设备产生,在同声翻译领域的实际应用中是有限制的。该方法以传统的双麦克风波束形成法为基础,通过对前向的目标信号进行估算以及维纳滤波,获得增强的语音信号,但是若环境中存在多个竞争性语音噪声,该方法的性能将无法保证。目前市面上已有的语音识别app。目前常用的麦克风阵列可以按布局形状分为:线性阵列,平面阵列,以及立体阵列。

江苏自主可控麦克风阵列设计,麦克风阵列

    )可以认为是麦克风阵列上所有麦克风对的信号两两做基于相位变换的广义互相关并求和:()=其中k、l第k、l个麦克风,表示相位变换的权重,τ()表示从声音从位置x到达第k个麦克风的时间。式中将定义为组合加权函数:考虑到计算()所涉及的对称性,并去掉一些固定能量项,则()随x变化的部分为:=因而,为了简化计算可以替换为:=4.在整个房间内进行全局搜索,利用随机区域收缩算法(src)得到能量大的坐标点y。随机区域收缩算法的基本思想是,在所给定的初始值中随机找出一个n维的矩阵,在顺序过程中,逐步缩小范围,直到达到足够小的范围,找出峰值。从而计算出定位坐标点。随机区域收缩算法的过程如下:1)先定义i为迭代的次数,表示第i次迭代时随机抽取的点数,表示下一代的子搜索空间中包含的点数,表示下一代子搜索空间。定义每计算一次便记为一次,表示第i次迭代后的次数,表示停止值,φ表示大被允许计算的次数。表示新的子搜索空间的边界;2)初始化迭代次数i=0;3)设置初始参数:、,;4)计算中所有的值;5)整理出,使得≪;6)根据收缩当前的搜索空间,更新搜索空间和新的区域边界;7)如果,或者并且,则确定该点坐标位置,保存结果并输出;8)如果只有,则舍弃结果。使用无线连接方式操控便携式可视化麦克风阵列。江苏自主可控麦克风阵列设计

声源与麦克风阵列的距离,是麦克风阵列孔径,是声源的工作波长。江苏自主可控麦克风阵列设计

    包括灯控、温控器、开关三大类,媒体分析,谷歌随后还会提供针对家庭第三方设备的软件开发包,以方便鼓励第三方开发商增加新的服务功能,提升GoogleHome的兼容性。以对抗出货量400万台的Echo营造的生态体系,因为Echo对接的名单已经是很长一大串,其中就包括了Nest。双麦克阵列在智能家居领域落地为虽然多麦克阵列方案在业内炒的如火如荼,但在落地过程中,双麦克方案却成为家电产业中出货量大的方案。据了解,目前国内主流家电厂商应用语音交互技术的产品中,包括乐视电视、海信电视、格力空调、美的空调、华帝烟机等,出货量大的产品搭载的都是双麦克方案。另外,国内的主流人工智能企业也都在双麦克方案上重点布局。据悉,云知声一家企业,目前搭载双麦克的芯片模组每月的出货量就超过几万片,而科大讯飞目前也在紧锣密鼓研发双麦克方案,争夺智能家居市场。据家电行业技术人士介绍,从2012年开始行业内就开始寻求语音交互技术应用在家电产品中,并明确要求:、用户直接通过语音方式控制产品,且不受产品自身噪声影响;第二、一定距离的远场语音交互得以实现;第三、方案成熟,成本控制。远场语音交互是关键中的关键。当时市场上普遍解决方案都是八个麦克风收音。江苏自主可控麦克风阵列设计

深圳鱼亮科技有限公司正式组建于2017-11-03,将通过提供以智能家居,语音识别算法,机器人交互系统,降噪等服务于于一体的组合服务。是具有一定实力的通信产品企业之一,主要提供智能家居,语音识别算法,机器人交互系统,降噪等领域内的产品或服务。随着我们的业务不断扩展,从智能家居,语音识别算法,机器人交互系统,降噪等到众多其他领域,已经逐步成长为一个独特,且具有活力与创新的企业。深圳鱼亮科技有限公司业务范围涉及语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。等多个环节,在国内通信产品行业拥有综合优势。在智能家居,语音识别算法,机器人交互系统,降噪等领域完成了众多可靠项目。