您好,欢迎访问

商机详情 -

北京通话声学回声打断交互算法

来源: 发布时间:2022年12月31日

    随着秒新月异的科技发展,各项技术成果不断地应用在我们日益拓展的各领域需求当中,刷新着我们的生活和工作。地球村的崛起,不断以互联网、物联网等方式揭示着万物相连的关系。无论是飞机、高铁还是电话、网络,都成为托起地球新村时空纵横的重要载体。怎样拉近人与人之间的关系,如何建立起更行之有效的联络方式,提高远程协同工作、信息传达效率成为了一个重要命题。该图片源于网络远程会议的出现在很大程度上为这种多极化办公互动提供了质量的平台保障,在借助互联网便捷的远程通信架构下,通讯数据安全,稳定可靠,很长一段时间广受用户青睐。该图片源于网络然而美中不足的是,这样的(声音)系统仍逃不出的还是自然声学上的问题。有和业内朋友聊天中谈到,今后的扩声系统也许只保留两级传统装置了,那就是声电转换和电声转换的拾音和还原。而正是这两级客观存在的物理声学现象,造就了我们所讨论的内容。该图片源于网络在远程会议系统的终端(本地),为了实现多人互动、多人拾音等目的,系统声音免不了被放大还原,而在诸如此类的放大系统中,为本地音箱能够听到远端声音,并能把本地拾音信号传送到远端而互通。众所周知,话筒在拾取到放大后的音箱信号后。

  先对非线性声学回声的特性进行分析。北京通话声学回声打断交互算法

北京通话声学回声打断交互算法,声学回声

    为什么声学器件的小型化容易产生非线性的失真呢?这个需要从喇叭发声的基本原理说起,我们都知道声波的本质是一种物理振动,而喇叭发声的基本原理就是通过电流来驱动喇叭的振膜发生振动之后,这个振膜会带动周围的空气分子相应发生振动,这样就产生了声音。如果我们要发出一个大的声音的话,那么就需要在单位时间内用更多的电流去驱动更多的空气分子发生振动。假设有大小不同的两个喇叭,他们用同样的功率去驱动,对于大喇叭而言,由于它跟空气接触的面积要大一些,所以他在单位时间内能够带动更多的空气分子振动,所以它发出来的声音也会大一些。而小喇叭如果想发出跟大喇叭一样大的声音,就需要加大驱动功率,这样会带来一个问题:我们的功率放大器件会进入到一种饱和失真的状态,由此就会带来非线性的失真。这就是声学器件小型化容易产生非线性失真的一个主要的原因。这里廉价化比较好理解了,就不多说了。原因之二,就是声学结构设计的不合理。典型的一个实例就是声学系统的隔振设计不合理。喇叭发声单元跟麦克接收单元之间,通常是需要做隔振处理的,如果没有隔振处理的话,那么在喇叭发声的过程中,他所产生的振动会通过物理方式传递到麦克接收端。

     安徽交互声学回声打断交互算法AEC声学回声,电话的扬声器的声音。

北京通话声学回声打断交互算法,声学回声

    WebRtcAec_Process接口如上,参数reported_delay_ms为当前设备需要调整延时的目标值。如某Android设备固定延时为400ms左右,400ms已经超出滤波器覆盖的延时范围,至少需要调整300ms延时,才能满足回声消除没有回声的要求。固定延时调整在WebRTCAEC算法开始之初作用一次,为什么target_delay是这么计算?inttarget_delay=startup_size_ms*self->rate_factor*8;startup_size_ms其实就是设置下去的reported_delay_ms,这一步将计算时间毫秒转化为样本点数。16000hz采样中,10ms表示160个样本点,因此target_delay实际就是需要调整的目标样本点数(aecpc->rate_factor=aecpc->splitSampFreq/8000=2)。我们用330ms延时的数据测试:如果设置默认延时为240ms,overhead_elements次被调整了-60个block,负值表示向前查找,正好为60*4=240ms,之后线性滤波器固定index=24,表示24*4=96ms延时,二者之和约等于330ms。②大延时检测是基于远近端数据相似性在远端大缓存中查找相似的帧的过程,其算法原理有点类似音频指纹中特征匹配的思想。大延时调整的能力是对固定延时调整与线型滤波器能力的补充,使用它的时候需要比较慎重。需要控制调整的频率,以及控制造成非因果的风险。

    

    对麦克接收到的声学信号进行调制,而这种振动本质上是一种随机的、非线性的振动,所以它必然会带来非线性失真。3.手机声学特性调研,我们之前针对市面上主要的手机机型做过一次调研,主要调查声学特性。结果我们很惊讶地发现,市面上超过半数的手机机型,声学特性不够理想,对应这里面的“较差”和“极差”这两档。我们平时用手机开外音玩游戏,或者语音通话时,经常会出现漏回声问题和双讲剪切问题,就与手机声学特性不佳有直接联系。当然这组数据只是针对手机这种电子产品,市面上类似于手机这样的电子产品还有很多,它们应该也有类似的问题。这组数据告诉我们,非线性失真问题在我们生活中的电子产品里是一个普遍存在的问题,我相信对这个问题的研究将会是一个很有价值也很有意义的方向。4.非线性声学回声消除技术研究现状我之前在IEEE的数字图书馆里搜索了“声学回声消除”的相关文献,一共找到了3402篇,其中有会议论文,还有期刊、杂志、书等。我用同样的方法搜索了“非线声学回声消除”,结果只找到了254篇文献,不到前面文献的1/10,这意味着非线性声学回声消除技术在整个声学回声消除领域是一个相对比较冷的研究方向。既然这个方向很有价值也很有意义。

     的是声学回声的路径。

北京通话声学回声打断交互算法,声学回声

    3.双耦合滤波器设计当滤波器的结构确定下来之后,我们要去设计滤波器系数了。设计过程我把它总结成了三步,第一步就是构建优化准则,第二步是求解滤波器的权系数——Wl和Wn,一步就是构建耦合机制。第一步就是构建优化准则。我觉得构建优化准则,应该是整个滤波器设计里面重要的一步,因为它决定了滤波器性能的上限。什么样的优化准则是一个好的优化准则呢?我觉得好的优化准则需要跟问题的物理特性有效匹配起来,所以在构建优化准则之前,我们先对非线性声学回声的特性进行分析,希望通过这种分析去挖掘非线性声学回声的一些物理特性。我们的分析是基于上面的函数,我们称它为短时相关度,它所表示的是两个信号,在一个短时的观测时间窗“T”这样一个尺度范围内的波形的相似程度,需要注意的是这个函数它是统计意义上的,因为我们对它进行了数学期望运算。同时在分子的一项我们还加了一个相位校正因子,目的是为了将这两路信号的初始相位对齐。基于前面构建的短时相关度函数,我们对大量声学回声数据进行分析,并挑选了几组比较典型的数据:绿色的曲线对应的是一组线性度非常好的回声数据。我们从这个数据上可以看到,在整个时间T的变化范围内,它的短时相关度都非常高。

     声学回声消除应用技术。安徽交互声学回声打断交互算法

非线性的声学回声消除问题是一个困扰了行业很多年的技术难题。北京通话声学回声打断交互算法

    第三个部分是通过实验来检验这个算法的性能;再做一些简单的总结。非线性声学回声1什么是非线性声学回声?,什么是非线性的声学回声?的是声学回声的路径,左边对应的是发射端,右边对应的是接收端。我们发出的信号首先要经过D/A变换,从数字域变换到模拟域,然后再经过功率放大器,放大之后驱动喇叭,这样就会发出声音。发出来的声音经过空气信道传播之后,到了接收端被麦克风采集到,然后再次经过功率放大器,再通过A/D变换,从模拟域又变回到数字域。那么这里的y[k]就是我们收到的回声信号。,我们接收到的回声y[k]到底是线性回声还是非线性回声呢?或者说我们应该怎么去判断它?我觉得要解决这个问题,就是要认识清楚这里面的每一个环节,看看它们到底是线性系统还是非线性系统,如果所有的环节都是线性的话,那么很自然y[k]就是一个线性的回声,否则只要有一个环节是非线性的,那么这个回声就是非线性回声。在这里我将整个回声路径分成了A、B、C、D四个部分。我们一起来看一下,ABCD里面哪一个环节有可能是非线性的?答案应该是B。也就是回声路径里面的功率放大器和喇叭,具体的原因稍后会做详细分析。接下来我想再解释一下为什么A、C、D它们不是非线性的。

    北京通话声学回声打断交互算法

深圳鱼亮科技有限公司办公设施齐全,办公环境优越,为员工打造良好的办公环境。Bothlent是深圳鱼亮科技有限公司的主营品牌,是专业的语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。公司,拥有自己**的技术体系。我公司拥有强大的技术实力,多年来一直专注于语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。的发展和创新,打造高指标产品和服务。深圳鱼亮科技有限公司主营业务涵盖智能家居,语音识别算法,机器人交互系统,降噪,坚持“质量保证、良好服务、顾客满意”的质量方针,赢得广大客户的支持和信赖。