首页 / 专利库 / 信号处理 / 信号 / 音频信号 / 一种音频信号自动增益控制方法及装置

一种音频信号自动增益控制方法及装置

阅读:637发布:2020-05-11

专利汇可以提供一种音频信号自动增益控制方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 提供一种音频 信号 自动增益控制方法及装置,上述 音频信号 自动增益控制方法包括:判断输入的且经过回声消除的当前 帧 音频信号是否有回声残余;若有回声残余,则根据回声残余数据得到回音残余因子;根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值;根据所述自动增益值对所述当前帧音频信号进行自动增益处理。本发明能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频 质量 ,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内。,下面是一种音频信号自动增益控制方法及装置专利的具体信息内容。

1.一种音频信号自动增益控制方法,其特征在于,包括:
判断输入的且经过回声消除的当前音频信号是否有回声残余;
若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理;
若未有回声残余,则根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
对所述第二初始增益值进行平滑处理,得到第二自动增益值;
根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理;
所述自动增益控制策略包括:
计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
2.根据权利要求1所述的音频信号自动增益控制方法,其特征在于,所述根据回声残余数据得到所述当前帧音频信号的第一自动增益值包括:
根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
3.根据权利要求2所述的音频信号自动增益控制方法,其特征在于,按照以下公式计算出所述第一初始增益值:
g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
4.根据权利要求1所述的音频信号自动增益控制方法,其特征在于,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,包括:
若所述平滑幅度值大于语音上阈值,则根据第一公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值,则根据第二公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值,则根据第三公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述噪声阈值,则根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,
Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,所述第二公式为g=gmoderate,
所述第三公式为
Tdowm表示语音下阈值,Tnoise表示噪声阈值,Rdown
表示当Tdowm≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
5.根据权利要求2或3中所述的音频信号自动增益控制方法,其特征在于,根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
6.根据权利要求1或4所述的音频信号自动增益控制方法,其特征在于,根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
7.根据权利要求1至4中任一项所述的音频信号自动增益控制方法,其特征在于,在判断所述当前帧音频信号是否有回声残余之前,还包括:
判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
8.一种音频信号自动增益控制装置,其特征在于,包括:
回声残余判断单元,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;
第一增益值计算单元,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
增益控制单元,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理;
第二增益值计算单元,用于在所述判断单元确定未有回声残余时,根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
平滑处理单元,对所述第二初始增益值进行平滑处理,得到第二自动增益值;
所述增益控制单元根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理;
所述第二增益值计算单元包括:
平滑幅度值计算子单元,计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
增益值处理子单元,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
9.根据权利要求8所述的音频信号自动增益控制装置,其特征在于,所述第一增益值计算单元包括:
第一计算子单元,根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
第二计算子单元,根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
第三计算子单元,对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
10.根据权利要求9所述的音频信号自动增益控制装置,其特征在于,所述第二计算子单元按照以下公式计算出所述第一初始增益值:
2
g=a/γ,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
11.根据权利要求8所述的音频信号自动增益控制装置,其特征在于,所述增益值处理子单元用于在所述平滑幅度值大于语音上阈值时,根据第一公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时,根据第二公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时,根据第三公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述噪声阈值时,根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,
Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,所述第二公式为g=gmoderate,
所述第三公式为
Tdowm表示语音下阈值,Tnoise表示噪声阈值,Rdown
表示当Tdowm≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
12.根据权利要求9或10中所述的音频信号自动增益控制装置,其特征在于,所述第三计算子单元根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
13.根据权利要求8或11中任一项所述的音频信号自动增益控制装置,其特征在于,所述平滑处理单元根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
14.根据权利要求8至11中任一项所述的音频信号自动增益控制装置,其特征在于,还包括:
语音帧判断单元,用于在判断所述当前帧音频信号是否有回声残余之前,判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则通知所述回声残余判断单元判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。

说明书全文

一种音频信号自动增益控制方法及装置

技术领域

[0001] 本发明属于计算机技术领域,尤其涉及一种音频信号自动增益控制方法及装置。

背景技术

[0002] 音源与拾音器的距离决定了声音的强弱程度,当音源距离拾音器较近时采集到的声音就较强;当音源距离拾音器较远时采集到的声音就较弱。在直录播互动系统中由于不可避免的主观因素,老师和麦克之间的距离不可能是恒定不变的,导致采集到的声音忽大忽小,严重影响接收方收听的效果。自动增益控制模(Automatic gain control)则可以通过改变音频信号输入输出压缩比来实现控制声音大小的功能,使得最终输出的声音幅度始终保持在一个恒定的范围内。然而直录播互动系统中由于存在互动的功能,麦克风必然会采集到远端的声音(也就是回声),经过回音消除模块处理后还是会有一定程度的回声残余,所以单纯使用自动增益控制模块会容易将原本已经减弱的回声再次放大。

发明内容

[0003] 本发明提供一种音频信号自动增益控制方法及装置,以解决上述问题。
[0004] 本发明公开了一种音频信号自动增益控制方法,包括:判断输入的且经过回声消除的当前音频信号是否有回声残余;若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值;根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
[0005] 本发明还公开了一种音频信号自动增益控制装置,包括:回声残余判断单元,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;第一增益值计算单元,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;增益控制单元,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
[0006] 相较于先前技术,根据本发明提供的技术方案,能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频质量,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内,解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。附图说明
[0007] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0008] 图1所示为根据本发明的一较佳实施例提供的音频信号自动增益控制方法的流程图
[0009] 图2所示为根据本发明的另一较佳实施例提供的音频信号自动增益控制方法的流程图;
[0010] 图3所示为根据本发明的又一较佳实施例提供的音频信号自动增益控制装置的框图

具体实施方式

[0011] 下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0012] 图1所示为根据本发明的一较佳实施例提供的音频信号自动增益控制方法的流程图。如图1所示,本发明的较佳实施例提供的音频信号自动增益控制方法包括以下步骤:
[0013] 步骤102,判断输入的且经过回声消除的当前帧音频信号是否有回声残余。
[0014] 步骤104,若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值。
[0015] 步骤106,根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
[0016] 在本实施例中,输入的当前帧音频信号是已经经过回声消除的信号,虽然经过回声消除,但仍有回声残余。因此,本发明实施例在对音频信号进行自动增益控制时,考虑到了回声残余,使得音频质量更高。
[0017] 上述步骤104中,所述根据回声残余数据得到所述当前帧音频信号的第一自动增益值具体包括:
[0018] 根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
[0019] 根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
[0020] 对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
[0021] 其中,按照以下公式计算出所述第一初始增益值:
[0022] g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
[0023] 在本实施例中,通过回声残余数据可以计算出回声残余因子,而回声残余数据是根据当前帧音频信号与参考信号之间的相关性数据而求得,因此根据回声残余因子计算得到的增益值,考虑到了回声残余的情况,先削弱回声残余,然后对最终的音频信号进行自动增益控制,最大化地避免对残余回声的放大,更符合真实的音频信号。
[0024] 音频信号自动增益控制方法还可以包括以下步骤:
[0025] 若未有回声残余,则根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
[0026] 对所述第二初始增益值进行平滑处理,得到第二自动增益值;
[0027] 根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理。
[0028] 其中,所述自动增益控制策略包括:
[0029] 计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
[0030] 根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
[0031] 其中,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,具体包括:
[0032] 若所述平滑幅度值大于语音上阈值,则根据第一公式计算出所述第二初始增益值;
[0033] 若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值,则根据第二公式计算出所述第二初始增益值;
[0034] 若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值,则根据第三公式计算出所述第二初始增益值;
[0035] 若所述平滑幅度值小于等于所述噪声阈值,则根据第四公式计算出所述第二初始增益值;
[0036] 其中,所述第一公式为 Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,
[0037] 所述第二公式为g=gmoderate,
[0038] 所述第三公式为 Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,
[0039] 所述第四公式为g=gconceal,gconceal表示增益压制量。
[0040] 其中,根据以下公式对所述第一初始增益值进行平滑处理:
[0041] G=(1-β)×G'+β×g
[0042] 其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
[0043] 其中,根据以下公式对所述第二初始增益值进行平滑处理:
[0044] G=(1-β)×G'+β×g
[0045] 其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
[0046] 如果没有回声残余,则采用自动增益控制策略对音频信号进行增益处理。
[0047] 音频信号自动增益控制方法在判断所述当前帧音频信号是否有回声残余之前,还包括:
[0048] 判断所述当前帧音频信号是否是语音帧信号;
[0049] 若是语音帧信号,则判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
[0050] 图2所示为根据本发明的另一较佳实施例提供的音频信号自动增益控制方法的流程图。
[0051] 如图2所示,首先在本实施例中,输入的音频信号是经过回声消除、降噪处理后的麦克信号。步骤202,判断当前帧音频信号是否为语音帧,若为语音帧则不做自动增益处理,否则进入步骤204。
[0052] 步骤204,判断当前帧音频信号是否有回声残余存在,若有回声残余,则进入步骤206利用准则1计算初始增益值然后跳至步骤7;若无回声残余,则直接进入步骤208。
[0053] [准则1]
[0054] g=a/γ2
[0055] 其中g表示初始增益值,γ表示回声残余因子(γ是通过当前帧音频信号与远端参考信号的相关性求得,γ越大则g越小,γ越小则g越大),a是一个常量转换因子。
[0056] 步骤208,计算当前帧音频信号的平均幅度值并做平滑处理。
[0057]
[0058] Asmooth=(1-α)×Asmooth+α×Amp
[0059] 其中s[i]表示当前帧音频信号中第i个采样点的值,N表示当前帧音频信号包含的总采样点数,Amp表示当前帧音频信号的平均幅度值,Asmooth是对Amp平滑后的结果,α是平滑因子。
[0060] 根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算步骤210,如果Asmooth>Tup,则进入步骤212,利用准则2计算初始增益值然后跳至步骤224,否则直接进入步骤214。
[0061] [准则2]
[0062]
[0063] 其中Tup表示语音上阈值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量。
[0064] 步骤214,如果Tup≥Asmooth>Tdown,则进入步骤216利用准则3计算初始增益值然后跳至步骤224,否则直接进入步骤218。
[0065] [准则3]
[0066] g=gmoderate
[0067] 其中Tdown表示语音下阈值。
[0068] 步骤218,如果Tdown≥Asmooth>Tnoise,则进入步骤220利用准则4计算初始增益值然后跳至步骤224,否则利用准则5计算初始增益值然后跳至步骤224。
[0069] [准则4]
[0070]
[0071] [准则5]
[0072] g=gconceal
[0073] 其中Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,gconceal表示增益压制量。
[0074] 步骤224,对初始增益值做平滑处理,得到当前帧音频信号的自动增益值。
[0075] G=(1-β)×G'+β×g
[0076] 其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
[0077] 本发明充分考虑了回声的存在,能最大化地避免对残余回声的放大;将音频信号转换到对数域后再进行自动增益处理,更加符合真实声学模型
[0078] 图3所示为根据本发明的又一较佳实施例提供的音频信号自动增益控制装置的框图。
[0079] 如图3所示,根据本发明的实施例的音频信号自动增益控制装置300,包括:
[0080] 回声残余判断单元302,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;
[0081] 第一增益值计算单元304,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
[0082] 增益控制单元306,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
[0083] 所述第一增益值计算单元304包括:
[0084] 第一计算子单元3042,根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
[0085] 第二计算子单元3044,根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
[0086] 第三计算子单元3046,对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
[0087] 其中,所述第二计算子单元3044按照以下公式计算出所述第一初始增益值:
[0088] g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
[0089] 音频信号自动增益控制装置还可以包括:
[0090] 第二增益值计算单元308,用于在所述判断单元确定未有回声残余时,根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
[0091] 平滑处理单元310,对所述第二初始增益值进行平滑处理,得到第二自动增益值;
[0092] 所述增益控制单元306根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理。
[0093] 其中,所述第二增益值计算单元308包括:
[0094] 平滑幅度值计算子单元3082,计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
[0095] 增益值处理子单元3084,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
[0096] 其中,所述增益值处理子单元3084用于在所述平滑幅度值大于语音上阈值时,根据第一公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时,根据第二公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时,根据第三公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述噪声阈值时,根据第四公式计算出所述第二初始增益值;
[0097] 其中,所述第一公式为 Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,
[0098] 所述第二公式为g=gmoderate,
[0099] 所述第三公式为 Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,
[0100] 所述第四公式为g=gconceal,gconceal表示增益压制量。
[0101] 其中,所述第三计算子单元3046根据以下公式对所述第一初始增益值进行平滑处理:
[0102] G=(1-β)×G'+β×g
[0103] 其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
[0104] 所述平滑处理单元310根据以下公式对所述第二初始增益值进行平滑处理:
[0105] G=(1-β)×G'+β×g
[0106] 其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
[0107] 音频信号自动增益控制装置还可以包括:
[0108] 语音帧判断单元312,用于在判断所述当前帧音频信号是否有回声残余之前,判断所述当前帧音频信号是否是语音帧信号;
[0109] 若是语音帧信号,则通知所述回声残余判断单元判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
[0110] 相较于先前技术,根据本发明提供的技术方案,能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频质量,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内,解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。
[0111] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈