首页 / 专利库 / 广播 / 音频信号 / 音源的控制方法以及扬声设备

音源的控制方法以及扬声设备

阅读:1048发布:2020-06-01

专利汇可以提供音源的控制方法以及扬声设备专利检索,专利查询,专利分析的服务。并且本 发明 涉及扬声器技术领域,公开了一种音源的控制方法以及扬声设备。该控制方法包括:利用骨传导麦克 风 采集第一音频 信号 以及利用气传导麦克风采集第二 音频信号 ;计算第二音频信号的 信噪比 ,并判断第二音频信号的信噪比是否大于信噪比 阈值 :若是,则输出第二音频信号;若否,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出。通过上述方式,本发明能够改善应用于语音通讯的语音 质量 。,下面是音源的控制方法以及扬声设备专利的具体信息内容。

1.一种音源的控制方法,其特征在于,所述控制方法包括:
利用骨传导麦克采集第一音频信号以及利用气传导麦克风采集第二音频信号
计算所述第二音频信号的信噪比,并判断所述第二音频信号的信噪比是否大于信噪比阈值
若是,则输出所述第二音频信号;
若否,则将所述第一音频信号和所述第二音频信号进行融合,以得到第一融合音频信号并输出。
2.根据权利要求1所述的控制方法,其特征在于,所述利用气传导麦克风采集第二音频信号的步骤包括:
利用至少两个所述气传导麦克风分别同步采集第二音频信号;
所述输出所述第二音频信号的步骤包括:
确定所述第二音频信号中的语音段和非语音段;
将所述至少两个气传导麦克风所采集的第二音频信号中处于非语音段的部分进行零点形成,以将所述至少两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号,进而输出所述第二融合音频信号;
所述将所述第一音频信号和所述第二音频信号进行融合,以得到第一融合音频信号并输出的步骤包括:
确定所述第二音频信号中的语音段和非语音段;
将所述至少两个气传导麦克风所采集的第二音频信号中处于非语音段的部分进行零点形成,以将所述至少两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号,进而将所述第二融合音频信号与所述第一音频信号进行融合以得到所述第一融合音频信号并输出。
3.根据权利要求2所述的控制方法,其特征在于,所述将所述至少两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号的步骤之后包括:
将所述第二融合音频信号从时域转换至频域;
估算所述第二融合音频信号中各频点语音存在的概率,以判断各频点是否存在语音;
对所述第二融合音频信号中存在语音和不存在语音的频点的音频信号分别进行增益处理;
其中,所述第二融合音频信号中存在语音和不存在语音的频点的音频信号分别对应不同的增益。
4.根据权利要求2所述的控制方法,其特征在于,所述第一音频信号的信噪比大于所述第二融合音频信号的信噪比,并且所述第一音频信号和所述第二融合音频信号所包括的内容一致;
所述将所述至少两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号的步骤之后包括:
将所述第一音频信号从时域转换至频域;
估算所述第一音频信号中各频点语音存在的概率,以判断各频点是否存在语音,进而确定所述第二融合音频信号中各频点语音存在的概率,其中所述第二融合音频信号中各频点语音存在的概率与所述第一音频信号中各频点语音存在的概率相同;
对所述第二融合音频信号中存在语音和不存在语音的频点的音频信号分别进行增益处理;
其中,所述第二融合音频信号中存在语音和不存在语音的频点的音频信号分别对应不同的增益。
5.根据权利要求2所述的控制方法,其特征在于,所述第一音频信号的信噪比大于所述第二音频信号的信噪比,并且所述第一音频信号和所述第二音频信号所包括的内容一致;
所述确定所述第二音频信号中的语音段和非语音段的步骤包括:
将所述骨传导麦克风所采集的所述第一音频信号和所述至少两个气传导麦克风所采集的第二音频信号进行同步;
对所述第一音频信号进行语音活动检测,以确定所述第一音频信号中的语音和非语音帧,所述第一音频信号中的所有语音帧组成所述第一音频信号的语音段,所述第一音频信号中的所有非语音帧组成所述第一音频信号的非语音段,进而确定所述第二音频信号中的语音段和非语音段;其中,所述第一音频信号和所述第二音频信号二者语音段的起止点相同,并且二者非语音段的起止点也相同。
6.根据权利要求1所述的控制方法,其特征在于,所述第一音频信号的信噪比大于所述第二音频信号的信噪比,并且所述第一音频信号和所述第二音频信号所包括的内容一致;
所述将所述第一音频信号和所述第二音频信号进行融合,以得到第一融合音频信号并输出的步骤包括:
以所述第二音频信号为基础,利用所述第一音频信号中处于预设频段的音频信号替换所述第二音频信号中所述预设频段对应的音频信号,以得到所述第一融合音频信号。
7.根据权利要求6所述的控制方法,其特征在于,所述利用所述第一音频信号中处于预设频段的音频信号替换所述第二音频信号中所述预设频段对应的音频信号的步骤之前包括:
将所述第一音频信号和所述第二音频信号二者处于所述预设频段的音频信号的平均能量调整至一致。
8.根据权利要求6或7所述的控制方法,其特征在于,所述预设频段对应的音频信号的频率小于其它频段对应的音频信号的频率。
9.一种扬声设备,其特征在于,所述扬声设备包括处理器、骨传导麦克风和气传导麦克风,所述骨传导麦克风和所述气传导麦克风分别耦接所述处理器,所述处理器用于:
利用所述骨传导麦克风采集第一音频信号以及利用所述气传导麦克风采集第二音频信号;
计算所述第二音频信号的信噪比,并判断所述第二音频信号的信噪比是否大于信噪比阈值:
若是,则输出所述第二音频信号;
若否,则将所述第一音频信号和所述第二音频信号进行融合,以得到第一融合音频信号并输出。
10.根据权利要求9所述的扬声设备,其特征在于,所述扬声设备为机。

说明书全文

音源的控制方法以及扬声设备

技术领域

[0001] 本发明涉及扬声器技术领域,特别是涉及一种音源的控制方法以及扬声设备。

背景技术

[0002] 随着数字化音频技术以及消费电子的发展,越来越多的人使用诸如机等扬声器做为语音通讯的工具,使得耳机等扬声器的使用也越来越普遍。但传统的耳机在强噪声环境以及强噪干扰下,用户输入耳机的语音常伴有较大的噪声,导致语音质量较差,很难大幅度地改善语音质量。

发明内容

[0003] 有鉴于此,本发明主要解决的技术问题是提供一种音源的控制方法以及扬声设备,能够改善应用于语音通讯的语音质量。
[0004] 为解决上述技术问题,本发明采用的一个技术方案是:提供一种音源的控制方法,该控制方法包括:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值:若是,则输出第二音频信号;若否,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出。
[0005] 为解决上述技术问题,本发明采用的又一个技术方案是:提供一种扬声设备,该扬声设备包括处理器、骨传导麦克风和气传导麦克风,骨传导麦克风和气传导麦克风分别耦接处理器,处理器用于:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值:若是,则输出第二音频信号;若否,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出。
[0006] 本发明的有益效果是:区别于现有技术,本发明提供一种音源的控制方法以及扬声设备。该音源的控制方法利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号,并计算第二音频信号的信噪比,从而判断环境中噪声的情况。当第二音频信号的信噪比大于信噪比阈值时,说明环境噪声较小,则输出第二音频信号,应用于语音通讯。由于气传导麦克风所采集的第二音频信号在低噪声环境中具有良好的音质,其有利于保证应用于语音通讯的语音具有较高的质量,因此能够改善应用于语音通讯的语音质量;而当第二音频信号的信噪比不大于信噪比阈值时,说明环境噪声较大,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出,应用于语音通讯。此时,气传导麦克风所采集的第二音频信号中伴有较大的噪声,而骨传导麦克风所采集的第一音频信号具有较高的信噪比,但第一音频信号中高频部分的音质较差,因此将第一音频信号和第二音频信号进行融合能够得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
附图说明
[0007] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。此外,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
[0008] 图1是本发明音源的控制方法第一实施例的流程示意图;
[0009] 图2是本发明音源的控制方法第二实施例的流程示意图;
[0010] 图3是本发明音源的控制方法第三实施例的流程示意图;
[0011] 图4是本发明第二音频信号的降噪处理过程一实施例的流程示意图;
[0012] 图5是本发明扬声设备一实施例的结构示意图。

具体实施方式

[0013] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0014] 为解决现有技术中扬声设备应用于语音通讯的语音质量较差的技术问题,本发明的一实施例提供一种音源的控制方法。该控制方法包括:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值:若是,则输出第二音频信号;若否,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出。以下进行详细阐述。
[0015] 骨传导麦克风提供一种采集、捕捉用户声音的方式。其用于采集通过用户的颅骨、骨迷路等介质传递的用户发出的声音。骨传导麦克风能够采集到较为纯净的用户发出的声音,具有较高的信噪比,但是骨传导麦克风所采集的声音其频率不高,表现为高频声音缺失,导致音质较差。
[0016] 而气传导麦克风提供另一种采集、捕捉用户声音的方式。其用于采集通过空气传递的用户发出的声音。气传导麦克风能够采集到用户发出的大部分频段的声音,尤其是高频的部分,但同时也会采集到环境中的噪声,而当环境中的噪声较大时,就会导致气传导麦克风所采集的声音信号的信噪比较小。
[0017] 有鉴于此,本发明的实施例结合骨传导麦克风和气传导麦克风,提出一种音源的控制方法,能够改善应用于语音通讯的语音质量。以下进行详细阐述:
[0018] 请参阅图1,图1是本发明音源的控制方法第一实施例的流程示意图。
[0019] S101:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;
[0020] 在本实施例中,利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号,以根据环境中噪声的情况,结合骨传导麦克风和气传导麦克风的优势,提供高质量的语音输出方案,进而改善应用于语音通讯的语音质量,使得语音输出方所发出的语音清楚、完整地传递至语音接收方,保障语音通讯的良好进行。
[0021] S102:计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值;
[0022] 在本实施例中,若第二音频信号的信噪比大于信噪比阈值,则执行步骤S103,而若第二音频信号的信噪比不大于信噪比阈值,则执行步骤S104。
[0023] 由于气传导麦克风所采集的第二音频信号容易受到环境中噪声的影响,因此可以借由气传导麦克风所采集的第二音频信号来判断当前环境中噪声的情况,从而选择合适的语音输出方案。
[0024] 而第二音频信号中最直接地反映当前环境中噪声情况的就是第二音频信号的信噪比。第二音频信号的信噪比越高,则说明当前环境中噪声越小,而第二音频信号的信噪比越小,则说明当前环境中噪声越大。具体地,将当前第二音频信号的信噪比和预定的信噪比阈值进行比较,判断第二音频信号的信噪比是否大于信噪比阈值,从而判断当前环境中噪声的情况。
[0025] 其中,信噪比阈值定义为应用于语音通讯的音频信号其信噪比能够满足正常语音通讯的要求的信噪比限值。
[0026] S103:输出第二音频信号;
[0027] 在本实施例中,第二音频信号的信噪比大于信噪比阈值,说明气传导麦克风所采集的第二音频信号具有较高的信噪比,其清晰度足以满足正常语音通讯的要求,因此可以直接输出第二音频信号,应用于语音通讯。同时,第二音频信号在高频部分也具有良好的音质,使得应用于语音通讯的音频信号具有良好的音质,能够改善应用于语音通讯的语音质量,保障语音通讯的良好进行。之后结束流程。
[0028] S104:将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出;
[0029] 在本实施例中,第二音频信号的信噪比不大于信噪比阈值,说明气传导麦克风所采集的第二音频信号的信噪比较小,其清晰度难以满足正常语音通讯的要求。此时,考虑到骨传导麦克风所采集的第一音频信号具有较高的信噪比,可借以提高应用于语音通讯的音频信号的信噪比,但考虑到第一音频信号的高频部分音质较差,因此本实施例中将第一音频信号和第二音频信号进行融合能够得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
[0030] 以上可以看出,本发明所提供的音源的控制方法,其当第二音频信号的信噪比大于信噪比阈值时,说明环境噪声较小,则输出第二音频信号,应用于语音通讯。由于气传导麦克风所采集的第二音频信号在低噪声环境中具有良好的音质,其有利于保证应用于语音通讯的语音具有较高的质量,因此能够改善应用于语音通讯的语音质量;而当第二音频信号的信噪比不大于信噪比阈值时,说明环境噪声较大,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出,应用于语音通讯。此时,气传导麦克风所采集的第二音频信号中伴有较大的噪声,而骨传导麦克风所采集的第一音频信号具有较高的信噪比,但第一音频信号中高频部分的音质较差,因此将第一音频信号和第二音频信号进行融合能够得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
[0031] 请参阅图2,图2是本发明音源的控制方法第二实施例的流程示意图。
[0032] S201:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;
[0033] 在本实施例中,利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号,以根据环境中噪声的情况,结合骨传导麦克风和气传导麦克风的优势,提供高质量的语音输出方案,进而改善应用于语音通讯的语音质量,使得语音输出方所发出的语音清楚、完整地传递至语音接收方,保障语音通讯的良好进行。
[0034] S202:计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值;
[0035] 在本实施例中,若第二音频信号的信噪比大于信噪比阈值,则执行步骤S203,而若第二音频信号的信噪比不大于信噪比阈值,则执行步骤S204。
[0036] S203:输出第二音频信号;
[0037] 在本实施例中,第二音频信号的信噪比大于信噪比阈值,说明气传导麦克风所采集的第二音频信号具有较高的信噪比,其清晰度足以满足正常语音通讯的要求,因此可以直接输出第二音频信号,应用于语音通讯。同时,第二音频信号在高频部分也具有良好的音质,使得应用于语音通讯的音频信号具有良好的音质,能够改善应用于语音通讯的语音质量,保障语音通讯的良好进行。之后结束流程。
[0038] S204:以第二音频信号为基础,利用第一音频信号中处于预设频段的音频信号替换第二音频信号中预设频段对应的音频信号,以得到第一融合音频信号并输出;
[0039] 在本实施例中,第二音频信号的信噪比不大于信噪比阈值,说明气传导麦克风所采集的第二音频信号的信噪比较小,其清晰度难以满足正常语音通讯的要求。此时,考虑到骨传导麦克风所采集的第一音频信号具有较高的信噪比,可借以提高应用于语音通讯的音频信号的信噪比,但考虑到第一音频信号的高频部分音质较差,因此本实施例中将第一音频信号和第二音频信号进行融合能够得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
[0040] 具体地,以第二音频信号为基础,利用第一音频信号中处于预设频段的音频信号替换第二音频信号中预设频段对应的音频信号,以得到第一融合音频信号并输出。
[0041] 进一步地,利用第一音频信号中处于预设频段的音频信号替换第二音频信号中预设频段对应的音频信号之前,先分别计算第一音频信号和第二音频信号二者处于预设频段的音频信号的平均能量,求出二者对应的权系数,根据得到的权系数对第一音频信号中处于预设频段的音频信号的频谱进行修正,具体地将第一音频信号和第二音频信号二者处于预设频段的音频信号的平均能量调整至一致,之后再利用修正后的第一音频信号中处于预设频段的音频信号替换第二音频信号中预设频段对应的音频信号,完成预设频段部分的处理,进而得到第一融合音频信号并输出。
[0042] 更进一步地,由于第一音频信号中高频段音质较差,因此预设频段设定为预设频段对应的音频信号的频率小于其它频段对应的音频信号的频率。也就是说,预设频段为低频段,本实施例通过将骨传导麦克风所采集的第一音频信号中处于低频段的部分音频去替换第二音频信号中的低频段部分,来提高第一融合音频信号的信噪比,并且由于保留了第二音频信号的高频部分,使得第一融合音频信号具有良好的音质。
[0043] 请参阅图3,图3是本发明音源的控制方法第三实施例的流程示意图。
[0044] S301:利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号;
[0045] 在本实施例中,利用骨传导麦克风采集第一音频信号以及利用气传导麦克风采集第二音频信号,以根据环境中噪声的情况,结合骨传导麦克风和气传导麦克风的优势,提供高质量的语音输出方案,进而改善应用于语音通讯的语音质量,使得语音输出方所发出的语音清楚、完整地传递至语音接收方,保障语音通讯的良好进行。
[0046] S302:计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值;
[0047] 在本实施例中,若第二音频信号的信噪比大于信噪比阈值,则执行步骤S303,而若第二音频信号的信噪比不大于信噪比阈值,则执行步骤S305。
[0048] S303:对第二音频信号进行降噪处理,得到第二融合音频信号;
[0049] 在本实施例中,第二音频信号的信噪比大于信噪比阈值,说明气传导麦克风所采集的第二音频信号具有较高的信噪比,环境中的噪声较小。但为进一步对第二音频信号进行输出增强,以提高应用于语音通讯的语音质量,因此本实施例中优选地对第二音频信号进行降噪处理。
[0050] 在一实施方式中,主要利用气传导麦克风阵列处理实现语音增强,以达到降噪的效果。具体地,在利用气传导麦克风采集第二音频信号的步骤中利用至少两个气传导麦克风分别同步采集第二音频信号(下文以利用两个气传导麦克风分别同步采集第二音频信号为例进行阐述,在此不做限定),之后确定第二音频信号中的语音段和非语音段,再将两个气传导麦克风所采集的第二音频信号中处于非语音段的部分进行零点形成,以将两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号,进而输出第二融合音频信号,第二融合音频信号即为第二音频信号经过降噪处理的结果。
[0051] 进一步地,上述零点形成可以是基于双气传导麦克风的自适应零点形成(Adaptive Null-Forming,ANF)。适用的场景是目标信号来自于端射方向,比如通话时的耳机,说话人嘴的位置大致在两个气传导麦克风连线的延长线上。ANF算法可以定向拾取端射方向的目标信号,并且自适应地在噪声来源方向形成零点,从而提高语音质量。ANF包括两个差分波束形成器和一个自适应滤波器。两个差分波束形成器(A和B)可以分别定向拾取语音和噪声:A主要包含目标语音,作为自适应滤波器的期望信号;B主要包含0度之外的噪声,可以作为自适应滤波器的输入参考噪声。自适应滤波器的算法包括但不限于LMS(Least Mean Square,最小均方)和NLMS(Normalized Least Mean Square,归一化最小均方)等。
[0052] 需要说明的是,自适应滤波器的系数只有在没有语音的情况下才更新,因此上述过程中需要确定第二音频信号中的语音段和非语音段,进而将两个气传导麦克风所采集的第二音频信号中处于非语音段的部分进行零点形成。
[0053] 更进一步地,由于骨传导麦克风直接通过与说话者的接触拾取振动并依靠固体传播,可以很好屏蔽环境中的高噪声得到较纯净的音频信号,即第一音频信号的信噪比较高且大于第二音频信号的信噪比,可以用来得到较准确的语音判断。并且由于骨传导麦克风和气传导麦克风同步采集用户的语音,因此第一音频信号和第二音频信号所包括的内容一致。
[0054] 具体地,将骨传导麦克风所采集的第一音频信号和至少两个气传导麦克风所采集的第二音频信号进行同步。之后,对第一音频信号进行语音活动检测(VAD,Voice Activity Detection),以确定第一音频信号中的语音和非语音帧,第一音频信号中的所有语音帧组成第一音频信号的语音段,第一音频信号中的所有非语音帧组成第一音频信号的非语音段,进而确定第二音频信号中的语音段和非语音段;其中,第一音频信号和第二音频信号二者语音段的起止点相同,并且二者非语音段的起止点也相同。
[0055] 请参阅图4,图4是本发明第二音频信号的降噪处理过程一实施例的流程示意图。根据上文所述,本实施例中步骤S303对第二音频信号进行降噪处理,以得到第二融合音频信号的过程主要包括如下步骤:
[0056] S3031:将骨传导麦克风所采集的第一音频信号和两个气传导麦克风所采集的第二音频信号进行同步;
[0057] 具体地,将骨传导麦克风的第一音频信号和两个气传导麦克风的第二音频信号做分帧处理,在帧内同时进行基音搜索,利用搜索出的基音起点对齐同步骨传导麦克风的第一音频信号和两个气传导麦克风的第二音频信号,或者是利用骨传导麦克风的第一音频信号和两个气传导麦克风的第二音频信号计算互相关,找到最大相关值的时间点,以此对齐同步骨传导麦克风的第一音频信号和两个气传导麦克风的第二音频信号。
[0058] S3032:对第一音频信号进行语音活动检测,以确定第二音频信号中的语音段和非语音段;
[0059] 其中,可以通过短时能量和短时过零率等方式对骨传导麦克风所采集的第一音频信号进行语音活动检测,在此不做限定。
[0060] S3033:将两个气传导麦克风所采集的第二音频信号中处于非语音段的部分进行零点形成,以将两个气传导麦克风所采集的第二音频信号融合成一个第二融合音频信号。
[0061] 当然,在本发明的其它实施例中,所形成的零点可以是固定的,即固定零点形成,而不是如上文中所述的自适应地在噪声来源方向形成零点,在此不做限定。
[0062] S304:对第二融合音频信号进行增益处理,而后进行输出;
[0063] 在本实施例中,对第二音频信号进行降噪处理,得到第二融合音频信号后,若为进一步提高应用于语音通讯的语音质量,本实施例中优选地还可以对第二融合音频信号进行增益处理,而后输出增益处理后的第二融合音频信号。之后结束流程。
[0064] 进一步地,主要的方案是通过对第二融合音频信号中的语音帧和非语音帧使用不同的增益,实现对第二融合音频信号中语音帧和非语音帧的不同噪声消除增益。
[0065] 具体地,将第二融合音频信号从时域转换至频域。估算第二融合音频信号中各频点语音存在的概率,以判断各频点是否存在语音。对第二融合音频信号中存在语音和不存在语音的频点的音频信号分别进行增益处理。其中,第二融合音频信号中存在语音和不存在语音的频点的音频信号分别对应不同的增益。
[0066] 通过快速傅里叶变换(FFT,Fast Fourier Transform)将第二融合音频信号从时域(time-domain)转换到频域(frequency-domain)谱X1(k,l)和X2(k,l)。在频域内引入概率模型计算增益函数G(k,l),k为帧数,l为频点。通过第二融合音频信号中对语音帧和非语音帧使用不同的增益,实现对第二融合音频信号中语音帧和非语音帧的不同噪声消除增益。引入概率模型后,核心在于对当前频点语音存在的概率进行估算。具体地,设定门限值和判别函数。当当前频点的频谱能量大于门限值时,认为存在语音,概率I(k,l)为1,而当当前频点的频谱能量小于门限值时,认为不存在语音,概率I(k,l)为0。
[0067] 对语音概率p(k,l)进行更新:
[0068] p(k,l)=αpp(k,l-1)+(1-αp)I(k,l);
[0069] 对噪声谱的估计依据概率p(k,l)进行更新:
[0070] λd(k+1,l)=λd(k,l)p(k,l)+[αdλd(k,l)+(1-αd)|X1(k,l)|](1-p(k,l))其中,0<αd,αp<1均为平滑系数;
[0071] 然后再计算总增益函数即可,总增益函数为:
[0072] G(k,l)={GH1(k,l)}p(k,l)Gmin1-p(k,l),之后对第二融合音频信号进行增益处理,而后进行输出。
[0073] 在一替代实施例中,由于气传导麦克风所采集的音频信号其容易受到环境噪声的影响,尤其是在环境噪声较大的情况下,气传导麦克风所采集的音频信号的信噪比较小,则意味着第二融合音频信号的语音概率估算会较为复杂,计算负担较重。然而,骨传导麦克风所采集的音频信号其信噪比通常较高,因此可以借助骨传导麦克风所采集的音频信号进行第二融合音频信号的语音概率的估算。
[0074] 考虑到第一音频信号的信噪比大于第二融合音频信号的信噪比,并且第一音频信号和第二融合音频信号所包括的内容一致,因此借助骨传导麦克风所采集的音频信号进行第二融合音频信号的语音概率的估算存在实现的可能。
[0075] 具体地,将第一音频信号从时域转换至频域。估算第一音频信号中各频点语音存在的概率,以判断各频点是否存在语音,进而确定第二融合音频信号中各频点语音存在的概率。其中第二融合音频信号中各频点语音存在的概率与第一音频信号中各频点语音存在的概率相同。通过上述方式,即可借助骨传导麦克风所采集的音频信号进行第二融合音频信号的语音概率的估算。
[0076] 当然,在本发明的其它实施例中,增益处理不需要精确到频点量级,只需精确到帧量级时,可以利用上述实施例中第一音频信号的语音活动检测的结果,直接把第二融合音频信号中语音帧所对应频点的语音存在概率设为1,而将第二融合音频信号中非语音帧所对应频点的语音存在概率设为0。其中,第一音频信号和第二融合音频信号所记载的内容一致,因此第一音频信号的语音帧即对应第二融合音频信号的语音帧,第一音频信号的非语音帧即对应第二融合音频信号的非语音帧,由此确定第二融合音频信号中的语音帧和非语音帧,进而完成语音存在概率估算。
[0077] S305:对第二音频信号进行降噪处理,得到第二融合音频信号;
[0078] 在本实施例中,第二音频信号的信噪比不大于信噪比阈值,说明气传导麦克风所采集的第二音频信号的信噪比较小,其清晰度难以满足正常语音通讯的要求。因此为提高应用于语音通讯的语音质量,本实施例优选地对第二音频信号进行降噪处理,以得到第二融合音频信号,借助第二融合音频信号提供高质量的语音输出。
[0079] 需要说明的是,上述第二音频信号进行降噪处理的过程已在上文中详细阐述,在此就不再赘述。
[0080] S306:对第二融合音频信号进行增益处理;
[0081] 在本实施例中,对第二音频信号进行降噪处理,得到第二融合音频信号后,若为进一步提高应用于语音通讯的语音质量,本实施例中优选地还可以对第二融合音频信号进行增益处理,而后输出增益处理后的第二融合音频信号。
[0082] 需要说明的是,上述第二融合音频信号进行增益处理的过程已在上文中详细阐述,在此就不再赘述。
[0083] S307:将增益处理后的第二融合音频信号和第一音频信号进行融合,以得到第一融合音频信号并输出;
[0084] 在本实施例中,考虑到气传导麦克风所采集的第二音频信号的信噪比较小,即便对第二音频信号进行降噪处理,并且还对第二融合音频信号进行增益处理,增益处理后的第二融合音频信号其信噪比可能仍然较小。考虑到骨传导麦克风所采集的第一音频信号具有较高的信噪比,可借以提高应用于语音通讯的音频信号的信噪比,但第一音频信号的高频部分音质较差,因此本实施例中将第一音频信号和增益处理后的第二融合音频信号进行融合,以得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
[0085] 具体地,以增益处理后的第二融合音频信号为基础,利用第一音频信号中处于预设频段的音频信号替换增益处理后的第二融合音频信号中预设频段对应的音频信号,以得到第一融合音频信号并输出。
[0086] 当然,利用第一音频信号中处于预设频段的音频信号替换增益处理后的第二融合音频信号中预设频段对应的音频信号之前,也可以包括将第一音频信号和增益处理后的第二融合音频信号二者处于预设频段的音频信号的平均能量调整至一致的过程,在此不做限定。
[0087] 综上所述,本发明所提供的音源的控制方法,其当第二音频信号的信噪比大于信噪比阈值时,说明环境噪声较小,则输出第二音频信号,应用于语音通讯。由于气传导麦克风所采集的第二音频信号在低噪声环境中具有良好的音质,其有利于保证应用于语音通讯的语音具有较高的质量,因此能够改善应用于语音通讯的语音质量;而当第二音频信号的信噪比不大于信噪比阈值时,说明环境噪声较大,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出,应用于语音通讯。此时,气传导麦克风所采集的第二音频信号中伴有较大的噪声,而骨传导麦克风所采集的第一音频信号具有较高的信噪比,但第一音频信号中高频部分的音质较差,因此将第一音频信号和第二音频信号进行融合能够得到信噪比且音质良好的音频信号,即第一融合音频信号,从而保证应用于语音通讯的语音具有较高的质量,以进一步改善应用于语音通讯的语音质量。
[0088] 请参阅图5,图5是本发明扬声设备一实施例的结构示意图。
[0089] 在一实施例中,扬声设备1包括处理器11、骨传导麦克风12和气传导麦克风13,骨传导麦克风12和气传导麦克风13分别耦接处理器11。处理器11用于:利用骨传导麦克风12采集第一音频信号以及利用气传导麦克风13采集第二音频信号;计算第二音频信号的信噪比,并判断第二音频信号的信噪比是否大于信噪比阈值:若是,则输出第二音频信号;若否,则将第一音频信号和第二音频信号进行融合,以得到第一融合音频信号并输出。
[0090] 可选地,扬声设备1可以为耳机等,其不限于入耳式耳机、头戴式耳机、颈戴式耳机等。
[0091] 进一步地,考虑到上述实施例中所阐述的气传导麦克风13的语音增强输出方案,因此本实施例中气传导麦克风13的数量可以为至少两个,优选地为两个,具体语音增强过程已在上述实施例中阐述,在此就不再赘述。
[0092] 此外,在本发明中,除非另有明确的规定和限定,术语“相连”、“连接”、“层叠”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0093] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈