首页 / 专利库 / 信号处理 / 盲源分离 / 一种基于欠定卷积混叠模型的稀疏盲分离方法

一种基于欠定卷积混叠模型的稀疏盲分离方法

阅读:502发布:2020-05-12

专利汇可以提供一种基于欠定卷积混叠模型的稀疏盲分离方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及 信号 处理技术领域,提出一种基于欠定卷积 混叠 模型的稀疏盲分离方法,包括以下步骤:获取欠定混叠 语音信号 ;对所述欠定混叠语音信号进行短时傅里叶变换,得到频域上的稀疏混叠信号;对所述频域上的稀疏混叠信号进行数学建模,得到欠定卷积混叠模型;在所述欠定卷积混叠模型下建立稀疏代价函数,利用盲分离技术对混叠通道进行实时更新,得到估计的源信号;对所述估计的源信号进行尺度和排序处理,再利用傅里叶变换的逆运算得到时域上的完成分离的源信号。本发明利用源信号的稀疏约束以及欠定卷积混叠模型的构造,在处理真实环境下的高混响混叠信号具有更明显的优势。,下面是一种基于欠定卷积混叠模型的稀疏盲分离方法专利的具体信息内容。

1.一种基于欠定卷积混叠模型的稀疏盲分离方法,包括以下步骤:
S1:获取欠定混叠语音信号
S2:对所述欠定混叠语音信号进行短时傅里叶变换,得到频域上的稀疏混叠信号;
S3:对所述频域上的稀疏混叠信号进行数学建模,得到欠定卷积混叠模型;
S4:在所述欠定卷积混叠模型下建立稀疏代价函数,利用盲分离技术对混叠通道进行实时更新,得到估计的源信号;
S5:对所述估计的源信号进行尺度和排序处理,再利用傅里叶变换的逆运算得到时域上的完成分离的源信号。
2.根据权利要求1所述的基于欠定卷积混叠模型的稀疏盲分离方法,其特征在于:所述S1步骤中,采用在高混响的环境下,同时播放N组语音源信号,利用M个麦克进行接收,获取欠定混叠语音信号,其中,N、M为正整数,且N>M。
3.根据权利要求2所述的基于欠定卷积混叠模型的稀疏盲分离方法,其特征在于:所述S3步骤中,所述欠定卷积混叠模型的表达公式如下:
其中,N为源信号个数,L为卷积核的长度;hn=[h1n,h2n,...,hMn]T表示第n个源信号在时频域上的脉冲响应;对于每个频点,利用矩阵的表示形式如下:
Xf=Hf*Sf+Nf
其中,*表示卷积过程, 表示卷积混叠系统,Sf表示源信号,Nf表示近似误差。
4.根据权利要求3所述的基于欠定卷积混叠模型的稀疏盲分离方法,其特征在于:所述S4步骤中,所述稀疏代价函数的公式如下:
其中,||·||F表示Frobenius范数;p为常数,且05.根据权利要求4所述的基于欠定卷积混叠模型的稀疏盲分离方法,其特征在于:所述S4步骤中,利用临近算子得到估计的源信号 其计算公式如下:
其中,(Si)+=max(0,Si)。
6.根据权利要求5所述的基于欠定卷积混叠模型的稀疏盲分离方法,其特征在于:所述S5步骤中,对所述估计的源信号采用混叠阵矩阵进行列的标准化进行尺度处理,对所述估计的源信号采用方向到达技术进行排序处理。

说明书全文

一种基于欠定卷积混叠模型的稀疏盲分离方法

技术领域

[0001] 本发明涉及信号处理技术领域,更具体地,涉及一种基于欠定卷积混叠模型的稀疏盲分离方法。

背景技术

[0002] 盲源分离(Blind source separation,BSS)是在混叠信道未知的情况下,仅仅从观测到的混叠信号中分离源信号。特别的,欠定的盲源分离问题引起了越来越多的关注,如何在源信号数目大于传感器的数目下的混叠信号中有效地分离源信号是一个极具挑战性的问题。
[0003] 目前,在解决卷积混叠盲分离问题上,主要采用独立元分析方法在假设源信号之间是相互独立的条件下,进行源信号的盲分离。然而,独立元分析在处理欠定的卷积混叠盲分离问题上有一定的局限性,因为独立元分析只能处理过定的或者正定的情形,即源信号数目小于或等于传感器的数目。为了解决欠定的情况,一般结合稀疏元分析理论对源信号进行盲分离,其中,稀疏元分析理论是假设源信号满足一定的稀疏性,即假设在每个频点上只有唯一的源信号是活跃的,其他的等于零或者接近于零。然而,时域上的信号并不具有很好的稀疏性。为了满足稀疏性的假设,常规的方法是利用短时傅里叶变换,把时域信号转换到频域上进行处理。但是,在源信号恢复阶段容易导致排序歧义性问题和尺度不确定问题,从而对盲分离结果带来了严重的影响。另外,由于混响时间过长还会导致混叠过程更加复杂,已有的多数卷积盲分离算法只能解决低混响的混叠信号,但无法解决高混响的混叠情形。

发明内容

[0004] 本发明为克服上述现有技术所述的欠定卷积混叠信号盲分离结果不理想的缺陷,提供一种基于欠定卷积混叠模型的稀疏盲分离方法。
[0005] 为解决上述技术问题,本发明的技术方案如下:
[0006] 一种基于欠定卷积混叠模型的稀疏盲分离方法,包括以下步骤:
[0007] S1:获取欠定混叠语音信号
[0008] S2:对所述欠定混叠语音信号进行短时傅里叶变换,得到频域上的稀疏混叠信号;
[0009] S3:对所述频域上的稀疏混叠信号进行数学建模,得到欠定卷积混叠模型;
[0010] S4:在所述欠定卷积混叠模型下建立稀疏代价函数,利用盲分离技术对混叠通道进行实时更新,得到估计的源信号;
[0011] S5:对所述估计的源信号进行尺度和排序处理,再利用傅里叶变换的逆运算得到时域上的完成分离的源信号。
[0012] 本技术方案用用于在欠定卷积混叠模型下对混叠信号进行分离,对所述待分离的混叠信号进行短时傅里叶变换,将混叠信号变换到频域上,并进行数学建模,得到欠定卷积混叠模型;然后,在此模型下构建稀疏代价函数,利用稀疏盲分离技术分离源信号;再对分离的源信号进行尺度和排序处理,使得估计的源信号与真实的源信号排序上保持一致。最后,利用傅里叶变换的逆运算将频域上估计的源信号变换到时域上,得到分离后的源信号。
[0013] 优选地,S1步骤中,采用在高混响的环境下,同时播放N组语音源信号,利用M个麦克进行接收,获取欠定混叠语音信号,其中,N、M为正整数,且N>M。
[0014] 优选地,S3步骤中,所述欠定卷积混叠模型的表达公式如下:
[0015]
[0016] 其中,N为源信号个数,L为卷积核的长度;hn=[h1n,h2n,...,hMn]T表示第n个源信号在时频域上的脉冲响应;对于每个频点,利用矩阵的表示形式如下:
[0017] Xf=Hf*Sf+Nf
[0018] 其中,*表示卷积过程, 表示卷积混叠系统,Sf表示源信号,Nf表示近似误差。
[0019] 优选地,S4步骤中,所述稀疏代价函数的公式如下:
[0020]
[0021] 其中,||·||F表示Frobenius范数;p是常数,且0
[0022] 优选地,S4步骤中,利用临近算子得到估计的源信号 其计算公式如下:
[0023]
[0024] 其中,(Si)+=max(0,Si)。
[0025] 优选地,S5步骤中,对所述估计的源信号采用混叠阵矩阵进行列的标准化进行尺度处理,对所述估计的源信号采用方向到达技术进行排序处理。为了避免尺度不确定性问题,本优选方案对混叠矩阵进行列的标准化;同时利用方向到达角技术弥补排序不一致问题,再利用傅里叶变换的逆运算,把频域上估计的源信号变换到时域上,从而得到分离的源信号。
[0026] 与现有技术相比,本发明技术方案的有益效果是:通过构建欠定卷积混叠模型,实现更好地、更精确地描述高混响环境下的混叠信号;通过构造稀疏代价函数,利用原信号的稀疏性更好地重构源信号;利用源信号的稀疏约束以及欠定卷积混叠模型的构造,在处理真实环境下的高混响混叠信号具有更明显的优势。附图说明
[0027] 图1为实施例1的基于欠定卷积混叠模型的稀疏盲分离方法的流程图
[0028] 图2为实施例1的原始语音源信号的波形图。
[0029] 图3为实施例1的混叠通道的波形图。
[0030] 图4为实施例1的完成分离的源信号波形图。

具体实施方式

[0031] 附图仅用于示例性说明,不能理解为对本专利的限制;
[0032] 对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0033] 下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0034] 实施例1
[0035] 本实施例提出一种基于欠定卷积混叠模型的稀疏盲分离方法,如图1所示,为本实施例的基于欠定卷积混叠模型的稀疏盲分离方法的流程图。
[0036] 本实施例中的基于欠定卷积混叠模型的稀疏盲分离方法包括以下步骤:
[0037] S1:获取欠定混叠语音信号。
[0038] 本实施例中,通过在网上公共语音数据集获取N组语音源信号,然后采用在高混响的环境下,同时播放上述获取的N组语音源信号,利用M个麦克风进行接收,获取欠定混叠语音信号,其中,N、M为正整数,且N>M。
[0039] S2:对所述欠定混叠语音信号进行短时傅里叶变换,得到频域上的稀疏混叠信号。
[0040] 本实施例中,根据上述获得的稀疏混叠信号,为了保障源信号的稀疏性,通过计算机编程,在计算机上对所获得的欠定混叠语音信号进行短时傅里叶变换,把时域上的欠定混叠语音信号变换到频域上,得到更加稀疏的信号。
[0041] S3:对所述频域上的稀疏混叠信号进行数学建模,得到欠定卷积混叠模型。
[0042] 本步骤中,欠定卷积混叠模型的表达公式如下:
[0043]
[0044] 其中,N为源信号个数,L为卷积核的长度;hn=[h1n,h2n,...,hMn]T表示第n个源信号在时频域上的脉冲响应;对于每个频点,利用矩阵的表示形式如下:
[0045] Xf=Hf*Sf+Nf
[0046] 其中,*表示卷积过程, 表示卷积混叠系统,Sf表示源信号,Nf表示近似误差。
[0047] S4:在所述欠定卷积混叠模型下建立稀疏代价函数,利用盲分离技术对混叠通道进行实时更新,得到估计的源信号。
[0048] 本步骤中,首先建立稀疏代价函数,其中,稀疏代价函数的公式如下:
[0049]
[0050] 公式中,||·||F表示Frobenius范数;p是常数,且0
[0051] 然后,利用临近算子计算得到估计的源信号 其计算公式如下:
[0052]
[0053] 其中,(Si)+=max(0,Si)。
[0054] S5:对所述估计的源信号 进行尺度和排序处理,再利用傅里叶变换的逆运算得到时域上的完成分离的源信号。
[0055] 本步骤中,为了避免尺度不确定性问题,本实施例对混叠矩阵进行列的标准化;同时利用方向到达角技术弥补排序不一致的问题,再利用傅里叶变换的逆运算,把频域上估计的源信号 变换到时域上,从而得到分离的源信号。
[0056] 进一步的,本实施例采用两组实验数据说明本实施例提出的基于欠定卷积混叠模型的稀疏盲分离方法的可行性和优越性。本实施例提出的实验数据是在Windows 10,Inter(R)Xeon(R)CPU E5-2630 v3@2.40GHz,32.00GB,Matlab R2019a环境下实现的。
[0057] 首先,我们测试一组三个源信号两通道的欠定卷积混叠信号,数据集来自于“SISEC2013”(http://sisec.wiki.irisa.fr/tiki-index.html),选用真实记录的混叠信号:“dev1/dev1_female3_liverec_130ms_5cm_mix”,该混叠信号是由三个语音源信号两通道混叠而成。在欠定混叠语音信号获取过程中,所采用的两个麦克风之间的距离是5cm,混响时间为130ms。为了更好的说明本发明的可行性,我们测试不同参数p值对分离结果的影响,评价标准选用公用的SDR,SIR,ISR,SAR的平均值作为参考。
[0058] 实验结果如下表1所示:
[0059] 表1三个语音源信号两通道的卷积混叠信号盲分离结果(dB)
[0060]  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
SDR 1.28 3.18 2.52 2.82 1.96 1.44 1.97 4.19 4.90 4.18
SIR 1.02 2.96 2.04 2.65 0.77 0.11 1.38 5.52 7.74 6.39
ISR 4.12 5.97 5.72 6.13 5.17 4.90 5.61 7.72 8.56 7.89
SAR 7.51 9.84 10.53 8.48 10.24 6.80 8.23 8.79 10.85 7.51
[0061] 由表1结果可知,不同的p值产生的分离结果不同,在p=0.9时盲分离结果最理想。同时,我们对比了本实施例提出的基于欠定卷积混叠模型的稀疏盲分离方法在p=0.9时的原始信号与分离信号的波形图。
[0062] 如图2所示,为本实施例所采用的原始语音源信号的波形图,图3为混叠通道的波形图,图4为分离的源信号波形图。
[0063] 由图可知,通过对比图2和图4,可以发现本实施例待分离的混叠信号显然能够实现分离,因此本实施例所提出的基于欠定卷积混叠模型的稀疏盲分离方法具有可行性。
[0064] 本实施例还测试了一组由四个源信号三通道的欠定卷积混叠信号,数据集来自于“SISEC2013”(http://sisec.wiki.irisa.fr/tiki-index.html),选用真实记录的混叠信号:“dev3/dev3_female3_liverec_380ms_5cm_mix”。所选用的混叠信号是由四个语音源信号三通道混叠而成,在获取欠定混叠语音信号的过程中,所采用的是两个麦克风之间的距离是5cm,混响时间为380ms的高混响环境。
[0065] 本实施例对比了以下现有算法:Full-rank算法、N-Regu算法、C-PALM算法,采用SDR值、SIR值对实验结果进行判断。本实施例的实验结果如下表2所示:
[0066] 表2四个语音源信号三通道的卷积混叠信号盲分离结果(dB)
[0067]
[0068] 由表2结果可知,相比于其他现有的盲分离算法,本实施例提出的基于欠定卷积混叠模型的稀疏盲分离方法在分离高混响的欠定混叠信号中具有一定的优越性。
[0069] 由上述实施结果可知,本实施例提出的基于欠定卷积混叠模型的稀疏盲分离方法通过构建欠定卷积混叠模型,实现更好地、更精确地描述高混响环境下的混叠信号;通过构造稀疏代价函数,利用原信号的稀疏性更好地重构源信号;针对排序歧义性问题,通过采用方向到达角的排序方案,解决排序混乱问题,从而有效地分离高混响环境下的混叠信号。本实施例充分利用源信号的稀疏约束以及欠定卷积混叠模型的构造,在处理真实环境下的高混响混叠信号具有更高的优势。
[0070] 相同或相似的标号对应相同或相似的部件;
[0071] 附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
[0072] 显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈