一种音频文件播放方法及装置

申请号 CN201310393430.X 申请日 2013-09-02 公开(公告)号 CN104424971B 公开(公告)日 2017-09-29
申请人 华为技术有限公司; 发明人 许剑峰; 汪香君; 张清;
摘要 本 发明 公开了一种音频文件播放方法及装置,用以在音频文件播放时,扩展音频文件的声道 信号 数目,提升音频文件的播放效果。该方法为:移动设备在获得音频文件后,将判断音频文件中是否包含有自身能够播放的声道信号,若有则直接播放,否则,将音频文件中的声道信号转换为自身能够播放的 声音信号 后再播放,这样,当使用多个移动设备播放同一个音频文件时,既可以避免各个移动设备执行相同的操作,同时又增加了音频文件的声道数目,扩大了音频文件的声场,提升了音频文件的播放效果。
权利要求

1.一种音频文件的播放方法,其特征在于,包括:
获取音频文件,并获取所述音频文件中包含的声道信号
获取预先存储的声道标识;
若获取的所述声道信号与所述声道标识匹配,则播放所述与所述声道标识匹配的声道信号;
若获取的所述声道信号与所述声道标识不匹配,则基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号。
2.如权利要求1所述的方法,其特征在于,若获取的所述声道信号与所述声道标识匹配,则播放所述与所述声道标识匹配的声道信号,包括:
若所述音频文件为立体声音频文件,则在确定所述声道标识为左声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的左声道信号;或者,在确定所述声道标识为右声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的右声道信号;
若所述音频文件为单声道音频文件,则在确定所述声道标识为中声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述单声道音频文件中的单声道信号。
3.如权利要求1所述的方法,其特征在于,包括:若获取的所述声道信号与所述声道标识不匹配,则基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号,包括:
若所述音频文件为立体声音频文件,则根据所述立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号;
若所述音频文件为单声道音频文件,则先采用全通滤波方式将所述单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号。
4.如权利要求3所述的方法,其特征在于,若所述音频文件为立体声音频文件且所述声道标识为中声道的标识,则基于左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,包括:
将当前的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
5.如权利要求3所述的方法,其特征在于,若所述音频文件为立体声音频文件或单声道音频文件,且所述声道标识为左后声道的标识或右后声道的标识,则基于左声道信号和右声道信号生成与所述声道标识匹配的声道信号,包括:
将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
若所述声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
若所述声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
6.一种移动设备,其特征在于,包括:
获取单元,用于获取音频文件,并获取所述音频文件中包含的声道信号,以及获取预先存储的声道标识;
处理单元,用于在确定获取的所述声道信号与所述声道标识匹配时,播放所述与所述声道标识匹配的声道信号;以及在确定获取的所述声道信号与所述声道标识不匹配时,基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号。
7.如权利要求6所述的移动设备,其特征在于,所述处理单元具体用于:
若所述音频文件为立体声音频文件,则所述处理单元在确定所述声道标识为左声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的左声道信号;或者,所述处理单元在确定所述声道标识为右声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的右声道信号;
若所述音频文件为单声道音频文件,则所述处理单元在确定所述声道标识为中声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述单声道音频文件中的单声道信号。
8.如权利要求6所述的移动设备,其特征在于,在确定获取的所述声道信号与所述声道标识不匹配时,所述处理单元具体用于:
若所述音频文件为立体声音频文件,则所述处理单元根据所述立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号;
若所述音频文件为单声道音频文件,则所述处理单元先采用全通滤波方式将所述单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号。
9.如权利要求8所述的移动设备,其特征在于,若所述音频文件为立体声音频文件且所述声道标识为中声道的标识,则所述处理单元具体用于:
将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
10.如权利要求8所述的移动设备,其特征在于,若所述音频文件为立体声音频文件或单声道音频文件,且所述声道标识为左后声道的标识或右后声道的标识,则所述处理单元具体用于:
将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
若所述声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
若所述声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。

说明书全文

一种音频文件播放方法及装置

技术领域

[0001] 本发明涉及音频处理技术,特别涉及一种音频文件播放方法及装置。

背景技术

[0002] 近年来,智能手机用户和手持平板电脑设备用户越来越多。传统的移动设备的音乐播放大多数是在同一个设备上进行的。通过多个移动设备协作播放同一首音乐,可以提升音量或扩展声场,提升用户体验。但目前用户广泛使用的音频文件(如MP3),声道数一般是单声道或双声道(即立体声),多声道格式(例如,5.1)的音频文件数量比较少。如果简单地使用多个移动设备播放同一个音频文件,只是增加了音频的音量,不能扩展音频的声场。
[0003] 例如,现有技术下的第一种方案为:将单声道的音频文件使用两台或多台移动设备进行播放,每台移动设备都是播放相同的音频信号。如,参阅图1所示,移动设备1、移动设备2和移动设备3均播放同一个单声道的音频文件。
[0004] 又例如:现有技术下的第二种方案为:将立体声音频文件使用两台或多台移动设备进行播放,有的移动设备播放立体声音频文件的左声道信号,有的移动设备播放立体声音频文件的右声道信号。如,参阅图2所示,移动设备1和移动设备2播放同一个立体声音频文件的左声道信号,移动设备3和移动设备4播放同一个立体声音频文件的右声道信号。
[0005] 又例如:现有技术下的第三种方案为:将多声道的音频文件(如5.1声道)使用多台移动设备进行播放,不同的移动设备负责播放不同的声道信号。如,参阅图3所示,移动设备1播放同一个5.1声道音频文件的中声道信号,移动设备2播放同一个5.1声道音频文件的左声道信号,移动设备3播放同一个5.1声道音频文件的右声道信号,移动设备4播放同一个
5.1声道音频文件的左后声道信号,移动设备4播放同一个5.1声道音频文件的右后声道信号。
[0006] 但是,使用多台移动设备分别播放5.1声道音频文件的各个声道信号,虽然播放的声道信号数(多个)比单声道信号和立体声信号多,却也只是增强了播放的音量,并不能增加扩展声道信号数,即要求原始音频文件就是多声道的。如果原始音频文件是立体声或者是单声道,就没有办法实时转成多声道进行播放。

发明内容

[0007] 本发明实施例提供一种音频文件的播放方法及装置,用以在音频文件播放时,扩展音频文件的声道信号数目,提升音频文件的播放效果。
[0008] 本发明实施例提供的具体技术方案如下:
[0009] 第一方面,一种音频文件的播放方法,包括:
[0010] 获取音频文件,并获取所述音频文件中包含的声道信号;
[0011] 获取预先存储的声道标识;
[0012] 若获取的所述声道信号与所述声道标识匹配,则播放所述与所述声道标识匹配的声道信号;
[0013] 若获取的所述声道信号与所述声道标识不匹配,则基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号。
[0014] 结合第一方面,在第一种可能的实现方式中,若获取的所述声道信号与所述声道标识匹配,则播放所述与所述声道标识匹配的声道信号,包括:
[0015] 若所述音频文件为立体声音频文件,则在确定所述声道标识为左声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的左声道信号;或者,在确定所述声道标识为右声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的右声道信号;
[0016] 若所述音频文件为单声道音频文件,则在确定所述声道标识为中声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述单声道音频文件中的单声道信号。
[0017] 结合第一方面,在第二种可能的实现方式中,包括:若获取的所述声道信号与所述声道标识不匹配,则基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号,包括:
[0018] 若所述音频文件为立体声音频文件,则根据所述立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号;
[0019] 若所述音频文件为单声道音频文件,则先采用全通滤波方式将所述单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号。
[0020] 结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述音频文件为立体声音频文件且所述声道标识为中声道的标识,则基于左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,包括:
[0021] 将当前的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0022] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0023] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0024] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
[0025] 将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
[0026] 结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,若所述音频文件为立体声音频文件或单声道音频文件,且所述声道标识为左后声道的标识或右后声道的标识,则基于左声道信号和右声道信号生成与所述声道标识匹配的声道信号,包括:
[0027] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0028] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0029] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0030] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
[0031] 若所述声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
[0032] 若所述声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
[0033] 第二方面,一种移动设备,包括:
[0034] 获取单元,用于获取音频文件,并获取所述音频文件中包含的声道信号,以及获取预先存储的声道标识;
[0035] 处理单元,用于在确定获取的所述声道信号与所述声道标识匹配时,播放所述与所述声道标识匹配的声道信号;以及在确定获取的所述声道信号与所述声道标识不匹配时,基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号。
[0036] 结合第二方面,在第一种可能的实现方式中,所述处理单元具体用于:
[0037] 若所述音频文件为立体声音频文件,则所述处理单元在确定所述声道标识为左声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的左声道信号;或者,所述处理单元在确定所述声道标识为右声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的右声道信号;
[0038] 若所述音频文件为单声道音频文件,则所述处理单元在确定所述声道标识为中声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述单声道音频文件中的单声道信号。
[0039] 结合第二方面,在第二种可能的实现方式中,在确定获取的所述声道信号与所述声道标识不匹配时,所述处理单元具体用于:
[0040] 若所述音频文件为立体声音频文件,则所述处理单元根据所述立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号;
[0041] 若所述音频文件为单声道音频文件,则所述处理单元先采用全通滤波方式将所述单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号。
[0042] 结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,若所述音频文件为立体声音频文件且所述声道标识为中声道的标识,则所述处理单元具体用于:
[0043] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0044] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0045] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0046] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
[0047] 将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
[0048] 结合第二方面的第二种可能的实现方式,在第四种可能的实现方式中,若所述音频文件为立体声音频文件或单声道音频文件,且所述声道标识为左后声道的标识或右后声道的标识,则所述处理单元具体用于:
[0049] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0050] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0051] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0052] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
[0053] 若所述声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
[0054] 若所述声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
[0055] 第三方面,一种移动设备,包括:
[0056] 存储器,用于存储音频文件,以及存储预先设置的声道标识;
[0057] 处理单元,用于获取音频文件,并获取所述音频文件中包含的声道信号,以及获取预先存储的声道标识;在确定获取的所述声道信号与所述声道标识匹配时,播放所述与所述声道标识匹配的声道信号;以及在确定获取的所述声道信号与所述声道标识不匹配时,基于所述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号,并播放所述生成的与所述声道标识匹配的声道信号。
[0058] 结合第三方面,在第一种可能的实现方式中,所述处理单元具体用于:
[0059] 若所述音频文件为立体声音频文件,则所述处理单元在确定所述声道标识为左声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的左声道信号;或者,所述处理单元在确定所述声道标识为右声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述立体声音频文件中包含的右声道信号;
[0060] 若所述音频文件为单声道音频文件,则所述处理单元在确定所述声道标识为中声道的标识时,确认获取的声道信号与所述声道标识匹配,并直接播放所述单声道音频文件中的单声道信号。
[0061] 结合第三方面,在第二种可能的实现方式中,在确定获取的所述声道信号与所述声道标识不匹配时,所述处理单元具体用于:
[0062] 若所述音频文件为立体声音频文件,则所述处理单元根据所述立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号;
[0063] 若所述音频文件为单声道音频文件,则所述处理单元先采用全通滤波方式将所述单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与所述声道标识匹配的声道信号。
[0064] 结合第三方面的第二种可能的实现方式,在第三种可能的实现方式中,若所述音频文件为立体声音频文件且所述声道标识为中声道的标识,则所述处理单元具体用于:
[0065] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0066] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0067] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0068] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
[0069] 将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
[0070] 结合第三方面的第二种可能的实现方式,在第四种可能的实现方式中,若所述音频文件为立体声音频文件或单声道音频文件,且所述声道标识为左后声道的标识或右后声道的标识,则所述处理单元具体用于:
[0071] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0072] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0073] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0074] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
[0075] 若所述声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
[0076] 若所述声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
[0077] 综上所述,本发明实施例中,本发明实施例中,移动设备在获得音频文件后,将判断音频文件中是否包含有自身能够播放的声道信号,若有则直接播放,否则,将音频文件中的声道信号转换为自身能够播放的声音信号后再播放,这样,当使用多个移动设备播放同一个音频文件时,既可以避免各个移动设备执行相同的操作,同时又增加了音频文件的声道数目,扩大了音频文件的声场,提升了音频文件的播放效果。附图说明
[0078] 图1-图3为现有技术下播放音乐文件示意图;
[0079] 图4为本发明实施例中播放音频文件流程图
[0080] 图5为本发明实施例中基于左声道信号和右声道信号生成中声道信号示意图;
[0081] 图6为本发明实施例中基于左声道信号和右声道信号生成左后声道信号或右后声道信号示意图;
[0082] 图7和图8为本发明实施例中移动设备结构图。

具体实施方式

[0083] 为了能够在音频文件播放时,扩展音频文件的声道信号数目,提升音频文件的播放效果。本发明实施例中,移动设备在获得音频文件后,将判断音频文件中是否包含有自身能够播放的声道信号,若有则直接播放,否则,将音频文件中的声道信号转换为自身能够播放的声音信号后再播放,这样,可以在音频文件播放时,扩展音频文件的声道信号数目,提升音频文件的播放效果。
[0084] 下面结合附图对本发明优选的实施方式进行详细说明。
[0085] 参阅图4所示,本发明实施例中,移动设备播放音频文件的详细流程如下:
[0086] 步骤400:移动设备获取音频文件,并获取该音频文件中包含的声道信号。
[0087] 步骤410:移动设备获取预先存储的声道标识。
[0088] 步骤420:若获取的上述声道信号与上述声道标识匹配,则移动设备播放与上述声道标识匹配的声道信号。
[0089] 例如:若音频文件为立体声音频文件,则移动设备在确定声道标识为左声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的左声道信号;或者,在确定声道标识为右声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的右声道信号。
[0090] 又例如:若音频文件为单声道音频文件,则移动设备在确定声道标识为中声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放单声道音频文件中的单声道信号。
[0091] 步骤430:若获取的上述声道信号与上述声道标识不匹配,则移动设备基于上述音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与上述声道标识匹配的声道信号,并播放生成的与上述声道标识匹配的声道信号。
[0092] 其中,联合协方差矩阵系数反映了声道信号的能量及声道间的相关程度,(例如,左声道信号和右声道信号的能量,以及左声道信号和右声道信号之间的相关程度);联合协方差角度则反映了声源信号在空间上的方位信息。采用这种方式计算与上棕声道标识匹配的声道信号,可以降低算法整体的复杂度,从而在移动设备上也能够实现。
[0093] 例如,若音频文件为立体声音频文件,则移动设备根据立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号。
[0094] 又例如,若音频文件为单声道音频文件,则移动设备先采用全通滤波方式将单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号。
[0095] 由上述流程可以看出,本发明实施例中,当单声道音频文件或立体声音频文件在多个移动设备之间协作播放时,各个移动设备上均设置有其负责的声道标识(例如:假设需要将音频文件转成5.1声道格式播放,则可以分为左声道、右声道、中声道、左后声道、右后声道等五个声道,具体的设置可以根据移动设备所处的相对位置来决定,也可以由用户自行设定);在播放的时候,每个移动设备将原始的音频文件实时地转换成与自身负责的声道标识匹配的声道信号,并进行播放。
[0096] 下面分别以立体声音频文件和单声道音频文件为例,对上述步骤420的具体执行作出进一步详细说明。
[0097] 第一场景,假设多台移动设备协作播放一个立体声音频文件,每台移动设备确定自身负责播放的声道标识(如,左声道、右声道、中声道、左后声道、或者右后声道),确定方法可以由用户设定,也可以是根据移动设备所处的位置来确定。如果其中一台移动设备确定自身负责播放左声道或者右声道,则直接播放立体声音频文件中包含的左声道信号或者右声道信号;如果其中一台移动设备确定自身负责播放中声道,则需要实时地将立体声音频文件中包含的左声道信号和右声道信号转换成中声道信号进行播放;如果其中一台移动设备确定自身负责播放左后声道或者右后声道,则需要实时地将立体声音频文件中包含的左声道信号和右声道信号转换成左后声道信号或者右后声道信号进行播放。
[0098] 参阅图5所示,本发明实施例中,假设待播放的音频文件为立体声音频文件,且移动设备中设置的声道标识为中声道的标识,则基于音立体声音频文件中包含的左声道信号和右声道信号生成中声道信号的步骤如下:
[0099] 步骤500:移动设备将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号。
[0100] 本发明实施例中,为了便于实时转换及播放,将立体声音频文件中包含的左声道信号和右声道信号分别按照相同规格划分为大小相同的帧,每帧中包含相同数目(如,数目N)的采样点,N为正整数。例如,N=512,或者,N=1024。分帧的目的是便于实时处理,每处理完一帧,就可以直接播放这一帧处理后得到的音频数据,而不用等整个立体声音频文件都处理完才进行播放。为了便于描述,后续本实施例中,以对一帧声道信号的处理为例进行介绍。
[0101] 具体的,本发明实施例中,例如,可以采用离散傅里叶变换(DFT)、快速傅里叶变换(FFT)、余弦变换(DCT)等等方法将当前帧的左声道信号经频域变换得到左声道频域信号SL,以及将当前帧的右声道信号经频域变换得到右声道频域信号SR。以DCT为例,将当前帧的左声道信号sL(也称为左声道时域信号)和当前帧的右声道信号sR(也称为右声道时域信号)分别进行频域变换时,可以采用如下公式:
[0102]
[0103]
[0104] 其中,n为采用点的序号,k为生成点的序号,e为自然对数的底。
[0105] FFT实质上是DFT的快速算法,计算过程不一样,但得到的结果是一样的或者是相近的。因为移动设备一般计算能比台式机要弱,使用电池还要考虑减小计算复杂度来节约用电,因此,较佳的,也可以采用FFT进行上述过程的计算。经傅里叶变换后的信号是复数,即具有实部虚部
[0106] 步骤510:移动设备将转换后的左声道频域信号和右声道频域信号SR分别基于相同的子带规格划分为多个子带频域信号,再分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号计算相应子带规格的联合协方差矩阵系数。
[0107] 本发明实施例中,不同的子带规格即是指不同的声音频段,换言之,不同的子带规格可以视为不同的声源信号。移动设备按照连续的声音频段将左声道频域信号SL划分为若干左声道子带频域信号,以及按照相同的连续的声音频段将右声道频域信号SR划分为若干右声道子带频域信号,因此,同一种声音频段会对应一个左声道子带频域信号和一个右声道子带频域信号。
[0108] 以任意一种子带规格为例,其对应的联合协方差矩阵系数有三个,分别表示为rLL、rRR、rLR,这是因为音频信号中,每个子带规格对应的信号分布都不一样,因此,将频域信号分成子带频域信号进行处理有助于提升音频信号质量
[0109] 在计算任意一种子带规格对应的联合协方差矩阵系数时,可以采用以下公式:
[0110]
[0111]
[0112]
[0113] 其中Nsb表示子带规格的数目,k表示子带规格的索引号,i表示频域信号的索引号;start(k)表示第k种子带规格的起始点,end(k)表示第k种子带规格的结束点,start(k)和end(k)都是正整数,end(k)>start(k);SL表示左声道频域信号,SR表示右声道频域信号,表示取复数的实部,Ι表示取复数的虚部。
[0114] 步骤520:移动设备分别对每一种子带规格对应的联合协方差矩阵系数进行帧间平滑处理,得到每一种子带规格对应的平滑联合协方差矩阵系数。
[0115] 具体的,在针对任意一种子带规格的联合协方差矩阵系数进行平滑处理时,可以采用以下公式:
[0116]
[0117]
[0118]
[0119] 其中 和 表示当前帧中第k种子带规格对应的的平滑协方差矩阵系数; 和 表示上一帧中第k种子带规格对应的平滑协方差矩阵
系数,wsm1表示预设的第一平滑系数,wsm2表示预设的第二平滑系数,第一平滑系数和第二平滑系数都是正数,通常情况下,wsm1+wsm2=1,例如:当wsm1=0.8,则wsm2=0.2。
[0120] 当然,步骤520是对步骤510的优化操作,根据具体应用环境的不同,必要时,也可以不执行步骤520,而直接执行步骤530。
[0121] 步骤530:移动设备分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度。
[0122] 较佳的,可以采用反正切函数(即atan)来计算上述任意一种子带规格对应的联合协方差角度,具体可以采用以下公式:
[0123]
[0124] 其中 和 表示当前帧中第k种子带规格对应的的平滑协方差矩阵系数。
[0125] 步骤540:移动设备分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度。
[0126] 具体的,可以采用以下公式对上述任意一种子带规格对应的联合协方差角度进行平滑处理:
[0127]
[0128] 其中,α(k)表示当前帧中的第k种子带规格的联合协方差角度, 表示是上一帧中的第k种子带规格的平滑联合协方差角度;wsm1是表示预设的第一平滑系数,wsm2表示预设的是第二平滑系数,第一平滑系数和第二平滑系统都是正数,通常情况下,wsm1+wsm2=1,例如:当wsm1=0.85,则wsm2=0.15。
[0129] 当然,步骤540是对步骤530的优化操作,根据具体应用环境的不同,必要时,也可以不执行步骤540,而直接执行步骤550。
[0130] 步骤550:移动设备分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的中声道子带频域信号。
[0131] 具体的,移动设备可以采用加权加法使用以下公式计算任意一个中声道子带频域信号:
[0132]
[0133]
[0134]
[0135] 其中,SC(s)表示第k种子带规格对应的中声道子带频域信号,即表示s点的取值从start(k)到end(k)那么多点构成的一个中声道子带频域信号,g表示预设的能量控制因子,取值为正数,例如, wL(k)和wR(k)均表示预设的第k种子带规格对应的加权因子,SL(s)表示第k种子带规格左声道子带频域信号,SR(s)表示第k种子带规格右声道子带频域信号,s表示生成点的序号,start(k)表示第k种子带规格的起始点,end(k)表示第k种子带规格的结束点。
[0136] 显然,按照不同的子带规格分别计算对应的中声道子带频域信号,即是基于不同的声源信号来计算中声道子带频域信号,这样,可以有效提高最终获得的中声道频域信号的准确性。后续采用不同子带规格计算其他声道频域信号的原理亦是如此,将不再赘述。
[0137] 步骤560:移动设备将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号(即中声道时域信号)。
[0138] 具体的,在进行反频域变换时,移动设备可以采用反离散傅里叶变换)IDFT)、反快速傅里叶变换(IFFT)和反离散余弦变换(IDCT)等等方法,得到中声道信号sC(i)(时域)。以IDFT为例,所采用的公式如下:
[0139]
[0140] 其中,i表示中声道时频信号的索引号,SC(k)表示中声道频域信号,k表示中声道频域信号的索引号,N表示每一帧中的采样点数目,e为自然对数的底。
[0141] 这样,当多个移动设备获得立体声音频文件时,可以基于立体声音频文件中包含的左声道信号和右声道信号分别生成符合其各自声道标识的声道信号进行播放,例如,参阅图3所示,移动设备1基于立体声音频文件1中包含的左声道信号和右声道信号生成中声道信号进行播放;移动设备2将立体声音频文件中包含的左声道信号直接播放;移动设备3将立体声音频文件中包含的右声道信号直接播放;移动设备4基于立体声音频文件1中包含的左声道信号和右声道信号生成左后声道信号进行播放;移动设备5基于立体声音频文件1中包含的左声道信号和右声道信号生成右后声道信号进行播放。显然,采用这种方式可以避免各个移动设备执行相同的操作,同时又增加了立体声音频文件1的声道数目,扩大了立体声音频文件1的声场,提升了立体声音频文件1的播放效果。
[0142] 参阅图6所示,本发明实施例中,假设待播放的音频文件为立体声音频文件,且移动设备中设置的声道标识为左后声道的标识(或右后声道的标识),则基于音立体声音频文件中包含的左声道信号和右声道信号生成左后声道的信号(或右后声道的信号)的步骤如下:
[0143] 步骤600:移动设备将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号。
[0144] 本发明实施例中,为了便于实时转换及播放,将立体声音频文件中包含的左声道信号和右声道信号分别按照相同规格划分为大小相同的帧,每帧中包含相同数目(如,数目N)的采样点,N为正整数。例如,N=512,或者,N=1024。分帧的目的是便于实时处理,每处理完一帧,就可以直接播放这一帧处理后得到的音频数据,而不用等整个立体声音频文件都处理完才进行播放。为了便于描述,后续本实施例中,以对一帧声道信号的处理为例进行介绍。
[0145] 具体的,在进行频域变换时所采用的方式与步骤500相同,具体参阅步骤500,在此不再赘述。
[0146] 步骤610:移动设备将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,再分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号计算相应子带规格的联合协方差矩阵系数。
[0147] 本发明实施例中,生成联合协方差矩阵系数的方式与步骤510相同,具体参见步骤510,在此不再赘述。
[0148] 步骤620:移动设备分别对每一种子带规格对应的联合协方差矩阵系数进行帧间平滑处理,得到每一种子带规格对应的平滑联合协方差矩阵系数。
[0149] 本发明实施例中,对生成的联合协方差矩阵系数进行平滑处理的方式与步骤520相同,具体参见步骤520,在此不再赘述。
[0150] 步骤630:移动设备分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度。
[0151] 本发明实施例中,计算上述联合协方差角度的方式与步骤530相同,具体参见步骤530,在此不再赘述。
[0152] 步骤640:移动设备分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度。
[0153] 本发明实施例中,计算上述平滑联合协方差角度的方式与步骤540相同,具体参见步骤540,在此不再赘述。
[0154] 步骤650:移动设备分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号、每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号。
[0155] 具体的,移动设备可以采用加权减法使用以下公式计算任意一个后声道子带频域信号:
[0156]
[0157]
[0158]
[0159] 其中,SS(s)表示第k种子带规格对应的后声道子带频域信号,即表示s点的取值从start(k)到end(k)那么多点构成的一个后声道子带频域信号,g表示预设的能量控制因子,取值为正数,例如,g=1.414;wL(k)和wR(k)均表示预设的第k种子带规格对应的加权因子,SL(s)表示第k种子带规格对应的左声道子带频域信号,SR(s)表示第k种子带规格对应的右声道子带频域信号,s表示生成点的序号,start(k)表示第k种子带规格的起始点,end(k)表示第k种子带规格的结束点。
[0160] 通过加权减法,可以较好的减弱音频信号中的人声信号,因为在实际应用中,人声信号一般是从前方传过来的。
[0161] 步骤660:若移动设备保存的声道标识为左后声道的标识,则移动设备分别根据获得的每一个子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一个子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号(即左后声道时域信号)。
[0162] 具体的,移动设备可以采用加权加法使用以下公式计算任意一个左后声道子带频域信号,记为SSL(s)。
[0163]
[0164] 其中,SSL(s)表示第k种子带规格对应的左后声道子带频域信号,即表示s点的取值从start(k)到end(k)那么多点构成的一个左后声道子带频域信号,SS[s]表示第k种子带规格对应的后声道子带频域信号,SL[s]表示第k种子带规格对应的左声道子带频域信号,w1表示预设的第一加权系数,w2表示预设的第二加权系数,通常情况下,w1+w2=1,例如:w1=0.9,则w2=0.1,s表示生成点的序号,start(k)表示第k种子带规格的起始点,end(k)表示第k种子带规格的结束点
[0165] 而在将获得的各个左后声道子带频域信号合并为左后声道频域信号后,在对左后声道频域信号进行频域变换时,移动设备可以采用反离散傅里叶变换)IDFT)、反快速傅里叶变换(IFFT)和反离散余弦变换(IDCT)等等方法,得到左后声道信号sSL(i)(时域)。以IDFT为例,所采用的公式如下:
[0166]
[0167] 其中,i表示左后声道时频信号的索引号,SSL(k)表示左后声道频域信号,k表示左后声道频域信号的索引号,N表示每一帧中的采样点数目,e为自然对数的底。
[0168] 步骤670:若移动设备保存的声道标识为右后声道的标识,则移动设备分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号(即右后声道时域信号)。
[0169] 具体的,移动设备可以采用加权加法使用以下公式计算任意一个左后声道子带频域信号,记为SSR(s):
[0170]
[0171] 其中,SSR(s)表示第k种子带规格对应的右后声道子带频域信号,即表示s点的取值从start(k)到end(k)那么多点构成的一个右后声道子带频域信号,SS[s]表示第k种子带规格对应的后声道子带频域信号,SR[s]表示第k种子带规格对应的右声道子带频域信号,w1表示预设的第一加权系数,w2表示预设的第二加权系数,通常情况下,w1+w2=1,例如:w1=0.9,则w2=0.1,s表示生成点的序号,start(k)表示第k种子带规格的起始点,end(k)表示第k种子带规格的结束点。
[0172] 而在将获得的各个右后声道子带频域信号合并为右后声道频域信号后,在对右后声道频域信号进行频域变换时,移动设备可以采用反离散傅里叶变换)IDFT)、反快速傅里叶变换(IFFT)和反离散余弦变换(IDCT)等等方法,得到右后声道信号sSR(i)(时域)。以IDFT为例,所采用的公式如下:
[0173]
[0174] 其中,i表示右后声道时频信号的索引号,SSR(k)表示右后声道频域信号,k表示右后声道频域信号的索引号,N表示每一帧中的采样点数目,e为自然对数的底。
[0175] 通过上述步骤650和步骤660,移动设备可以去除后声道频域信号SS(s)中可能出现的频谱空洞,避免了帧间频谱突变导致的噪声。
[0176] 第二场景,假设多台移动设备协作播放一个单声道音频文件,每台移动设备确定自身负责播放的声道标识(如,左声道、右声道、中声道、左后声道、或者右后声道),确定方法可以由用户设定,也可以是根据移动设备所处的位置来确定。如果其中一台移动设备确定自身播放中声道,则直接播放单声道音频文件中包含的单声道信号;如果其中一台移动设备确定自身负责播放左声道或者右声道,则采用全通滤波方式将单声道音频文件中包含的单声道信号转换为左声道信号或右声道信号进行播放;如果其中一台移动设备确定自身负责播放左后声道或者右后声道,则需要实时地将基于单声道信号转换获得的左声道信号和右声道信号再次转换成左后声道信号或者右后声道信号进行播放。
[0177] 具体的,移动设备在获得单声道音频文件后,先将其中包含的单声道信号分成相同大小的帧,每帧包含同样多的样点数目N。本发明实施例中,为了便于实时转换及播放,将单声道音频文件中包含的单声道信号划分为大小相同的帧,每帧中包含相同数目(如,数目N)的采样点,N为正整数。例如,N=512,或者,N=1024。分帧的目的是便于实时处理,每处理完一帧,就可以直接播放这一帧处理后得到的音频数据,而不用等整个单声道音频文件都处理完才进行播放。为了便于描述,后续实施例中,以对一帧单声道信号的处理为例进行介绍。
[0178] 接着,移动设备将当前帧的单声道信号sM进行全通滤波,全通滤波器会让输入信号的所有频段的信号都能全部通过,但是会改变信号的相位和时延。如果移动设备负责播放左声道,则采用时延为dL的全通滤波器,得到左声道信号sL;如果移动设备负责播放右声道,则采用时延为dR的全通滤波器,得到右声道信号sR,dL和dR都是非负整数,且dL≠dR,例如,dL=5,dR=400。对左右声道采用不同时延的全通滤波器,可以在协作播放时,形成方位感和立体感,起到把单声道信号变为立体声信号的作用。
[0179] 然后,移动设备可以基于获得的转换后的左声道信号和右声道信号生成与本地保存的声道标识匹配的左后声道信号或者右后声道信号进行播放,具体的实现方式与步骤600-步骤660相同,在此不再赘述。
[0180] 这样,当多个移动设备获得单声道音频文件时,可以将单声道音频文件中包含的单声道信号分别转换为符合其各自声道标识的声道信号进行播放,例如,参阅图3所示,移动设备1将单声道音频文件1中包含的单声道信号作为中声道信号播放;移动设备2将单声道音频文件1中包含的单声道信号转换为左声道信号后进行播放;移动设备3将单声道音频文件1中包含的单声道信号转换为右声道信号后进行播放;移动设备4将单声道音频文件1中包含的单声道信号转换为左后声道信号后进行播放;移动设备5将单声道音频文件1中包含的单声道信号转换为右后声道信号后进行播放;显然,采用这种方式可以避免各个移动设备执行相同的操作,同时又增加了单声道音频文件1的声道数目,扩大了单声道音频文件1的声场,提升了单声道音频文件1的播放效果。
[0181] 参阅图7所示,为实现上述步骤400-步骤430,本发明实施例中提供了一种移动设备,该移动设备包括获取单元70和处理单元71,其中,
[0182] 获取单元70,用于获取音频文件,并获取音频文件中包含的声道信号,以及获取预先存储的声道标识;
[0183] 处理单元71,用于在确定获取的声道信号与声道标识匹配时,播放与声道标识匹配的声道信号;以及在确定获取的声道信号与声道标识不匹配时,基于音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号,并播放生成的与声道标识匹配的声道信号。
[0184] 处理单元71具体用于:
[0185] 若音频文件为立体声音频文件,则处理单元71在确定声道标识为左声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的左声道信号;或者,处理单元在确定声道标识为右声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的右声道信号;
[0186] 若音频文件为单声道音频文件,则处理单元71在确定声道标识为中声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放单声道音频文件中的单声道信号。
[0187] 在确定获取的声道信号与声道标识不匹配时,处理单元71具体用于:
[0188] 若音频文件为立体声音频文件,则处理单元71根据立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号;
[0189] 若音频文件为单声道音频文件,则处理单元71先采用全通滤波方式将单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号。
[0190] 若音频文件为立体声音频文件且声道标识为中声道的标识,则处理单元71具体用于:
[0191] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0192] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0193] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0194] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
[0195] 将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
[0196] 若音频文件为立体声音频文件或单声道音频文件,且声道标识为左后声道的标识或右后声道的标识,则处理单元71具体用于:
[0197] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0198] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0199] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0200] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
[0201] 若声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
[0202] 若声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
[0203] 参阅图8所示,为实现上述步骤400-步骤430,本发明实施例中提供了一种移动设备,该移动设备包括存储器80和处理器81,其中,
[0204] 存储器80,用于存储音频文件,以及存储预先设置的声道标识;
[0205] 处理器81,用于获取音频文件,并获取音频文件中包含的声道信号,以及获取预先存储的声道标识;在确定获取的声道信号与声道标识匹配时,播放与声道标识匹配的声道信号;以及在确定获取的声道信号与声道标识不匹配时,基于音频文件包含的声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号,并播放生成的与声道标识匹配的声道信号。
[0206] 处理器81具体用于:
[0207] 若音频文件为立体声音频文件,则处理器81在确定声道标识为左声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的左声道信号;或者,处理器在确定声道标识为右声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放立体声音频文件中包含的右声道信号;
[0208] 若音频文件为单声道音频文件,则处理器81在确定声道标识为中声道的标识时,确认获取的声道信号与声道标识匹配,并直接播放单声道音频文件中的单声道信号。
[0209] 在确定获取的声道信号与声道标识不匹配时,处理器81具体用于包括:
[0210] 若音频文件为立体声音频文件,则处理器81根据立体声音频文件中包含的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号;
[0211] 若音频文件为单声道音频文件,则处理器81先采用全通滤波方式将单声道音频文件中包含的单声道信号分别转换为左声道信号和右声道信号,再基于转换后的左声道信号和右声道信号对应的联合协方差矩阵系数及联合协方差角度,生成与声道标识匹配的声道信号。
[0212] 若音频文件为立体声音频文件且声道标识为中声道的标识,则处理器81具体用于:
[0213] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0214] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0215] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0216] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算每一种子带规格对应的中声道子带频域信号;
[0217] 将获得的各个中声道子带频域信号进行合并,得到中声道频域信号,并将中声道频域信号进行反频域变换,获得中声道信号。
[0218] 若音频文件为立体声音频文件或单声道音频文件,且声道标识为左后声道的标识或右后声道的标识,则处理器81具体用于:
[0219] 将当前帧的左声道信号转换为左声道频域信号,以及将当前帧的右声道信号转换为右声道频域信号;
[0220] 将转换后的左声道频域信号和右声道频域信号分别基于相同的子带规格划分为多个子带频域信号,并分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号生成相应子带规格的联合协方差矩阵系数,以及分别对每一种子带规格对应的联合协方差矩阵系数进行平滑处理,获得每一种子带规格对应的平滑联合协方差矩阵系数;
[0221] 分别根据每一种子带规格的平滑联合协方差矩阵系数,计算每一种子带规格对应的联合协方差角度,以及分别对每一种子带规格对应的联合协方差角度进行帧间平滑,得到每一种子带规格对应的平滑联合协方差角度;
[0222] 分别根据每一种子带规格对应的左声道子带频域信号和右声道子带频域信号,以及每一种子带规格对应的平滑联合协方差角度,计算出每一种子带规格对应的后声道子带频域信号;
[0223] 若声道标识为左后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和左声道子带频域信号,计算获得每一种子带规格对应的左后声道子带频域信号,再将获得的各个左后声道子带频域信号进行合并,得到左后声道频域信号,以及将左后声道频域信号进行反频域变换,获得左后声道信号;
[0224] 若声道标识为右后声道的标识,则分别根据获得的每一种子带规格对应的后声道子带频域信号和右声道子带频域信号,计算获得每一种子带规格对应的右后声道子带频域信号,再将获得的各个右后声道子带频域信号进行合并,得到右后声道频域信号,以及将右后声道频域信号进行反频域变换,获得右后声道信号。
[0225] 综上所述,本发明实施例中,每个移动设备首先确定自身负责播放的声道标识,然后,若确定获得的音频文件中包含有与本地声道标识匹配的声道信号,则直接播放该声道信号,若确定获得的音频文件中未包含有与本地声道标识匹配的声道信号,则基于该声道信号生成与本地声道标识匹配的声道信号并进行播放。这样,避免了每个移动设备都做同样的操作,并且不需要每个移动设备都生成所有声道的信号,从而减小了算法复杂度,有利于降低移动设备的工作负荷,节约了电能;同时,当存在多个移动设备时,又可以确保按照使用需求增加音频文件的声道数目,既提升了音频文件的声场,又提高了音频文件的播放效果。
[0226] 当然,本发明实施例中提供的技术方案可以应用到其他需要将单声道或立体声信号转换为多声道信号的场景中,其算法复杂度低,转换后的声音质量完全可以满足用户需求,并且还可以有效削弱左后声道和右后声道中的人声。
[0227] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0228] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0229] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0230] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0231] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0232] 显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
QQ群二维码
意见反馈