首页 / 专利库 / 残疾人专用配件 / 听觉模型 / 一种基于听觉模型的自适应音频盲水印方法

一种基于听觉模型的自适应音频盲印方法

阅读:361发布:2020-05-11

专利汇可以提供一种基于听觉模型的自适应音频盲印方法专利检索,专利查询,专利分析的服务。并且一种基于 听觉模型 的自适应音频盲 水 印方法:对水印 信号 进行Arnold变换、 降维 处理和混沌变换,得到水印信息;计算人 耳 听觉掩蔽 阈值 ;自适应选取水印嵌入段和嵌入 位置 ;进行数字水印的嵌入;进行音频段重组,将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的 音频信号 ;提取数字水印。本 发明 保证水印信号不影响音频 质量 的前提下嵌入较大 能量 的水印信息,实现了水印嵌入段、水印嵌入位置和水印嵌入强度的自适应选取,在保证 算法 不可 感知 性的同时提高了水印鲁棒性和水印嵌入容量。本发明更为精细的利用了人耳听觉特性,具有更好的隐藏性能。进一步保证了水印的安全性,而且能够有效抵抗常见 信号处理 的攻击。,下面是一种基于听觉模型的自适应音频盲印方法专利的具体信息内容。

1.一种基于听觉模型的自适应音频盲印方法,其特征在于,包括如下步骤:
1)对水印信号进行Arnold变换、降维处理和混沌变换,得到水印信息w:
w={w(i),0≤i≤M×N};
其中,w(i)表示加密后的水印序列,M×N表示水印序列总数;
2)计算人听觉掩蔽阈值
3)自适应选取水印嵌入段和嵌入位置
将水印信息嵌入到频域系数X(jw)的中、低频系数中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于所设限值T的音频段作为水印嵌入段,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前L位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入;
4)进行数字水印的嵌入
采用量化索引调制的方法将L位水印嵌入到所选频域系数中,对嵌入水印后的音频段做逆离散余弦变换和逆离散小波包变换,小波包逆变换后的音频信号表示为A*(k),用A*(k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段载体音频中嵌入水印,直至实现所有的水印嵌入;
5)进行音频段重组
将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号;
6)提取数字水印,包括:
(1)采用步骤2)的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
(2)采用步骤3)的方法找到水印嵌入段和嵌入位置;
(3)采用如下公式提取水印序列:


式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
(4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
2.根据权利要求1所述的一种基于听觉模型的自适应音频盲水印方法,其特征在于,步骤2)包括:
(1)设原始音频信号为A={a(i),1≤i采样点个数,a(i)为音频信号,对音频信号进行分段处理,每段包含2048个采样点,设第k段原始音频信号表示为A(k),采用db8小波基对每一段音频信号进行8级小波包变换,将0~22kHz的频带划分为26个非等宽的子带;
(2)对每个子带的小波包系数进行离散余弦变换,得到频域系数X(jw):
X(jw)=DCT(wi(k))
其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
(3)将频域系数X(jw)映射到巴克域:
z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]},
其中,f表示频率,z表示巴克域各子带编号,
计算各个子带的能量值Spz(z):

其中,|X(jw)|2表示临界频带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率;
(4)将各个子带的能量值Spz(z)调整为Sm(z)=Spz(z)×B(z),
其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
(5)计算每个子带的噪声特性因子a(z):a(z)=min[10lg(G/A)/Smax,1]
其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0;考虑噪声特性因子后的掩蔽阈值修正值为O(z):O(z)=(14.5+z)a+5.5(1-a);
计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带
样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。
3.根据权利要求1所述的一种基于听觉模型的自适应音频盲水印方法,其特征在于,步骤4)包括:
设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:

式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
4.根据权利要求3所述的一种基于听觉模型的自适应音频盲水印方法,其特征在于,所述的量化步长,是根据噪声掩蔽比为每一个临界子带确定一个量化步长,

说明书全文

一种基于听觉模型的自适应音频盲印方法

技术领域

[0001] 本发明涉及信息隐藏领域。特别是涉及一种用于音频作品版权管理的基于听觉模型的自适应音频盲水印方法。

背景技术

[0002] 信息技术和计算机网络的快速发展引发了一系列信息安全问题、盗版问题等,使得多媒体内容的版权保护和内容认证成为了亟待解决的问题。数字水印技术作为一种有效的解决方案获得了迅速的发展,并且已经成为学术界的一个研究热点。由于人具有更高的灵敏度,使得音频水印技术相比视频和图像水印技术具有更大的挑战。音频水印技术就是将一种特殊的标志信息嵌入到原始数字音频作品中,用以辨识音频作品的版权和合法使用者,从而达到音频作品版权保护的作用。音频水印技术需要满足三个基本要求,即水印的不可感知性、鲁棒性和水印容量,三者之间是相互矛盾的。如何设计方法,使得三者之间达到最佳的平衡一直是音频水印技术的一个难点。当前,数字水印技术大致可以分为两种不同的类型,包括时间域水印嵌入方法和变换域水印嵌入方法。早期的方法选择嵌入在时域部分。它的特点是算法简单,易于实现,但鲁棒性和不可感知性较差。当前主流的音频水印算法是变换域算法,变换域算法在嵌入水印前需要将音频载体信号从时域变换到频域。由于变换域算法考虑了音频载体特性和人耳听觉特性,具有比时域算法更好的鲁棒性和不可感知性。而对于音频这样的时变信号,利用小波分析的多分辨率特性和时频局部特性,相比其他变换域算法具有更好的鲁棒性,已经成为音频水印算法的研究热点。近年来有不少学者将压缩感知、奇异值分解、量化索引调制、神经网络和人耳掩蔽效应等方法应用到变换域算法中,进一步提高了变换域算法的性能。
[0003] 尽管当前水印算法已经获得了很好的鲁棒性和不可感知性,但是多数算法对水印嵌入容量问题考虑较少。如何设计算法使得水印在鲁棒性、不可感知性和嵌入容量三者之间达到最佳的平衡依然需要做进一步的研究和探索。此外,大多数算法根据一般经验和实验效果选择将水印嵌入在整个音频段的固定频率点,嵌入位置不是自适应的。

发明内容

[0004] 本发明所要解决的技术问题是提供了一种鲁棒性和透明性好、隐藏容量大的基于听觉模型的自适应音频盲水印方法。
[0005] 本发明所采用的技术方案是:一种基于听觉模型的自适应音频盲水印方法,包括如下步骤:
[0006] 1)对水印信号进行Arnold变换、降维处理和混沌变换,得到水印信息w:
[0007] w={w(i),0≤i≤M×N};
[0008] 其中,w(i)表示加密后的水印序列,M×N表示水印序列总数;
[0009] 2)计算人耳听觉掩蔽阈值
[0010] 3)自适应选取水印嵌入段和嵌入位置:
[0011] 将水印信息嵌入到频域系数X(jw)的中、低频系数中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于所设限值T的音频段作为水印嵌入段,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前L位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入;
[0012] 4)进行数字水印的嵌入
[0013] 采用量化索引调制的方法将L位水印嵌入到所选频域系数中,对嵌入水印后的音频段做逆离散余弦变换和逆离散小波包变换,小波包逆变换后的音频信号表示为A*(k),用*A(k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段载体音频中嵌入水印,直至实现所有的水印嵌入;
[0014] 5)进行音频段重组
[0015] 将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号;
[0016] 6)提取数字水印,包括:
[0017] (1)采用步骤2)的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
[0018] (2)采用步骤3)的方法找到水印嵌入段和嵌入位置;
[0019] (3)采用如下公式提取水印序列:
[0020]
[0021]
[0022] 式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
[0023] (4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
[0024] 骤2)包括:
[0025] (1)设原始音频信号为A={a(i),1≤i采样点个数,a(i)为音频信号,对音频信号进行分段处理,每段包含2048个采样点,设第k段原始音频信号表示为A(k),采用db8小波基对每一段音频信号进行8级小波包变换,将0~22kHz的频带划分为26个非等宽的子带;
[0026] (2)对每个子带的小波包系数进行离散余弦变换,得到频域系数X(jw):
[0027] X(jw)=DCT(wi(k))
[0028] 其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
[0029] (3)将频域系数X(jw)映射到巴克域:
[0030] z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]},
[0031] 其中,f表示频率,z表示巴克域各子带编号,
[0032] 计算各个子带的能量值Spz(z):
[0033]
[0034] 其中,|X(jw)|2表示临界频带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率;
[0035] (4)将各个子带的能量值Spz(z)调整为Sm(z)=Spz(z)×B(z),
[0036] 其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
[0037] (5)计算每个子带的噪声特性因子a(z):a(z)=min[10lg(G/A)/Smax,1][0038] 其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0;考虑噪声特性因子后的掩蔽阈值修正值为O(z):O(z)=(14.5+z)a+5.5(1-a);
[0039] 计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。
[0040] 步骤4)包括:
[0041] 设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:
[0042]
[0043] 式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
[0044] 根据权利要求3所述的一种基于听觉模型的自适应音频盲水印方法,其特征在于,所述的量化步长,是根据噪声掩蔽比为每一个临界子带确定一个量化步长,[0045] 本发明的一种基于听觉模型的自适应音频盲水印方法,将水印嵌入在DWPT和DCT的混合域,利用掩蔽阈值确定水印嵌入段和具体嵌入位置。根据噪声掩蔽比对水印嵌入强度进行了调制,保证水印信号不影响音频质量的前提下嵌入较大能量的水印信息,实现了水印嵌入段、水印嵌入位置和水印嵌入强度的自适应选取,在保证算法不可感知性的同时提高了水印鲁棒性和水印嵌入容量。本发明更为精细的利用了人耳听觉特性,具有更好的隐藏性能。对于数字水印,采用Logistic加密,同时结合Arnold变换实现了水印双重加密,进一步保证了水印的安全性。实验表明本发明所提算法不仅具有较好的不可感知性和较大的水印容量,而且能够有效抵抗常见信号处理的攻击,具有很好的鲁棒性。附图说明
[0046] 图1是本发明一种基于听觉模型的自适应音频盲水印方法的流程图
[0047] 图2是本发明实施例原始音频信号波形图;
[0048] 图3是本发明实施例含水印音频信号波形图;
[0049] 图4是本发明实施例含水印音频信号与原始音频信号差值波形图。

具体实施方式

[0050] 下面结合实施例和附图对本发明的一种基于听觉模型的自适应音频盲水印方法做出详细说明。
[0051] 如图1所示,本发明的一种基于听觉模型的自适应音频盲水印方法,包括如下步骤:
[0052] 1)对水印信号进行Arnold变换、降维处理和混沌变换,得到水印信息w。
[0053] 设M0是原始水印信号,表示为M0={m0(i,j),0≤i
[0054] 为了进一步提高水印的抗攻击能,本发明使用Logistic方程得到混沌序列,将此序列与降维后的图像水印序列v(k)做异或运算。经Logistic加密后的水印表示为:
[0055] w={w(i),0≤i≤M×N}
[0056] 其中,w(i)表示加密后的水印序列,M×N为水印序列总数。
[0057] 本发明将混沌序列的初值、参数和Arnold变换次数作为秘钥,在提取水印时利用这些秘钥可以重新获得水印序列。
[0058] 2)计算人耳听觉掩蔽阈值
[0059] 人耳存在掩蔽效应,当存在能量相差一定程度的两个或多个激励声音同时作用于人类听觉系统时,弱音就会被强音掩蔽掉,变得不可感知,这种现象称为同时掩蔽(或频率掩蔽)效应。当水印能量被限制在掩蔽阈值以下时,就能保证水印的不可感知性。心理声学模型中子带划分应尽可能接近人耳临界频带,而小波包分解的多分辨率特性满足这个要求,所以本发明选择在小波包域中计算掩蔽阈值。本发明采用了文献[1]提出的一种简单的心理声学模型,并在此基础上进行了改进,将小波包变换引入了心理声学模型,将整个频带划分成26个不等宽的子带,使得子带带宽接近人耳临界频带带宽。具体计算步骤如下:
[0060] (1)设原始音频信号为A={a(i),1≤i
[0061] (2)对每个子带的小波包系数进行离散余弦变换(DCT),得到频域系数X(jw):
[0062] X(jw)=DCT(wi(k))
[0063] 其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
[0064] (3)将频域系数X(jw)映射到巴克(Bark)域:
[0065] z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
[0066] 其中,f表示频率,z表示巴克(Bark)域各子带编号。
[0067] 计算各个子带的能量值Spz(z):
[0068]
[0069] 其中|X(jw)|2表示临界子带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率。
[0070] (4)由人耳感知特性知,某个子带内的信号会受到相邻子带信号的影响,将各个子带的能量值Spz(z)调整为
[0071] Sm(z)=Spz(z)×B(z)
[0072] 其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
[0073] (5)掩蔽阈值的计算与音频的噪声特性有关,计算每个子带的噪声特性因子a(z):
[0074] a(z)=min[10lg(G/A)/Smax,1]
[0075] 其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0。
[0076] 由人耳掩蔽效应知,当纯音掩蔽噪声时,掩蔽阈值大约下降14.5+zdb;当噪声掩蔽纯音时,掩蔽阈值下降5.5db。考虑噪声特性因子后的掩蔽阈值修正值为:O(z)=(14.5+z)a+5.5(1-a)
[0077] 计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。本发明根据所求掩蔽阈值自适应确定水印嵌入段、具体嵌入位置和水印嵌入强度。
[0078] 3)根据听觉掩蔽阈值自适应选取水印嵌入段和嵌入位置:
[0079] 音频信号是非平稳信号,每个音频段对噪声的敏感程度不同,如果水印嵌入在整个音频段,势必降低音频信号的信噪比。为此,本发明提出一种水印嵌入段选择方案来提高水印的性能。在确定水印嵌入位置上,已有算法大多根据人耳掩蔽效应给出大致的嵌入范围,没有精确给出不容易被感知的频率位置。本发明所提算法利用频域掩蔽效应来精确确定水印嵌入位置,具有更好的不可感知性。
[0080] 根据听觉模型,当一音频信号中可被掩蔽的频率分量足够多时,说明该音频段噪声敏感度低,可用来隐藏水印信息。由于中低频系数集中了音频信号的大部分能量,而常见音频信号处理大多在高频部分进行(如压缩、滤波等)。考虑到算法的鲁棒性,本发明将水印信息嵌入到频域系数X(jw)的中、低频系数(第0~12Bark)中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于所设门限值T的音频段作为水印嵌入段,由频域掩蔽效应知:幅值越大的频域系数,它两侧的频率分量越容易被掩蔽。因此,本算法在选定音频数据段后,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前L位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入。
[0081] 4)进行数字水印的嵌入
[0082] 采用量化索引调制的方法将水印嵌入到所选频域系数中;包括:
[0083] 设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:
[0084]
[0085] 式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
[0086] 这里,量化步长的选取关系算法的不可感知性和鲁棒性,量化步长越小不可感知性越好,但降低了鲁棒性;量化步长越大抗攻击能力越强,但不可感知性越差。本发明利用心理声学模型的噪声掩蔽比为每一个临界子带自适应确定水印嵌入强度。
[0087] 文献[2]通过对嵌入水印的音频信号设置不同的噪声掩蔽比,分析了嵌入水印对音频质量的影响。实验结果证明如果嵌入水印后的音频噪声掩蔽比NMR小于等于-5db,则音频失真将是不可感知的。基于此,本发明设计了一种根据噪声掩蔽比自适应确定水印嵌入强度的方法。
[0088] 所述的量化步长,是根据噪声掩蔽比为每一个临界子带确定一个量化步长,本发明中临界子带的量化噪声由该子带内的频带引入量化噪声的最大值确定,每个临界子带的噪声掩蔽比为:
[0089]
[0090] NMR(i)=Ens(i)-Thr(i)
[0091] 其中,i表示临界子带号,j表示嵌入水印的频率点。Ens(i)和NMR(i)分别表示第i个临界子带的噪声和噪声掩蔽比。E0(i,j)为原始音频信号能量,Ew(i,j)为含水印音频信号能量,Thr(i)为第i个临界子带的掩蔽阈值。根据量化策略,每个系数的量化误差不超过△/2,即eq∈[0,△/2)。
[0092] 由于|fk*-fk|≤△/2,则有Ens≤△2/4,为使得临界子带内信号的失真不被人耳感知,需满足 据此可得出水印量化步长满足 本发明取
[0093] 由上式可知,水印嵌入强度随掩蔽阈值的变化而变化。掩蔽阈值越大,越容易掩蔽噪声,所以可以有较大的量化步长,从而实现了水印嵌入强度与掩蔽效应的自适应性。
[0094] 重复上述过程直到L位水印信息全部嵌入后,对嵌入水印的音频段频域系数作做* *逆离散余弦变换和离散小波包重构,小波包逆变换后的音频信号表示为A (k),用A(k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段嵌入水印,直至实现所有的水印嵌入。
[0095] 5)进行音频段重组
[0096] 将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号。
[0097] 6)提取数字水印,本发明采用的数字水印提取方法是一种盲水印算法,即水印提取过程不需要原始音频载体。包括:
[0098] (1)采用步骤2)的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
[0099] (2)采用步骤3)的方法找到水印嵌入段和嵌入位置,由于水印对宿主信号的影响较小,使得水印嵌入前后的掩蔽阈值误差基本可以忽略;
[0100] (3)采用如下公式提取水印序列:
[0101]
[0102]
[0103] 式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
[0104] (4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
[0105] 下面给出最佳实例:
[0106] 1.选取40×40的二值图像做为水印,对水印信号进行Arnold变换、降维处理和混沌变换,得到水印信息w:
[0107] w={w(i),0≤i≤M×N}
[0108] 其中,w(i)表示加密后的水印序列,M×N表示水印序列总数。
[0109] 2.计算人耳听觉掩蔽阈值;
[0110] (1)设原始音频信号为A={a(i),1≤i节点和频率边界值。由表可知子带带宽接近人耳临界频带带宽。
[0111] 表1小波包变换的子带分解
[0112]
[0113] (2)对每个子带的小波包系数进行离散余弦变换,得到频域系数X(jw):
[0114] X(jw)=DCT(wi(k))
[0115] 其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
[0116] (3)将频域系数X(jw)映射到巴克域:
[0117] z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
[0118] 其中,f表示频率,z表示巴克域各子带编号。
[0119] 计算各个子带的能量值Spz(z):
[0120]
[0121] 其中,|X(jw)|2表示临界子带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率;
[0122] (4)将各个子带的能量值Spz(z)调整为Sm(z)=Spz(z)×B(z),
[0123] 其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
[0124] (5)计算每个子带的噪声特性因子a(z):a(z)=min[10lg(G/A)/Smax,1][0125] 其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0;考虑噪声特性因子后的掩蔽阈值修正值为:
[0126] O(z)=(14.5+z)a+5.5(1-a)。
[0127] 计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。
[0128] 3.根据掩蔽阈值自适应选取水印嵌入段和嵌入位置:
[0129] 将水印信息嵌入到频域系数X(jw)的中、低频系数中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于61的音频段作为水印嵌入段,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前46位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入。
[0130] 4.进行数字水印的嵌入
[0131] 采用量化索引调制的方法将46位水印嵌入到所选频域系数中,设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:
[0132]
[0133] 式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
[0134] 本发明利用心理声学模型的噪声掩蔽比为每一个临界子带自适应确定水印嵌入强度,量化步长取
[0135] 对嵌入水印后的音频段做逆离散余弦变换和逆离散小波包变换,小波包逆变换后* *的音频信号表示为A (k),用A (k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段音频信号中嵌入水印,直至实现所有的水印嵌入。
[0136] 5.进行音频段重组
[0137] 将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号。
[0138] 6.提取数字水印,包括:
[0139] (1)采用步骤2的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
[0140] (2)采用步骤3的方法找到水印嵌入段和嵌入位置;
[0141] (3)采用如下公式提取水印序列:
[0142]
[0143]
[0144] 式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
[0145] (4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
[0146] 为了测试本发明的性能,选取了三种不同类型的载体音频文件分别为流行音乐、古典音乐和摇滚音乐,它们的采样频率均为44.1kHz;量化精度为16位;格式为单声道。以流行音乐为例,图2、图3、图4分别是原始音频信号、含水印音频信号和二者的差值信号的波形图。由图可见,含水印的音频信号波形图与原始音频信号波形图之间差异很小。水印嵌入后基本察觉不到音频质量的失真。为了更好的评价本方法性能,我们将本发明提出的基于DWPT-DCT的水印方法与传统的基于心理声学模型的水印方法和当前流行的DWT-SVD方法,从不可感知性、水印容量和鲁棒性三个方面进行了比较。
[0147] (1)不可感知性对比
[0148] 本发明采用信噪比和平均分段信噪比来评价水印对宿主信号的影响。定义如下:
[0149]
[0150]
[0151] 其中S'(i)为嵌入水印后的系数,S(i)为原始音频信号系数,K为水印嵌入所需音频帧数,N为一帧音频信号包含的采样点个数。SegSNR表示每帧含水印音频信号的信噪比均值,相比SNR,SegSNR能够更好的反映水印信息对原始音频信号的影响。由公式可知,频域系数的改变量决定了信噪比。设某个频域系数的修改增量为e,其引入的噪声能量为e2,根据量化原理,系数的量化噪声是均匀分布的,它的期望值 设某帧音频信号的能量为Eg,我们可以据此来估计嵌入水印帧的信噪比上限为:
[0152]
[0153] 联立量化步长的求解公式,可得嵌入水印的每帧音频信噪比上限为:
[0154] SNR≤10lg{4Eg/(Thr·L)}+5
[0155] 针对流行音乐、古典音乐、摇滚音乐三种音乐类型,实测的信噪比分别为34.23db,29.62db,32.81db;分段信噪比均值分别为32.58db,28.26db,30.95db。实验表明本方法所得分段信噪比均在理论上限值之下,并且大于20db。本发明信噪比平均高于文献[3]7~
8db,高于文献[4]1~4db。
[0156] (2)水印容量分析
[0157] 水印嵌入容量的计算公式为 其中,Nw=40×40,它表示嵌入的水印量,T为水印嵌入完成所需要的时间。水印嵌入率为100%时,不同类型音频载体的水印嵌入容量分别为流行音乐(689.5bps),古典音乐(576.7bps),摇滚音乐(668.9bps)。文献[3]在1600个采样点中嵌入1bit水印信息,水印嵌入容量只有27.56bps。文献[4]在512个采样点中嵌入8bit水印,水印嵌入容量为689.06bps,相比之下本发明水印嵌入容量远远高于文献[3]提出的方法,与文献[4]提出的方法嵌入容量相当。
[0158] (3)水印鲁棒性分析
[0159] 为了测试水印抵抗常见信号处理的攻击能力,本发明对嵌入水印的音频信号做如下处理:(1)叠加噪声:对数字音频信号在时域中加入高斯白噪声,信噪比为20db。(2)重采样:先下采样至22.05kHz,再上采样至44.1kHz。(3)重量化:先将音频信号从16bit量化为8bit,再从8bit量化为16bit。(4)mp3音频压缩:先对音频信号进行压缩,再解压缩(比特率为128kbps)。(5)低通滤波,截止频率为8kHz。本发明比较了所提方法与文献[3]和[4]对常见信号处理与攻击的抵抗能力,对三种方法选取相同的宿主音乐(流行音乐)和水印图像,在满足水印不被感知的条件下测得它们的NC值如表3所示。由表可知,本发明与文献[4]水印容量相当的情况下具有更好的鲁棒性。尽管本发明在水印容量上要远远高于文献[3],但是水印鲁棒性并不差于文献[3]。
[0160] 表2不同音乐类型的抗攻击能力
[0161]
[0162] 表3不同方法的抗攻击能力
[0163]
[0164]
[0165] 相关文献如下:
[0166] 1、Johnston J D.Transform coding of audio signals using perceptual noise criteria[J].IEEE Journal on Selected Areas in Communications,1988,6(2):314-323.
[0167] 2、Arnold M.Quality evaluation of watermarked audio tracks[J].Proceedings of SPIE-The International Society for Optical Engineering,2002,4675:91-101.
[0168] 3、Cai Y M,Guo W Q,Ding H Y.An audio blind watermarking scheme based on DWT-SVD[J].Journal of Software,2013,8(7).1801-1808.
[0169] 4、李榕,王宏霞,赵鹏君.基于心理声学模型的自适应音频数字水印算法[C].全国信息隐藏暨多媒体信息安全学术大.2010.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈