[0061] (2)对每个子带的小波包系数进行离散余弦变换(DCT),得到频域系数X(jw):
[0062] X(jw)=DCT(wi(k))
[0063] 其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
[0064] (3)将频域系数X(jw)映射到巴克(Bark)域:
[0065] z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
[0066] 其中,f表示频率,z表示巴克(Bark)域各子带编号。
[0067] 计算各个子带的能量值Spz(z):
[0068]
[0069] 其中|X(jw)|2表示临界子带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率。
[0070] (4)由人耳感知特性知,某个子带内的信号会受到相邻子带信号的影响,将各个子带的能量值Spz(z)调整为
[0071] Sm(z)=Spz(z)×B(z)
[0072] 其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
[0073] (5)掩蔽阈值的计算与音频的噪声特性有关,计算每个子带的噪声特性因子a(z):
[0074] a(z)=min[10lg(G/A)/Smax,1]
[0075] 其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0。
[0076] 由人耳掩蔽效应知,当纯音掩蔽噪声时,掩蔽阈值大约下降14.5+zdb;当噪声掩蔽纯音时,掩蔽阈值下降5.5db。考虑噪声特性因子后的掩蔽阈值修正值为:O(z)=(14.5+z)a+5.5(1-a)
[0077] 计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。本发明根据所求掩蔽阈值自适应确定水印嵌入段、具体嵌入位置和水印嵌入强度。
[0078] 3)根据听觉掩蔽阈值自适应选取水印嵌入段和嵌入位置:
[0079] 音频信号是非平稳信号,每个音频段对噪声的敏感程度不同,如果水印嵌入在整个音频段,势必降低音频信号的
信噪比。为此,本发明提出一种水印嵌入段选择方案来提高水印的性能。在确定水印嵌入位置上,已有算法大多根据人耳掩蔽效应给出大致的嵌入范围,没有精确给出不容易被感知的频率位置。本发明所提算法利用频域掩蔽效应来精确确定水印嵌入位置,具有更好的不可感知性。
[0080] 根据听觉模型,当一
帧音频信号中可被掩蔽的频率分量足够多时,说明该音频段噪声敏感度低,可用来隐藏水印信息。由于中低频系数集中了音频信号的大部分能量,而常见
音频信号处理大多在高频部分进行(如压缩、滤波等)。考虑到算法的鲁棒性,本发明将水印信息嵌入到频域系数X(jw)的中、低频系数(第0~12Bark)中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于所设门限值T的音频段作为水印嵌入段,由频域掩蔽效应知:幅值越大的频域系数,它两侧的频率分量越容易被掩蔽。因此,本算法在
选定音频数据段后,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前L位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入。
[0081] 4)进行数字水印的嵌入
[0082] 采用量化索引调制的方法将水印嵌入到所选频域系数中;包括:
[0083] 设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:
[0084]
[0085] 式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
[0086] 这里,量化步长的选取关系算法的不可感知性和鲁棒性,量化步长越小不可感知性越好,但降低了鲁棒性;量化步长越大抗攻击能力越强,但不可感知性越差。本发明利用心理声学模型的噪声掩蔽比为每一个临界子带自适应确定水印嵌入强度。
[0087] 文献[2]通过对嵌入水印的音频信号设置不同的噪声掩蔽比,分析了嵌入水印对音频质量的影响。实验结果证明如果嵌入水印后的音频噪声掩蔽比NMR小于等于-5db,则音频失真将是不可感知的。基于此,本发明设计了一种根据噪声掩蔽比自适应确定水印嵌入强度的方法。
[0088] 所述的量化步长,是根据噪声掩蔽比为每一个临界子带确定一个量化步长,本发明中临界子带的量化噪声由该子带内的频带引入量化噪声的最大值确定,每个临界子带的噪声掩蔽比为:
[0089]
[0090] NMR(i)=Ens(i)-Thr(i)
[0091] 其中,i表示临界子带号,j表示嵌入水印的频率点。Ens(i)和NMR(i)分别表示第i个临界子带的噪声和噪声掩蔽比。E0(i,j)为原始音频信号能量,Ew(i,j)为含水印音频信号能量,Thr(i)为第i个临界子带的掩蔽阈值。根据量化策略,每个系数的量化误差不超过△/2,即eq∈[0,△/2)。
[0092] 由于|fk*-fk|≤△/2,则有Ens≤△2/4,为使得临界子带内信号的失真不被人耳感知,需满足 据此可得出水印量化步长满足 本发明取
[0093] 由上式可知,水印嵌入强度随掩蔽阈值的变化而变化。掩蔽阈值越大,越容易掩蔽噪声,所以可以有较大的量化步长,从而实现了水印嵌入强度与掩蔽效应的自适应性。
[0094] 重复上述过程直到L位水印信息全部嵌入后,对嵌入水印的音频段频域系数作做* *逆离散余弦变换和离散小波包重构,小波包逆变换后的音频信号表示为A (k),用A(k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段嵌入水印,直至实现所有的水印嵌入。
[0095] 5)进行音频段重组
[0096] 将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号。
[0097] 6)提取数字水印,本发明采用的数字水印提取方法是一种盲水印算法,即水印提取过程不需要原始音频载体。包括:
[0098] (1)采用步骤2)的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
[0099] (2)采用步骤3)的方法找到水印嵌入段和嵌入位置,由于水印对宿主信号的影响较小,使得水印嵌入前后的掩蔽阈值误差基本可以忽略;
[0100] (3)采用如下公式提取水印序列:
[0101]
[0102]
[0103] 式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
[0104] (4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
[0105] 下面给出最佳实例:
[0106] 1.选取40×40的二值图像做为水印,对水印信号进行Arnold变换、降维处理和混沌变换,得到水印信息w:
[0107] w={w(i),0≤i≤M×N}
[0108] 其中,w(i)表示加密后的水印序列,M×N表示水印序列总数。
[0109] 2.计算人耳听觉掩蔽阈值;
[0110] (1)设原始音频信号为A={a(i),1≤i节点和频率边界值。由表可知子带带宽接近人耳临界频带带宽。
[0111] 表1小波包变换的子带分解
[0112]
[0113] (2)对每个子带的小波包系数进行离散余弦变换,得到频域系数X(jw):
[0114] X(jw)=DCT(wi(k))
[0115] 其中,wi(k)表示小波包分解后第i个子带中的第k个小波包系数,X(jw)表示DCT变换后的频域系数;
[0116] (3)将频域系数X(jw)映射到巴克域:
[0117] z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
[0118] 其中,f表示频率,z表示巴克域各子带编号。
[0119] 计算各个子带的能量值Spz(z):
[0120]
[0121] 其中,|X(jw)|2表示临界子带对应采样点的功率值,hbz和lbz分别表示各子带的上下边界频率;
[0122] (4)将各个子带的能量值Spz(z)调整为Sm(z)=Spz(z)×B(z),
[0123] 其中B(z)为扩展函数,B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
[0124] (5)计算每个子带的噪声特性因子a(z):a(z)=min[10lg(G/A)/Smax,1][0125] 其中,A为功率谱的算术平均值,G为功率谱的几何平均值,当音频信号为纯音时,a(z)=1;白噪声时,a(z)=0;考虑噪声特性因子后的掩蔽阈值修正值为:
[0126] O(z)=(14.5+z)a+5.5(1-a)。
[0127] 计算每个子带的实际掩蔽阈值T(z): 求实际掩蔽阈值T(z)与子带样点个数的商,并将所述的商与绝对掩蔽阈值进行比较,将二者中值大的作为最终的掩蔽阈值Thr(z):Thr(z)=max(T,TH)。
[0128] 3.根据掩蔽阈值自适应选取水印嵌入段和嵌入位置:
[0129] 将水印信息嵌入到频域系数X(jw)的中、低频系数中,计算每个子带中能量值Spz(z)低于掩蔽阈值Thr(z)的中、低频频率分量的总数,选择频率分量总数高于61的音频段作为水印嵌入段,将能量值小于掩蔽阈值的频率分量从大到小进行排序,选取前46位频率分量Fk={fk(i),1≤i≤L}进行水印嵌入。
[0130] 4.进行数字水印的嵌入
[0131] 采用量化索引调制的方法将46位水印嵌入到所选频域系数中,设第k段音频信号量化后的频域系数表示为Fk={fk*(i),1≤i≤L},量化规则为:
[0132]
[0133] 式中,w是水印信息,fk*(i)是第k段音频信号量化后的系数,fk(i)是原始音频的频域系数,△是量化步长,根据量化原理,最大量化误差为0.5△。
[0134] 本发明利用心理声学模型的噪声掩蔽比为每一个临界子带自适应确定水印嵌入强度,量化步长取
[0135] 对嵌入水印后的音频段做逆离散余弦变换和逆离散小波包变换,小波包逆变换后* *的音频信号表示为A (k),用A (k)代替A(k)完成一段音频信号的水印嵌入。然后,继续在满足条件的下一段音频信号中嵌入水印,直至实现所有的水印嵌入。
[0136] 5.进行音频段重组
[0137] 将所有未嵌入水印的音频段和嵌入水印的音频段进行重组,组合成含有全部水印的音频信号。
[0138] 6.提取数字水印,包括:
[0139] (1)采用步骤2的方法对含水印音频信号进行分段处理和小波包变换,并计算每一段音频信号的听觉掩蔽阈值;
[0140] (2)采用步骤3的方法找到水印嵌入段和嵌入位置;
[0141] (3)采用如下公式提取水印序列:
[0142]
[0143]
[0144] 式中fk*(i)是第k段待测音频信号的频域系数,△*是第k段待测音频信号的量化步长;
[0145] (4)对提取的水印序列进行升维、逆Arnold变换和Logistic解密操作,得到最终的水印图像。
[0146] 为了测试本发明的性能,选取了三种不同类型的载体音频文件分别为流行音乐、古典音乐和摇滚音乐,它们的
采样频率均为44.1kHz;量化
精度为16位;格式为单声道。以流行音乐为例,图2、图3、图4分别是原始音频信号、含水印音频信号和二者的差值信号的波形图。由图可见,含水印的音频信号波形图与原始音频信号波形图之间差异很小。水印嵌入后基本察觉不到音频质量的失真。为了更好的评价本方法性能,我们将本发明提出的基于DWPT-DCT的水印方法与传统的基于心理声学模型的水印方法和当前流行的DWT-SVD方法,从不可感知性、水印容量和鲁棒性三个方面进行了比较。
[0147] (1)不可感知性对比
[0148] 本发明采用信噪比和平均分段信噪比来评价水印对宿主信号的影响。定义如下:
[0149]
[0150]
[0151] 其中S'(i)为嵌入水印后的系数,S(i)为原始音频信号系数,K为水印嵌入所需音频帧数,N为一帧音频信号包含的采样点个数。SegSNR表示每帧含水印音频信号的信噪比均值,相比SNR,SegSNR能够更好的反映水印信息对原始音频信号的影响。由公式可知,频域系数的改变量决定了信噪比。设某个频域系数的
修改增量为e,其引入的噪声能量为e2,根据量化原理,系数的量化噪声是均匀分布的,它的期望值 设某帧音频信号的能量为Eg,我们可以据此来估计嵌入水印帧的信噪比上限为:
[0152]
[0153] 联立量化步长的求解公式,可得嵌入水印的每帧音频信噪比上限为:
[0154] SNR≤10lg{4Eg/(Thr·L)}+5
[0155] 针
对流行音乐、古典音乐、摇滚音乐三种音乐类型,实测的信噪比分别为34.23db,29.62db,32.81db;分段信噪比均值分别为32.58db,28.26db,30.95db。实验表明本方法所得分段信噪比均在理论上限值之下,并且大于20db。本发明信噪比平均高于文献[3]7~
8db,高于文献[4]1~4db。
[0156] (2)水印容量分析
[0157] 水印嵌入容量的计算公式为 其中,Nw=40×40,它表示嵌入的水印量,T为水印嵌入完成所需要的时间。水印嵌入率为100%时,不同类型音频载体的水印嵌入容量分别为流行音乐(689.5bps),古典音乐(576.7bps),摇滚音乐(668.9bps)。文献[3]在1600个采样点中嵌入1bit水印信息,水印嵌入容量只有27.56bps。文献[4]在512个采样点中嵌入8bit水印,水印嵌入容量为689.06bps,相比之下本发明水印嵌入容量远远高于文献[3]提出的方法,与文献[4]提出的方法嵌入容量相当。
[0158] (3)水印鲁棒性分析
[0159] 为了测试水印抵抗常见信号处理的攻击能力,本发明对嵌入水印的音频信号做如下处理:(1)
叠加噪声:对数字音频信号在时域中加入高斯白噪声,信噪比为20db。(2)重采样:先
下采样至22.05kHz,再上采样至44.1kHz。(3)重量化:先将音频信号从16bit量化为8bit,再从8bit量化为16bit。(4)mp3音频压缩:先对音频信号进行压缩,再解压缩(比特率为128kbps)。(5)低通滤波,截止频率为8kHz。本发明比较了所提方法与文献[3]和[4]对常见信号处理与攻击的抵抗能力,对三种方法选取相同的宿主音乐(流行音乐)和水印图像,在满足水印不被感知的条件下测得它们的NC值如表3所示。由表可知,本发明与文献[4]水印容量相当的情况下具有更好的鲁棒性。尽管本发明在水印容量上要远远高于文献[3],但是水印鲁棒性并不差于文献[3]。
[0160] 表2不同音乐类型的抗攻击能力
[0161]
[0162] 表3不同方法的抗攻击能力
[0163]
[0164]
[0165] 相关文献如下:
[0166] 1、Johnston J D.Transform coding of audio signals using perceptual noise criteria[J].IEEE Journal on Selected Areas in Communications,1988,6(2):314-323.
[0167] 2、Arnold M.Quality evaluation of watermarked audio tracks[J].Proceedings of SPIE-The International Society for Optical Engineering,2002,4675:91-101.
[0168] 3、Cai Y M,Guo W Q,Ding H Y.An audio blind watermarking scheme based on DWT-SVD[J].Journal of Software,2013,8(7).1801-1808.
[0169] 4、李榕,王宏霞,赵鹏君.基于心理声学模型的自适应音频数字水印算法[C].全国信息隐藏暨多媒体信息安全学术大.2010.