音频信号编码装置和译码装置以及音频信号编码和译码方法

申请号 CN98800527.1 申请日 1998-05-14 公开(公告)号 CN1144178C 公开(公告)日 2004-03-31
申请人 松下电器产业株式会社; 发明人 津岛峰生; 则松武志; 石川智一;
摘要 一种音频 信号 编码装置和译码装置以及 音频信号 编码和译码方法,提高在译码装置中即使不使用编码装置的全部信息也可以进行音频信号的再生的编码装置和与其对应的译码装置。将构成编码装置(1)的量化部采用具有由低频、中频、高频的小量化部构成的第1小量化部(501)、进而将第1小量化部(501)的量化误差进行量化处理的第2小量化部(502)和进而将由第1小量化部(501)和第2小量化部(502)进行处理后的量化误差进行量化处理的第3小量化部。
权利要求

1.一种对将输入音频信号进行频率变换而得到的频率特性信号序 列进行矢量量化处理并将音频信号进行编码的音频信号编码装置,其 特征在于:具备至少具有将上述频率特性信号序列或其一部分进行矢 量量化处理的第1级矢量量化器和将上述第1级矢量量化器的量化器 误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元,上 述多级量化单元的各级量化单元具有至少1个以上的分割化矢量量化 器,用于对将上述频率特性信号序列利用各级的分割方式分割为至少2 个以上的在多个级间可以具有重复的部分的频带的多个频带的某一个 频带的系数串进行矢量量化处理。
2.按权利要求1所述的音频信号编码装置,其特征在于:具有将 上述频率特性信号序列进行归一化处理并将其输出供给上述多级量化 单元的归一化单元。
3.按权利要求1或2所述的音频信号编码装置,其特征在于:上 述各级量化单元适当地选择量化误差的能量之和大的频带作为应进行 量化处理的上述频率特性信号序列的分割的频带进行量化处理。
4.按权利要求1或2所述的音频信号编码装置,其特征在于:上 述各级的量化单元,根据人的听觉上的性质即听觉敏感特性,适当地 选择对其重要性高的频带加上大的权重值的量化误差的能量之和大的 频带作为应进行量化处理的上述频率特性信号序列的分割的频带,进 行量化处理。
5.按权利要求1或2所述的音频信号编码装置,其特征在于:在 构成上述多级量化单元的第1级矢量量化器和第2级矢量量化器之间 具有第1量化频带选择部,在上述第2级矢量量化器和上述第3级矢量 量化器之间具有第2量化频带选择部,上述第1量化频带选择部将上 述第1级矢量量化器的量化误差的输出作为其输入,选择应由上述第2 级矢量量化器进行量化处理的频带;上述第2量化频带选择部将上述 第2级矢量量化器的量化误差的输出作为其输入,选择应由上述第3 级矢量量化器进行量化处理的频带。
6.按权利要求5所述的音频信号编码装置,其特征在于:上述多 级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各 系数串,由第I级分割的矢量量化器独立地进行量化处理的多个第I级 的分割矢量量化器,和作为至少一次将应进行量化处理的输入信号的 各频带全部进行量化处理的全频带量化部的第J级矢量量化器。
7.按权利要求1所述的音频信号编码装置,其特征在于:上述多 级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢 量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步 进行矢量量化处理。
8.按权利要求2所述的音频信号编码装置,其特征在于:上述多 级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢 量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步 进行矢量量化处理。
9.按权利要求8所述的音频信号编码装置,其特征在于:上述多 级量化单元的矢量量化器在检索矢量量化处理中的上述代码薄内的最 佳代码时使用的代码间的距离的计算中,使用从上述归一化单元输出 的输入信号的归一化成份作为权重计算该距离,抽出给定最小距离的 代码。
10.按权利要求9所述的音频信号编码装置,其特征在于:上述多 级量化单元的矢量量化器将从上述归一化单元输出的频率特性信号序 列的归一化成份和考虑了人的听觉上的性质即听觉敏感特性的值两者 作为权重计算上述距离,抽出给定最小距离的代码。
11.按权利要求2和8~10中的任一权项所述的音频信号编码装置, 其特征在于:上述归一化单元具有将上述频率特性信号序列的概形大 致地进行归一化处理的频率概形归一化部。
12.按权利要求2和8~10中的任一权项所述的音频信号编码装置, 其特征在于:上述归一化单元具有将上述频率特性信号序列分为多个 连续的单位频带的各成份,并通过用1个值除各单位频带的系数串而 进行归一化的频带振幅归一化部。
13.按权利要求1所述的音频信号编码装置,其特征在于:上述多 级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各 系数串,利用分割化矢量量化器独立地进行量化处理的矢量量化器, 和作为至少一次将应进行量化处理的输入信号的各频带全部进行量化 处理的全频带量化部的矢量量化器。
14.按权利要求13所述的音频信号编码装置,其特征在于:上述 多级量化单元具有由低频区的分割化矢量量化器、中频区的分割化矢 量量化器和高频区的分割化矢量量化器构成的第1矢量量化器,与其 后级连接的第2矢量量化器和与其后级连接的第3矢量量化器,将输 入该多级量化单元的频率特性信号序列分割为3个频带,由上述低频 区的分割化矢量量化器独立地将该3个频带中的低频带成份的频率特 性信号序列进行量化处理,由上述中频区的分割化矢量量化器独立地 将上述3个频带中的中频的频带成份的频率特性信号序列进行量化处 理,由上述高频区的分割化矢量量化器独立地将上述3个频带中的高 频带成份的频率特性信号序列进行量化处理,由构成上述第1矢量量 化器的各分割化矢量量化器计算对频率特性信号序列的量化误差,将 其作为向后级的上述第2矢量量化器的输入,在上述第2矢量量化器 中对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2 矢量量化器的输入的量化误差,将其作为向上述第3矢量量化器的输 入,在上述第3矢量量化器中,对该第3矢量量化器量化的频带宽度 进行量化处理。
15.按权利要求14所述的音频信号编码装置,其特征在于:在构 成上述多级量化单元的第1矢量量化器和第2矢量量化器之间设置第1 量化频带选择部,同时,在上述第2矢量量化器和上述第3矢量量化 器之间设置第2量化频带选择部,上述第1量化频带选择部将上述第1 矢量量化器的输出作为其输入,选择应由上述第2矢量量化器进行量 化处理的频带,上述第2矢量量化器对于由上述第1量化选择部选择 的频带的由上述3个矢量量化器构成的第1矢量量化器的量化误差, 对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2矢 量量化器的输入的量化误差,并将其作为向上述第2量化频带选择部 的输入;上述第2量化频带选择部将上述第2矢量量化器的量化误差 作为输入,选择应由上述第3矢量量化器进行量化处理的频带,上述 第3矢量量化器对于上述第2量化频带选择部选择的频带的上述第2 矢量量化器的量化误差,对该第2矢量量化器量化的频带宽度进行量 化处理。
16.按权利要求14所述的音频信号编码装置,其特征在于:使用 上述低频区的分割化矢量量化器、中频区的分割化矢量量化器和高频 区的分割化矢量量化器构成上述第2矢量量化器或第3矢量量化器, 取代上述第1矢量量化器。
17.一种将权利要求1所述的音频信号编码装置输出的代码作为其 输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信 号译码装置,其特征在于:具有使用上述音频信号编码装置的量化单 元输出的代码的至少一部分进行逆量化处理的逆量化部,和使用作为 该逆量化部的输出的频率特性信号序列将频率特性信号序列变换为与 原来的音频输入信号相当的信号的逆频率变换部。
18.一种将权利要求2所述的音频信号编码装置输出的代码作为其 输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信 号译码装置,其特征在于:具有再生频率特性信号序列的逆量化部, 及使用作为该逆量化部的输出的频率特性信号序列根据作为上述音频 信号编码装置的输出的代码再生归一化成份并将上述频率特性信号序 列与归一化成份相乘而输出的逆归一化部,和接收该逆归一化的输出 并将频率特性信号序列变换为与原来的音频信号相当的信号的逆频率 变换部。
19.一种将权利要求13所述的音频信号编码装置的输出这样的代 码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号 的音频信号译码装置,其特征在于:具有不论构成上述音频信号编码 装置的量化单元的全部还是一部分矢量量化器输出代码时都使用输出 的代码进行逆量化处理的逆量化部。
20.按权利要求19所述的音频信号译码装置,其特征在于:上述 逆量化部在某一级的指定频带的量化代码的逆量化之后,交替地进行 该指定频带的下一级的量化代码的逆量化处理和与该某一级的该指定 频带不同的频带的量化代码的逆量化处理,在不存在该指定频带的下 一级的量化代码时,接着就进行不同的频带的量化代码的逆量化处理; 在不存在与上述指定的频带不同的频带的量化代码时,接着就进行下 一级的量化代码的逆量化处理。
21.一种将权利要求14所述的音频信号编码装置输出的代码作为 其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频 信号译码装置,其特征在于:具有不论从构成上述音频信号编码装置 的第1矢量量化器的3个分割化矢量量化器全部还是一部分输出代码 时都只使用构成上述第1矢量量化器的低频区的分割化矢量量化器的 代码进行逆量化处理的逆量化部。
22.按权利要求21所述的音频信号译码装置,其特征在于:上述 逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢 量量化器的代码外,还使用上述第2矢量量化器的代码进行逆量化处 理。
23.按权利要求22所述的音频信号译码装置,其特征在于:上述 逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢 量量化器的代码和上述第2矢量量化器的代码外,还使用来自构成上 述第1矢量量化器的中频区的分割化矢量量化器的代码进行逆量化处 理。
24.按权利要求23所述的音频信号译码装置,其特征在于:上述 逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢 量量化器的代码、来自上述第2矢量量化器的代码和来自构成上述第1 矢量量化器的中频区的分割化矢量量化器的代码外,还使用来自上述 第3矢量量化器的代码进行逆量化处理。
25.按权利要求24所述的音频信号编码装置,其特征在于:上述 逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢 量量化器的代码、来自上述第2矢量量化器的代码、来自构成上述第1 矢量量化器的中频区的分割化矢量量化器的代码和来自上述第3矢量 量化器的代码外,还使用来自构成上述第1矢量量化器的高频区的分 割化矢量量化器的代码进行逆量化处理。
26.一种接收将输入音频信号进行频率变换而得到的频率特性信号 序列、将其编码而输出并将该输出的代码信号作为输入将其译码从而 再生与原来的输入音频信号相当的信号的音频信号编码和译码方法, 其特征在于:将上述频率特性信号序列分为与至少分割为2个以上的 频带的频带相当的系数串,分别独立地进行量化处理而输出,根据接 收的已量化的信号,通过对与上述分割的频带相当的任意的频带的数 据进行逆量化处理,再生与原来的音频输入信号相当的信号。
27.按权利要求26所述的音频信号编码和译码方法,其特征在于: 上述量化处理分阶段进行,从而将计算出的量化误差进一步进行量化 处理;上述逆量化处理反复交替地进行向扩展频带方向的逆量化处理 和向上述量化处理时量化阶段加深的方向的逆量化处理。
28.按权利要求27所述的音频信号编码和译码方法,其特征在于: 向扩展上述频带方向的逆量化处理按考虑了人的听觉心理特性的顺序 扩展频带而进行。
29.按权利要求26~28中的任一权项所述的音频信号编码和译码 方法,其特征在于:在编码侧,将上述频率特性信号序列归一化后, 将该频率特性信号序列分为与至少分割为2个以上的频带的频带相当 的系数串,进行分别独立地量化而输出的处理;在译码侧,使用关于 上述编码侧的归一化的代码,将上述编码侧的代码进行逆归一化处理 后,对该逆归一化处理后的代码,通过对与上述分割的频带相当的任 意的频带的数据进行逆量化处理,再生与原来的音频输入信号相当的 信号。
30.一种对将输入音频信号进行频率变换而得到的频率特性信号序 列进行归一化和矢量量化处理并将音频信号进行编码的音频信号编码 装置,其特征在于:具备至少具有将上述频率特性信号序列或其一部 分进行归一化和矢量量化处理的第1级归一化及矢量量化器、和将上 述第1级归一化及矢量量化器的量化误差进行归一化及矢量量化处理 的第2级归一化及矢量量化器的多级量化单元,上述多级量化单元的 各级量化单元具有至少1个以上的分割化的归一化及矢量量化器,该 分割化的归一化及矢量量化器将利用各级的分割方式将上述频率特性 信号序列分割为至少2个以上的在多个级间具有叠加的部分的频带的 多个频带中的某个频带的系数串进行归一化及矢量量化处理。
31.按权利要求30所述的音频信号编码装置,其特征在于:在构 成上述多级量化单元的第1级归一化及矢量量化器和第2级归一化及 矢量量化器之间具有第1量化频带选择部,在上述第2级归一化及矢 量量化器和上述第3级归一化及矢量量化器之间具有第2量化频带选 择部,上述第1量化频带选择部将上述第1级归一化及矢量量化器的 量化误差的输出作为其输入,选择应由上述第2级归一化及矢量量化 器进行量化处理的频带,并将该选择的频带的量化误差的输出向上述 第2级归一化及矢量量化器输出;上述第2量化频带选择部将上述第2 级归一化及矢量量化器的量化误差的输出作为其输入,选择应由上述 第3归一化及矢量量化器进行量化处理的频带,并将该选择的频带的 量化误差的输出向上述第3级归一化及矢量量化器输出。
32.按权利要求31所述的音频信号编码装置,其特征在于:上述 多级量化单元的第2级以后的各级归一化及矢量量化器,适当地选择 应进行归一化及量化处理的上述频率特性信号序列的分割的频带中前 级的归一化及矢量量化器的输出即量化误差的能量之和大的频带,进 行归一化及量化处理。
33.按权利要求31所述的音频信号编码装置,其特征在于:上述 多级量化单元的第2级以后的各级归一化及矢量量化器,在应进行归 一化及量化处理的上述频率特性信号序列的分割的频带中,根据人的 听觉的性质即听觉灵敏特性,适当地选择对其重要性高的频带加权大 的值的前级的归一化及矢量量化器的输出即量化误差的能量之和大的 频带进行归一化及量化处理。
34.一种将作为权利要求30~33中的任一权项所述的音频信号编 码装置的输出的代码作为其输入并将其译码从而输出与原来的输入音 频信号相当的信号的音频信号译码装置,其特征在于:具有接收上述 音频信号编码装置的量化部的各量化器的信号,并再生与上述频率特 性信号序列分割为多个频带的各频带的系数串相当的信号的逆量化 部,设置在该多个逆量化部中,将作为其输出的频率特性信号序列的 系数串,与根据关于作为上述音频信号编码装置的输出的归一化的代 码而再生的归一化成份相乘,从而输出与编码前的频率特性信号序列 的各系数串相当的信号的多个逆归一化部,和接收该多个逆归一化部 的输出并将它们变换为与原来的音频信号相当的信号的逆频率变换 部。
35.一种接收将输入音频信号进行频率变换而得到的频率特性信号 序列并将其进行编码后输出、将该输出的代码信号作为输入并将其译 码从而再生与原来的输入音频信号相当的信号的音频信号编码和译码 方法,其特征在于:将上述频率特性信号序列分为与分割为至少2个 以上的频带的频带相当的系数串,分别独立地进行归一化及量化处理 后输出,从接收的已量化的信号中使用关于编码侧的归一化的代码, 通过对与上述分割的频带相当的任意的频带的数据进行逆归一化及逆 量化处理,再生与原来的音频输入信号相当的信号。
36.按权利要求35所述的音频信号编码和译码方法,其特征在于: 上述归一化及量化处理分阶段进行,从而对计算出的量化误差进一步 进行归一化及量化处理;上述逆归一化及逆量化处理,反复交替地进 行向扩展频带的方向的逆归一化及逆量化处理和向上述量化处理时的 量化阶段深入的方向的逆归一化及逆量化处理。
37.按权利要求36所述的音频信号编码和译码方法,其特征在于: 向扩展上述频带的方向的逆归一化及逆量化处理,按照考虑了人的听 觉心理特性的顺序扩展频带而进行。
38.一种对将输入音频信号进行频率变换而得到的频率特性信号序 列进行矢量量化处理并对音频信号进行编码的音频信号编码装置,其 特征在于:具有具备至少具有对上述频率特性信号序列进行矢量量化 处理的第1级矢量量化器和对上述第1级矢量量化器的量化误差成份 进行矢量量化处理的第2级矢量量化器的多级量化单元,上述多级量 化单元的各级量化单元由将上述频率特性信号序列或前级的量化单元 的量化误差成份全部进行矢量量化处理的全频带矢量量化器构成。

说明书全文

技术领域

发明涉及将声音信号及音乐信号等音频信号编码的音频信号编 码装置。特别是使用正交变换等方法,将音频信号从时间区域变换到 频率区域,并且可以比源音频信号用尽可能少的代码串表现的将该变 换后的信号有效地进行编码的装置,和使用编码后的信号这样的全部 代码串或其一部分代码串,可以将高品质和宽频带的音频信号译码的 译码装置以及该音频信号的编码及译码方法。

背景技术

将音频信号有效地进行编码及译码的方法提案了各种各样的方案。 音乐信号等具有20KHz以上的频带的音频信号,特别是近年来有 MPEG音频方式等。以MPEG方式为代表的编码方式,是使用余弦变 换等正交变换将时间轴上的数字音频信号变换为频率轴上的数据,并 利用人的听觉上的敏感特性将该频率轴上的信息对听觉上重要的信息 进行编码的方式,对听觉上不重要的信息和冗长的信息不进行编码的 方式。对于源数字信号的信息量,想用很少的信息量表现时,有使用 矢量量化的方法的TC-WVQ等编码方式。MPEG音频和TC-WVQ 分别在ISO/IEC标准IS-11172-3和T.Moriya,H.Suga:An 8 Kbits transform coder for noisy channels,Proc.ICASSP 89,pp196-199等中已作 了介绍。下面,使用图24说明先有的音频信号编码装置的结构。
在图24中,1601是将输入信号进行频率变换的FFT部,1602是 计算用以将经过频率变换的输入信号中的特定的频带进行编码的最小 可听限和利用掩蔽特性计算进行自适应位分配的计算的自适应位分配 计算部,1603是将输入信号分割为多个频带的子频带分割部,1604是 使用比例因子将分割为多个频带的各成份进行归一化的比例因子归一 化部,1605是根据上述自适应位分配计算部1602的位分配将比例因子 归一化部1604的归一化输出进行标量量化处理的标量量化部。
下面,说明其动作。输入信号输入FFT部1601和子频带分割部 1603。在FFT部1601中,将输入信号进行频率变换,并将其输出输入 自适应位分配部1602。在自适应位分配部1602中,根据按人的听觉特 性定义的最小可听限和掩蔽特性对某一频带成份计算应供给多少信息 量,并将各频带的信息量分配编码为索引(index)。
另一方面,在子频带分割部1603中,将输入信号分割为例如32个 频带而输出。并且,在比例因子归一化部1604中,对由上述子频带分 割部1603分割的各频带成份以某一代表值进行归一化处理。该归一化 的值量化为索引IND1。在标量量化部1605中,根据由上述自适应位分 配计算部1602计算的位分配将比例因子归一化部1604的输出进行标量 量化处理,并将该量化值编码为索引IND2。
先有的音频信号编码装置按上述方式构成,MPEG音频方式是对 每1信道用64000位/秒以上的信息量进行编码所使用的方法,但是, 通常在该信息量以下,有时可再生的频带宽度及所译码的音频信号的 主观的品质将显著地变坏。其原因在于,如图24所示的例子那样,编 码的信息大致由自适应位分配部1602的位分配、比例因子归一化部 1604的频带代表值和标量量化部1605的量化值3部分构成,在高压缩 率的情况下,信息量未充分地分配给量化值输出。另外,在先有的音 频信号编码装置中,通常是采用使编码的信息量和译码的信息量相同 来构成编码装置和译码装置的方法。例如,在每秒钟编码为128000位 的信息量的方法中,其译码装置就将128000位的信息量译码。
但是,根据上述情况,在先有的音频信号编码装置和译码装置中, 为了得到良好的音质,必须用固定的信息量进行编码和译码,这就不 能用高压缩率得到高品质的音质。

发明内容

本发明就是为了解决上述问题而提案的,目的旨在提供即使用很少 的信息量进行编码和译码也可以得到高品质和宽的再生频带并且可以 使编码和译码时的信息量不是固定的值而是可以改变的音频信号编码 装置和译码装置以及音频信号编码和译码方法。
此外,本发明的目的还在于提供可以进一步大大提高量化效率的音 频信号编码装置和译码装置以及音频信号编码和译码方法。
为了解决上述问题,本发明的技术方案1所述的发明的特征在于: 在对将输入音频信号进行频率变换而得到的频率特性信号序列进行矢 量量化处理并将音频信号进行编码的音频信号编码装置中,具备至少 具有将上述频率特性信号序列或其一部分进行矢量量化处理的第1级 矢量量化器和将上述第1级矢量量化器的量化器误差成份进行矢量量 化处理的第2级矢量量化器的多级量化单元,上述多级量化单元的各 级量化单元具有对将上述频率特性信号序列利用各级的分割方式分割 为至少2个以上的在多个级间可以具有重复的部分的频带的多个频带 的某一个频带的系数串进行矢量量化处理的至少1个以上的分割化矢 量量化器。
本发明的技术方案2所述的发明的特征在于:在技术方案1所述的 音频信号编码装置中具有将上述频率特性信号序列进行归一化处理并 将其输出供给上述多级量化单元的归一化单元。
本发明的技术方案3所述的发明的特征在于:在技术方案1或2 所述的音频信号编码装置中,上述各级量化单元适当地选择量化误差 的能量之和大的频带作为应进行量化处理的上述频率特性信号序列的 分割的频带进行量化处理。
本发明的技术方案4所述的发明在特征在于:在技术方案1或2 所述的音频信号编码装置中,上述各级的量化单元,根据人的听觉上 的性质即听觉敏感,特性适当地选择对其重要性高的频带加上大的权 重值的量化误差的能量之和大的频带作为应进行量化处理的上述频率 特性信号序列的分割的频带,进行量化处理。
本发明的技术方案5所述的发明的特征在于:在技术方案1~4的 任一权项所述的音频信号编码装置中,在构成上述多级量化单元的第1 级矢量量化器和第2级矢量量化器之间具有第1量化频带选择部,在 上述第2级矢量量化器和上述第3级矢量量化器之间具有第2量化频带 选择部,上述第1量化频带选择部将上述第1级矢量量化器的量化误 差的输出作为其输入,选择应由上述第2级矢量量化器进行量化处理 的频带;上述第2量化频带选择部将上述第2级矢量量化器的量化误 差的输出作为其输入,选择应由上述第3级矢量量化器进行量化处理 的频带。
本发明的技术方案6所述的发明的特征在于:在技术方案5所述的 音频信号编码装置中,上述多级量化单元具有,将上述频率特性信号 序列的上述分割的各频带的各系数串,由第I级分割的矢量量化器独立 地进行量化处理的多个第I级的分割矢量量化器,和作为至少一次将应 进行量化处理的输入信号的各频带全部进行量化处理的全频带量化部 的第J级矢量量化器。
本发明的技术方案7所述的发明的特征在于:在技术方案1所述的 音频信号编码装置中,上述多级量化单元使用前级矢量量化器使用代 码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器 对该计算出的量化误差进一步进行矢量量化处理。
本发明的技术方案8所述的发明的特征在于:在技术方案2所述的 音频信号编码装置中,上述多级量化单元使用前级矢量量化器使用代 码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器 对该计算出的量化误差进一步进行矢量量化处理。
本发明的技术方案9所述的发明的特征在于:在技术方案8所述的 音频信号编码装置中,上述多级量化单元的矢量量化器在检索矢量量 化处理中的上述代码薄内的最佳代码时使用的代码间的距离的计算 中,使用从上述归一化单元输出的输入信号的归一化成份作为权重计 算该距离,抽出给定最小距离的代码。
本发明的技术方案10所述的发明的特征在于:在技术方案9所述 的音频信号编码装置中,上述多级量化单元的矢量量化器将从上述归 一化单元输出的频率特性信号序列的归一化成份和考虑了人的听觉上 的性质即听觉敏感特性的值两者作为权重计算上述距离,抽出给定最 小距离的代码。
本发明的技术方案11所述的发明的特征在于:在技术方案2和 8~10中的任一权项所述的音频信号编码装置中,上述归一化单元具有 将上述频率特性信号序列的概形大致地进行归一化处理的频率概形归 一化部。
本发明的技术方案12所述的发明的特征在于:在技术方案2和 8~10中的任一权项所述的音频信号编码装置中,上述归一化单元具有 将上述频率特性信号序列分为多个连续的单位频带的各成份,并通过 用1个值除各单位频带的系数串而进行归一化的频带振幅归一化部。
本发明的技术方案13所述的发明的特征在于:在技术方案1所述 的音频信号编码装置中,上述多级量化单元具有,将上述频率特性信 号序列的上述分割的各频带的各系数串,利用分割化矢量量化器独立 地进行量化处理的矢量量化器,和作为至少一次将应进行量化处理的 输入信号的各频带全部进行量化处理的全频带量化部的矢量量化器。
本发明的技术方案14所述的发明的特征在于:在技术方案13所述 的音频信号编码装置中,上述多级量化单元具有由低频区的分割化矢 量量化器、中频区的分割化矢量量化器和高频区的分割化矢量量化器 构成的第1矢量量化器,与其后级连接的第2矢量量化器和与其后级 连接的第3矢量量化器,将输入该多级量化单元的频率特性信号序列 分割为3个频带,由上述低频区的分割化矢量量化器独立地将该3个 频带中的低频带成份的频率特性信号序列进行量化处理,由上述中频 区的分割化矢量量化器独立地将上述3个频带中的中频的频带成份的 频率特性信号序列进行量化处理,由上述高频区的分割化矢量量化器 独立地将上述3个频带中的高频带成份的频率特性信号序列进行量化 处理,由构成上述第1矢量量化器的各分割化矢量量化器计算对频率 特性信号序列的量化误差,将其作为向后级的上述第2矢量量化器的 输入,在上述第2矢量量化器中对该第2矢量量化器量化的频带宽度 进行量化处理,计算对该第2矢量量化器的输入的量化误差,将其作 为向上述第3矢量量化器的输入,在上述第3矢量量化器中,对该第3 矢量量化器量化的频带宽度进行量化处理。
本发明的技术方案15所述的发明的特征在于:在技术方案14所述 的音频信号编码装置中,在构成上述多级量化单元的第1矢量量化器 和第2矢量量化器之间设置第1量化频带选择部,同时,在上述第2 矢量量化器和上述第3矢量量化器之间设置第2量化频带选择部,上 述第1量化频带选择部将上述第1矢量量化器的输出作为其输入,选 择应由上述第2矢量量化器进行量化处理的频带,上述第2矢量量化 器对于由上述第1量化选择部选择的频带的由上述3个矢量量化器构 成的第1矢量量化器的量化误差,对该第2矢量量化器量化的频带宽 度进行量化处理,计算对该第2矢量量化器的输入的量化误差,并将 其作为向上述第2量化频带选择部的输入;上述第2量化频带选择部 将上述第2矢量量化器的量化误差作为输入,选择应由上述第3矢量 量化器进行量化处理的频带,上述第3矢量量化器对于上述第2量化 频带选择部选择的频带的上述第2矢量量化器的量化误差,对该第2 矢量量化器量化的频带宽度进行量化处理。
本发明的技术方案16所述的发明的特征在于:在技术方案14所述 的音频信号编码装置中,使用上述低频区的分割化矢量量化器、中频 区的分割化矢量量化器和高频区的分割化矢量量化器构成上述第2矢 量量化器或第3矢量量化器,取代上述第1矢量量化器。
本发明的技术方案17所述的发明是一种将技术方案1所述的音频 信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输 入音频信号相当的信号的音频信号译码装置,其特征在于:具有使用 上述音频信号编码装置的量化单元输出的代码的至少一部分进行逆量 化处理的逆量化部,和使用作为该逆量化部的输出的频率特性信号序 列将频率特性信号序列变换为与原来的音频输入信号相当的信号的逆 频率变换部。
本发明的技术方案18所述的发明是一种将技术方案2所述的音频 信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输 入音频信号相当的信号的音频信号译码装置,其特征在于:具有再生 频率特性信号序列的逆量化部及使用作为该逆量化部的输出的频率特 性信号序列,根据作为上述音频信号编码装置的输出的代码再生归一 化成份,并将上述频率特性信号序列与归一化成份相乘而输出的逆归 一化部,和接收该逆归一化的输出并将频率特性信号序列变换为与原 来的音频信号相当的信号的逆频率变换部。
本发明的技术方案19所述的发明是一种将技术方案13所述的音频 信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输 入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论 构成上述音频信号编码装置的量化单元的全部还是一部分矢量量化器 输出代码时都使用输出的代码进行逆量化处理的逆量化部。
本发明的技术方案20所述的发明的特征在于:在技术方案19所述 的音频信号译码装置中,上述逆量化部在某一级的指定频带的量化代 码的逆量化之后,交替地进行该指定频带的下一级的量化代码的逆量 化处理和与该某一级的该指定频带不同的频带的量化代码的逆量化处 理,在不存在该指定频带的下一级的量化代码时,接着就进行不同的 频带的量化代码的逆量化处理;在不存在与上述指定的频带不同的频 带的量化代码时,接着就进行下一级的量化代码的逆量化处理。
本发明的技术方案21所述的发明是一种将技术方案14所述的音频 信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输 入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论 从构成上述音频信号编码装置的第1矢量量化器的3个分割化矢量量 化器全部还是一部分输出代码时都只使用构成上述第1矢量量化器的 低频区的分割化矢量量化器的代码进行逆量化处理的逆量化部。
本发明的技术方案22所述的发明的特征在于:在技术方案21所述 的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量 化器的低频区的分割化矢量量化器的代码外,还使用上述第2矢量量 化器的代码进行逆量化处理。
本发明的技术方案23所述的发明的特征在于:在技术方案22所述 的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量 化器的低频区的分割化矢量量化器的代码和上述第2矢量量化器的代 码外,还使用构成上述第1矢量量化器的中频区的分割化矢量量化器 的代码进行逆量化处理。
本发明的技术方案24所述的发明的特征在于:在技术方案23所述 的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量 化器的低频区的分割化矢量量化器的代码、上述第2矢量量化器的代 码和构成上述第1矢量量化器的中频区的分割化矢量量化器的代码外, 还使用上述第3矢量量化器的代码进行逆量化处理。
本发明的技术方案25所述的发明的特征在于:在技术方案24所述 的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量 化器的低频区的分割化矢量量化器的代码、上述第2矢量量化器的代 码、构成上述第1矢量量化器的中频区的分割化矢量量化器的代码和 上述第3矢量量化器的代码外,还使用构成上述第1矢量量化器的高 频区的分割化矢量量化器的代码进行逆量化处理。
本发明的技术方案26所述的发明是一种接收将输入音频信号进行 频率变换而得到的频率特性信号序列、将其编码而输出并将该输出的 代码信号作为输入将其译码从而再生与原来的输入音频信号相当的信 号的音频信号编码和译码方法,其特征在于:将上述频率特性信号序 列分为与至少分割为2个以上的频带的频带相当的系数串,分别独立 地进行量化处理而输出,根据接收的已量化的信号,对与上述分割的 频带相当的任意的频带的数据进行逆量化处理,再生与原来的音频输 入信号相当的信号。
本发明的技术方案27所述的发明的特征在于:在技术方案26所述 的音频信号编码和译码方法中,上述量化处理分阶段进行,从而将计 算出的量化误差进一步进行量化处理;上述逆量化处理反复交替地进 行向扩展频带方向的逆量化处理和向上述量化处理时量化阶段加深的 方向的逆量化处理。
本发明的技术方案28所述的发明的特征在于:在技术方案27所述 的音频信号编码和译码方法中,向扩展上述频带方向的逆量化处理按 考虑了人的听觉心理特性的顺序扩展频带而进行。
本发明的技术方案29所述的发明的特征在于:在技术方案26~28 中的任一权项所述的音频信号编码和译码方法中,在编码侧,将上述 频率特性信号序列归一化后,将该频率特性信号序列分为与至少分割 为2个以上的频带的频带相当的系数串,进行分别独立地量化而输出 的处理;在译码侧,使用关于上述编码侧的归一化的代码,将上述编 码侧的代码进行逆归一化处理后,对该逆归一化处理后的代码,通过 对与上述分割的频带相当的任意的频带的数据进行逆量化处理,再生 与原来的音频输入信号相当的信号。
本发明的技术方案30所述的发明是一种对将输入音频信号进行频 率变换而得到的频率特性信号序列进行归一化和矢量量化处理并将音 频信号进行编码的音频信号编码装置,其特征在于:具备至少具有将 上述频率特性信号序列或其一部分进行归一化和矢量量化处理的第1 级归一化及矢量量化器,和将上述第1级归一化及矢量量化器的量化 误差进行归一化及矢量量化处理的第2级归一化及矢量量化器的多级 量化单元,上述多级量化单元的各级量化单元具有至少1个以上的分 割化的归一化及矢量量化器,该分割化的归一化及矢量量化器将利用 各级的分割方式将上述频率特性信号序列分割为至少2个以上的在多 个级间可以具有叠加的部分的频带的多个频带中的某个频带的系数串 进行归一化及矢量量化处理。
本发明的技术方案31所述的发明的特征在于:在技术方案30所述 的音频信号编码装置中,在构成上述多级量化单元的第1级归一化及 矢量量化器和第2级归一化及矢量量化器之间具有第1量化频带选择 部,在上述第2级归一化及矢量量化器和上述第3级归一化及矢量量 化器之间具有第2量化频带选择部,上述第1量化频带选择部将上述 第1级归一化及矢量量化器的量化误差的输出作为其输入,选择应由 上述第2级归一化及矢量量化器进行量化处理的频带,并将该选择的 频带的量化误差的输出向上述第2级归一化及矢量量化器输出;上述 第2量化频带选择部将上述第2级归一化及矢量量化器的量化误差的 输出作为其输入,选择应由上述第3归一化及矢量量化器进行量化处 理的频带,并将该选择的频带的量化误差的输出向上述第3级归一化 及矢量量化器输出。
本发明的技术方案32所述的发明的特征在于:在技术方案31所述 的音频信号编码装置中,上述多级量化单元的第2级以后的各级归一 化及矢量量化器,适当地选择应进行归一化及量化处理的上述频率特 性信号序列的分割的频带中前级的归一化及矢量量化器的输出即量化 误差的能量之和大的频带,进行归一化及量化处理。
本发明的技术方案33所述的发明的特征在于:在技术方案31所述 的音频信号编码装置中,上述多级量化单元的第2级以后的各级归一 化及矢量量化器,在应进行归一化及量化处理的上述频率特性信号序 列的分割的频带中,根据人的听觉的性质即听觉敏感特性,适当地选 择对其重要性高的频带加权大的值的前级的归一化及矢量量化器的输 出即量化误差的能量之和大的频带进行归一化及量化处理。
本发明的技术方案34所述的发明是一种将作为技术方案30~33中 的任一权项所述的音频信号编码装置的输出的代码作为其输入并将其 译码从而输出与原来的输入音频信号相当的信号的音频信号译码装 置,其特征在于:具有接收上述音频信号编码装置的量化部的各量化 器的信号并再生与上述频率特性信号序列分割为多个频带的各频带的 系数串相当的信号的逆量化部,设置在该多个逆量化部中将作为其输 出的频率特性信号序列的系数串,根据关于作为上述音频信号编码装 置的输出的归一化的代码而再生的归一化成份相乘,从而输出与编码 前的频率特性信号序列的各系数串相当的信号的多个逆归一化部,和 接收该多个逆归一化部的输出并将它们变换为与原来的音频信号相当 的信号的逆频率变换部。
本发明的技术方案35所述的发明是一种接收将输入音频信号进行 频率变换而得到的频率特性信号序列并将其进行编码后输出、将该输 出的代码信号作为输入并将其译码从而再生与原来的输入音频信号相 当的信号的音频信号编码和译码方法,其特征在于:将上述频率特性 信号序列分为与分割为至少2个以上的频带的频带相当的系数串,分 别独立地进行归一化及量化处理后输出,从接收的已量化的信号中使 用关于编码侧的归一化的代码,通过对与上述分割的频带相当的任意 的频带的数据进行逆归一化及逆量化处理,再生与原来的音频输入信 号相当的信号。
本发明的技术方案36所述的发明的特征在于:在技术方案35所述 的音频信号编码和译码方法中,上述归一化及量化处理分阶段进行, 从而对计算出的量化误差进一步进行归一化及量化处理;上述逆归一 化及逆量化处理,反复交替地进行向扩展频带的方向的逆归一化及逆 量化处理和向上述量化处理时的量化阶段深入的方向的逆归一化及逆 量化处理。
本发明的技术方案37所述的发明的特征在于:在技术方案36所述 的音频信号编码和译码方法中,向扩展上述频带的方向的逆归一化及 逆量化处理,按照考虑了人的听觉心理特性的顺序扩展频带而进行。
本发明的技术方案38所述的发明是一种对将输入音频信号进行频 率变换而得到的频率特性信号序列进行矢量量化处理并对音频信号进 行编码的音频信号编码装置,其特征在于:具有具备至少具有对上述 频率特性信号序列进行矢量量化处理的第1级矢量量化器和对上述第1 级矢量量化器的量化误差成份进行矢量量化处理的第2级矢量量化器 的多级量化单元,上述多级量化单元的各级量化单元由将上述频率特 性信号序列或前级的量化单元的量化误差成份全部进行矢量量化处理 的全频带矢量量化器构成。
如上所述,按照本发明的音频信号编码装置和译码装置或者编码和 译码方法,量化处理使用矢量量化的方法等,具有在高信息压缩率中 也可以进行量化处理的结构,同时,采用将量化处理时的信息量的分 配交替地分配对再生频带的扩展有用的信息量和对提高品质有用的信 息量的结构,首先,在编码装置中,作为第1阶段,将输入的音频信 号变换为频率区域的信号,并将变换后的频率信号的一部分进行编码, 作为第2阶段,将未编码的频率信号的一部分和第1阶段的量化误差 信号进行编码,并附加到第1阶段的代码上,在第3阶段,进而对未 编码的频率信号的一部分和第1阶段及第2阶段的量化误差信号进行 编码并附加到第1阶段和第2阶段的代码上,同样,进而继续向下一 阶段推进,进行编码;另一方面,在译码装置中,也可以先只使用第1 阶段编码的代码进行译码,然后使用第1阶段和第2阶段编码的代码 进行译码,进而使用从第1阶段到第3阶段以上的阶段编码的代码进 行译码,采用译码的顺序为交替地将对频带扩展有用的代码和对品质 提高有用的代码进行译码的结构,所以,即使不使用固定的信息量进 行编码和译码,也可以得到良好的音质,另外,还可以用高的压缩率 得到高品质的声音。
另外,按照本发明的音频信号编码装置和译码装置或编码还译码方 法,在用量化单元进行量化处理之前,设置归一化单元,在对输入音 频信号进行归一化处理后进行量化处理,所以,可以进行归一化单元 和量化单元完全地发挥各自的能的编码,不会损失源音频信号所具 有的信息量,可以进行量化误差小、量化效率高的量化处理,从而可 以根据音频信号的种类而充分发挥其效果。另外,如上所述,通过采 用将量化处理时的信息量的分配交替地分配对再生频带的扩展有用的 信息量和对品质提高有用的信息量的结构,在限定受信侧的信息量时, 就只能在频带窄而浅的区域进行逆量化处理,但是,通过顺序将该逆 量化处理交替地向扩展频带的方向和加深逆量化处理的深度的方向扩 展,增大受信侧的信息量,则不论从编码装置发信来的信息量如何, 都可以将已编码的音频信号的所希望的信息量进行译码,这样,通过 根据受信侧的通信环境等改变进行译码的信息量,例如,即使在利用 通常的公用电话网时,也可以稳定地得到高品位的音质。
另外,按照本发明的音频信号编码装置和译码装置或编码和译码方 法,在进行多级量化处理的量化单元的前级分别设置归一化单元,对 分割的各频带并且在各级的量化处理前进行归一化处理后进行量化处 理,所以,利用各频带的归一化处理,进行与各频带的音频信号所具 有的信息量相应的适当的编码,即进行归一化单元和量化单元可以完 全地发挥各自的能力的编码,不会损失源音频信号所具有的信息量, 因此,可以进行量化误差小、量化效率高的量化处理,从而可以根据 音频信号的种类而充分发挥其效果。另外,如果将译码侧的逆归一化 和逆量化处理交替地向扩展量化的频带的方向和加深量化的深度的方 向进行,和上述一样,不论从编码装置发信来的信息量如何,都可以 将已编码的音频信号的所希望的信息量进行译码,即,可以根据受信 侧的通信环境等改变进行译码的信息量,例如,即使利用通常的公用 电话网时,也可以稳定地得到高品位的音质。
附图说明
图1是表示本发明的音频信号编码装置和译码装置的总体结构的 图。
图2是表示构成上述音频信号编码装置的归一化部的一例的结构 图。
图3是表示构成上述音频信号编码装置的频率概形归一化部的一 例的结构图。
图4是表示构成上述音频信号编码装置的量化部的实施例1的结构 图。
图5是表示构成上述音频信号编码装置的量化部的实施例2的结构 图。
图6是表示构成上述音频信号编码装置的量化部的实施例3的结构 图。    
图7是表示构成上述音频信号译码装置的逆量化部的实施例4的结 构图。
图8是表示构成上述音频信号译码装置的逆量化部的实施例4的一 例的结构图。
图9是表示构成上述音频信号译码装置的逆量化部的实施例4的其 他例的结构图。
图10是表示构成上述音频信号译码装置的逆量化部的实施例4的 另一例的结构图。
图11是表示构成上述音频信号译码装置的逆量化部的实施例4的 另一例的结构图。
图12是表示逆归一化部的一个实施例的结构图。
图13是用于说明上述编码装置的量化部的详细的动作的图。
图14是用于说明上述译码装置的逆量化部的信息的动作的图。
图15是用于说明上述实施例4的逆量化部的逆量化处理顺序的动 作的图。
图16是表示频率概形逆归一化部的一个实施例的结构图。
图17是用于说明先有的和本发明的音频信号编码装置的量化处理 的方法的图。
图18是表示本发明的实施例5的音频信号编码装置的量化部的结 构图。
图19是用于说明本发明的实施例5的音频信号编码装置的动作全 体的波形图。
图20是表示本发明的实施例1~3(图(A))和实施例5(图(B), (C))的音频信号编码装置的概略结构的图。
图21是用于说明本发明的实施例5的音频信号编码装置的动作全 体的波形图。
图22是用于说明本发明的实施例5的音频信号编码装置的第1 级~第3级归一化及量化单元的归一化和量化处理的方法的一例的图。
图23是用于说明与本发明的实施例5的音频信号编码装置对应的 音频信号译码装置的结构的图。
图24是表示先有的音频信号编码装置的结构的图。

具体实施方式

下面,参照附图说明本发明的实施例。
(实施例1)
图1是表示本发明的实施例1的音频信号编码装置和译码装置的总 体结构的图。在图1中,1是编码装置,2是译码装置。在编码装置1 中,101是将输入信号分割为指定的值的帧分割部,102是在时间轴 上将输入信号与窗函数相乘的加窗部,103是进行改进离散余弦变换 (Modified discrete cosine transform)的MDCT部,104是将帧分割部 101的输出即时间轴的信号和MDCT部103的输出即MDCT系数作为 输入并将该MDCT系数进行归一化处理的归一化部,105是将已归一 化的MDCT系数作为输入进行量化处理的量化部。这里,对作为时间 频率变换使用MDCT的情况进行说明,但是,也可以使用离散付利叶 变换(DFT:Discrete Fourier Transform)。
在译码装置2中,106是接收从编码装置1输出的信号(索引IND2) 并将其进行逆量化处理的逆量化部,107是使用编码装置1的归一化部 104的索引IND1将逆量化部106的输出进行逆归一化处理的逆归一化 部,108是将逆归一化部107的输出进行改进离散余弦变换的逆MDCT 部,109是对逆MDCT部108的输出进行加窗的加窗部,110是对加窗 部109的输出进行帧叠加的帧叠加部。
下面,说明按上述方式构成的音频信号编码装置和译码装置的动 作。
输入编码装置1的信号,假定是在时间上连续的数字信号序列。例 如,假定是将声音信号采样频率48KHZ量化为16位的数字信号。 该输入信号在达到某一一定的采样数之前由帧分割部101进行存储, 存储的采样数达到规定的帧长度时,就进行输出。这里,帧分割部101 的帧长度是例如128、256、512、1024、2048、4096采样等。在帧分割 部101中,也可以根据输入信号的特征改变帧长度而输出。另外,帧 分割部101是每隔某一移位长度进行输出的结构,例如,在将帧长度 采用4096采样时,如果设定帧长度的一半的移位长度,帧长度具有每 隔与达到2048采样相当的时间而输出最新的4096采样等的结构。当然, 即使改变帧长度或采样频率,同样也可以具有将移位长度设定为帧长 度的一半的结构。
并且,该帧分割部101的输出分别输入后级的加窗部102和归一化 部104。在加窗部102中,对上述帧分割部101的输出信号在时间轴上 乘以窗函数,作为加窗部102的输出。其形式可以用例如(1)式表示。
hxi=hi·xi    i=1,2,…,N
hi = sin ( π N ( i + 0.5 ) ) - - - ( 1 )
其中,XI是帧分割部101的输出,HI是窗函数,HXI是加窗部102 的输出。另外,I是时间的下标。在(1)式中所示的窗函数HI是一例, 窗函数不一定必须是(1)式所示的那样。窗函数的选择,依赖于输入 加窗部102的信号的特征、帧分割部101的帧长度和在时间上前后帧的 窗函数的形状。例如,作为输入加窗部102的信号的特征,设帧分割 部101的帧长度为N时,计算每隔N/4输入的信号的平均功率,该平 均功率发生非常大的变化时,就选择使帧长度比N短而进行(1)式所 示的运算等。另外,最好根据前一时刻的帧的窗函数的形状和后面的 帧的窗函数的形状适当地选择使当前时刻的帧的窗函数的形状没有畸 变。
其次,加窗部102的输出,输入MDCT部103。在此进行改进离 散余弦变换,并输出MDCT系数。改进离散余弦变换的一般式可以用 (2)式表示。
y k = Σ n = 0 N - 1 hx n · cos ( 2 π ( k + 1 / 2 ) ( n + n 0 ) N ) - - - ( 2 )
n0=N/4+1/2    (k=0,1,…,N/2-1)
这样,假设作为MDCT部103的输出的MDCT系数用(2)式的 YK表示,则MDCT部103的输出就表示频率特性,YK的变量K越接 近0,低频成份越与从0增大到接近N/2-1的高频成份线性地对应。 在归一化部104中,将作为帧分割部101的输出的时间轴上的信号XI 和作为MDCT部103的输出的MDCT系数YK作为输入,使用其几个 参量将MDCT系数进行归一化处理。这里,所谓MDCT系数的归一化, 就是要抑制在低频成份和高频成份部分的大小有非常大的差别的 MDCT系数的大小的偏差,例如,相对于高频成份,低频成份非常大 时,就选择在低频成份中成为大的值,在高频成份中成为小的值的参 量,通过用此参量除上述MDCT系数,来抑制MDCT系数的大小的偏 差。另外,在归一化部104中,将表现归一化所使用的参量的索引IND1 进行编码。
在量化部105中,就将由归一化部104进行归一化处理后的MDCT 系数作为输入,进行MDCT系数的量化处理。这时,该量化部105输 出使该量化处理后的值与和位于代码薄中的多个代码索引对应的各量 化输出之间的差别为最小的代码索引。这时,由上述量化部105进行 量化处理后的值与和从该量化部105输出的代码索引对应的值之差就 是量化误差。
另一方面,在译码装置2中,使用编码装置1的归一化部104的索 引IND1和量化部105的索引IND2进行译码。在逆量化部106中,使 用量化部105的索引IND2再生在上述编码装置1中进行归一化处理时 刻的MDCT系数。在逆量化部106中,既可以使用全部索引也可以使 用一部分索引进行MDCT系数的再生。当然,归一化部104的输出和 逆量化部106的输出伴有量化部105进行量化处理时的量化误差,所以, 与进行量化处理前的状态不一定一致。
在逆归一化部107中,根据编码装置1的归一化部104的索引IND1 对在编码装置1中进行归一化处理所使用的参量进行复原,将逆量化 部106的输出与该参量相乘,进行MDCT系数的复原。在逆MDCT部 108中,根据作为逆归一化部107的输出的MDCT系数进行逆MDCT 处理,从而进行从频率区域的信号向时间区域的信号的复原。上述逆 MDCT计算,可以用例如(3)式表示。
xx ( n ) = 2 N Σ k = 0 N - 1 yy k cos ( 2 π ( k + 1 / 2 ) ( n + n 0 ) N ) - - - ( 3 )
n0=N/4+1/2
其中,YYK是由逆归一化部107所复原的MDCT系数,XX(N) 是逆MDCT系数,将其作为逆MDCT部108的输出。
在加窗部109中,使用逆MDCT部108的输出XX(N)进行加窗 处理。加窗处理是使用在编码装置1的加窗部102中使用的窗函数进行 例如由(4)式所示的处理。
     Z(I)=XX(I)·HI                            (4)
其中,Z(I)是加窗部109的输出。
在帧叠加部110中,使用加窗部109的输出再生音频信号。由于加 窗部109的输出成为在时间上重复的信号,所以,在帧叠加部110中, 使用例如(5)式作为译码装置2的输出信号。
     out(i)=zm(i)+zm-1(i+SHIFT)                (5)
其中,ZM(I)是第M时刻的帧的第I个加窗部109的输出信号, ZM-1(I)是第M-1时刻的帧的第I个加窗部109的输出信号,SHIFT 是与编码装置的帧长度相当的采样数,OUT(I)是在帧叠加部110的 第M时刻的帧的译码装置2的输出信号。
下面,使用图2说明上述归一化部104的详细的一例。在图2中, 201是接收帧分割部101和MDCT部103的输出的频率概形归一化部, 202是接收频率概形归一化部201的输出并参照频带表203进行归一化 处理的频带振幅归一化部。
下面,说明其动作。在频率概形归一化部201中,使用帧分割部 101的时间轴上的数据输出计算作为大致的频率的概形的频率概形,并 用其除作为MDCT部103的输出的MDCT系数。表现频率概形所使用 的参量,编码为索引IND1。在频带振幅归一化部202中,将频率概形 归一化部201的输出信号作为输入,对在频带表203中所示的各频带进 行归一化处理。例如,设作为频率概形归一化部201的输出的MDCT 系数为DCT(I)(I=0~2047)、频带表203为例如(表1)所示的 那样,就使用(6)式等计算各频带的振幅的平均值。
(表1)


其中,bjlow,bjhigh分别表示频带表203所示的第J频带的DCT(I) 所属的最低频的索引I和最高频的索引I。另外,P是进行距离计算中 的范数,最好为2等数值。
avej是各频带号码J的振幅的平均值。在频带振幅归一化部202中, 将avej进行量化处理,计算qavej,使用例如(7)式进行归一化处理。 n_dct(i)=dct(i)/qavej    bjlow≤i≤bjhigh     (7)
avej的量化,既可以使用标量量化,也可以使用代码薄进行矢量量 化处理。在频带振幅归一化部202中,将表现qavej所使用的参量的索 引IND1进行编码。
编码装置1的归一化部104的结构,此处表示了使用图2的频率概 形归一化部201和频带振幅归一化部202的结构,但是,也可以是只使 用频率概形归一化部201的结构,或只使用频带振幅归一化部202的结 构。此外,当在MDCT部103输出的MDCT系数的低频成份和高频成 份中没有大的偏差时,也可以采用不使用两者的结构而将MDCT部103 的输出信号直接输入量化部105的结构。
下面,使用图3说明图2的频率概形归一化部201的详细情况。在 图3中,301是接收帧分割部101的输出的线性预测分析部,302是接 收线性预测分析部301的输出的概形量化部,303是接收MDCT部103 的输出的包络特性归一化部。
下面,说明上述频率概形归一化部201的动作。在上述线性预测分 析部301中,将帧分割部101的时间轴上的音频信号作为输入,进行线 性预测分析。线性预测分析的线性预测系数,通常可以通过计算加重 平均窗等的加窗的信号的自相关函数并求解标准方程等而计算。计算 出的线性预测系数变换为线频谱对系数(LSP(Line Spectrum Pair)系 数)等,由概形量化部302进行量化处理。作为量化方法,既可以使 用矢量量化,也可以使用标量量化。并且,由包络特性归一化部303 计算由概形量化部302进行量化处理的参量所表现的频率传递特性, 并通过用其除作为MDCT部103的输出的MDCT系数进行归一化处 理。作为具体的计算例子,假定与由概形量化部302进行量化处理的 参量等价的线性预测系数为qlpc(i),则由包络特性归一化部303计算的 上述频率传递特性可以用例如(8)式表示。

env(i)=1/fft(li)
其中,ORDER最好为10~40。fftO表示高速傅利叶变换。在包络 特性归一化部303中,使用计算出的频率传递特性env(i)利用例如以下 所示的(9)式进行归一化处理。
       fdct(i)=mdct(i)/env(i)    (9)
其中,mdct(i)是MDCT部103的输出信号,fdct(i)是进行归一化处 理的包络特性归一化部303的输出信号。
下面,使用图4说明编码装置1的量化部105的详细情况。在图4 中,401是第1小量化部,402是接收第1小量化部401的输出的第2 小量化部,403是接收第2小量化部402的输出的第3小量化部。
下面,说明上述量化部105的动作。输入上述第1小量化部401的 信号是编码装置的归一化部104的输出,是进行了归一化处理的MDCT 系数。但是,在不具有归一化部104的结构中,就成为MDCT部103 的输出。在第1小量化部401中,将输入的MDCT系数进行标量量化 处理或矢量量化处理后,将表现量化处理时所使用的参量的索引进行 编码。另外,计算量化处理引起的对MDCT系数的量化误差,并将其 向第2小量化部402输出。这里,在第1小量化部401中,可以将全部 MDCT系数进行量化处理,也可以只将一部分进行量化处理。当然, 只将一部分进行量化处理时,未由第1小量化部401进行量化处理的频 带的量化误差就是未进行量化处理的频带的输入MDCT系数本身。
其次,在第2小量化部402中,将第1小量化部401的MDCT系 数的量化误差作为输入,并进而将其进行量化处理。这时的量化也和 第1小量化部401一样,可以使用标量量化处理,也可以使用矢量量化 处理。并且,在第2小量化部402中,对表现量化处理所使用的参量的 索引进行编码。另外,计算量化处理所引起的量化误差,并将其向第3 小量化部403输出。该第3小量化部403的结构和上述第2小量化部相 同。这里,上述第1小量化部401、第2小量化部402、第3小量化部 403进行量化处理的MDCT系数的个数即频带宽度不一定必须是均匀 的,另外,进行量化处理的频带也不必相同。这时,最好考虑人的听 觉特性,第2小量化部402和第3小量化部403都设定为将表示低频成 份的MDCT系数的频带进行量化处理。
这样,按照本实施例1的音频信号编码装置,进行量化处理时,按 层次设置量化部即构成多级量化部,通过改变前级和后级的量化部进 行量化处理的频带宽度,将输入MDCT系数中与任意的频带例如对人 说来在听觉上重要的低频成份相当的系数重点地进行量化处理,所以, 即使以低位速率即高的压缩率将音频信号进行编码时,在受信侧也可 以进行高品位的声音的再生。
(实施例2)
下面,使用图5说明本发明的实施例2的音频信号编码装置。在本 实施例2中,由于只有编码装置1的量化部105的结构与上述实施例1 不同,所以,这里只说明量化部的结构。在图5中,501是第1小量化 部,502是第2小量化部,503是第3小量化部。和上述实施例1结构 不同的地方,是第1小量化部501将输入MDCT系数分割为3个频带 (高频、中频、低频)独立地进行量化处理,构成该第1小量化部501 的各频带的量化部与所谓的“分割化矢量量化器”相当。通常,在使 用矢量量化的方法进行量化处理时,可以从输入MDCT系数中抽出几 个要素构成矢量,进行矢量量化处理。在本实施例2的第1小量化部 501中,从输入MDCT系数中抽出几个要素构成矢量时,就成为低频 的量化只使用低频的要素进行矢量量化处理、中频的量化只使用中频 的要素进行矢量量化处理、高频的量化只使用高频的要素进行矢量量 化处理的结构。
在本实施例2中,以进行量化处理时分割为低频、中频、高频的3 个频带的方法作为一例进行说明的,但是,分割的频带的数也可以是3 以外的数。另外,对于第2小量化部502、第3小量化部503也和第1 小量化部501一样,可以采用将频带分割为几个进行量化处理的结构。
这样,按照本实施例2,在多级量化单元中,首先,在第1级中, 将输入MDCT系数分割为3个频带独立地进行量化处理,所以,在进 行第1次的量化处理时可以进行优先将听觉上重要的频带进行量化处 理等的处理,在后级的量化部502、503中,进而通过分阶段进行该听 觉上重要的频带的MDCT系数的量化处理,可以进一步减小量化误差, 从而在受信侧可以再现更高品位的音质。
(实施例3)
下面,使用图6说明本实施例3的音频信号编码装置。在本实施例 3中,由于只有编码装置1的量化部105的结构与上述实施例1不同, 所以,这里只说明量化部的结构。在图6中,601是第1小量化部,602 是第1量化频带选择部,603是第2小量化部,604是第2量化频带选 择部,605是第3小量化部。和上述实施例2结构不同的是,增加了第 1量化频带选择部602和第2量化频带选择部604。
下面,说明其动作。在上述第1量化频带选择部602中,使用作为 第1小量化部601的量化误差的输出计算应由第2小量化部602将哪个 频带的MDCT系数进行量化处理。例如,计算使由(10)式给定的esum(j) 为最大的J,可以将从J*OFFSET到J*OFFSET+BANDWIDTH的频 带进行量化处理。
esum ( j ) = Σ i = j · OFFSET j · OFFSET + BANDWIDTH fdct err ( i ) 2 - - - ( 10 )
其中,OFFSET是常数,BANDWIDTH是与第2小量化部603进 行量化处理的频带宽度相当的总采样。在第1量化频带选择部602中, 例如,将(10)式中给定esum(j)的最大值的J等进行编码后,作为索 引IND2。在第2小量化部603中,接收该索引IND2,将由第1量化频 带选择部602选择的频带进行量化处理。第2量化频带选择部604将第 2小量化部603的量化误差的输出作为其输入,并将该第2量化频带选 择部604所选择的频带输入上述第3小量化部605与其相除,可以采用 和上述第1量化频带选择部602相同的结构而实现。
以上,说明了在第1量化频带选择部602和第2量化频带选择部 604中使用(10)式选择下一个量化部应进行量化处理的频带的结构, 但是,也可以使用将(11)式的在归一化部104中进行归一化处理所使 用的值与考虑了与人的频率对应的相对的听觉敏感特性的值相乘的值 计算应进行量化处理的频带。
esum ( j ) = Σ i = j · OFFSET j · OFFSET + BANDWIDTH { fdct err ( i ) · env ( i ) · zxc ( i ) } 2 - - - ( 11 )
其中,env(i)是用归一化部104的输出与MDCT部103的输出相除 后的值,zxc(i)是考虑了与人的频率对应的相对的听觉敏感特性的表, 将其一例示于(表2)。另外,在(11)式中,也可以是将zxc(i)全部 作为1而未考虑在内的结构。

此外,量化频带选择部可以采用不一定必须设置多个而只使用第1 量化频带选择部602的结构或只使用第2量化频带选择部604的结构。
这样,在本实施例3中,在由多级量化单元分进行多级量化处理时, 通过在前级的量化部和后级的量化部之间设置量化频带选择部,改变 并适当地选择进行量化处理的频带,可以根据输入信号适当地改变进 行量化处理的频带,并可提高量化的完全度,从而可以重点地将需要 量化的部分进行量化处理,大大提高量化效率。
下面,使用图1~图13说明上述实施例1~3的编码装置1的量化 部106的量化方法的详细的动作。输入各小量化部的MDCT系数1401, 从该MDCT系数1401中抽出几个构成声源子矢量1403。同样,在归 一化部104中,将用作为归一化部104的输出的MDCT系数除作为归 一化部104的输入的MDCT系数后的系数串作为归一化成份1402时, 对于该归一化成份1402,也可以按照和从MDCT系数1401中抽出声 源子矢量1403相同的规则从该归一化成份1402中抽出,构成加权子矢 量1404。这样,从MDCT系数1401和归一化成份1402中分别抽出声 源子矢量1403和加权子矢量1404的规则,有例如由(14)式所示的方 法等。

其中,第I个声源子矢量的第J个要素为subvector(j),MDCT系 数1401是vectorO,MDCT系数1401的总要素数为TOTAL,声源子 矢量1403的要素数为CR,VTOTAL是与TOTAL相同的值或大于 TOTAL的值,VTOTAL/CR设定为整数值。例如,TOTAL为2048 时,CR为19、VTOTAL为2052、CR为23、VTOTAL为2070、CR 为21、VTOTAL为2079等。对于加权子矢量1404,也可以按(14) 式的顺序抽出。
在矢量量化器1405中,从代码薄1409中的代码矢量中检索与声源 子矢量1403的距离由加权子矢量1404进行加权而成为最小的代码矢 量,并输出给定该最小距离的代码矢量的索引IND2和与给定最小距离 的代码矢量与输入声源子矢量1403的量化误差相当的残差子矢量 1410。作为实际的计算顺序例子,说明该矢量量化器1405具有距离计 算单元1406、代码决定单元1407和残差生成单元1408等3个结构要 素的情况。在距离计算单元1406中,使用例如(15)式计算第I个声 源子矢量1403与代码薄1409的第K个代码矢量的距离。
dik = Σ j = 0 CR - 1 w j R ( subvecto r i ( j ) - c k ( j ) ) S - - - ( 15 )
其中,wj是加权子矢量的第J个要素,ck(j)是第K个代码矢量的 第J个要素,R、S是距离计算的范数,作为R、S的值,最好为1、1.5、 2等值。该距离计算的范数R和S不必是相同的数值。dik表示第K个 代码矢量与第I个声源子矢量的距离。在代码决定单元1407中,选出 按(15)式等计算的距离中最小的代码矢量,并将其索引进行编码 (IND2)。例如,diu为最小值时,对第I个子矢量编码的索引为U。 在残差生成单元1408中,使用由代码决定单元1407选出的代码矢量, 用(16)式生成残差子矢量1410。
resi(j)=subvectori(j)-cu(j)    (16) 其中,第I个残差子矢量1410的第J个要素是resi(j),将由代码决 定单元1407选出的第U个代码矢量的第J个要素作为cu(j)。残差子矢 量1410通过进行(14)式的逆过程等,作为其以后的小量化部的量化 对象的MDCT系数而进行保持。但是,在某一频带的量化进行对其以 后的小量化部没有影响的频带的量化处理时,即以后的小量化部不进 行量化处理时,残差生成单元1408就不必生成残差子矢量1410和 MDCT系数1411。另外,代码薄1409具有的代码矢量的个数为几个都 可以,若考虑存储容量和计算时间等因素时,则最好约为64个。
作为上述矢量量化器1405的其他实施例,也可以采用以下的结构。 即,在距离计算单元1406中,使用(17)式计算距离。

其中,K是代码薄1409的代码检索所使用的代码矢量的总数。
在代码决定单元1407中,选出给定由(17)式计算的距离dik 的最小值的k,并将其索引进行编码(IND2)。但是,k是从0到2 K-1的值。在残差生成单元1408中,使用(18)式生成残差子矢 量1410。

代码薄1409具有的代码矢量为几个都可以,但是,若考虑存储器 的容量和计算时间等因素,最好采用约64个。
另外,作为加权子矢量1404,只说明了根据归一化成份1402而生 成该加权子矢量的结构,但是,进而将考虑了人的听觉特性的权重乘 以加权子矢量1404,也可以生成加权子矢量。
按照上述本实施例3,在第1小量化部和第2小量化部之间设置第 1量化频带选择部,在第2小量化部和第3小量化部之间设置第2量化 频带选择部,改变并适当地选择由上述第2小量化部和第3小量化部 进行量化处理的频带,所以,可以根据输入信号适当地改变进行量化 处理的频带,提高量化的完全度,从而可以重点地将需要量化的部分 进行量化处理,大大提高量化效率。
此外,在上述实施例1~3中,在对输入音频信号进行频率变换而 得到的频率特性信号序列进行矢量量化处理并对音频信号进行编码的 音频信号编码装置中,可以采用至少具有将上述频率特性信号序列或 其一部分进行矢量量化处理的第1级矢量量化器和将上述第1级矢量 量化器的量化误差成份进行矢量量化处理的第2级矢量量化器的多级 量化单元的结构,同时该多级量化单元的各级的量化单元可以采用具 有对将上述频率特性信号序列利用各级的分割方式分割为至少2个以 上的在多个级间可以具有重复的部分的频带的多个频带中的某一个频 带的系数串进行矢量量化处理的至少1个以上的分割化矢量量化器的 结构。利用这样的结构,对输入MDCT系数中与任意的频带例如对人 说来听觉上重要的低频成份相当的系数重点地量化处理到所希望的深 度,另一方面,在译码侧,可以使用多个阶段的已编码的代码进行译 码,另外,可以采用译码的顺序为交替地对频带扩展有用的代码和对 品质提高有用的代码进行译码的结构,这样,即使是以低位速率即高 的压缩率进行音频信号编码的情况,以及即使不是按固定的信息量进 行编码和译码,在受信侧也可以进行高品位的声音的再生。
(实施例4)
下面,使用图1、图7~图11说明本发明的实施例4的音频信号译 码装置。作为编码装置1的输出的索引,大致分为归一化部104输出的 索引IND1和量化部105输出的索引IND2。
归一化部104输出的索引IND1由逆归一化部107进行译码,量化 部105输出的索引IND2由逆量化部106进行译码。这里,在逆量化部 106中,可以只使用量化部105输出的索引IND2的一部分进行译码。
即,下面,说明将编码装置1的量化部105的结构采用图5所示的 结构时在译码装置2中使用具有图7的结构的逆量化部进行逆量化处 理的情况。在图7中,701是第1低频成份的逆量化部。在该第1低频 成份的逆量化部701中,只使用第1小量化部501的低频成份的索引 IND21进行译码。
通过这样处理,在第1低频成份的逆量化部701中,通过只使用第 1小量化部501的低频成份的索引进行译码,不论从编码装置1发信来 的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译 码。即,即使在受信侧进行译码的信息量有限制的情况下,也可以使 编码的信息量和译码的信息量为不同的值而只对所希望的信息量进行 译码。因此,可以根据在受信侧的通信环境等改变译码的信息量,例 如,即使在利用通常的公用电话网的情况下,也可以稳定地得到高品 位的音质。
图8是表示按2阶段进行逆量化处理时的音频信号译码装置的逆量 化部的结构的图,在图8中,704是第2逆量化部。在该第2逆量化部 704中,使用第2小量化部502的索引IND3进行译码。因此,将第1 低频成份的逆量化部701的输出IND21’与第2逆量化部704的输出 IND3’之和作为逆量化部106的输出信号而输出。但是,这里的两者 之和是对与在量化处理时各小量化部所量化处理的频带相同的频带进 行相加而计算的。
这样,利用第1低频成份的逆量化部701将第1小量化部(低频) 的索引IND21进行译码同时将第2小量化部的索引IND3进行逆量化处 理时,通过将上述第1低频成份的逆量化部701的输出IND21’与该逆 量化处理的对象相加后进行逆量化处理,便可按2阶段进行逆量化处 理,以及可以正确地将按多阶段量化的音频信号进行译码,从而可以 得到更高品质的音质。
另外,图9是表示按2阶段进行逆量化处理时将作为对象的频带扩 大而进行的音频信号译码装置的逆量化部的结构的图,在图9中,702 是第1中频成份的逆量化部。在该第1中频成份的逆量化部702中,使 用第1小量化部501的中频成份的索引IND22进行译码。因此,第1 低频成份的逆量化部701的输出IND21’、第2逆量化部704的输出 IND3’和第1中频成份的逆量化部702的输出IND22’之和就作为逆 量化部106的输出信号而输出。但是,这里的三者之和是对与量化处 理时各小量化部所量化处理的频带相同的频带进行相加而计算的。通 过这样处理,便可扩大再生的声音的频带,从而可以进行更高品质的 音频信号的再生。
另外,图10是表示在具有图9的结构的逆量化部中按3阶段进行 逆量化处理的级数时的音频信号译码装置的逆量化部的结构的图,在 图10中,705是第3逆量化部。在第3逆量化部705中,使用第3小 量化部503的索引进行译码。因此,第1低频成份的逆量化部701的输 出IND21’、第2逆量化部704的输出IND3’、第1中频成份的逆量 化部702的输出IND22’与第3逆量化部705的输出IND4’之和就作 为逆量化部106的输出信号而输出。但是,这里的四者之和是对与量 化处理时各小量化部所量化处理的频带相同的频带进行相加而计算 的。
此外,图11是表示在具有图10的结构的逆量化部中按3阶段进行 逆量化处理时将作为对象的频带扩大而进行的音频信号译码装置的逆 量化部的结构的图,在图11中,703是第1高频成份的逆量化部。在 第1高频成份的逆量化部703中,使用第1小量化部501的高频成份的 索引进行译码。因此,第1低频成份的逆量化部701的输出IND21’、 第2逆量化部704的输出IND3’、第1中频成份的逆量化部702的输 出IND22’、第3逆量化部705的输出IND4’与第1高频成份的逆量 化部703的输出IND23’之和就作为逆量化部106的输出信号而输出。 但是,这里的五者之和是对与量化处理时各小量化部所量化处理的频 带相同的频带进行相加而计算的。
在本实施例4中,以逆量化部106将由具有图6的结构的量化部 105所量化的信息进行逆量化处理的情况为例进行了说明,但是,量化 部105的结构为图4或图5所示的结构时也同样可以进行。
另外,作为量化部,使用上述图5所示的结构的量化部进行编码、 作为其逆量化部使用具有图11所示的结构的逆量化部进行译码时,如 图15所示,将第1小量化部的低频的索引进行逆量化处理后,将下一 级的第2小量化部502的索引进行逆量化处理,然后再次将第1小量化 部的中频的索引进行逆量化处理,就这样反复交替地进行用于扩大频 带的逆量化处理和用于减小量化误差的逆量化处理,使用具有图11所 示的结构的逆量化部将由图4所示的结构的量化部所编码的信号进行 译码时,在图4的结构中,由于没有分割的频带,所以,顺序进行将 由下级的量化部所量化的系数进行译码的处理。
下面,使用图1和图14说明构成上述译码装置2的逆量化部106 的详细的动作。逆量化部106具有例如图7所示的逆量化部时,由第1 低频的逆量化部701构成,具有图8所示的逆量化部时,由第1低频的 逆量化部701和第2逆量化部704这2个逆量化部构成。
矢量逆量化器1501使用矢量量化器105的索引IND2进行MDCT 系数的再生。小量化部具有图7所示的结构时的逆量化处理,根据索 引IND21将索引号码进行译码,并从代码薄1502中选出该号码的代码 矢量。假定代码薄1502的内容和编码装置1的代码薄相同。从该选出 的代码矢量中可以得到再生子矢量1503,这就是按(14)式的逆过程 进行了逆量化处理的MDCT系数(I,J)1504。
另外,小量化部具有图8所示的结构时的逆量化处理,根据索引 IND21和索引IND3将索引号码K进行译码,从代码薄1502中选出按 (19)式计算的号码U的代码矢量。

再生子矢量使用(20)式生成。

其中,假定第I个再生子矢量的第J个要素为resi(j)。
下面,使用图1和图12说明构成音频信号译码装置的逆归一化部 107的详细的结构。在图12中,1201是频率概形逆归一化部,1202是 频带振幅逆归一化部,1203是频带表。频率概形归一化部1201将频率 概形归一化部201的索引IND11作为输入,再生频率概形,并将上述 频率概形与逆量化部106的输出相乘而输出。在频带振幅逆归一化部 1202中,将频带振幅归一化部202的索引IND12作为输入,并与频带 表1203所示的各频带的振幅值相乘而复原。假定使用频带振幅归一化 部202的索引IND12所复原的各频带的值为qavej,则频带振幅逆归一 化部1202的运算由(12)式给出。
dct(i)=n_dct(i)·qavej    bjlow≤i≤bjhigh    (12)
其中,设频率概形逆归一化部1201的输出为n_dct(i),频带振幅 逆归一化部1202的输出为dct(i)。另外,频带表1203和图2的频带表 203一样。
下面,使用图16说明构成译码装置2的频率概形逆归一化部1201 的详细的结构。在图16中,1301是概形逆量化部,1302是包络特性逆 归一化部。在概形逆量化部1301中,使用编码装置1的概形量化部301 的索引IND13将表示频率概形的参量例如线性预测系数等复原。如果 所复原的系数是线性预测系数,则通过进行与例如(8)式同样的计算, 复原所量化的包络特性E13。所复原的系数不是线性预测系数时,例如 是LSP系数等时,就将其变换为频率特性,后,复原包络特性E13。 在包络特性逆量化部1302中,如(13)式所示的那样,将复原的包络 特性E13与逆量化部106的输出IND16相乘而输出,并输入频带振幅 逆归一化部1201。
mdct(i)=fdct(i)·env(i)    (13)
按照这样的本实施例4,在由量化单元进行量化处理之前,设置归 一化单元,在进行输入音频信号的归一化处理后进行量化处理,所以, 可以进行归一化单元和量化单元完全地发挥各自的能力的编码,从而 可以进行不会损失源音频信号所具有的信息量、量化误差小、量化效 率高的量化处理。另外,在受信侧的信息量已限定时,只能在频带窄 而浅的区域进行逆量化处理,但是,通过将该逆量化处理顺序交替地 向扩展频带的方向和加深逆量化处理的深度的方向扩展,增大受信侧 的信息量,不论从编码装置1发信来的信息量如何,都可以将已编码 的音频信号的所希望的信息量进行译码。因此,通过根据受信侧的通 信环境等改变进行译码的信息量,即使在例如利用通常的公用电话网 的情况下,也可以稳定地得到高品位的音质。
(实施例5)
下面,使用图18说明本发明的实施例5的音频信号编码装置。在 本实施例5中,只有编码装置1的量化部105的结构与上述实施例不同, 所以,这里只说明量化部的结构,对其他结构则省略其说明。
在图18中,1801是第1归一化部,1802是第1小量化部,1803 是第1量化频带选择部,1804是第2归一化部,1805是第2小量化部, 1806是第2量化频带选择部,1807是第3归一化部,1808是第3小量 化部,1809是第3量化频带选择部。
和实施例3结构不同的地方是,附加了第2和第3归一化部1804 和1807。
下面,说明本实施例5的各结构要素。第1、第2、第3归一化部 1801、1804、1807可以利用和实施例1的归一化部104相同的结构实 现。另外,第1、第2、第3小量化部1802、1805、1808可以利用和实 施例3的第1小量化部601相同的结构实现。另外,第1、第2、第3 量化频带选择部1803、1806、1809可以利用和实施例3的第1量化频 带选择部602相同的结构实现。在本实施例5中,说明具有3组由归一 化部、小量化部和量化频带选择部这三者构成的组合的情况,但是, 该组合也可以不是3组,可以是4组以上,也可以是2组。另外,最后 一级的1组的量化频带选择部有时不一定需要,可以省略。
下面,说明图18的本实施例5的编码装置的动作。
在图18中,输入本实施例5的输入音频信号的MDCT系数首先由 第1归一化部1801进行归一化处理,并输出归一化后的MDCT系数。 在第1小量化部1802中,将作为第1归一化部1801的输出信号的已归 一化的MDCT系数进行量化处理。在第1小量化部1802中,将量化处 理所使用的参量作为索引,进而将在这时的量化处理中产生的量化误 差向下一级的量化频带选择部1803输出。在第1量化频带选择部1803 中,使用第1小量化部1802的输出计算在第2小量化部1805中应将哪 个频带的MDCT系数进行量化处理。
在第2归一化部1804中,根据第1量化频带选择部1803的频带选 择结果,对该选择的频带将作为第1小量化部1802的输出的MDCT系 数进行归一化处理。在第2小量化部1805中,将第2归一化部1804的 输出进行量化处理,并将这时的量化处理所使用的参量作为索引而输 出,同时也输出在这时的量化处理中产生的量化误差。在第2量化频 带选择部1806中,使用第2小量化部1805的输出计算在第3小量化部 1808中应将哪个频带的MDCT系数进行量化处理。
在第3归一化部1807中,根据第2量化频带选择部1806的频带选 择结果,对该选择的频带将作为第2小量化部1805的输出的MDCT系 数进行归一化处理。在第3小量化部1808中,将第3归一化部1807的 输出进行量化处理,并将这时的量化处理所使用的参量作为索引而输 出,同时也输出在这时的量化处理中产生的量化误差。
图中所示的第3量化频带选择部1809是在后级进而存在第4小量 化部(图中未示出)时所需要的要素。如果存在第4小量化部,该第3 量化频带选择部1809就使用第3小量化部1808的输出计算在第4小量 化部中应将哪个频带的MDCT系数进行量化处理。第1、第2、第3 归一化部1801、1804、1807都和实施例1的归一化部105一样,将归 一化处理所使用的参量作为索引而输出。
下面,通过与上述实施例1~3的编码装置进行比较而说明本实施 例5的编码装置的动作和作用的特征。
在具有上述实施例1~3的音频信号编码装置的归一化单元的结构 中,如图19(A)所示,将时间轴上的声音信号波形利用MDCT和FFT 变换为频率轴上的波形,如图20(A)所示,对该频率轴上的波形的全 频率范围利用归一化单元进行该归一化A即概形抽出与由该抽出的概 形的振幅值的除法运算,然后,对该归一化输出按将上述全频率范围 分割的例如3个频率区域即低频区域、中频区域、高频区域进行量化 处理X,Y,Z,这样,便可得到量化输出=A(X+Y+Z)。
与此相反,如图20(B)所示,本实施例5在上述分割化的各量化 单元的前级分别具有归一化单元α、β、γ,首先,如图19(D)所示 的那样,将频率轴上的波形分割为多个频带后,对各分割的频带分别 进行归一化和量化处理,所以,结果便是得到量化输出=αX+βY+ γZ。其全体的情况进而示于图21。
通常,在音频信号的频率特性中有非常偏倚的情况时,例如,像声 音信息那样是集中在低频区域的信号时,就总体地将其大致地进行归 一化处理了,从而不能重点地将有上述低频区域的特征的地方进行归 一化和量化处理。即,总体的大致的归一化,在信号变化的细微的地 方不能获得信号的包络线,从而将损失该信号变化的细微处的信息。 因此,在进行这样的归一化处理之后进行量化处理,即使量化器完全 地发挥自己的能力,对于未扩展的信号变化的细微处的信息也已进行 了量化处理,也就是进行了没有太大意义的量化处理。换言之,就是 进行了难于使归一化和量化一致的量化处理。即,如果设置归一化单 元,就可以使归一化单元和量化单元完全地发挥各自的能力,相反, 在非常粗略的信号时,即使单纯将其全体大致地进行归一化处理,结 果也几乎是不变化的。
这里,图20(A)是表示具有图1所示的归一化部104的上述实施 例1~3的音频信号编码装置的归一化单元与各量化单元的关系的图, 对于归一化单元A将输入音频信号的频率特性信号序列全体进行归一 化处理的结构,如上所述,在输入音频信号有例如集中在低频区域那 样的在频率上偏倚的信号时,可以认为就是归一化单元和量化单元不 能完全地发挥各自的能力的结构。
与此相反,如图20(B)所示的那样,在各量化单元X、Y、Z分 别在其前级具有归一化单元α、β、γ的本实施例5的结构中,对于 各量化单元要进行量化处理的各对象的信号进行归一化处理,所以, 各归一化单元可以进行使考虑了要进行量化处理的各量化单元的负荷 的最佳的归一化即各应进行量化处理的信号的电平具有各量化单元可 以完全地发挥其能力的电平的归一化处理,从而可以获得将归一化单 元与量化单元组合的最大的效果。
即,本实施例5的编码装置的归一化部和量化部的结构如图20(B) 所示的那样,是对于将输入音频信号进行频率变换而得到的频率特性 信号序列或分割该频率特性信号序列的频带的某一频带A的系数串, 首先由第1级的归一化单元α和量化单元X进行归一化和量化处理, 并且,由第2级的归一化单元β和量化单元Y对与上述第1级的频带A 的系数串相邻的频带B的系数串进行归一化和量化处理,此外,由第3 级的归一化单元γ和量化单元Z对与上述第2级的频带B的系数串相 邻的频带C的系数串进行归一化和量化处理的结构。
或者,如图20(C)所示的那样,是第2级的归一化单元β和量化 单元Y在与上述第1级的频带A具有一部分叠加而相邻的频带B中, 在该叠加部分对作为第1级的输出的量化误差进行归一化和量化处理、 在其他部分对上述频率特性信号序列的该频带B的系数串进行归一化 和量化处理,由第3级的归一化单元γ和量化单元Z在与上述第2级 的频带B的系数串具有一部分叠加而相邻的频带C中,在该叠加部分 对作为第2级的输出的量化误差进行归一化和量化处理、在其他部分 对上述频率特性信号序列的该频带C的系数串进行归一化和量化处理 的结构。
在上述图20(B)、(C)所示的结构中,通过对各量化单元的量 化进行归一化处理,各归一化单元进行考虑了各量化单元的负荷的归 一化处理,这样,便可进行各归一化单元和量化单元完全地发挥各自 的能力的量化处理,从而可以大大提高量化效率。
图20(B)、(C)的各级的归一化单元和量化单元处理的频带和 量化的深度不限于上述例子,可以任意地进行调整。
下面,使用图18和图22说明第1级~第3级的归一化单元和量化 单元的归一化和量化处理的方法的一例。
在本实施例5中,作为第1、第2、第3各归一化单元1801、1804、 1807,可以用和上述实施例1的归一化单元104相同的结构实现,作为 归一化的参量计算方法,也可以使用其他方法来实现,例如,根据输 入各归一化部的MDCT系数直接计算LPC系数和LSP系数等,也可 以将它们作为归一化的参量构成归一化部。在图22中,T1、T2、T3 是各级的归一化单元α、β、γ分别使用的用于归一化的表,它们可 以用以下的方法求出。
即,对于有可能作为输入音频信号而输入的各种声源信号的MDCT 系数,进行LPC(Linear Predictive Coding)分析,求出LSP(Line Spectrum Pair)系数。并且,对各声源反复进行该动作,对所有的帧 进行求LSP系数的处理,将所有的这些系数集中在一起,进行分类分 析,求出典型的多个包络线参量,将它们作为第1级的归一化单元α 的归一化表T1。
使用这样得到的多个包络线参量进行第1级的归一化和量化处理, 并对其输出进行和上述相同的LPC分析的处理,和上述一样,求出多 个包络线参量,将它们作为第2级的归一化单元β的归一化表T2。
以下,按照同样的处理,可以求出第3级的归一化单元γ的归一化 表T3。
这样,作为第1级~第3级的各量化单元的量化处理,由于考虑了 各量化单元的负荷,可以进行完全地发挥归一化和量化单元的各自的 能力的最佳的量化处理,所以,可以得到归一化单元的归一化表T1、 T2、T3。
在这样的结构的音频信号编码装置中,可以认为由多个种类的各种 声源信号构成的输入音频信号输入主装置时,如从图19(A)到(B) 所示的那样,该输入音频信号由MDCT和FFT从时间轴上的数据变换 为频率轴上的数据。并且,该变换为频率轴上的数据的信号,如从图 19(B)到(C)所示的那样,进行其概形抽出。这时的概形抽出使用 第1级的归一化单元α的归一化表T1进行,结果,所得到的概形是由 例如20位的LSP的多项式构成。并且,通过用所得到的概形来除变换 为上述频率轴上的数据的信号,进行归一化α处理。另外,在进行该 归一化处理后,由量化单元X将其进行量化处理,则第1级的归一化 和量化处理即告结束。这样,便可进行考虑了上述多个种类的各种声 源信号的特征的高效率的量化处理。
其次,由第2级的归一化和量化单元使用上述第2级的归一化表 T2,对与在第1级作为量化处理的对象的分割频率特性信号序列的某 一频带A的系数串不同的频带B的系数串或作为上述第1级的归一化 和量化处理的结果的量化误差的输出进行第2级的归一化和量化处理。 这样,仍然可以以考虑了上述多个种类的各种声源信号的特征的所需 要的频带为重点或以所需要的频带部分的量化的深度为重点进行高效 率的量化处理。
此外,由第2级的归一化和量化单元使用第3级的归一化表T3, 对与在第1级、第2级作为量化处理的对象的分割频率特性信号序列 的各频带的系数串不同的频带B的系数串或作为上述第2级的归一化 和量化处理的结果的量化误差的输出进行第3级的归一化和量化处理。 这样,仍然可以以考虑了上述多个种类的各种声源信号的特征的所需 要的频带为重点或以所需要的频带部分的量化的深度为重点进行高效 率的量化处理。
这样,通过使用按以上说明的方法作成的归一化表T1、T2、T3进 行各级的归一化α、量化X、归一化β、量化Y、归一化γ、量化Z, 便可根据作为应进行量化处理的对象的信号的性质等进行减轻量化处 理的过度的分担的归一化处理,从而可以大大改善量化效率,大大提 高在再生侧的品质。
另外,如图23(B)、(C)所示,与本实施例5的编码装置对应 的译码装置,与图20(B)、(C)所示的编码装置侧的结构对应,具 有接收上述音频信号编码装置的量化部的各量化器的信号并再生与上 述频率特性信号序列分割为多个频带的各频带的系数串相当的信号的 逆量化部X’、Y’、Z’、设置在该多个各逆量化部中将作为其输出 的频率特性信号序列的系数串与根据关于作为上述音频信号编码装置 的输出的归一化的代码而再生的归一化成份相乘并输出与编码前的频 率特性信号序列的各系数串相当的信号的多个逆归一化部α’、β’、 γ’和接收该多个各逆归一化部的输出并输出与原来的音频信号相当 的信号的逆频率变换部(图中未示出)。
另外,如果将该译码装置的逆归一化和逆量化处理交替地向扩展量 化处理的频带的方向和加深量化的深度的方向进行,就和在上述实施 例4中说明的一样,不论从编码装置发信来的信息量如何,都可以将 已编码的音频信号的所希望的信息量进行译码。即,可以根据受信侧 的通信环境等改变译码的信息量,例如,即使在利用通常的公众电话 网的情况下,也可以稳定地得到高品位的音质。
在上述实施例5中,第1、第2、第3量化频带选择部1803、1806、 1809的结构,也可以作为输出各预先设定的应进行量化处理的频带的 结构而实现。这时,在第1、第2、第3量化频带选择部1803、1806、 1809中,不进行计算应进行量化处理的频带的计算而输出各预先设定 的应进行量化处理的频带,从而可以使结构更简化。
另外,上述实施例5的第1、第2、第3量化频带选择部1803、1806、 1809的结构也可以构成为为了根据人的听觉特性作为输出而得到应进 行量化处理的频带使用寂静时的最小可听特性和难于根据某一输入频 率成份而听到其附近的频率成份的声音的掩蔽特性进行频带的选择。
按照这样的本实施例5的音频信号编码装置,在进行多级量化处理 的量化单元的前级设置各归一化单元,对分割的各频带及各级的量化 在进行归一化处理后进行量化处理,所以,通过各频带的归一化处理, 进行与各频带的音频信号所具有的信息量对应的适当的编码,即,进 行归一化单元和量化单元可以完全地发挥各自的能力的编码,并可进 行不会损失原来的音频信号所具有的信息量从而量化误差小、量化效 率高的量化处理,从而可以稳定地得到高品位的音质。
在上述实施例1~5中,上述多级量化单元至少具有将上述频率特 性信号序列或其一部分进行矢量量化处理的第1级矢量量化器和将上 述第1级的矢量量化器的量化误差成份进行矢量量化处理的第2级矢 量量化器,同时,该多级量化单元的各级量化单元对利用各级的分割 的方式将上述频率特性信号序列分割为至少2个以上的在多个级间具 有重复的部分的频带的多个频带中的某个频带的系数串进行矢量量化 处理的至少1个以上的分割化矢量量化器,但是,该多级量化单元的 各级的量化单元也可以是由将上述频率特性信号序列或前级的量化单 元的量化误差成份全部进行矢量量化处理的全频带矢量量化器构成, 这样,分多级进行量化处理,即使和上述一样按低位速率即高的压缩 率将音频信号进行编码时,另外,即使不以固定的信息量进行编码和 译码,在受信侧也可以进行高品位的声音的再生。
如上所述,按照本发明的音频信号编码装置和译码装置或编码及译 码方法,具有在进行量化处理时可以使用矢量量化的方法等在高的信 息压缩率下进行量化处理的结构,同时,采用对量化处理时的信息量 的分配进行交替地分配对再生频带的扩展有用的信息量和对品质提高 有用的信息量的结构,首先,在编码装置中,作为第1阶段,将输入 的音频信号变换为频率区域的信号,并将变换后的频率信号的一部分 进行编码;在第2阶段,将未编码的频率信号的一部分和第1阶段的 量化误差信号进行编码,并附加到第1阶段的代码上;在第3阶段, 进而将未编码的频率信号的一部分和第1阶段及第2阶段的量化误差 信号进行编码,并附加到第1阶段和第2阶段的代码上;按照同样的 方式,进而将阶段叠加地进行编码,另一方面,在译码装置中,可以 只使用第1阶段的已编码的代码进行译码,使用第1阶段和第2阶段已 译码的代码进行译码,使用从第1阶段到第3阶段以上的阶段已译码 的代码进行译码,译码的顺序采用交替地将对频带扩展有用的代码和 对品质提高有用的代码进行译码的结构,所以,即使不以固定的信息 量进行编码和译码,也可以得到良好的音质,另外,还可以在高的压 缩率下得到高品质的声音。
另外,按照本发明的音频信号编码装置和译码装置或编码及译码方 法,在由量化单元进行量化处理之前,设置归一化单元,在进行输入 音频信号的归一化处理后再进行量化处理,所以,可以进行归一化单 元还量化单元完全地发挥各自的能力的编码,从而可以进行不会损失 原来的音频信号所具有的信息量、量化误差小、量化效率高的量化处 理,根据音频信号的种类不同可以发挥更大的效果。另外,如上所述, 通过采用对量化处理时的信息量的分配交替地分配对再生频带的扩展 有用的信息量还对品质提高有用的信息量的结构,在受信侧的信息量 已限定时,就只能在频带窄而浅的区域进行逆量化处理,但是,通过 交替地将该逆量化处理向扩展频带的方向和加深逆量化处理的深度的 方向扩展,增大受信侧的信息量,不论从编码装置发信来的信息量如 何,都可以将已编码的音频信号的所希望的信息量进行译码,这样, 通过根据受信侧的通信环境等改变译码的信息量,即使在例如利用通 常的公众电话网的情况下,也可以稳定地得到高品位的音质。
另外,按照本发明的音频信号编码装置和译码装置或编码及译码方 法,在进行多级量化处理的量化单元的前级分别设置归一化单元,在 对分割的各频带以及各级的量化进行归一化处理后进行量化处理,所 以,通过各频带的归一化处理进行与各频带的音频信号所具有的信息 量对应的适当的编码即进行归一化单元和量化单元完全地发挥各自的 能力的编码,便可进行不会损失原来的音频信号所具有的信息量从而 量化误差小、量化效率高的量化处理,根据音频信号的种类不同可以 发挥更大的效果。另外,如果将译码侧的逆归一化和逆量化处理交替 地向扩展量化的频带的方向和加深量化的深度的方向进行,和上述一 样,不论从编码装置发信来的信息量如何,都可以将已编码的音频信 号的所希望的信息量进行译码,即,可以根据受信侧的通信环境等改 变译码的信息量,即使在例如利用通常的公众电话网的情况下,也可 以稳定地得到高品位的音质。
如上所述,按照本发明的音频信号编码装置和译码装置或编码及译 码方法,即使不以固定的信息量进行编码和译码,也可以得到良好的 音质,另外,可以在高的压缩率下得到高品质的声音。
另外,通过利用各频带的归一化处理进行与各频带的音频信号所具 有的信息量对应的适当的量化处理,进行归一化单元和量化单元完全 地发挥各自的能力的编码,便可进行不会损失原来的音频信号所具有 的信息量、量化误差小、量化效率高的量化处理,可以根据音频信号 的种类不同发挥更大的效果,从而,通过根据受信侧的通信环境等改 变译码的信息量,即使在例如利用通常的公众电话网的情况下,也可 以稳定地得到高品位的音质。
QQ群二维码
意见反馈