信号处理设备及方法、程序和记录介质

申请号 CN200710162891.0 申请日 2007-10-22 公开(公告)号 CN101165773A 公开(公告)日 2008-04-23
申请人 索尼株式会社; 发明人 小林由幸;
摘要 在此公开一种 信号 处理设备及方法、程序和记录介质。 信号处理 设备包括: 抽取 装置,用于抽取在 声音信号 的预定范围内指示十二平均律的不同音的声音的特性的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预定音的声音;和通过对特征量的学习而预先产生的根音判别装置,用于根据特征量判别基准声音是否是根音。
权利要求

1.一种信号处理设备,包括: 抽取装置,用于抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及 通过关于所述特征量的学习而预先产生的根音判别装置,用于根据所述特征量来判别所述基准声音是否是根音。
2. 根据权利要求1所述的信号处理设备,还包括用于从所述声音信号 检测每个节拍位置的检测装置;所述抽取装置抽取所述声音信号的每个节拍的范围内的特征量; 所述根音判别装置在所述节拍范围内判别所述基准声音是否是根音。
3. 根据权利要求1所述的信号处理设备,其中,所述抽取装置抽取指 示所述十二平均律的不同音的声音的能级的特征量。
4. 根据权利要求3所述的信号处理设备,其中,所述抽取装置抽取指 示在所述十二平均律的每个不同音的多个八度音上合成的声音的能级的特
5.根据权利要求1所述的信号处理设备,还包括和弦类型判别装置,所述和弦类型判别装置用于根据所述特征量至少判别和弦是大调和弦还是小调和弦。
6. 根据权利要求5所述的信号处理设备,还包括移位装置,所述移位 装置用于移位所述特征量从而将所述特征量的所述基准声音改变为另一声所述根音判别装置根据所述移位了的特征量,判别作为所述移位了的 特征量的基准的所述基准声音是否是根音;所述和弦类型判别装置根据所述移位了的特征量,至少判别所述和弦 是大调和弦还是小调和弦。
7. 根据权利要求5所述的信号处理设备,其中所述根音判别装置输出用于判别所述基准声音是否是根音的第一辨别 函数;所述和弦类型判别装置输出用于至少判别所述和弦是大调和弦还是小 调和弦的第二辨别函数;所述信号处理设备还包括概率计算装置,用于根据所述第一辨别函数计算所述基准声音是根音 的概率,并根据所述第二辨别函数计算所述和弦是大调和弦和小调和弦的 概率。
8. 根据权利要求l所述的信号处理设备,其中,所述根音判别装置根 据所述特征量判别所述基准声音是否是根音,并至少判别关于所述和弦是 大调和弦还是小调和弦的和弦类型。
9. 一种信号处理方法,包括以下步骤:抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是 预定音的声音;以及利用通过关于所述特征量的学习而预先产生的根音判别装置,根据所 述特征量判别所述基准声音是否是根音。
10. —种使得计算机执行以下步骤的程序:抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是 预定音的声音;以及利用通过关于所述特征量的学习而预先产生的根音判别装置,根据所 述特征量判别所述基准声音是否是根音。
11. 一种信号处理设备,包括:抽取装置,用于抽取在声音信号的预定范围内指示十二平均律的不同 音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及学习装置,用于基于所述声音信号的所述范围内的所述特征量以及和 弦,学习根据所述特征量判别所述基准声音是否是根音。
12. —种信号处理方法,包括以下步骤:抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是 预定音的声音;以及基于所述声音信号的所述范围内的所述特征量以及和弦,学习根据所 述特征量判别所述基准声音是否是根音。
13. —种使得计算机执行以下步骤的程序:抽取在声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是 预定音的声音;以及基于所述声音信号的所述范围内的所述特征量以及和弦,学习根据所 述特征量判别所述基准声音是否是根音。
14. 一种记录介质,其中或其上记录了根据权利要求IO所述的程序。
15. —种记录介质,其中或其上记录了根据权利要求13所述的程序。
16. —种信号处理设备,包括:抽取部分,被配置为抽取在声音信号的预定范围内指示十二平均律的 不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及通过关于所述特征量的学习而预先产生的根音判别部分,所述根音判 别部分被配置为根据所述特征量判别所述基准声音是否是根音。
17. —种信号处理设备,包括:抽取部分,被配置为抽取在声音信号的预定范围内指示十二平均律的 不同音的声音的特性的特征量,所述声音以基准声音为基准以音阶顺序排列,所述基准声音是预定音的声音;以及学习部分,被配置为基于所述声音信号的所述范围内的所述特征量以 及和弦,学习根据所述特征量判别所述基准声音是否是根音。

说明书全文

信号处理设备及方法、程序和记录介质技术领域本发明涉及信号处理设备及方法、程序和记录介质,并且更具体地涉 及处理声音信号的信号处理设备及方法、程序和记录介质。背景技术对作为声音的信号的声音信号应用各种信号处理的各种信号处理设备 被广泛地应用。如上所述的这样的信号处理设备中的一种包含再采样部分,其以八度音(octave)边界上的频率的二次幂的采样频率,对输入其中的音频信号 进行再采样。八度音分割模将从再采样部分输出的音频信号划分为八个 八度音,并将得到的信号输出到相应的BPFB。每个BPFB具有十二个 BPF,从而其从输入其中的一个八度音的音频信号中抽取并输出十二个不 同音(tone)的音频信号(例如,参见日本专利申请早期公开No. 2005-275068)。发明内容然而,在其设法从一段音乐的声音信号中确定一段音乐的和弦即和音 的情况下,信号处理设备有时不能确定正确的和弦。因此,需要提供一种信号处理设备和方法, 一种程序,及一种记录介 质,其中可从声音信号中准确地确定一段音乐的声音信号的和弦的根音。根据本发明的第一实施例,提供了一种信号处理设备,其包含用于抽 取声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征量 的抽取装置,这些声音以基准声音为基准以音阶顺序排列,该基准声音是 预定音的声音;和通过对特征量的学习而预先产生的根音判别装置,其被 配置用于根据特征量判别基准声音是否是根音。

信号处理设备还可包含用于检测声音信号的每个节拍(beat)的位置 的检测装置,抽取装置抽取声音信号的每个节拍范围内的特征量,根音判 别装置在节拍范围内判别基准声音是否是根音。抽取装置可抽取指示十二平均律的不同音的声音的能级的特征量。抽取装置可抽取指示在十二平均律的每个不同音的多个八度音上合成 的声音的能级的特征量。信号处理设备还可包含用于根据特征量至少判别和弦是大调和弦还是 小调和弦的和弦类型判别装置。在此情况下,信号处理设备还可包含移位装置,其用于移位特征量从 而将特征量的基准声音改变为另一声音,根音判别装置根据移位了的特征 量判别基准声音是否是根音,该基准声音是移位了的特征量的基准,和弦 类型判别装置根据移位了的特征量至少判别和弦是大调和弦还是小调和 弦。或者,根音判别装置可输出用于判别基准声音是否是根音的第一辨别 函数。和弦类型判别装置可输出用于至少判别和弦是大调和弦还是小调和 弦的第二辨别函数。信号处理设备还包括概率计算装置,其用于根据第一 辨别函数计算基准声音是根音的概率,并根据第二辨别函数计算和弦是大 调和弦和小调和弦的概率。根音判别装置可根据特征量判别基准声音是否是根音,并至少判别关 于和弦是大调和弦还是小调和弦的和弦类型。根据本发明的第一实施例,还提供了一种信号处理方法,其包括以下步骤:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预 定音的声音,以及借助于通过对特征量的学习而预先产生的根音判别装 置,根据特征量判别基准声音是否是根音。根据本发明的第一实施例,还提供了一种使得计算机执行以下步骤的 程序:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预 定音的声音,以及借助于通过对特征量的学习而预先产生的根音判别装

置,根据特征量判别基准声音是否是根音。根据本发明的第一实施例,可将程序记录在记录介质上或记录介质中。在该信号处理设备和方法、程序和记录介质中,在声音信号的预定范 围内指示十二平均律的不同音的声音的特性的特征量被抽取。这些声音以 基准声音为基准以音阶顺序排列,该基准声音是预定音的声音。然后,借 助于通过对所述特征量的学习而预先产生的根音判别部分,根据特征量判 别基准声音是否是根音。因此,利用信号处理设备和方法、程序和记录介质,可确定一段音乐 的和弦。此外,从一段音乐的声音信号中可准确地确定一段音乐的和弦的根根据本发明的第二实施例,提供了一种信号处理设备,其包含用于抽 取在声音信号的预定范围内指示十二平均律的不同音的声音的特性的特征 量的抽取装置,这些声音以基准声音为基准以音阶顺序排列,该基准声音 是预定音的声音,以及学习装置,其用于基于声音信号的范围内的特征量 以及和弦,学习根据特征量判别基准声音是否是根音。根据本发明的第二实施例,还提供了一种信号处理方法,其包括以下 步骤:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预 定音的声音,以及基于声音信号的范围内的特征量以及和弦,学习根据特 征量判别基准声音是否是根音。根据本发明的第二实施例,还提供了一种使得计算机执行以下步骤的 程序:抽取声音信号的预定范围内指示十二平均律的不同音的声音的特性 的特征量,这些声音以基准声音为基准以音阶顺序排列,该基准声音是预 定音的声音,以及基于声音信号的范围内的特征量以及和弦,学习根据特 征量判别基准声音是否是根音。根据本发明的第二实施例,可将程序记录在记录介质上或记录介质中。

在该信号处理设备和方法、程序和记录介质中,在声音信号的预定范 围内指示十二平均律的不同音的声音的特性的特征量被抽取。这些声音以 基准声音为基准以音阶顺序排列,该基准声音是预定音的声音。然后,基 于声音信号的范围内的特征量以及和弦,学习根据特征量判别基准声音是 否是根音。因此,利用信号处理设备和方法、程序和记录介质,利用信号处理的 结果可从声音信号中判别一段音乐的和弦。此外,当从一段音乐的声音信号中判别一段音乐的和弦的根音时,可 以较高的准确度判别根音。结合附图,通过以下描述和随附权利要求,本发明的上述及其他目 的、特征和优点将变得明了,在附图中用类似的标号指示类似部份或元 素。附图说明图l是示出应用了本发明的信号处理设备的配置的框图;图2是示出从声音信号中判别出的和弦的示例的示图;图3是示出从声音信号中检测节拍的示例的示图;图4是示出节拍检测部分的配置示例的框图;图5是示出起奏信息的示例的图;图6是示出起奏信息的另一示例的示图;图7是示出基本节拍周期的示图;图8是示出确定节奏的示图;图9是示出校正节拍相位的示图;图IO是示出校正节奏的示图;图11是示出和弦判别部分的配置示例的框图;图12是示出和弦判别过程的流程图;图13是示出从声音信号中去除中央分量的示例的示图;图14是示出中央去除部分的配置示例的框图;图15是示出在声音信号的多个八度音上的十二平均律的不同音的12

个声音的能量分布的示例的示图;图16是示出从声音信号中去除中央分量的示例的示图;图17是示出在每个节拍内判别和弦的示图;图18是示出从声音信号的节拍范围内抽取特征量的示图;图19是示出产生指示以音阶顺序排列的每个声音的能级的特征量的示图;图20是示出每个节拍的和弦判别特征量的示图;图21是示出每个节拍的和弦判别过程的示例的流程图;图22和图23是示出和弦判别部分的不同过程的示图;图24是示出辨别函数输出的示例的示图;图25和图26是示出和弦判别部分的不同过程的示图;图27是示出和弦判别部分的另一配置示例的框图;图28是示出每个节拍的和弦判别过程的另一示例的细节的流程图;图29是示出基于特征量执行学习来产生和弦判别部分的信号处理设备的配置示例的框图;图30是示出由每个节拍的和弦判别特征量指示的节拍范围内的和弦的示例的示图;图31是示出和弦判别学习过程的流程图;图32是示出针对每个节拍的用于学习判别声音是否是根音的和弦判 别学习过程的流程图;图33是示出移位原始声音根音判别特征量的示图;图34是示出学习判别每个节拍的和弦判别特征量的第一数据的声音 是否是根音的示图;图35是示出针对每个节拍的用于学习判别和弦是大调和弦还是小调 和弦的和弦判别学习过程的流程图;图36是示出学习判别和弦是大调和弦还是小调和弦的示图;图37是示出针对每个节拍的用于学习判别声音是否是根音以及判别 和弦是大调和弦还是小调和弦的和弦判别学习过程的流程图;图38是示出移位每个节拍的和弦判别特征量和正确的和弦名称的示

图;以及图39是示出个人计算机的配置示例的框图。 具体实施方式在详细描述本发明的优选实施例之前,先描述在权利要求中提出的几 个特征与以下描述的优选实施例的特定元素之间的对应关系。然而,该描 述仅用于证实在对本发明的实施例的描述中公开了支持如在权利要求中提 出的本发明的特定元素。因此,即使在以下描述中,在对实施例的描述中 提出的某一特定元素未作为特征之一被提出,这也并不表示特定元素与该 特征不对应。相反地,即使将某一特定元素作为与特征之一相对应的元素 提出,这也并不表示该元素与除了该特征外的任何其他特征不对应。根据本发明的第一实施例,提供了一种信号处理设备,其包含抽取装 置(例如,图1中示出的节拍特征量抽取部分23)和通过对特征量的学习 而预先产生的根音(root)判别装置(例如,图11中示出的根音判别部分 62),该抽取装置用于在声音信号的预定范围内抽取指示十二平均律(12-tone equal temperament)的不同音的声音特性的特征量,这些声音以基准 声音为基准以音阶顺序排列,该基准声音是预定音的声音,该根音判别装 置用于根据特征量判别基准声音是否是根音。信号处理设备还可包含用于检测声音信号的每个节拍的位置的检测装 置(例如,图1中示出的节拍检测部分21),抽取装置在声音信号的每个 节拍范围内抽取特征量,根音判别装置在节拍范围内判别基准声音是否是 根音。信号处理装置还可包含用于根据特征量至少判别和弦(chord)是大调 (major)和弦还是小调(minor)和弦的和弦类型判别装置(例如,图11 中示出的大调/小调判别部分63)。在此情况下,信号处理设备还可包含用于移位特征量从而将特征量的 基准声音改变为另一声音的移位装置(例如,图11中示出的移位寄存器 61),根音判别装置根据移位了的特征量判别基准声音(其是移位了的特 征量的基准)是否是根音,和弦类型判别装置根据移位了的特征量至少判 别和弦是大调和弦还是小调和弦。或者,信号处理设备可配置使得根音判别装置输出用于判别基准声音 是否是根音的第一辨别函数,和弦类型判别装置输出用于至少判别和弦是 大调和弦还是小调和弦的第二辨别函数,信号处理设备还包含概率计算装 置(例如,图11中示出的概率计算部分66),其用于根据第一辨别函数 计算基准声音是根音的概率,并根据第二辨别函数计算和弦是大调和弦和 是小调和弦的概率。根据本发明的第一实施例,提供了一种包含以下步骤的信号处理方法 和程序:在声音信号的预定范围内抽取指示十二平均律的不同音的声音的 特性的特征量,这些声音是以基准声音为基准以音阶顺序排列的,该基准声音是预定音的声音(例如,图12中在步骤S13的过程),以及借助于通过对特征量的学习而预先产生的根音判别装置,根据特征量判别基准声音是否是根音(例如,图21中在步骤S32的过程)。根据本发明的第二实施例,提供了一种信号处理设备,其包括抽取装 置(例如,图29中的节拍特征量检测部分23)和学习装置(例如,图29 中的和弦判别学习部分121),该抽取装置用于在声音信号的预定范围内 抽取指示十二平均律的不同音的声音的特性的特征量,这些声音是以基准 声音为基准以音阶顺序排列的,该基准声音是预定音的声音,该学习装置 用于基于声音信号的范围内的特征量以及和弦,学习判别根据特征量的基 准声音是否是根音。根据本发明的第二实施例,提供了一种包含以下步骤的信号处理方法 和程序:在声音信号的预定范围内抽取指示十二平均律的不同音的声音的 特性的特征量,这些声音是以基准声音为基准以音阶的顺序排列的,该基 准声音是预定音的声音,(例如,图31中在步骤S103的过程),以及基于声音信号的范围内的特征量以及和弦,学习判别根据特征量的基准声音 是否是根音(例如,图32中在步骤S134的过程)。参考图1,示出应用了本发明的信号处理设备的配置。所示出的信号 处理设备11包括节拍检测部分21、中央去除部分22、节拍特征量抽取部 分23以及和弦判别部分24。

代表输入到信号处理设备11的一段音乐的立体声信号形式的声音信 号被提供到节拍检测部分21、中央去除部分22和节拍特征量抽取部分23。节拍检测部分21检测一段音乐的声音信号的节拍。节拍是节拍点或韵律(meter),并且是一段音乐中听起来作为基本单 元的基准。虽然术语节拍通常具有多个含义,但是在以下描述中,使用该 术语来表示一段音乐中 一个时间周期的基本单元开始的时间。将一段音乐中一个时间周期的基本单元开始的时间称作节拍位置,并 将一段音乐中一个时间周期的基本单元的范围称作节拍范围。应注意,节 拍的长度是节奏(tempo)。更具体地,节拍检测部分21从一段音乐的声音信号中检测一段音乐 的声音信号的节拍位置。节拍检测部分21将表示声音信号的每个节拍的 位置的节拍信息提供到节拍特征量抽取部分23。应注意,因为在声音信号中从一个节拍的位置到下一节拍的位置的间 隔是节拍范围,所以如果检测到声音信号中的节拍位置,则可检测到节拍 范围。中央去除部分22从立体声音信号形式的声音信号中去除中央分量, 该中央分量是位于左和右之间的中央处的声音分量。中央去除部分22将 去除了中央分量的声音信号(此后将这样的声音信号称作中央去除的声音 信号)提供到节拍特征量抽取部分23。节拍特征量抽取部分23在预定范围内从声音信号抽取声音的特征 量。具体地,节拍特征量抽取部分23在声音信号的预定范围内抽取如下 的特征量:其分别表示以基准声音为基准以音阶顺序排列的十二平均律的 不同音的声音的特性,该基准声音是预定音的声音。例如,节拍特征量抽取部分23从声音信号中抽取每个节拍的声音的 特征量(即,下文中的每个节拍的和弦判别特征量)。具体地,节拍特征 量抽取部分23基于节拍信息,在声音信号的各个节拍范围内,抽取分别 表示十二平均律的音的声音的特性的特征量。更具体地,节拍特征量抽取 部分23基于节拍信息,从中央去除的声音信号中,在声音信号的各个节

拍范围内,抽取分别表示十二平均律的音的声音的特性的特征量。节拍特 征量抽取部分23还从未去除中央分量的原始声音信号中,在声音信号的 节拍范围内,抽取指示十二平均律的声音的特性的特征量。节拍特征量抽取部分23将每个节拍的和弦判别特征量提供到和弦判 别部分24,该和弦判别特征量包含从中央去除的声音信号中抽取的特征量 和从未去除中央分量的原始声音信号中抽取的特征量。和弦判别部分24根据从节拍特征量抽取部分23提供到它的每个节拍 的和弦判别特征量,判别每个节拍的和弦,然后输出和弦。换言之,和弦 判别部分24根据每个节拍的和弦判别特征量来判别节拍范围内的和弦。应注意,如下文中所述,基于特征量,通过学习,预先产生和弦判别 部分24。以这种方式,信号处理设备11从一段音乐的声音信号中判别每个节 拍的和弦。例如,如在图2中可见,信号处理设备11从一段音乐的声音信号中 判别出每个节拍的和弦:C和弦、降B和弦、A小调和弦、升G和弦、G 和弦、C和弦、F和弦、D小调和弦、D和弦、G和弦等。例如,信号处理 设备11判别每个节拍的和弦的和弦名称,并输出每个节拍的和弦的和弦 名称。首先,通过在图3中可见的声音信号,给出对检测每个节拍即每个韵 律的位置的节拍检测部分21的描述。参考图3,与"1 2 3 4 1 2 3 4 1 2 3 4"每个数字相对应的垂直线指示声音信号的节拍位置。从与"1 2 3 4 1 2 3 4 1 2 3 4"每个数字相对应的垂直线所指示的位置到下一垂直线的位置的 范围指示声音信号的节拍范围。应注意,由两个相邻垂直线指示的长度例如指示四分音符的长度,并 且与节奏相对应。同时,由与数字"1"相对应的垂直线指示的位置指示 小节的开始。图4示出节拍检测部分21的配置示例。参考图4,节拍检测部分21 包含起奏(attack)信息抽取部分41、基本节拍周期检测部分42、节奏确 定部分43、音乐特征量抽取部分44和节奏校正部分45。 起奏信息抽取部分41从指示一段音乐的波形的声音信号中抽取时间 序列的起奏信息。在此,时间序列起奏信息是随时间将人感受到节拍的音 量的变化转换得到的数据。如在图5中可见,用指示人感觉到的音量的音 量感觉来表示起奏信息。例如,起奏信息抽取部分41在声音信号的每个时间点处抽取指示声 音信号的声音级别的起奏信息。例如,如图6中所见,起奏信息抽取部分41将声音信号的声音划分 为多个八度音,并确定在各个八度音中十二平均律的不同音的12个声音 的每一个的能级(energy level),从而通过12音分析来确定分别指示每个 八度音的12个声音的能级的时间-音数据。起奏信息抽取部分41在每个时 间点处合成多个八度音的12个声音的声音能级,并将合成结果作为起奏 信息使用。此外,例如,起奏信息抽取部分41将声音信号的声音划分为多个八 度音的分量,并检测在各个八度音中十二平均律的不同音的12个声音的 发声开始处的定时。例如,如果在时间方向上每个声音的能级的差值比阈 值高,则起奏信息抽取部分41将该时间点确定为声音发声的开始。然后,起奏信息抽取部分41将l分配给声音发声的开始,并将0分配 给任何其他的时间点,然后合成多个八度音上的12个声音的l和0的值。 因此,起奏信息抽取部分41将合成结果确定为起奏信息。在图6中,圆形标记指示声音发声开始的位置。其中将1设定到声音 发声的开始,并将0设定到任何其他位置,然后这些值被合成用以确定起 奏信息,如果由多个八度音上的12个声音的相对较多个"1"来指示发声 的开始,则起奏信息显示较高的值,然而如果由多个八度音上的12个声 音的相对较少个"1"来指示发声的开始,则其显示较低的值。此外,起奏信息抽取部分41将声音信号的声音划分为多个八度音的 分量,并确定在各个八度音内十二平均律的不同音的12个声音的每一个 的能级中的变化。例如,将声音的能级中的变化计算为时间方向上声音的 能量的差值。起奏信息抽取部分41合成在各个八度音内的12个声音的每 个时间点处的声音的能级中的变化,然后将合成结果确定为起奏信息。

起奏信息抽取部分41将如上所述的这样的起奏信息提供到基本节拍周期检测部分42和节奏校正部分45。基本节拍周期检测部分42检测作为和弦检测目标的一段音乐中的最 基本的声音的长度。例如, 一段音乐中最基本的声音是由四分音符、八分 音符或十六分音符表示的声音。在以下的描述中,将一段音乐中最基本的声音的长度称作基本节拍周期。基本节拍周期检测部分42将时间序列形式的起奏信息与普通波形相 比较,从而执行基本音高(音)抽取以确定基本节拍周期。例如,如在图7中可见,基本节拍周期检测部分42对时间序列信息 形式的起奏信息执行短时傅立叶变换(short time Fourier transform)。作为 对起奏信息进行短时傅里叶变换的结果,得到指示时间序列中每个频率处 的能量强度的结果。具体地,当基本节拍周期检测部分42连续地移动窗口的位置时,基 本节拍周期检测部分42对窗口中的起奏信息部分进行傅里叶变换,该窗 口是相对于起奏信息而言与起奏信息的时间长度相比足够短的周期。然 后,基本节拍周期检测部分42以时间序列排列傅里叶变换的结果,以确 定指示时间序列中各个频率处的能量强度的结果。作为短时傅里叶变换的结果,具有比其他频率的能级更高的能级的频 率被检测为作为基本节拍周期候选的周期。在图7的下部部分,浓密度指 示能量强度。基本节拍周期检测部分42将最显著的一个周期检测为对起奏信息进 行傅里叶变换的结果,即基本节拍周期。具体地,基本节拍周期检测部分42参考基本节拍可能性(其是预先 准备的权重)和对起奏信息进行短时傅立叶变换的结果,从而将作为对起 奏信息进行短时傅立叶变换的结果而被检测到的周期中具有较高基本节拍 可能性的一个确定为基本节拍周期。更具体地,基本节拍周期检测部分42利用基本节拍可能性对作为对 起奏信息进行短时傅立叶变换的结果而得到的各个频率的能级进行加权, 该基本节拍可能性即预先确定的频率方向上的权重,并将通过加权而获得 的值之中显示出最高值的有关频率确定为基本节拍周期。通过使用基本节拍可能性,即频率方向上的权重,可防止将可能不是 基本节拍周期的很低的频率或很高的频率的周期确定为基本节拍周期。基本节拍周期检测部分42将以这种方式抽取的基本节拍周期提供到节奏确定部分43。音乐特征量抽取部分44将预定的信号处理应用到声音信号,以从一 段音乐中抽取预定数目的特征量(此后称作音乐特征量)。例如,音乐特 征量抽取部分44将声音信号划分为多个八度音的分量,并确定在各个八 度音中十二平均律的不同音的12个声音的信号。然后,音乐特征量抽取 部分44将预定的信号处理应用到各个八度音中12个声音的信号,从而抽 取音乐特征量。例如,音乐特征量抽取部分44将各个八度音中12个声音的信号的每 一个的每单位时间上的峰值数目确定为音乐特征量。此外,音乐特征量抽取部分44例如将八度音中12个声音的信号的音 乐间隔方向上的能量分布确定为音乐特性信号。此外,音乐特征量抽取部分44例如将各个八度音中12个声音的信号的低、中和高频区域之间的能量平衡确定为音乐特征量。此外,音乐特征量抽取部分44例如将各个八度音中12个声音的信号 的立体声声音信号的左和右声道信号之间的相关性振幅确定为音乐特征音乐特征量抽取部分44将以这种方式抽取的音乐特征量提供到节奏 确定部分43。通过预先学习音乐特征量和节奏来构造节奏确定部分43,并且节奏确 定部分43根据从音乐特征量抽取部分44提供的音乐特征量来估计节奏。 此后将通过估计得到的节奏称作估计节奏。节奏确定部分43基于估计节奏和从基本节拍周期检测部分42提供的 基本节拍周期,从基本节拍周期的2X倍数(...,1/8拍、1/4拍、1/2拍、 一拍、2拍、4拍、S拍...)中确定节奏。例如,将基本节拍周期乘以2或 1/2所获得的值确定为节奏,其中将基本节拍周期乘以2或1/2使得该值能够保持在估计节奏x2"2和估计节奏+21/2之间的范围内,在此估计节奏是根据一段音乐的特征量通过回归分析的估计获得的。例如,如在图8中可见,节奏确定部分43将从基本节拍周期检测部 分42提供的基本节拍周期与通过估计节奏+21/2所确定的周期彼此比较。 然后,如果基本节拍周期(在图8的上部部分,由空心圆圈指示的基本节 拍周期)比通过估计节奏+21/2所确定的周期长,则节奏确定部分43将基 本节拍周期乘以1/2。此外,节奏确定部分43将从基本节拍周期检测部分42提供的基本节 拍周期与通过估计节奏x2^所确定的周期彼此比较。然后,如果基本节拍 周期(在图8的下部部分,由空心圆圈指示的基本节拍周期)比通过估计 节奏><21/2所确定的周期短,则节奏确定部分43将基本节拍周期乘以2。在乘以1/2或2,或者重复地乘以1/2或2直到结果值进入估计节奏 ><21/2和估计节奏+21/2之间的范围内之后,节奏确定部分43将基本节拍周 期(由图8中的实心圆圈指示的基本节拍周期)确定为节奏。应注意,在基本节拍周期维持在估计节奏x2"2和估计节奏+21/2之间的 范围内的情况下,节奏确定部分43将基本节拍周期本身确定为节奏。节奏确定部分43将以这种方式确定的节奏提供到节奏校正部分45。节奏校正部分45利用起奏信息精细地校正由节奏确定部分43确定的 T奏。具体地,节奏校正部分45首先校正节拍的相位。具体地,如在图9中可见,节奏校正部分45对节奏周期中每个节拍 范围内的整个一段音乐上的起奏信息求和,该节奏周期是根据起奏信息确 定的。例如,节奏校正部分45将整个一段音乐上的节奏周期中所确定的第 一节拍到最后节拍的各个范围内的起奏信息的第一样本相加。然后,节奏 校正部分45将相加结果确定为节拍范围内的第一合计值。然后,节奏校 正部分45将整个一段音乐上的节奏周期中所确定的第一节拍到最后节拍 的各个范围内的起奏信息的第二样本相加。然后,节奏校正部分45将相

加结果确定为节拍范围内的第二合计值。类似地,节奏校正部分45将整个一段音乐上节奏周期中所确定的第 一节拍到最后节拍的各个范围内的起奏信息的第三到最后的样本的每一个相加。于是,节奏校正部分45将相加结果分别确定为节拍范围内的第一到最后的合计值。然后,节奏校正部分45移动与起奏信息相关的节奏周期的相位,并 类似地将每个节拍范围的整个一段音乐上的起奏信息相加。节奏校正部分45将与起奏信息相关的节奏周期的相位校正为如下的相位:利用该相位,可获得通过移动与起奏信息相关的节奏周期的相位而获得的显示出最高值的一个合计值。换言之,节奏校正部分45将节拍位 置校正到获得最大合计值的与起奏信息相关的节奏周期的位置。 此外,节奏校正部分45校正节奏。具体地,如在图10中可见,节奏校正部分45将节奏周期紧縮或拉伸 预定的长度(其与周期相比足够短),然后将整个一段音乐上紧縮或拉伸 后的周期中的每个节奏周期的起奏信息相加。仍在此情况下,节奏校正部分45将整个一段音乐上节奏周期中所确 定的第一节拍到最后的节拍的各个范围内的起奏信息的第一到最后的样本 相加。然后,节奏校正部分45将相加结果分别确定为节拍范围内第一到 最后的合计值。节奏校正部分45将节奏周期紧縮或拉伸预定的长度,并将紧縮或拉 伸后的节奏的每个周期的整个一段音乐上的起奏信息相加,从而确定节拍 范围内的第一到最后的合计值。节奏校正部分45将节奏的周期校正为如下的长度:利用该长度,从 原始长度以及紧縮和拉伸后的节奏的周期长度之中,可获得最大的合计 值。节奏校正部分45在必要时重复这样的节拍相位校正和节奏校正,以 确定最终的节奏。例如,节奏校正部分45重复节拍相位校正和节奏校正 预定的次数,例如两次,以确定最终的节奏。节奏校正部分45输出表示最终确定的节奏的节拍信息。

以这种方式,节拍检测部分21从声音信号中检测出每个节拍的位 置,并输出表示声音信号中的节拍位置的节拍信息。 现在,描述和弦判别部分24的配置。图11示出和弦判别部分24的配置示例。参考图11,所示出的和弦判 别部分24包含移位寄存器61、根音判别部分62、大调/小调判别部分 63、根音判别部分64、大调/小调判别部分65和概率计算部分66。移位寄存器61移位特征量,从而将特征量的基准声音改变为另一声 音。这是因为从节拍特征量抽取部分23提供的每个节拍的和弦判别特征 量包含:从中央去除的声音信号中抽取的特征量,和从未去除中央分量的 原始声音信号中抽取的特征量,以及以基准声音为基准以音阶顺序排列的 指示不同音的声音的能级的从中央去除的声音信号中抽取的特征量,和从 未去除中央分量的原始声音信号中抽取的特征量,这些基准声音是在声音 信号的每个节拍的范围内与十二平均律的不同音的声音相关的预定音的声音移位寄存器61将移位了的特征量提供到根音判别部分62、大调/小调 判别部分63、根音判别部分64和大调/小调判别部分65,移位该特征量是 为了将特征量的基准声音改变为不同的声音。根音判别部分62根据每个节拍的和弦判别特征量之中的从中央去除 的声音信号中抽取的特征量,判别基准声音是否是根音。更具体地,根音 判别部分62根据从节拍特征量抽取部分23提供的每个节拍的和弦判别特 征量之中的,从中央去除的声音信号中抽取的特征量,判别每个特征量的 基准声音是否是根音。此外,根音判别部分62根据从中央去除的声音信 号中抽取的并被移位寄存器61为了将每个基准声音改变为另一声音而移 位的特征量,判别移位了的特征量的基准声音是否是根音。例如,根音判别部分62输出用于判别基准声音是否是根音的辨别函数。大调/小调判别部分63根据每个节拍的和弦判别特征量之中的从中央 去除的声音信号中抽取的特征量,判别和弦是大调和弦还是小调和弦。更 具体地,大调/小调判别部分63根据从节拍特征量抽取部分23提供的每个

节拍的和弦判别特征量之中的,从中央去除的声音信号中抽取的特征量, 判别从中抽取特征量的节拍范围内的和弦是大调和弦还是小调和弦。此 外,大调/小调判别部分63根据从中央去除的声音信号中抽取的并为了将 每个基准声音改变为另一声音而被移位寄存器61移位了的特征量,判别 从中抽取基准声音被移位之前的特征量的节拍范围内的和弦是大调和弦还 是小调和弦。例如,大调/小调判别部分63输出用于判别和弦是大调和弦还是小调 和弦的辨别函数。根音判别部分64根据每个节拍的和弦判别特征量之中的,从未去除 中央分量的原始声音信号中抽取的特征量,判别基准声音是否是根音。更 具体地,根音判别部分64根据从节拍特征量抽取部分23提供的每个节拍 的和弦判别特征量之中的,从未去除中央分量的原始声音信号中抽取的特 征量,判别特征量的基准声音是否是根音。此外,根音判别部分64根据 从未去除中央分量的原始声音信号中抽取的并且为了将每个基准声音改变 为另一声音而移位了的特征量,判别移位了的特征量的基准声音是否是根例如,根音判别部分64输出用于辨别基准声音是否是根音的辨别函数。大调/小调判别部分65根据每个节拍的和弦判别征量之中的,从未去 除中央分量的原始声音信号中抽取的特征量,判别和弦是大调和弦还是小 调和弦。更具体地,大调/小调判别部分65根据从节拍特征量抽取部分23 提供的每个节拍的和弦判别特征量之中的,从未去除中央分量的原始声音 信号中抽取的特征量,判别从中抽取特征量的节拍范围内的和弦是大调和 弦还是小调和弦。此外,大调/小调判别部分65根据从未去除中央分量的 原始声音信号中抽取的并为了将基准声音改变为另一声音而被移位了的特 征量,判别从中抽取移位之前的特征量的节拍范围内的和弦是大调和弦还 是小调和弦。例如,大调/小调判别部分65输出用于判别和弦是大调和弦还是小调 和弦的辨别函数。

概率计算部分66根据从根音判别部分62输出的辨别函数或从根音判 别部分64输出的辨别函数,计算基准声音是根音的概率。此外,概率计 算部分66根据从大调/小调判别部分63输出的辨别函数或从大调/小调判 别部分65输出的辨别函数,计算和弦是大调和弦的概率以及和弦是小调 和弦的概率。和弦判别部分24根据基准声音是根音的概率、和弦是大调和弦的概 率及和弦是小调和弦的概率,判别最终的和弦,并输出判别出的最终和 弦。现在,参考图12的流程图描述信号处理设备11的和弦判别过程。首 先在步骤Sll,节拍检测部分21检测节拍。具体地,在歩骤Sll,节拍检 测部分21执行在上文中参考图3到图IO所描述的过程,从而从声音信号 即一段音乐的信号中检测声音信号中每个节拍的位置。然后,节拍检测部 分21将表示声音信号中每个节拍的位置的节拍信息提供到节拍特征量抽 取部分23。在步骤S12,中央去除部分22从立体声信号形式的声音信号中去除中 央分量,并将中央去除的声音信号提供到节拍特征量抽取部分23,该中央 分量是位于左和右之间的中央的声音分量。例如,如在图13中可见,在步骤S12,中央去除部分22确定立体声 信号形式的声音信号内的一个声道的信号与另一声道的信号之间的差值, 从而从声音信号中去除中央分量。更具体地,中央去除部分22从左声道 信号中减去右声道信号,该左声道信号包含左分量L (位于左侧的声音分 量)和中央分量C (位于声音信号内左和右声道之间的中央的声音分 量),该右声道信号包含右分量R (位于右侧的声音分量)和中央分量C (位于左和右声道之间的中央的声音分量)。从而,中央去除部分22产 生了根据从左分量L中减去右分量R的减法结果而形成的去除了中央分量 C的中央去除的声音信号。此外,例如,在步骤S12,中央去除部分22将立体声信号形式的声音 信号划分为预定数目的频带。然后,如果任一频带中的一个声道的信号相 位与另一声道的信号相位之间的差值小于预先确定的阈值,则中央去除部

分22遮蔽(mask)该频带中的声音信号以从声音信号中去除中央分量。在此情况下,如在图14中可见,中央去除部分22包含DFT (离散傅 立叶变换)滤波器组81、另一 DFT滤波器组82、遮蔽部分83、另外的 DFT滤波器组84和另外的DFT滤波器组85。DFT滤波器组81将离散傅立叶变换的处理应用到左声道信号以产生 指示由DFT滤波器组81产生的多频带信号中多个频带频谱的多频带信 号,该左声道信号包含作为位于左侧的声音分量的左分量L,和作为位于 声音信号内的左和右声道之间的中央的声音分量的中央分量C。 DFT滤波 器组81将所产生的多频带信号提供到遮蔽部分83。DFT滤波器组82将离散傅立叶变换的处理应用到右声道信号以产生 指示多个频带的频谱的多频带信号,该右声道信号包含作为位于右侧的声 音分量的右分量R,和作为位于声音信号内的左和右声道之间的中央的声 音分量的中央分量C。 DFT滤波器组82将所产生的多频带信号提供到遮 蔽部分83。遮蔽部分83针对每个频带,将从DFT滤波器组81提供的多频带信号 的相位与从DFT滤波器组82提供的多频带信号的相位彼此比较。然后, 如果从DFT滤波器组81提供的多频带信号的相位与从DFT滤波器组82 提供的多频带信号的相位之间的差值小于预先确定的阈值,则遮蔽部分 遮蔽从DFT滤波器组81提供的多频带信号内的该频带中的信号,并遮蔽 从DFT滤波器组82提供的多频带信号内的该频带中的信号。遮蔽部分83将从DFT滤波器组81提供的包含经遮蔽频带的信号的多 频带信号提供到DFT滤波器组84。此外,遮蔽部分83将从DFT滤波器组 82提供的包含经遮蔽频带的信号的多频带信号提供到DFT滤波器组85。DFT滤波器组84将离散傅立叶逆变换的处理应用到从遮蔽部分83提 供的包含经遮蔽频带的信号的多频带信号,以产生去除了中央分量C并且 仅包含左分量L的信号,该中央分量C是位于左和右声道之间的中央的声 音分量,该左分量L是位于左侧的声音分量。DFT滤波器组84输出仅包 含左分量L的信号。DFT滤波器组85将离散傅立叶逆变换的处理应用到从遮蔽部分83提供的包含经遮蔽频带的信号的多频带信号,以产生去除了中央分量C并且 仅包含右分量R的信号,该中央分量C是位于左和右声道之间的中央的声音分量,该右分量R是位于右侧的声音分量。DFT滤波器组85输出仅包 含右分量R的信号。此外,例如,如在图15中可见,可根据声音信号的多个八度音中十 二平均律的不同音的12个声音的能级,来确定中央去除的声音信号。具体的,可采取以下措施。具体地,在步骤S12,中央去除部分22将 声音信号的左和右声道信号的每一个划分为多个八度音的分量,并确定各 个八度音中十二平均律的不同音的12个声音的能级。然后,中央去除部 分22对各个八度音中的每个声音执行如下的减法:从根据左声道信号确 定的能级中减去根据右声道信号确定的能级。然后,中央去除部分22确 定由该减法结果的绝对值组成的信号,并将所确定的信号确定为中央去除 的声音信号。应注意,在此情况下,由于在抽取和弦时基本信号是重要的,所以使 用如下的措施:对于包含基本信号的频带,不计算左声道信号与右声道信 号之间的差值。声音信号常常包含在中央分量呈现较高能量的发音线(vocal line)或 打击乐器的乐器声音分量。因此,为了能够以更高的准确度确定和弦,从立体声信号形式的声音 信号中去除中央分量。将如下的中央去除的声音信号作为示例来给出以下示例,该中央去除 的声音信号指示左声道信号和右声道信号之间的各个八度音中十二平均律 的不同音的12个声音的能量的差值的绝对值。返回参考图12,在步骤S13,节拍特征量抽取部分23从原始声音信 号中抽取每个节拍的和弦判别特征量。具体地,在步骤S13,节拍特征量 抽取部分23从未去除中央分量的声音信号中抽取表示每个节拍范围内十 二平均律的不同音的每个声音的特性的特征量。在步骤S14,节拍特征量抽取部分23从去除了中央分量的中央去除的 声音信号中抽取每个节拍的和弦判别特征量。具体地,在步骤S14,节拍

特征量抽取部分23从去除了中央分量的声音信号中抽取表示每个节拍范 围内十二平均律的不同音的声音的特性的特征量。在步骤S13和S14,节拍特征量抽取部分23基于由节拍检测部分21 检测到的表示节拍位置的节拍信息,在每个节拍的范围内抽取去除了中央 分量的声音信号和未去除中央分量的声音信号的特征量。如在图17中可见,在以下描述的步骤S15,在每个节拍的和弦判别过 程中根据每个节拍范围内的特性判别和弦。在步骤S13和S14,抽取了将 要用于在声音信号的每个节拍的范围内判别和弦的声音信号的每个节拍范 围内的特征量。在此,将描述从声音信号的节拍范围中抽取特征量的细节,该声音信 号可能是去除了中央分量的声音信号,或是未去除中央分量的声音信号。首先,节拍特征量抽取部分23将未去除中央分量的声音信号的右声 道信号和左声道信号划分为多个八度音的分量。然后,节拍特征量抽取部 分23确定每个八度音中十二平均律的不同音的12个声音的每一个的能 级。例如,对于八度音的每个声音,节拍特征量抽取部分23将根据左声 道信号确定的能级和根据右声道信号确定的能级相加。通过这些处理,以指示左声道信号和右声道信号之间的八度音中十二 平均律的不同音的12个声音的能级的差值的绝对值的形式,未去除中央 分量的声音信号被转换为类似于中央去除的声音信号的八度音中十二平均 律的不同音的12个声音的能级。然后,如在图18中可见,节拍特征量抽取部分23基于由节拍信息指 示的节拍位置,从去除了中央分量的声音信号和未去除中央分量的声音信 号(这两种声音信号都是以八度音中十二平均律的不同音的12个声音的 能级的形式)之一中仅裁切从预定节拍位置到下一节拍位置的节拍范围内 的信号。节拍特征量抽取部分23按照时间平均由所裁切节拍范围内的信号指 示的能级。因此,如在图18的右侧部分可见,八度音中十二平均律的不 同音的12个声音的能级被确定。此外,如在图19中可见,节拍特征量抽取部分23对例如7个八度音 的十二平均律的不同音的12个声音的能级进行加权。在此情况下,节拍 特征量抽取部分23使用预先确定的用于八度音中十二平均律的不同音的12个声音的各个声音的权重来对声音的能级进行加权。然后,例如,节拍特征量抽取部分23将7个独立八度音中的相同声 音名称的声音的能级相加,以确定由各个声音名称指定的12个声音的能 级。节拍特征量抽取部分23以声音名称的音阶顺序排列12个声音的能 级,从而产生以音阶顺序排列的指示声音的能级的特征量。更具体地,例如,节拍特征量抽取部分23将经加权的能级之中的声 音C1、 C2、 C3、 C4、 C5、 C6和C7的能级相加,从而确定声音名称为C 的声音的能级。此外,节拍特征量抽取部分23将经加权的能级之中的声 音C#l、 C#2、 C#3、 C#4、C#5、 C#6和C#7的能级相加,从而确定声音 名称为C弁的声音的能级。类似地,节拍特征量抽取部分23将八度音01到07的声音D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的能级相加,从而分别确定声音名称为 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的声音的能级。节拍特征量抽取部分23产生如下的特征量:其是以音阶顺序排列的 指示声音名称为C、 C弁、D、 D弁、E、 F、 F#、 G、 G#、 A、 A弁和B的声音 的能级的数据。以这种方式,节拍特征量抽取部分23产生声音信号的节拍范围内的 特征量,该声音信号是去除了中央分量的声音信号和未去除中央分量的声 音信号之一。应注意,节拍特征量抽取部分23产生将要被用于判别根音的特征量 (在下文中称作原始信号根音判别特征量)和将要被用于判别和弦是大调 和弦还是小调和弦的另一特征量(在下文中称作原始信号大调/小调判别特 征量),作为在未去除中央分量的声音信号的节拍范围内的每个节拍的和 弦判别特征量。在产生原始信号根音判别特征量中使用的对声音的能级进行加权的权 重,与在产生原始信号大调/小调判别特征量中使用的对声音的能级进行加 权的权重彼此不同。 节拍特征量抽取部分23产生,作为在去除了中央分量的声音信号的 节拍范围内的每个节拍的和弦判别特征量的,将要被用于判别根音的特征 量(在下文中称作中央去除的根音判别特征量)和将要被用于判别和弦是 大调和弦还是小调和弦的另一特征量(在下文中称作中央去除的大调/小调 判别特征量)。在产生中央去除的根音判别特征量中使用的对声音的能级进行加权的 权重,与在产生中央去除的大调/小调判别特征量中使用的对声音的能级进 行加权的权重彼此不同。以这种方式,如在图20中可见,节拍特征量抽取部分23产生作为每 个节拍的和弦判别特征量的原始信号根音判别特征量、原始信号大调/小调 判别特征量、中央去除的根音判别特征量和中央去除的大调/小调判别特征返回参考图12,在歩骤S15,和弦判别部分24执行每个节拍的和弦 判别过程,然后和弦判别过程结束。图21示出每个节拍的和弦判别过程的示例的细节。参考图21,在步骤S31,和弦判别部分24从原始声音信号获取每个 节拍的和弦判别特征量。具体地,和弦判别部分24获取从节拍特征量抽 取部分23提供的每个节拍的和弦判别特征量的原始信号根音判别特征量 和原始信号大调/小调判别特征量。在步骤S32,根音判别部分64基于原始信号根音判别特征量执行根音 判别。例如,在步骤S32,根音判别部分64根据原始信号根音判别特征量 判别基准声音是否是根音,该原始信号根音判别特征量指示以基准声音为 基准以音阶顺序排列的音的各个声音的能级,该基准声音是预定音的声 音。在此情况下,根音判别部分64输出用于判别基准声音是否是根音的 辨别函数。具体地,例如,在步骤S32,根音判别部分64根据原始信号根音判别 特征量,判别是原始信号根音判别特征量的第一数据的声音的基准声音是 否是根音,并输出辨别函数。在步骤S33,概率计算部分66将根音判别部分64的输出值转换为概

率。具体地,在步骤S33,概率计算部分66将来自根音判别部分64的用于判别基准声音是否是根音的辨别函数转换为概率。在步骤S34,大调/小调判别部分65基于原始信号大调/小调判别特征 量,判别和弦是大调和弦还是小调和弦。例如,在步骤S34,大调/小调判 别部分65根据原始声音大调/小调判别特征量判别和弦是大调和弦还是小 调和弦,该原始声音大调/小调判别特征量指示以基准声音(其是预定音的 声音)为基准以音阶顺序排列的音的声音的能级。在此情况下,大调/小调 判别部分65输出用于辨别和弦是大调和弦还是小调和弦的辨别函数。在步骤S35,概率计算部分66将大调/小调判别部分65的输出值转换 为概率。具体地,在步骤S35,概率计算部分66将大调/小调判别部分65 的用于判别和弦是大调和弦还是小调和弦的辨别函数转换为概率。在步骤S36,和弦判别部分24根据在步骤S33确定的概率和在步骤 S35确定的概率,确定当前根音是大调和弦的音以及是小调和弦的音的概在步骤S37,移位寄存器61移位每个节拍的和弦判别特征量。 在步骤S38,和弦判别部分24判断从步骤S32到步骤S38的过程是否 被重复了 12次。如果其判断该过程尚未被执行12次,则处理返回步骤 S32,从而利用移位了的每个节拍的和弦判别特征量,重复从步骤S32到 步骤S38的过程。如图22所示,和弦判别部分24相继地将根音假设为从C到B以移位 和弦判别特征量,从而所假设的根音数据到达顶部,然后相继地判别所假 设的根音是大调和弦的音的概率,以及所假设的根音是小调和弦的音的概率。例如,和弦判别部分24使用原始信号根音判别特征量和原始信号大调 /小调判别特征量(以按音阶顺序排列的表示12个不同声音名称的声音的 能级的数据的形式),来判别和弦是大调和弦的概率,其中在预先确定的 位置处排列的能级的声音是根音,该预先确定的位置例如是图22中用斜 线指示的位置,并且和弦判别部分24判别和弦是小调和弦的概率,其中 在该位置处排列的能级的声音是根音。27

例如,在如下的情况下:在原始信号根音判别特征量和原始信号大调/小调判别特征量中,表示声音名称为C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、八#和B的声音的能级的数据以此顺序排列,和弦判别部分24确 定由图22中斜线指示的排列在和弦判别特征量顶部的能级的声音C是大 调和弦的概率,并确定声音C是小调和弦的概率。移位寄存器61将原始信号根音判别特征量和原始信号大调/小调判别 特征量中以音阶顺序排列的表示12个不同声音名称的声音的能级的数据 的排列进行循环地移位,即轮转地移位。例如,在如下的情况下,即在原 始信号根音判别特征量和原始信号大调/小调判别特征量中,由图22中斜 线指示的排列在顶部的能级的声音是C,并且指示声音名称为C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的声音的能级的数据以此顺序 排列,移位寄存器61移位原始信号根音判别特征量和原始信号大调/小调 判别特征量中指示能级的数据的排列,从而指示声音名称为C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B和C的声音的能级的数据以此顺序排 列。在此情况下,由图22中斜线指示的置于和弦判别特征量顶部的能级 的声音是C弁。和弦判别部分24根据移位了的原始信号根音判别特征量和原始信号大 调/小调判别特征量,确定和弦是C弁的大调和弦的概率及和弦是C弁的小调 和弦的概率,其中所述移位使得指示声音名称为C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B和C的声音的能级的数据以此顺序排列。通过重复移位原始信号根音判别特征量和原始信号大调/小调判别特征 量中的指示声音的能级的数据的排列的过程,来确定和弦是排列在预先确 定的位置(例如在和弦判别特征量的顶部的能级的声音)的根音为基准声 音的大调和弦的概率,并确定和弦是根音为基准声音的小调和弦的概率, 和弦判别部分24确定和弦是D的大调和弦的概率及和弦是D的小调和弦 的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率。现详细描述上述过程。具体地,在图21中所示的步骤S32中,根音判 别部分64根据指示以基准声音(其是预定音的声音)为基准以音阶顺序 排列的音的声音的能级的原始信号根音判别特征量,判别基准声音是否是

根音。然后,根音判别部分64输出用于判别基准声音是否是根音的辨别 函数。在步骤S33,概率计算部分66将来自根音判别部分64的用于判别基 准声音是否是根音的辨别函数转换为概率,以确定基准声音是根音的概率 R。然后在步骤S34,大调/小调判别部分65根据指示以基准声音(其是 预定音的声音)为基准以音阶顺序排列的音的声音的能级的原始信号大调/ 小调判别特征量,判别和弦是大调和弦还是小调和弦。然后,大调/小调判 别部分65输出用于判别和弦是大调和弦还是小调和弦的辨别函数。在步骤S35,概率计算部分66将来自大调/小调判别部分65的用于判 别和弦是大调和弦还是小调和弦的辨别函数转换为概率,以确定和弦是大 调和弦的概率Maj及和弦是小调和弦的概率Min。和弦判别部分24将概率R与概率Maj相乘,以计算出和弦是根音为 基准声音的大调和弦的概率。此外,和弦判别部分24将概率R与概率 Min相乘,以计算出和弦是根音为基准声音的小调和弦的概率。应注意,如从示出用于判别和弦是大调和弦还是小调和弦的辨别函数 的输出值的示例的图24中可见,因为辨别函数的输出值是不同于概率的 连续值,所以在将辨别函数的输出值转换为概率时,概率计算部分66使 用正态分布或GMM (高斯混合模型)来估计与辨别函数的输出值相对应 的各个状态的概率。因此,如在图25中可见,和弦判别部分24根据原始信号根音判别特 征量和原始信号大调/小调判别特征量,确定节拍范围内的和弦是C的大调 和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率 及和弦是B的小调和弦的概率。具体地,和弦判别部分24根据原始信号 根音判别特征量和原始信号大调/小调判别特征量,确定和弦是C的大调和 弦的概率、和弦是C的小调和弦的概率、和弦是C弁的大调和弦的概率、 和弦是C弁的小调和弦的概率、和弦是D的大调和弦的概率、和弦是D的 小调和弦的概率、和弦是D弁的大调和弦的概率、和弦是D弁的小调和弦的 概率、和弦是E的大调和弦的概率、和弦是E的小调和弦的概率、和弦是 、和弦是F的小调和弦的概率、和弦是F弁的大调和弦的概率、和弦是F弁的小调和弦的概率、和弦是G的大调和弦的概率、和 弦是G的小调和弦的概率、和弦是G弁的大调和弦的概率、和弦是G弁的小 调和弦的概率、和弦是A的大调和弦的概率、和弦是A的小调和弦的概 率、和弦是A弁的大调和弦的概率、和弦是A弁的小调和弦的概率、和弦是 B的大调和弦的概率以及和弦是B的小调和弦的概率。返回参考图21,如果在步骤S38判断从步骤S32到S38的过程已经被 重复了12次,则处理前进到步骤S39。在步骤S39,和弦判别部分24从去除了中央分量的声音信号中获取每 个节拍的和弦判别特征量。具体地,和弦判别部分24获取从节拍特征量 抽取部分23提供的每个节拍的和弦判别特征量的中央去除的根音判别特 征量和中央去除的大调/小调判别特征量。在步骤S40,根音判别部分62基于中央去除的根音判别特征量执行根 音判别。例如,在步骤S40,根音判别部分62根据中央去除的根音判别特 征量判别基准声音是否是根音,该中央去除的根音判别特征量指示以基准 声音(其是预定音的声音)为基准以音阶顺序排列的音的各个声音的能 级。在此情况下,根音判别部分62输出用于判别基准声音是否是根音的 辨别函数。在步骤S41,概率计算部分66将根音判别部分62的输出值转换为概 率。具体地,在步骤S41,概率计算部分66将来自根音判别部分62的用 于判别基准声音是否是根音的辨别函数转换为概率。在步骤S42,大调/小调判别部分63基于中央去除的大调/小调判别特 征量,判别和弦是大调和弦还是小调和弦。例如,在歩骤S42,大调/小调 判别部分63根据中央去除的大调/小调判别特征量判别和弦是大调和弦或 者是小调和弦,该中央去除的大调/小调判别特征量指示以基准声音(其是 预定音的声音)为基准以音阶顺序排列的音的声音的能级。在此情况下, 大调/小调判别部分63输出用于辨别和弦是大调和弦还是小调和弦的辨别 函数。在步骤S43,概率计算部分66将大调/小调判别部分63的输出值转换 为概率。具体地,在步骤S43,概率计算部分66将大调/小调判别部分63 的用于判别和弦是大调和弦还是小调和弦的辨别函数转换为概率。在步骤S44,和弦判别部分24根据在步骤S41确定的概率及在歩骤 S43确定的概率,确定当前根音是大调和弦的音以及是小调和弦的音的概"在步骤S45,移位寄存器61移位每个节拍的和弦判别特征量。在步骤S46,和弦判别部分24判断从步骤S40到步骤S45的过程是否 被重复了 12次。如果其判断该过程尚未被执行12次,则处理返回步骤 S40,从而利用移位了的每个节拍的和弦判别特征量,重复从步骤S40到 步骤S45的过程。如在图26中可见,通过从步骤S31到步骤S46的过程,与从根据原始 信号根音判别特征量和原始信号大调/小调判别特征量确定的节拍范围内的 和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的 大调和弦的概率及和弦是B的小调和弦的概率相分别地,根据中央去除的 根音判别特征量和中央去除的大调/小调判别特征量确定出节拍范围内的和 弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大 调和弦的概率及和弦是B的小调和弦的概率。以这种方式,通过根据各种特性确定的和弦概率的综合判别,确定了 各个节拍范围内的和弦。返回参考图21,如果在步骤S46判断从步骤S40到S45的过程己经被 重复了12次,则处理前进到步骤S47。在步骤S47,和弦判别部分24将具有最高概率的和弦判别为正确的和 弦。具体地,和弦判别部分24从如下的概率之中将具有最高概率的和弦 判别为正确的和弦:根据原始信号根音判别特征量和原始信号大调/小调判 别特征量确定的,节拍范围内的和弦是C的大调和弦的概率及和弦是C的 小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的 概率,以及根据中央去除的根音判别特征量和中央去除的大调/小调判别特 征量确定的,节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调 和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概

此外,和弦判别部分24将具有最高平均概率的和弦判别为正确的和 弦。具体地,和弦判别部分24将具有如下两种概率之中的最高平均概率 的和弦判别为正确的和弦:根据原始信号根音判别特征量和原始信号大调/ 小调判别特征量确定的、节拍范围内的和弦是C的大调和弦的概率及和弦是C的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率,与根据中央去除的根音判别特征量和中央去除的大调/小调判别特征量确定的、从节拍范围内的和弦是c的大调和弦的概率及和弦是c的小调和弦的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦 的概率。例如,对于从和弦是C的大调和弦的概率及和弦是C的小调和弦 的概率,到和弦是B的大调和弦的概率及和弦是B的小调和弦的概率的每 一个概率,和弦判别部分24确定根据原始信号根音判别特征量和原始信 号大调/小调判别特征量确定的概率与根据中央去除的根音判别特征量和中 央去除的大调/小调判别特征量确定的概率的平均值。然后,和弦判别部分 24将具有最高平均概率(其是从而被确定的平均值)的和弦判别为正确的 和弦。在步骤S48,和弦判别部分24将正确的和弦作为每个节拍的和弦而输 出。因此,处理结束。应注意,在此情况下,和弦判别部分24将和弦的 和弦名称作为每个节拍的和弦而输出。以这种方式,可从声音信号中准确地确定一段音乐的和弦。或者,可将和弦判别部分24配置为其根据指示以音阶顺序排列的音的 声音的能级的特征量来判别根音,然后判别和弦是大调和弦还是小调和 弦,而无需确定概率。图27示出和弦判别部分24的另一配置示例,在此情况下,和弦判别 部分24根据指示以音阶顺序排列的音的声音的能级的特征量判别根音, 然后判别和弦是大调和弦还是小调和弦,而无需确定概率。和弦判别部分24包含正确和弦判别部分91 。正确和弦判别部分91根据原始信号根音判别特征量和原始信号大调/ 小调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调

判别特征量来判别根音,并判别和弦是大调和弦还是小调和弦。例如,正 确和弦判别部分91根据原始信号根音判别特征量和原始信号大调/小调判 别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调判别特征量,直接输出指示正确和弦的索引(index)。具体地,正确和弦判别部分91根据原始信号根音判别特征量和原始信 号大调/小调判别特征量,以及中央去除的根音判别特征量和中央去除的大 调/小调判别特征量,判别基准声音是否是根音,并判别和弦的类型,即至 少判别和弦是大调和弦还是小调和弦。图28示出由正确和弦判别部分91形成的和弦判别部分24的每个节拍 的和弦判别过程的另一示例的细节。在步骤S61,和弦判别部分24从节拍特征量抽取部分23获取和弦判 别特征量,其包含每个节拍的原始信号根音判别特征量和原始信号大调/小 调判别特征量,以及中央去除的根音判别特征量和中央去除的大调/小调判 别特征量。在步骤S62,和弦判别部分24的正确和弦判别部分91判别正确的和 弦。例如,在步骤S62,正确和弦判别部分91从如下的和弦之中判别指示 节拍范围正确的和弦的正确和弦:C的大调和弦、C的小调和弦、C弁的大 调和弦、C存的小调和弦、D的大调和弦、D的小调和弦、D弁的大调和弦、 D弁的小调和弦、E的大调和弦、E的小调和弦、F的大调和弦、F的小调和 弦、F弁的大调和弦、F弁的小调和弦、G的大调和弦、G的小调和弦、G弁的 大调和弦、G弁的小调和弦、A的大调和弦、A的小调和弦、A弁的大调和 弦、A弁的小调和弦、B的大调和弦、B的小调和弦。在步骤S63,和弦判别部分24将正确的和弦作为每个节拍的和弦而输 出,然后处理结束。仍在此情况下,和弦判别部分24可将和弦的和弦名 称作为每个节拍的和弦而输出。现在,描述用于产生和弦判别部分24的基于特征量的学习。图29示出信号处理设备101的配置示例,信号处理设备101执行用于 产生和弦判别部分24的基于特征量的学习。参考图29,所示出的信号处理设备101包含与在上文中参考图1描述 的那些部分类似的节拍检测部分21、中央去除部分22和节拍特征量抽取部分23。信号处理设备101还包含和弦判别学习部分121。和弦判别学习部分121根据声音信号的预定范围内的每个节拍的和弦 判别特征量以及和弦,学习根据从节拍特征量抽取部分23提供的每个节 拍的和弦判别特征量来判别基准声音是否是根音。例如,和弦判别学习部分121根据从节拍特征量抽取部分23提供的 每个节拍的和弦判别特征量,和由每个节拍的和弦判别特征量指示的节拍 范围内的每个节拍的和弦,学习判别声音信号的节拍范围内的和弦。具体 地,和弦判别学习部分121根据特征量和由特征量指示的声音信号的节拍 范围内的正确和弦,学习判别由一个特征量到另一特征量指示的声音信号 的节拍范围内的和弦。如在图30中可见,提供到和弦判别学习部分121的每个节拍的和弦 指示由每个节拍的和弦判别特征量指示的节拍范围内的正确和弦。具体 地,在此情况下,与12个节拍范围内的每个节拍的和弦判别特征量相对 应的每个节拍的和弦指示12个节拍范围内的C、 C、 C、 C、 Am、 Am、 Am、 Am、 Em、 Em、 Em和Em的正确和弦。现在,参考图31的流程图描述和弦判别学习过程。参考图31,从步 骤S101到S104,分别执行与图12的步骤Sll到S14所执行的过程类似的 过程。在步骤S105,和弦判别学习部分121执行每个节拍的和弦判别学习过 程。然后,处理结束。在步骤S105的每个节拍的和弦判别学习过程包含,例如,学习判别 基准声音是否是根音的过程,和学习判别和弦是大调和弦还是小调和弦的 过程。图32示出学习判别基准声音是否是根音的每个节拍的和弦判别学习 过程。参考图32,在步骤S121,和弦判别学习部分121从原始声音信号 中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习 部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量 之中,获取原始信号根音判别特征量。

在步骤S122,和弦判别学习部分121移位所获取的每个节拍的和弦判 别特征量即原始信号根音判别特征量,使得正确根音的数据到达顶部。例如,如在图33中可见,在如下的情况下,即在从节拍特征量抽取 部分23提供的每个节拍的和弦判别特征量的原始信号根音判别特征量 中,表示声音名称为C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的 声音的能级的数据被以此顺序排列,并且由与每个节拍的和弦判别特征量 相对应的每个节拍的和弦指示的正确和弦是D的情况下,和弦判别学习部 分121将原始信号根音判别特征量移位两次,从而指示声音名称为D的声 音的能级的数据被排列在原始信号根音判别特征量的顶部。具体地,和弦判别学习部分121移位指示原始信号根音判别特征量的 能级的数据的排列,从而指示声音名称为C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B和C的声音的能级的数据可以此顺序排列。此外,和弦判 别学习部分121移位指示原始信号根音判别特征量的声音的能级的数据的 排列,从而指示声音名称为D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B、 C 和C弁的声音的能级的数据可以此顺序排列。返回参考图32,在步骤S123,和弦判别学习部分121将每个节拍的 和弦判别特征量添加到正确的数据,所述每个节拍的和弦判别特征量即为 使得正确根音的数据到达顶部而被移位了的原始信号根音判别特征量。在步骤S124,和弦判别学习部分121再次将移位了的每个节拍的和弦 判别特征量移位一个声音的距离,并将每个节拍的和弦判别特征量即原始 信号根音判别特征量添加到不正确的数据。在步骤S125,和弦判别学习部分121判断步骤S124的过程是否被重 复了 11次。因此,处理返回步骤S124,直到步骤S124的过程被重复了 11次。如果在步骤S125判断步骤S124的过程被重复了 11次,则处理前进 到步骤S126。在步骤S126,和弦判别学习部分121判断是否对所有节拍 执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤 S121,从而对下一节拍重复在上文中描述的过程。如果在步骤S126其确定对所有节拍执行了处理,则处理前进到歩骤

S127。在步骤S127,和弦判别学习部分121根据取决于原始信号根音判别特征量而产生的正确数据和不正确数据,通过机器学习,产生用于判别每 个节拍的和弦判别特征量的第一数据的声音是否是根音的判别部分。例如,如在图34中可见,和弦判别学习部分121执行根音判别部分 64的学习,使得其中第一数据的声音是根音并且是利用GP (遗传编 程)、各种抑制分析或类似方法,基于原始信号根音判别特征量产生的正 确数据时,响应于每个节拍的和弦判别特征量的输入而输出真(True), 并且其中第一数据的声音是除根音外的任何音并且是基于原始信号根音判 别特征量产生的不正确的数据时,响应于每个节拍的和弦判别特征量的输 入而输出假(False)。在步骤S12S,和弦判别学习部分121从去除了中央分量的声音信号中 获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学习部 分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征量之 中获取中央去除的根音判别特征量。在步骤S129,和弦判别学习部分121移位所获得的每个节拍的和弦判 别特征量即中央去除的根音判别特征量,使得正确根音的数据到达顶部。例如,在如下的情况下,即在中央去除的根音判别特征量中,表示声 音名称为C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的声音的能级 的数据以此顺序排列,并且与每个节拍的和弦判别特征量相对应的每个节 拍的正确和弦是E的情况下,和弦判别学习部分121将中央去除的根音判 别特征量移位四次,从而指示声音名称为E的声音的能级的数据被排列在 中央去除的根音判别特征量的顶部。在步骤S130,和弦判别学习部分121将每个节拍的和弦判别特征量添 加到正确数据,该每个节拍的和弦判别特征量是为使得正确根音的数据到 达顶部而被移位了的中央去除的根音判别特征量。在步骤S131,和弦判别学习部分121进一步将移位了的每个节拍的和 弦判别特征量移位一个声音的距离,并添加每个节拍的和弦判别特征量即 中央去除的根音判别特征量。在步骤S132,和弦判别学习部分121判断步骤S131的过程是否被重36

复了 11次,并且处理返回步骤S131,直到步骤S131的过程被重复了 11次。如果在步骤S132判断步骤S131的过程被重复了 11次,则处理前进 到步骤S133,在步骤S133,和弦判别学习部分121判断是否对所有节拍 执行了处理。如果其确定尚未对所有节拍执行处理,则处理返回步骤 S128,从而对所有节拍重复了上述过程。如果在步骤S133其判断对所有节拍执行了处理,则处理前进到步骤 S134。在步骤S134,和弦判别学习部分121从基于中央去除的根音判别特 征量而产生的正确数据和不正确数据,通过机器学习,产生用于判别每个 节拍的和弦判别特征量的第一数据的声音是否是根音的判别部分。例如,和弦判别学习部分121执行根音判别部分64的学习,使得其 中第一数据的声音是根音并且是利用GP (遗传编程)、各种抑制分析或 类似方法基于中央去除的根音判别特征量产生的正确数据时,响应于每个 节拍的和弦判别特征量的输入而输出真,并且其中第一数据的声音是除根 音外的任何音并且是基于中央去除的根音判别特征量产生的不正确的数据 时,响应于每个节拍的和弦判别特征量的输入而输出假。现在,参考图35描述每个节拍的学习在大调和弦与小调和弦之间的 和弦判别的和弦判别学习过程。在步骤S151,和弦判别学习部分121从原 始声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和 弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦 判别特征量之中,获取原始信号大调/小调判别特征量。在步骤S152,和弦判别学习部分121移位所获取的每个节拍的和弦判 别特征量即原始信号大调/小调判别特征量,使得正确根音到达顶部。在步骤S153,和弦判别学习部分121判别与每个节拍的和弦判别特征 量相对应的节拍的正确和弦是否是大调和弦。如果其判断正确和弦是大调 和弦,则处理前进到步骤S154。在步骤S154,和弦判别学习部分121将 每个节拍的和弦判别特征量添加到为真的数据,该每个节拍的和弦判别特 征量是为使得正确根音的数据到达顶部而被移位了的原始信号大调/小调判 别特征量。然后,处理前进到步骤S156。

如果在步骤S153判断出正确和弦不是大调和弦,即正确和弦是小调和弦,则处理前进到步骤S155。在步骤S155,和弦判别学习部分121将 每个节拍的和弦判别特征量添加到为假的数据,该每个节拍的和弦判别特 征量是为使得正确数据到达顶部而被移位了的原始信号大调/小调判别特征 量。然后,处理前进到步骤S156。在步骤S156,和弦判别学习部分121判断是否对所有节拍执行了处 理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S151,使得对 下一节拍重复上述过程。如果在步骤S156判断对所有节拍执行了处理,则处理前进到步骤 S157。在步骤S157,和弦判别学习部分121从基于原始信号大调/小调判 别特征量而产生的为真的数据和为假的数据,通过机器学习,产生用于判 别和弦是大调和弦还是小调和弦的判别部分,在此情况下每个节拍的和弦 判别特征量的第一数据的声音是根音。例如,如在图36中可见,和弦判别学习部分121执行大调/小调判别 部分65的学习,使得响应于为真的数据的输入而输出真,其中第一数据 的声音是根音并且是利用GP、各种递归分析或类似方法基于从大调和弦 的节拍范围中抽取的原始信号大调/小调判别特征量而产生的,并且响应于 为假的数据的输入而输出假,其中第一数据的声音是根音并且是基于从小 调和弦的节拍范围中抽取的原始信号大调/小调判别特征量而产生的。返回参考图35,在步骤S158,和弦判别学习部分121从去除了中央分量的声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况 下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍 的和弦判别特征量之中获得中央去除的大调/小调判别特征量。在步骤S159,和弦判别学习部分121移位所获取的每个节拍的和弦判 别特征量即中央去除的大调/小调判别特征量,使得正确根音的数据到达顶 部。在步骤S160,和弦判别学习部分121判别与每个节拍的和弦判别特征 量相对应的节拍的正确和弦是否是大调和弦。如果判断正确和弦是大调和 弦,则处理前进到步骤S161。在步骤S161,和弦判别学习部分121将每

个节拍的和弦判别特征量添加到为真的数据,该每个节拍的和弦判别特征 量是使得正确根音的数据到达顶部而被移位了的中央去除的大调/小调判别 特征量。然后,处理前进到步骤S163。如果在步骤S160判断正确和弦不是大调和弦,即正确和弦是小调和 弦,则处理前进到步骤S162。在步骤S162,和弦判别学习部分121将每 个节拍的和弦判别特征量添加到为假的数据,该每个节拍的和弦判别特征 量是使得正确根音的数据到达顶部而被移位了的中央去除的大调/小调判别 特征量。然后,处理前进到步骤S163。在步骤S163,和弦判别学习部分121判断是否对所有节拍执行了处 理。如果其确定尚未对所有节拍执行处理,则处理返回步骤S158,使得上 述过程被重复。如果在步骤S163判断对所有节拍执行了处理,则处理前进到步骤 S164。在步骤S164,和弦判别学习部分121从基于中央去除的大调/小调 判别特征量而产生的为真的数据和为假的数据,通过机器学习,产生用于 判别和弦是大调和弦还是小调和弦的判别部分,在此情况下每个节拍的和 弦判别特征量的第一数据的声音是根音。然后,处理结束。例如,和弦判别学习部分121执行大调/小调判别部分63的学习,从 而响应于为真的数据的输入而输出真,其中第一数据的声音是根音并且是 利用GP、各种递归分析或类似方法基于从大调和弦的节拍范围中抽取的 中央去除的大调/小调判别特征量而产生的,并且响应于为假的数据的输入 而输出假,其中第一数据的声音是根音并且是基于从小调和弦的节拍范围 中抽取的中央去除的大调/小调判别特征量而产生的。现在,描述用于产生正确和弦判别部分91的学习。图37示出学习判别第一数据的声音是否是根音以及判别和弦是大调 和弦还是小调和弦的每一节拍的和弦判别学习过程。参考图37,首先在步骤S181,和弦判别学习部分121从原始声音信 号中获取每个节拍的和弦判别特征量。具体地,在此情况下,和弦判别学 习部分121从由节拍特征量抽取部分23提供的每个节拍的和弦判别特征 量之中,获取原始信号根音判别特征量和原始信号大调/小调判别特征量。 在步骤S182,和弦判别学习部分121将每个节拍的和弦判别特征量和正确和弦名称添加到教导数据(teacher data),所述每个节拍的和弦判别 特征量是原始信号根音判别特征量和原始信号大调/小调判别特征量,所述 正确和弦名称是由与每个节拍的和弦判别特征量相对应的每个节拍的和弦 指示的正确和弦的名称。在步骤S183,和弦判别学习部分121移位每个节拍的和弦判别特征量 (原始信号根音判别特征量和原始信号大调/小调判别特征量)和正确声音 名称一个声音的距离,并将移位了的每个节拍的和弦判别特征量和正确和 弦名称添加到教导数据。在步骤S184,和弦判别学习部分121判断在步骤S183的过程是否被 重复了11次,并且处理返回步骤S183,直到在步骤S183的过程被重复了 11次。如果在步骤S184判断步骤S183的过程被重复了 11次,则处理前进 到步骤S185。例如,如在图38中可见,在正确的和弦名称(由与每个节拍的和弦 判别特征量相对应的每个节拍的和弦指示的正确和弦的名称)是D的情况 下,原始信号根音判别特征量和原始信号大调/小调判别特征量(其中表示 声音名称为C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B的声音的能 级的数据以此顺序排列)与正确的和弦名称D—起被添加到教导数据。然后,和弦判别学习部分121移位表示原始信号根音判别特征量和原 始信号大调/小调判别特征量的声音的能级的数据,从而指示声音名称为 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B禾卩C的声音的能级的数据可 以此顺序排列。此外,和弦判别学习部分121将正确的和弦名称移位到 C#。和弦判别学习部分121将原始信号根音判别特征量和原始信号大调/小 调判别特征量(其中指示声音名称为C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B和C的声音的能级的数据被以此顺序排列)与正确的和弦名称 C弁一起添加到教导数据。此外,和弦判别学习部分121移位表示原始信号根音判别特征量和原 始信号大调/小调判别特征量的声音的能级的数据,从而指示声音名称为 D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B、 C禾n C弁的声音的能级的数据可 以此顺序排列。此外,和弦判别学习部分121将正确的和弦名称移位到 D。和弦判别学习部分121将原始信号根音判别特征量和原始信号大调/小 调判别特征量(其中指示声音名称为D、 D#、 E、 F、 F#、 G、 G#、 A、 A#、 B、 C和C弁的声音的能级的数据被以此顺序排列)与正确的和弦名称 D—起添加到教导数据。以这种方式,将移位指示原始信号根音判别特征量和原始信号大调/小 调判别特征量中的声音的能级的数据的排列重复11次,从而将来自一个 原始信号根音判别特征量的12个数据添加到教导数据,并将来自一个原 始信号大调/小调判别特征量的12个数据添加到教导数据。返回参考图37,在步骤S185,和弦判别学习部分121从去除了中央 分量的声音信号中获取每个节拍的和弦判别特征量。具体地,在此情况 下,和弦判别学习部分121从由节拍特征量抽取部分23提供的每个节拍 的和弦判别特征量之中获取中央去除的根音判别特征量和中央去除的大调/ 小调判别特征量。在步骤S186,和弦判别学习部分121将每个节拍的和弦判别特征量及 正确的和弦名称添加到教导数据,该每个节拍的和弦判别特征量即中央去 除的根音判别特征量和中央去除的大调/小调判别特征量,该正确的和弦名 称是由与每个节拍的和弦判别特征量相对应的每个节拍的和弦指示的正确 和弦的名称。在步骤S187,和弦判别学习部分121将每个节拍的和弦判别特征量 (中央去除的根音判别特征量和中央去除的大调/小调判别特征量)及正确 的和弦名称移位一个声音的距离,并将移位了的每个节拍的和弦判别特征 量及正确的和弦名称添加到教导数据。在步骤S188,和弦判别学习部分121判断在歩骤S187的过程是否被 重复了11次,并且处理返回步骤S187,直到在步骤S187的过程被重复了 11次。如果在步骤S187判断在步骤S187的过程被重复了 11次,则处理前 进到步骤S189。

在步骤S189,和弦判别学习部分121判断是否对所有节拍执行了处理。如果其判断尚未对所有节拍执行处理,则处理返回步骤S181,从而对下一节拍重复上述过程。如果在步骤S189其判断对所有节拍执行了处理,则和弦判别学习部 分121根据所产生的教导数据,通过机器学习,产生用于判别正确的和弦 名称的判别部分。因此,处理结束。例如,在步骤S190,和弦判别学习部分121产生利用诸如k近邻(k-Nearest Neighbor) 、 SVM (Support Vector Machine,支持向量机)、朴素 贝叶斯(Naive Bayes)、将具有最小距离的和弦判别为正确的和弦的氏 距离(Mahalanobis distance)或将具有最高概率的和弦判别为正确的和弦 的GMM (Gaussian Mixture Model,高斯混合模型)之类的技术,根据所 产生的教导数据判别正确的和弦名称的判别部分。以这种方式,和弦判别学习部分121执行正确和弦判别部分91的学 习,用于基于如上所述产生的教导数据,根据原始信号根音判别特征量和 原始信号大调/小调判别特征量以及中央去除的根音判别特征量和中央去除 的大调/小调判别特征量,判别正确的和弦。在以如上所述的这种方式处理声音信号的情况下,可判别音乐的和 弦。此外,在特征量指示以基准声音(预定音的声音)为基准以音阶顺序 排列的声音(其是声音信号的预定范围内十二平均律的不同音的声音)的 特性,并且通过基于特征量的学习而预先产生装置,根据特征量来判别基 准声音是否是根音的情况下,从声音信号中可准确地判别一段音乐的和 弦。此外,在通过使用声音信号的信号处理来执行学习的情况下,利用信 号处理的结果,可从声音信号中判别一段音乐的和弦。此外,在特征量指 示以基准声音(预定音的声音)为基准以音阶顺序排列的声音(其是声音 信号的预定范围内十二平均律的不同音的声音)的特性,并且基于特征量 和声音信号范围内的和弦学习根据特征量判别基准声音是否是根音的情况 下,可以更高精度从声音信号中判别一段音乐的和弦的根音。应注意,信号处理设备11可以是处理声音信号的任何设备,并且例

如可将其配置为记录并再现声音信号的固定设备或便携式设备。此外,虽然在前述描述中,将表示基准声音的能级的数据排列在特征 量的顶部,但是对此数据的排列并不局限于此,可将基准声音的能级的数 据置于特征量中的任意位置,例如置于特征量的末尾或中部。应注意,虽然前述描述针对判别声音信号的节拍范围内的和弦,但和 弦的范围并不局限于此,可判别声音信号的预定范围内的和弦,例如小节 范围或预定节拍数的范围。在此情况下,抽取和弦的确定范围内的声音信 号的特征量。虽然上述一系列的处理可由硬件执行,然而也可由软件来执行这些处 理。在由软件执行一系列处理的情况下,将构成软件的程序从程序记录介 质安装到被并入专用硬件的计算机,或例如通过安装各种程序可执行各种 功能的通用个人计算机。图39示出根据程序执行在上文中描述的一系列处理的个人计算机的配置示例。参考图39,中央处理单元(CPU) 201根据存储在只读存储器 (ROM) 202或存储部分208中的程序执行各种处理。将要被CPU 201执 行的程序、数据等被适当地存储在随机存取存储器(RAM) 203中。通过 总线204将CPU 201 、 ROM 202和RAM 203彼此连接。通过总线204还将输入/输出接口 205连接到CPU 201。将包含键盘鼠标、麦克等的输入部分206和包含显示单元、扬声器等的输出部分 207等等连接到输入/输出接口 205。 CPU 201根据从输入部分206输入的 指令执行各种处理。然后,CPU201向输出部分207输出处理结果。由硬盘或类似物构成的存储部分208被连接到输入/输出接口 205,并 存储将要被CPU 201执行的程序和各种数据。通信部分209与通过诸如互 联网及/或局域网之类的网络连接到它的外部设备通信。可通过通信部分209获得程序,并且可将获得的程序存储到存储部分 208中。驱动器210连接到输入/输出接口 205。当将诸如磁盘、光盘、磁光 盘、半导体存储器或类似物之类的可移动介质211适当地载入驱动器210 中时,驱动器210驱动可移动介质211。此后,驱动器210获得记录在可

移动介质211上的程序、数据等。在必要时将获得的程序或数据传送到并存储到存储部分208中。其上记录了将要被安装到计算机中并且将要被置于计算机的执行环境中的程序的程序记录介质可以是,如图39所示,例如由磁盘(包含软 盘)、光盘(包含CD-ROM (压縮盘只读存储器)和DVD (数字多功能 光盘),磁光盘)或半导体存储器构成的封装介质形式的可移动介质 211。另外,可将程序记录介质形成为ROM 202、存储部分208中包含的 硬盘或类似物,其中程序被临时地或永久地记录。在必要时,利用诸如局 域网、互联网或数字卫星广播之类的有线或无线通信介质,通过作为诸如 路由器和调制解调器之类的接口的通信部分209将程序存储到程序记录介 质。应注意,在本说明书中,描述记录在程序记录介质中的程序的步骤可 以按照所描述的时间顺序处理,但并非必需如此,并且包括被并行执行的 或被个别执行的处理而无需按照时间顺序处理。虽然已经利用特定术语描述了本发明的优选实施例,然而此描述仅是 出于说明性的目的,并且应理解可做出改变和变更而不会背离以下权利要 求的精神或范围。本发明包含与2006年10月20日递交到日本专利局的日本专利申请 JP 2006-286259相关的主题,通过引用将该日本专利申请的全部内容结合 于此。

QQ群二维码
意见反馈