信号处理装置和方法及程序

申请号 CN201310169340.2 申请日 2013-05-09 公开(公告)号 CN103390405A 公开(公告)日 2013-11-13
申请人 索尼公司; 发明人 山口健; 加藤靖彦;
摘要 这里公开一种 信号 处理装置,包括:第一A/D转换器,配置为通过以第一增益调整 输入信号 执行A/D转换;第二A/D转换器,配置为通过以小于第一增益的第二增益调整输入信号执行A/D转换;合成 块 ,配置为如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号和通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及 信号处理 块,配置为通过使用从合成块输出的信号执行信号处理。
权利要求

1.一种信号处理装置,包括:
第一A/D(模拟/数字)转换器,配置为通过以第一增益调整输入信号执行A/D转换;
第二A/D转换器,配置为通过以小于第一增益的第二增益调整输入信号执行A/D转换;
合成,配置为如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号和通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及信号处理块,配置为通过使用从合成块输出的信号执行信号处理。
2.根据权利要求1所述的信号处理装置,其中,信号处理块通过使用从合成块输出的信号执行语音识别处理。
3.根据权利要求2所述的信号处理装置,其中,合成块输入用于每个窗口部分的第一信号和第二信号,以及如果输入的第一信号的窗口部分被剪辑,合成块合成第一信号与第二信号以输出合成后的信号。
4.根据权利要求3所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分,合成块用第二信号的窗口部分取代第一信号的窗口部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
5.根据权利要求3所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分的剪辑后的样本部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值来取代该部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
6.根据权利要求3所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分的剪辑后的样本部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值来取代该部分,执行位调整,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
7.根据权利要求3所述的信号处理装置,其中,如果第一信号的窗口部分没有被剪辑,合成块输出第一信号。
8.根据权利要求2所述的信号处理装置,其中,对于其中第一信号被剪辑的部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值取代该部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
9.根据权利要求8所述的信号处理装置,其中,如果第一信号没有被剪辑,合成块输出该第一信号。
10.一种信号处理装置执行的信号处理方法,包括:
通过以第一增益调整输入信号执行第一A/D(模拟/数字)转换;
通过以小于第一增益的第二增益调整输入信号执行第二A/D转换;
如果第一信号被剪辑,合成通过第一A/D转换获取的第一信号与通过第二A/D转换获取的第二信号,以输出作为结果的合成后的信号;以及
通过使用由此合成并输出的信号执行信号处理。
11.一种配置为使得计算机执行处理的程序,所述处理包括:
通过第一A/D(模拟/数字)转换器,通过以第一增益调整输入信号执行A/D转换;
通过第二A/D转换器,通过以小于第一增益的第二增益调整输入信号执行A/D转换;
如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号与通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及通过使用由此合成并输出的信号执行信号处理。

说明书全文

信号处理装置和方法及程序

技术领域

[0001] 本公开涉及信号处理装置和方法及程序,尤其涉及配置为减轻剪辑引起的处理性能的下降的信号处理装置和方法及程序。

背景技术

[0002] 在现有技术中,通过麦克输入很大的声音引起A/D(模拟/数字)转换时的剪辑,导致损失信息。在语音识别系统中,试图对剪辑后的声音进行分析造成不正确的分析,由此显著地降低识别性能。
[0003] 为了避免上述问题,提出日本专利特开第2008-129084(下文中称为专利文献1)中公开的技术,其中,一旦发生剪辑,丢弃剪辑后的数据并且将其通知给说话者,由此提示说话者再次发出声音。发明内容
[0004] 然而,上述专利文献1中公开的方法通过请求说话者重复讲话向说话者强加过多负担。例如,如果说话者意识到说话者正在向语音识别系统讲话,则可实行相应地在系统侧采取动作;另一方面,如果说话者没有意识到系统,则不可能提示说话者再次讲话用于语音识别。
[0005] 此外,在系统配置为检测诸如炮火声之类的不寻常声音的情况下,提示重新发出不寻常的声音是不可行的。
[0006] 为了克服上述问题,可能提供具有不引起针对大的声音的剪辑的增益的A/D转换布置。然而,利用这样的布置,如果同时处理人类声音和炮火声音的具有很大不同增益的声音,劣化较低声音的分辨率,由此例如降低有关系统的性能。在该情况下,来自噪声的影响变得显著,这也会降低性能。
[0007] 因此,本公开致于与现有技术方法和装置相关联的上述和其他问题,并且期望提供一种配置为减轻剪辑引起的处理性能的降低的信号处理装置和方法以及程序。
[0008] 根据本公开的一个实施例,提供一种信号处理装置,包括:第一A/D转换器,配置为通过以第一增益调整输入信号执行A/D转换;第二A/D转换器,配置为通过以小于第一增益的第二增益调整输入信号执行A/D转换;合成,配置为如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号和通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及信号处理块,配置为通过使用从合成块输出的信号执行信号处理。
[0009] 根据本公开的另一个实施例,提供一种信号处理装置执行的信号处理方法,包括:通过以第一增益调整输入信号执行第一A/D转换;通过以小于第一增益的第二增益调整输入信号执行第二A/D转换;如果第一信号被剪辑,合成通过第一A/D转换获取的第一信号与通过第二A/D转换获取的第二信号,以输出作为结果的合成后的信号;以及通过使用由此合成并输出的信号执行信号处理。
[0010] 根据本公开的进一步的实施例,提供一种配置为使得计算机执行处理的程序,所述处理包括:通过第一A/D转换器,通过以第一增益调整输入信号执行A/D转换;通过第二A/D转换器,通过以小于第一增益的第二增益调整输入信号执行A/D转换;如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号与通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及通过使用由此合成并输出的信号执行信号处理。
[0011] 根据本公开的上述实施例,通过第一增益调整输入信号以执行第一A/D转换,并且通过小于第一增益的第二增益调整输入信号以执行第二A/D转换。然后,如果通过第一A/D转换获取的第一信号被剪辑,相互合成第一信号和通过第二A/D转换获取的第二信号以被输出。通过使用该输出的合成后的信号执行信号处理。
[0012] 根据本公开的上述实施例,可以实现信号处理。尤其可以减轻由于剪辑引起的处理性能的降低。附图说明
[0013] 参考附图从实施例的以下描述中,本公开的其他目的和优点将变得显然。
[0014] 图1是图示根据本公开的第一实施例的语音识别系统的示例性配置的框图
[0015] 图2是图示根据第一实施例的要由合成块执行的合成处理的图;
[0016] 图3是指示根据第一实施例信号处理的一个示例的流程图
[0017] 图4是图示根据第二实施例的语音识别系统的示例性配置的框图;
[0018] 图5是图示根据第二实施例的要由合成块执行的合成处理的图;
[0019] 图6是指示根据第二实施例的信号处理的一个示例的流程图;
[0020] 图7是指示根据第二实施例的信号处理的另一示例的流程图;
[0021] 图8是指示根据第二实施例的信号处理的另一示例的流程图;以及[0022] 图9是图示计算机的示例性配置的框图。

具体实施方式

[0023] 这里公开的技术将通过其实施例参考附图进一步详细描述。以下面的顺序进行描述。
[0024] 1.第一实施例
[0025] 2.第二实施例
[0026] <1.第一实施例>
[0027] [语音识别系统的示例性配置]
[0028] 参考图1,示出作为基于本公开的信号处理装置的语音识别系统的示例性配置。应该注意,在图1所示的示例中,未示出与本公开的描述无关的部分。
[0029] 在图1所示的示例中,语音识别系统11包括麦克风21、A/D转换器22-1和22-2、合成块23、窗口分割块24和语音识别块25。
[0030] 麦克风21输入语音到语音识别系统11。通过麦克风21输入的语音被输出到两个A/D转换器22-1和22-2。
[0031] A/D转换器22-1和22-2具有不同增益设置。在A/D转换器22-1中,设置第一增益。在A/D转换器22-2中,设置小于第一增益的第二增益。
[0032] A/D转换器22-1利用第一增益调整(或者放大)(以模拟信号)输入的语音,并且对增益调整后的模拟信号执行A/D转换,由此转换成数字信号。A/D转换器22-1输出该数字信号到合成块23作为输出1。
[0033] A/D转换器22-2利用第二增益调整(以模拟信号)输入的输入语音,并且对增益调整后的模拟信号执行A/D转换,由此转换成数字信号。A/D转换器22-2输出该数字信号到合成块23作为输出2。
[0034] 基本地,来自A/D转换器22-1的输出1用于后级的语音识别。因此,设置第一增益,使得来自A/D转换器22-1的输出1的分辨率变得等于或者高于对于语音识别必要的最低分辨率。即,A/D转换器22-1在分辨率上高于A/D转换器22-2。
[0035] 设置第二增益,使得增益调整小于(或者低于)第一增益。结果,如果通过A/D转换器22-1中的第一增益发生剪辑,则利用A/D转换器22-2中的第二增益不导致剪辑。
[0036] 合成块23确定作为来自A/D转换器22-1的数字信号的输出1是否被剪辑。通过数字信号的输出1是否是其最大值,可以进行该确定。
[0037] 如果没有发现剪辑,则合成块23将来自A/D转换器22-1的输出1输出到下一级中的窗口分割块24。如果发现剪辑,则合成块23将来自A/D转换器22-1的输出1与来自A/D转换器22-2的输出2合成,并且输出作为结果的信号到下一级中的窗口分割块24。
[0038] 窗口分割块24输入从合成块23供应的信号。该信号是时间序列连续信号。因此,窗口分割块24将输入的时间序列连续信号分割为要由语音识别块25执行的FFT(快速傅立叶变换)的窗口宽度,并且将每个窗口宽度的信号输出到语音识别块25。
[0039] 语音识别块25对从窗口分割块24供应的每个窗口宽度的信号执行作为信号处理的语音识别处理。语音识别块25基于对从窗口分割块24供应的每个窗口宽度的信号的模型比较,执行语音识别处理,诸如FFT、特征提取和似然度计算,由此获取语音识别结果。语音识别块25获取的语音识别结果用在下一级,未示出。
[0040] [合成处理的描述]
[0041] 下面参考图2描述要由合成块23执行的合成处理的一个示例。
[0042] 图2所示的示例指示到A/D转换器22-1和22-2的输入信号的波形31、来自A/D转换器22-1的输出信号的波形32、来自A/D转换器22-2的输出信号的波形33、和通过合成块23的合成获取的输出信号的波形34。
[0043] 具有波形31指示的音量的输入信号从麦克风21输入到A/D转换器22-1和22-2。
[0044] A/D转换器22-1通过利用第一增益执行增益调整,对具有波形31的输入信号执行A/D转换。然而,在A/D转换器22-1中,剪辑利用第一增益来增益调整的信号的部分(下文称为CL部分),由此从A/D转换器22-1输出带有剪辑的CL部分的具有波形32的输出信号。
[0045] A/D转换器22-2通过利用第二增益的增益调整,对具有波形31的输入信号执行A/D转换。因为设置第二增益,使得调整第二增益的信号变得小于第一增益的信号,所以具有不带有剪辑的波形33的输出信号从A/D转换器22-2被输出。
[0046] 合成块23通过确定从A/D转换器22-1供应的具有波形32的输出信号是否具有其最大值,来确定是否已经发生剪辑。如果在具有波形32的信号中发现剪辑,则合成块23合成波形32的信号与波形33的信号,并且输出作为结果的信号到下一级中的窗口分割块24。
[0047] 更具体地,合成块23用通过使用第一增益和第二增益之间的差异调整粗线指示的具有波形33的信号而获取的值,来仅取代含有具有波形32的信号的剪辑的CL部分而执行合成。第一增益和第二增益之间的这个差异预先存储在合成块23中。
[0048] 在合成块23中,如利用粗虚线所示,获取具有波形34的合成信号,波形34具有用通过将波形33增加第一增益和第二增益之间的差异而获取的值取代波形32中的CL部分。
[0049] 在下一级的语音识别处理中,使用带有未剪辑的CL部分的具有波形34的信号,使得可以降低语音识别的性能中的劣化。
[0050] 应该注意,如果在波形32的信号中没有发现剪辑,则合成块23向下一级中的窗口分割块24输出波形32的信号。
[0051] [语音信号处理的示例]
[0052] 下面参考图3所示的流程图描述要由语音识别系统11执行的语音信号处理。
[0053] 在步骤S11,麦克风21输入语音。通过麦克风21输入的语音被输出到两个A/D转换器22-1和22-2。
[0054] 在步骤S12,A/D转换器22-1和22-2对从麦克风21供应的信号执行A/D转换。
[0055] 更具体地,A/D转换器22-1利用第一增益来增益调整(或者放大)输入的语音(模拟信号),并且对增益调整的模拟信号执行A/D转换为数字信号。A/D转换器22-1输出作为结果的数字信号到合成块23作为输出1。
[0056] A/D转换器22-2利用第二增益来增益调整输入的语音(模拟信号),并且对增益调整的模拟信号执行A/D转换为数字信号。A/D转换器22-2输出作为结果的数字信号到合成块23作为输出2。
[0057] 在步骤S13,合成块23确定作为从A/D转换器22-1供应的数字信号的输出1是否被剪辑。如果在步骤S13发现输出1已经被剪辑,则过程转到步骤S14。
[0058] 在步骤S14,合成块23对于不具有剪辑的部分输出输出1到下一级,并且对于剪辑的CL部分将输出2增加增益差异,供应作为结果的值到下一级。即,合成块23合成来自A/D转换器22-1的输出1和来自A/D转换器22-2的输出2,并且输出作为结果的信号到下一级中的窗口分割块24。
[0059] 如果在步骤S13没有发现剪辑,则过程转到步骤S15。在步骤S15,合成块23将从A/D转换器22-1供应的输出1供应到下一级中的窗口分割块24。
[0060] 在步骤S16,窗口分割块24对从合成块23供应的信号执行窗口分割。窗口分割块24将输入的时间序列连续信号分割为要由语音识别块25执行的FFT的窗口宽度,并且输出每个窗口宽度的信号到语音识别块25。
[0061] 在步骤S17,语音识别块25对从窗口分割块24供应的每个窗口宽度的信号执行语音识别处理,以获取语音识别结果。从语音识别块获取的语音识别结果用在下一级,未示出。
[0062] 如上所述,A/D转换之后的信号中,用具有更小增益的A/D转换之后的信号来取代剪辑后的部分,使得可以防止由于剪辑引起的信号损失。如果信号损失,则什么都不能做。通过此配置,信号处理的性能,即语音识别性能可以被增强。
[0063] 在信号取代中,可以取代信号调整为增加增益差异,使得可以最小化由于低信号分辨率引起的劣化。
[0064] <2.第二实施例>
[0065] [语音识别系统的另一示例性配置]
[0066] 参考图4,示出作为基于本公开的信号处理装置的语音识别系统的另一示例性配置。
[0067] 在图4示出的示例中,语音识别系统51包括麦克风21、A/D转换器22-1和22-2、窗口分割块61-1和61-2、合成块62和语音识别块25。
[0068] 应该注意,语音识别系统51在麦克风21、A/D转换器22-1和22-2和语音识别块25,与图1所示的语音识别系统11是共同的。
[0069] 语音识别系统51与图1所示的语音识别系统11不同在于合成块23由合成块62取代,并且窗口分割块24由窗口分割块61-1和61-2取代。
[0070] 更具体地,语音识别系统51中的合成块和窗口分割块的顺序与图1中所示的语音识别系统11的合成块和窗口分割块的顺序相反。
[0071] A/D转换器22-1通过第一增益来增益调整(或者放大)输入的语音,并且对增益调整后的模拟信号执行A/D转换为数字信号。A/D转换器22-1输出该数字信号到窗口分割块61-1。
[0072] A/D转换器22-2通过第二增益来增益调整输入的语音,并且对增益调整后的模拟信号执行A/D转换为数字信号。A/D转换器22-2输出该数字信号到窗口分割块61-2。
[0073] 窗口分割块61-1将从A/D转换器22-1供应的时间序列连续信号分割为要由语音识别块25执行的FFT的窗口宽度,并且输出每个窗口宽度的信号到合成块62作为输出1。
[0074] 窗口分割块61-2将从A/D转换器22-2供应的时间序列连续信号分割为要由语音识别块25执行的FFT的窗口宽度,并且输出每个窗口宽度的信号到合成块62作为输出2。
[0075] 来自窗口分割块61-1的每个窗口宽度的数字信号和来自窗口分割块61-2的每个窗口宽度的数字信号被输入到合成块62中。合成块62对于每个窗口部分确定作为来自窗口分割块61-1的数字信号的输出1是否被剪辑。该确定通过确定作为数字信号的输出1是否采用最大值来完成。
[0076] 如果没有发现剪辑,则合成块62向下一级中的语音识别块25输出从窗口分割块61-1供应的输出1。如果发现剪辑,则合成块62对于剪辑后的窗口部分的信号合成来自窗口分割块61-1的输出1和来自窗口分割块61-2的输出2,并且输出作为结果的信号到下一级中的语音识别块25。
[0077] 语音识别块25对从合成块62供应的每个窗口宽度的信号执行作为信号处理的语音识别处理。语音识别块25基于对从合成块62供应的每个窗口宽度的信号的模型比较执行语音识别处理,诸如FFT、特征提取和似然度计算,由此获取语音识别结果。语音识别块25获取的语音识别结果用在下一级,未示出。
[0078] [合成处理的描述]
[0079] 下面参考图5描述要由合成块62执行的合成处理的一个示例。
[0080] 在图5所示的示例中,示出从窗口分割块61-1供应的输出信号的波形71和从窗口分割块61-2供应的输出信号的波形72。
[0081] 来自窗口分割块61-1的输出信号的波形71通过第一增益被增益调整并且被A/D转换。来自窗口分割块61-2的输出信号的波形72通过第二增益被增益调整并且被A/D转换。
[0082] 合成块62对于每个窗口部分W确定具有波形71的信号是否被剪辑。如果在例如虚线指示的具有波形71的信号的窗口部分W中发现剪辑,则合成块62合成波形71的信号和波形72的信号,并且输出作为结果的合成后的信号到语音识别块25。
[0083] 更具体地,合成块62对于具有剪辑的窗口部分W合成具有波形72的信号和对于不具有剪辑的另一窗口部分合成具有波形71的信号,并且输出合成后的信号到下一级。
[0084] 应该注意,在上述情形中,对于具有剪辑的窗口部分W,根据需要向语音识别块25供应指示第一增益和第二增益之间的差异的信息。预先在合成块62中存储第一增益和第二增益之间的差异。
[0085] 如上所述,因为在下面的语音识别处理中使用不具有剪辑的信号,所以可以最小化语音识别的性能中的劣化。
[0086] [语音信号处理的示例]
[0087] 下面参考图6所示的流程图描述要由语音识别系统51执行的语音信号处理。
[0088] 在步骤S51,麦克风21输入语音。通过麦克风21输入的语音被输出到两个A/D转换器22-1和A/D转换器22-2。
[0089] 在步骤S52,A/D转换器22-1和22-2对从麦克风21供应的信号执行A/D转换。
[0090] 更具体地,A/D转换器22-1通过第一增益来增益调整(或者放大)输入的信号(模拟信号),并且对增益调整后的模拟信号执行A/D转换为数字信号。A/D转换器22-1输出该数字信号到窗口分割块61-1。
[0091] A/D转换器22-2通过第二增益来增益调整输入的语音(模拟信号),并且对增益调整后的模拟信号执行A/D转换为数字信号。A/D转换器22-2输出该数字信号到窗口分割块61-2。
[0092] 在步骤S53,窗口分割块61-1和61-2对输入的数字信号执行窗口分割。
[0093] 更具体地,窗口分割块61-1将从A/D转换器22-1供应的时间序列连续信号分割为要由语音识别块25执行的FFT的窗口宽度,并且输出每个窗口宽度的信号到合成块62作为输出1。
[0094] 窗口分割块61-2将从A/D转换器22-2供应的时间序列连续信号分割为要由语音识别块25执行的FFT的窗口宽度,并且输出每个窗口宽度的信号到合成块62作为输出2。
[0095] 在步骤S54,合成块62确定作为来自窗口分割块61-1的数字信号的输出1是否在窗口部分中被剪辑。如果在步骤S54发现输出1在窗口部分中被剪辑,则过程转到步骤S55。
[0096] 在步骤S55,合成块62将共同用于窗口部分的从窗口分割块61-2供应的输出2供应到下一级。剪辑后的输出1的窗口部分用要输出的输出2的窗口部分来取代。
[0097] 应该注意,在上述情形中,对于具有剪辑的窗口部分W,按照需要向语音识别块25供应指示第一增益和第二增益之间的差异的信息。
[0098] 如果在步骤S54中发现输出1没有在窗口部分中被剪辑,则过程转到步骤S56。在步骤S56,合成块62向语音识别块25供应共同用于窗口部分的来自语音分割块61-1的输出1。
[0099] 更具体地,取决于是否在每个窗口部分中发现剪辑,合成块62合成来自窗口分割块61-1的输出1和来自窗口分割块61-2的输出2,并且输出作为结果的合成后的信号到下一级中的语音识别块25。
[0100] 在步骤S57,语音识别块25对从合成块62供应的每个窗口宽度的信号执行语音识别处理,由此获取语音识别结果。语音识别块25获取的语音识别结果用在下一级,未示出。
[0101] 如上所述,在A/D转换之后的信号中,在每个窗口部分确定存在或者不存在剪辑,并且用具有更小增益的A/D转换后的信号取代剪辑后的窗口部分。
[0102] 由此可以防止由于剪辑引起的信号损失。作为结果,可以增强语音识别性能。
[0103] 应该注意,当发现剪辑时要执行的合成处理不限于图6所示的示例;执行图7或图8所示的合成处理也是可行的。
[0104] [语音信号处理的另一示例]
[0105] 下面参考图7所示的流程图描述要由语音识别系统51执行的语音信号处理的另一示例。应该注意,图7所示的步骤71到S74和步骤S76到S78基本与图6所示的步骤S51到步骤S57相同,使得将适当地忽略其描述。
[0106] 如果在步骤S74发现输出1在窗口部分中被剪辑,则过程转到步骤S75。
[0107] 在步骤S75,在来自窗口分割块61-1的输出1中,合成块62用通过将来自窗口分割块61-2的输出2增加增益差异而获取的值,来仅取代剪辑后的样本。
[0108] 在步骤S76,合成块62向下一级中的语音识别块25供应共同用于窗口部分的输出,其中仅剪辑后的样本已经被取代。
[0109] 如果在步骤S74中发现输出1在窗口部分中没有被剪辑,则过程转到步骤S77。在步骤S77中,合成块62向下一级中的语音识别块25供应共同用于窗口部分的来自窗口分割块61-1输出1。
[0110] 取决于对于每个窗口部分是否发现剪辑,合成块62合成来自窗口分割块61-1的输出1和来自窗口分割块61-2的输出2,并且输出作为结果的合成后的信号到下一级中的语音识别块25。
[0111] 在步骤S78,语音识别块25对从合成块62供应的每个窗口宽度的信号执行语音识别处理,由此获取语音识别结果。语音识别块25获取的语音识别结果用在下一级,未示出。
[0112] 如上所示,在剪辑后的窗口部分中,用通过将具有较小增益的A/D转换之后的信号增加增益差而异获取的值,来仅取代剪辑后的样本。
[0113] 由此可以防止由于剪辑引起的信号损失。作为结果,可以增强语音识别性能。
[0114] 在信号取代中,将取代信号调整为增加增益差异,使得可以最小化由于低信号分辨率引起的劣化。
[0115] [语音信号处理的另一示例]
[0116] 下面参考图8所示的流程图描述要由语音识别系统51执行的语音信号处理的另一示例。应该注意,图8所示的步骤S91到S95和步骤S97到S99基本与图7所示的步骤S71到S78相同,使得将适当地忽略其描述。
[0117] 如果在步骤S94发现输出1在窗口部分中被剪辑,则过程进行到步骤S95。
[0118] 在步骤S95,在来自窗口分割块61-1的输出1的窗口部分中,合成块62用通过将来自窗口分割块61-2的输出2增加增益差异而获取的值,来仅取代剪辑后的样本。
[0119] 在步骤S96,合成块62对其中仅已经取代剪辑后的样本的窗口部分执行位数的调整。即,合成块62对其中仅已经取代剪辑后的样本的窗口部分执行位数的调整,使得位数适合到语音识别块25中的输入的规定数量的位。
[0120] 在步骤S97,合成块62向下一级中的语音识别块25输出以位数调整的共同用于窗口部分的输出。
[0121] 此时,按照需要还向语音识别块25供应指示已经调整多少位的信息。
[0122] 如果在步骤S94发现输出1在窗口部分没有被剪辑,则过程转到步骤S98。在步骤S98,合成块62向下一级中的语音识别块25供应共同用于窗口部分的从窗口分割块61-1供应的输出1。
[0123] 更具体地,取决于对于每个窗口部分是否发现剪辑,合成块62合成来自窗口分割块61-1的输出1和来自窗口分割块61-2的输出2,并且向下一级中的语音识别块25输出作为结果的合成后的信号。
[0124] 在步骤S99,语音识别块25对从合成块62供应的每个窗口宽度的信号执行语音识别,由此获取语音识别结果。语音识别块25获取的语音识别结果用在下一级,未示出。
[0125] 应该注意,指示多少位已经被调整的信息(在图8所示的步骤97中供应给语音识别块25的信息)用在语音识别块25中,用于例如提取功率作为特征。
[0126] 在计算功率或者Δ功率作为特征中,如果增益差异是未知的,则可能不能获取正确的值。例如,如果实际声音功率在之前中是10并且在之后帧中是20,那么如果之前帧的增益与之后帧中的增益相同,则来自之前帧的输出值是10并且来自之后帧的输出值是20。因此,这些值可以在不需要改变的情况下用于正确地计算功率。
[0127] 然而,应该注意,如果之前帧的增益与之后帧的增益相差12dB,则来自之前帧的输出值变成10并且来自之后帧的输出值变成5,使得如果增益差异是未知的,不能完成校正,由此使得不可能计算正确的特征。在这种情况下,供应指示之前和之后帧之间的增益差异是12dB的信息,允许利用是10的之前帧的功率和是5×12dB=20的之后帧的功率的校正。因此可以正确地提取特征。应该注意,虽然省略描述,但是还以相同的方式使用指示图6所示的步骤S55供应的增益差异的信息。
[0128] 如上所述,在剪辑后的窗口部分中,用通过将具有更小增益的A/D转换之后的信号增加增益差异而获取的值,来仅取代剪辑后的样本,并且调整位数。
[0129] 上述配置允许进一步防止由于剪辑引起的信号损失。作为结果,可以增强语音识别性能。
[0130] 图6到图8所示的示例用作确定每个窗口部分存在或者不存在剪辑的示例。在图6所示的示例中,不要求合成处理,使得剪辑确定可以以相对小的计算量来处理。在图7所示的示例中,可以在不需要降低分辨率的情况下执行处理。在图8所示的示例中,可以以比图6所示的示例的分辨率更高的分辨率来执行输出。此外,因为到下一级中的处理的输出的位数变得恒定,下一级中的处理的配置不复杂。
[0131] 应该注意,在上面的描述中,已经说明通过使用取决于是否发现剪辑执行的信号合成而获取的信号执行语音识别的语音识别系统;然而,本公开不限于此示例。本公开可应用于配置为通过使用取决于是否发现剪辑执行的信号合成而获取的信号执行信号处理的任何装置。
[0132] 上述处理操作的序列可以由软件以及硬件来执行。如果通过软件执行上述处理操作的序列,则在计算机中安装构成软件的程序。这里,计算机包括构建在专用硬件设备中的计算机、其中可以安装用于执行各种功能的各种程序的通用个人计算机等。
[0133] [计算机的示例性配置]
[0134] 参考图9,示出配置为使用计算机程序执行上述处理操作的序列的计算机的示例性硬件配置。
[0135] 在计算机中,通过总线204互连CPU(中央处理器)201、ROM(只读存储器)202和RAM(随机存取存储器)203。
[0136] 总线204与输入/输出接口205连接。输入/输出接口205与输入块206、输出块207、记录块208、通信块209和驱动器210连接。
[0137] 输入块206包括例如键盘鼠标和麦克风。输出块207包括例如显示器和扬声器。记录块208包括例如硬盘单元或者非易失性存储器。通信块209包括例如网络接口。驱动器210驱动可移除介质211,诸如磁盘、光盘、磁光盘或者半导体存储器之类。
[0138] 在如上所述配置的计算机中,例如,CPU201将程序从记录块208经由输入/输出接口205和总线204加载到RAM203用于执行,由此执行上述处理操作的序列。
[0139] 要由计算机(或者CPU201)执行的每个程序可以记录到例如作为要被提供的封装介质的可移除介质211。还可以通过有线或者无线传输介质(诸如局域网、因特网和数字卫星广播之类)提供每个程序。
[0140] 在计算机中,通过将其中程序被记录的可移除介质211加载到驱动器210上,可以经由输入/输出接口205将每个程序安装在记录块208中。每个程序还可以经由有线或者无线传输介质在通信块209被接收以安装在记录块208中。另外,每个程序可以预先安装在ROM202或者记录块208中。
[0141] 应该注意,要由计算机执行的每个程序可以以按这里描述的序列的与时间相关的方式、以并行方式或者基于按需被执行。
[0142] 还应该注意,这里,用于描述上述处理操作的序列的步骤除了要以根据这里描述的序列的与时间相关的方式执行的处理,还可以包括要并行或者单独执行的处理。
[0143] 本公开的实施例不限于上述那些;只要不脱离本公开的范围,可以出现各种变型和改变。
[0144] 参考上述流程图描述的每个步骤可以以划分方式通过一个装置或者两个或者更多装置来执行。
[0145] 如果两个或者更多处理操作包括在一个步骤中,则这些处理操作除了通过单个装置的执行之外,还可以以分布方式由两个或者更多装置执行。
[0146] 以上作为一个装置(或者一个处理块)描述的每个配置可以在配置上被划分为两个或者更多装置(或者处理块)。以上作为两个或者更多装置(或者处理块)描述的配置可以被配置为一个装置(或者一个处理块)。此外,可以向上述每个装置(或者每个处理块)的配置添加另一配置。另外,如果整个系统的配置和操作基本相同,则特定装置(或者特定处理块)的配置的部分可以包括在另一装置(或者另一处理块)的配置中。本公开不限于上述实施例;因此,只要不脱离本公开的精神,可以出现各种变型和改变。
[0147] 到目前为止已经通过参考附图解释优选实施例。然而,本公开的范围绝不是限于这些实施例。显而易见的是,本公开的技术领域的普通技术人员能够在权利要求描述的技术概念的范围内想到各种改变和各种修改。当然,这样的改变和修改也包括在本公的技术范围内。
[0148] 应该注意,本公开可以具有以下配置。
[0149] (1)一种信号处理装置,包括:
[0150] 第一A/D转换器,配置为通过以第一增益调整输入信号执行A/D转换;
[0151] 第二A/D转换器,配置为通过以小于第一增益的第二增益调整输入信号执行A/D转换;
[0152] 合成块,配置为如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号和通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及
[0153] 信号处理块,配置为通过使用从合成块输出的信号执行信号处理。
[0154] (2)根据以上(1)所述的信号处理装置,其中,信号处理块通过使用从合成块输出的信号执行语音识别处理。
[0155] (3)根据以上(1)或(2)所述的信号处理装置,其中,合成块输入用于每个窗口部分的第一信号和第二信号,以及如果输入的第一信号的窗口部分被剪辑,合成块合成第一信号与第二信号以输出合成后的信号。
[0156] (4)根据以上(3)所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分,合成块用第二信号的窗口部分取代第一信号的窗口部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
[0157] (5)根据以上(3)所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分的剪辑后的样本部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值来取代该部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
[0158] (6)根据以上(3)所述的信号处理装置,其中,对于其中第一信号被剪辑的窗口部分的剪辑后的样本部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值来取代该部分,执行位调整,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
[0159] (7)根据以上(3)所述的信号处理装置,其中,如果第一信号的窗口部分没有被剪辑,合成块输出第一信号。
[0160] (8)根据以上(1)或(2)所述的信号处理装置,其中,对于其中第一信号被剪辑的部分,合成块用通过将第二信号增加第一增益和第二增益之间的差异而获取的值取代该部分,并且合成第一信号与第二信号以输出作为结果的合成后的信号。
[0161] (9)根据以上(8)所述的信号处理装置,其中,在第一信号没有被剪辑的情况下,合成块输出该第一信号。
[0162] (10)一种信号处理装置执行的信号处理方法,包括:
[0163] 通过以第一增益调整输入信号执行第一A/D(模拟/数字)转换;
[0164] 通过以小于第一增益的第二增益调整输入信号执行第二A/D转换;
[0165] 如果第一信号被剪辑,合成通过第一A/D转换获取的第一信号与通过第二A/D转换获取的第二信号,以输出作为结果的合成后的信号;以及
[0166] 通过使用由此合成并输出的信号执行信号处理。
[0167] (11)一种配置为使得计算机执行处理的程序,所述处理包括:
[0168] 通过第一A/D(模拟/数字)转换器,通过以第一增益调整输入信号执行第一A/D转换;
[0169] 通过第二A/D转换器,通过以小于第一增益的第二增益调整输入信号执行第二A/D转换;
[0170] 如果第一信号被剪辑,合成通过第一A/D转换器的转换获取的第一信号与通过第二A/D转换器的转换获取的第二信号,以输出作为结果的合成后的信号;以及[0171] 通过使用由此合成并输出的信号执行信号处理。
[0172] 本公开包含于2012年5月9日向日本专利局提交的日本优先权专利申请JP2012-107458中公开的主题有关的主题,其全部内容以引用的方式合并于此。
QQ群二维码
意见反馈