首页 / 专利分类库 / 基本电子电路 / 放大的控制 / 放大器中的音调控制和带宽控制 / 用于产生音频信号的音频系统、方法,计算机系统以及音频信号

用于产生音频信号的音频系统、方法,计算机系统以及音频信号

申请号 CN200980162957.3 申请日 2009-12-16 公开(公告)号 CN102656626A 公开(公告)日 2012-09-05
申请人 罗伯特·博世有限公司; 发明人 S·范拉尔特; R·杜伊斯特斯;
摘要 本 发明 涉及用于产生音频 信号 的音频系统。更具体而言,本发明涉及音频系统,特别是音频警报系统,其用于产生 音频信号 ,所述系统包括:用于产生所述音频信号的在基本 频率 处的成分的模 块 ,以及用于产生所述音频信号的在基本频率之外的另外频率处的额外成分的模块,其中使用分隔频带将所述基本频率和所述另外频率彼此分离,以便增强所述音频信号的响度。本发明还涉及用于产生音频信号的方法, 计算机程序 以及音频信号。
权利要求

1.音频系统(1),特别是音频警报系统,其用于产生音频信号,包括:
用于产生(2)所述音频信号的在基本频率处的成分的模
用于产生(3)所述音频信号的在所述基本频率之外的另外频率处的额外成分的模块,其中使用分隔频带将所述基本频率和所述另外频率彼此分隔开,以便增强所述音频信号的响度,
其特征在于,
用于定义和/或控制(4)所述音频信号的在所述基本频率处和所述另外频率处的成分的相位关系的模块。
2.如权利要求1所述的音频系统(1),其特征在于,选择所述音频信号的在所述基本频率处和所述另外频率处的成分的所述相位关系,以减小和/或最小化所述音频信号的波峰系数。
3.如权利要求2所述的音频系统(1),其特征在于,所减小的波峰系数小于参考音频信号的波峰系数的80%,特别是小于参考音频信号的波峰系数的60%,且特别是小于参考音频信号的波峰系数的40%,其中所述参考音频信号的全部成分都具有相等的相位。
4.如上述任一权利要求所述的音频系统(1),其特征在于,所述另外频率是所述基本频率的谐波,或者是从所述谐波中选出。
5.如上述任一权利要求所述的音频系统(1),其特征在于,所述分隔频带是通过以下方式来确定的:计算在所述基本频率处和所述另外频率处的听觉滤波器,其中所述听觉滤波器为每个频率指定带宽,将每个频率调谐至一频带,其中所述频率带宽被设置为不交叠。
6.如权利要求5所述的音频系统(1),其特征在于,所述听觉滤波器被实现为等效矩形带宽(ERB)滤波器。
7.如上述任一权利要求所述的音频系统(1),其特征在于,所有频率都被设置在可听频谱内,优选地在8kHz以下。
8.如上述任一权利要求所述的音频系统(1),其特征在于,所述基本频率的值是与时间相关的。
9.如权利要求8所述的音频系统(1),其特征在于,与时间相关的所述基本频率的最高频率值定义了用于所述音频信号的所述额外成分的谐波数量的最大量。
10.用于产生音频信号,特别是音频警报信号的方法,
其中,在基本频率处产生所述音频信号的成分,
其中,在所述基本频率之外的另外频率处产生所述音频信号的额外成分,其中,使用分隔频带将所述基本频率和所述另外频率彼此分隔开,以便增强所述音频信号的响度,其特征在于,
选择所述音频信号的在所述基本频率处和所述另外频率处的成分的相位关系,以便在将所述音频信号的RMS值保持在恒定平的同时降低所述音频信号的波峰系数。
11.包含程序代码模块的计算机程序,当所述计算机程序在计算机和/或如权利要求
1-9中任一项所述的音频系统(1)上执行时,所述程序代码模块能够执行权利要求10所述的方法。
12.音频信号,特别是音频警报信号,例如体现在存储器模块上,所述音频信号包括:
所述音频信号的在基本频率处的成分,
所述音频信号的在所述基本频率之外的另外频率处的额外成分,其中,使用分隔频带将所述基本频率和所述另外频率彼此分隔开,以便增强所述音频信号的响度,其特征在于,
以规则和/或人工模式来设置所述音频信号的在所述基本频率处和所述另外频率处的成分的相位关系
和/或者
波峰系数小于参考音频信号的波峰系数的80%,特别是小于参考音频信号的波峰系数的60%,且特别是小于参考音频信号的波峰系数的40%,其中,所述参考音频信号的全部成分具有相等的相位。

说明书全文

用于产生音频信号的音频系统、方法,计算机系统以及音频

信号

技术领域

[0001] 本发明涉及用于产生音频信号的音频系统。更具体而言,本发明涉及一种音频系统,特别是音频警报系统,其用于产生音频信号,所述系统包括:用于产生所述音频信号的在基本频率(base frequency)处的成分的模,以及用于产生所述音频信号的在基本频率之外的另外频率(other frequencies)处的额外成分(further component)的模块,其中使用分隔频带(separating frequency bands)将所述基本频率和所述另外频率彼此分离,以便增强所述音频信号的响度(loudness)。本发明还涉及用于产生音频信号的方法,计算机程序以及音频信号。

背景技术

[0002] 声音报警(alarm sounds)在公共建筑物中是不可缺少的,例如用于安全目的。声音报警具有向周围人群通知危险状况的功能。而且,声音报警应该在存在背景噪声的情况下能够在整个建筑物中听到,并且由此应该满足多种规定。
[0003] 声音报警经常由公共喊话系统(public address system)来提供,该公共喊话系统被调节为满足上述规定。公共喊话系统的制造商主要关注于满足规定,并且为公共喊话系统所警告的人群提供安全性。但是在考虑到这种公共喊话系统的制造成本的情况下,制造商还关注于将系统的组件控制为低成本。特别是,放大器是影响成本的组件,其中,成本随着放大器的最大输出功率的增加而增加。因此,在本领域中,希望提供这样的声音报警,其一方面符合规定,并且另一方面不需要放大器的过大的最大输出功率。同样的理由适用于扬声器的所需功率处理能。具有较低的最大功率处理能力的扬声器比高功率扬声器便宜,并且如果需要更少的RMS功率来产生符合规定的声音报警,则系统成本会降低。
[0004] 此外,这种公共喊话系统经常需要基于电池的备用电源。很多标准要求紧急报警系统应该能够在使用其备用电源的情况下连续地产生至少30分钟的警报声。因此,备用电池造成了系统成本的一大部分。用于相同响度的声音报警的较低放大器输出功率降低了备份电池的尺寸和成本。
[0005] 依据心理声学,已知的是,为了增加信号的响度,信号成分应该在不交叠的关键频带中尽可能地分布在整个可听频谱上。这个与警报声(alarm tone)相关的科学知识已经在一些专利中在一定程度上得到应用,例如US3504364或US 7089176,其代表了最接近的现有技术

发明内容

[0006] 本发明涉及具有权利要求1的特征的音频系统,具有权利要求10的特征的用于产生音频信号的方法,具有权利要求11的特征的计算机程序,具有权利要求12的特征的音频信号。从属权利要求说明书及其附图公开了本发明的优选实施例
[0007] 因此,本发明涉及音频系统,其优选地适于和/或可操作用于产生音频信号,特别是警报音频信号。所述音频信号或其主要部分位于可听频谱内,例如在200Hz至8kHz之间。所述音频信号优选地体现为人工声音(artificial tone)、例如,汽笛声或恒定声。
[0008] 研究所述音频信号的频率分布,所述音频信号包括所述音频信号的具有基本频率的成分。优选地,该成分携带了所述音频信号的信息内容。如稍后解释的,该成分可以是固定频率的信号或扫频(frequency sweep),从而使得所述基本频率是与时间相关的函数f(t)。所述基本频率可以是所述音频信号中的最低频率,或者可以被随意设置或由用户定义,例如在频率分布的中间。
[0009] 所述音频系统包括用于产生所述音频信号的在所述基本频率处的成分的模块,以及用于产生所述音频信号的在所述基本频率之外的另外频率处的额外成分的模块。为了增强所述音频信号的响度,以这样的方式将这些成分彼此分离:使得它们位于用分隔频带彼此分隔开的、分开的所谓关键频带中。所述分隔频带可以被实现为硬成块频带(hard blocking bands),在其他实施例中,所述音频信号在所述分隔频带中的幅度非常小,例如与所述音频信号在基本频率处的幅度相比非常小。
[0010] 根据本发明,建议的是,所述音频系统包括:用于定义和/或控制所述音频信号的在所述基本频率处和在所述另外频率处的成分的相位关系的模块。
[0011] 本发明的一个发现在于,所述相位关系是一个不影响RMS(均方根)的参数集。当信号的频率成分位于不同的关键频带中时,所述音频信号的响度同样不受影响。因此,相位关系的改变不会影响所述音频信号的技术特征或可听特征。但是,改变所述相位关系允许改变所谓的波峰系数(Crest factor),因此所述音频信号可以适应放大器的特性,使得例如对于相同的电源电压而言可以增加放大器的最大输出电平。可替换地,可以优化波峰系数以便在放大器的最大效率上使用放大器。特别是,工作在MB类、G类和H类上的放大器的效率是非常依赖于信号电平的。
[0012] 以下,给出了关于术语RMS、波峰系数等等的一些定义。应该注意到,这些定义仅是用于理解本发明的一般性概念的提示,并且优选地并不应限制这些术语的范围。
[0013] 作为幅度为a0,频率为f0的单正弦信号的简单基本信号s0(t)给出如下:
[0014] s0(t)=a0sin(2πf0t)
[0015] 该单正弦信号的均方根(RMS)给出如下:
[0016]
[0017] 一个复合声音信号(tone complex)包括多个正弦信号作为成分,其中所述成分是频率f0的N个谐波,该复合声音信号的RMS值给出如下:
[0018]
[0019] 波峰系数是音频信号的系数,其被定义为音频信号的峰值与音频信号的均方根(RMS)值之比。对于周期为T的连续时域信号s(t),波峰系数给出如下:
[0020]
[0021] 纯正弦(pure sinusoid)信号的波峰系数是
[0022] 在本发明的优选实施例中,选择所述相位关系,以减小和/或最小化所述音频信号的波峰系数,例如与对于全部成分而言具有相等相位值(例如,所有相位为零)的参考音频信号相比来减小和/或最小化。所述减小能够通过借助于分别地调整每个成分的相位以降低所述复合声音信号的峰值来实现。具有多个另外频率的音频信号给出如下:
[0023] s(t)=∑i∈Haisin(2πif0t+φi)
[0024] 本领域技术人员能够找到借助于调节每个成分的相位来降低或最小化波峰系数的算法。例如,可以使用迭代算法。在采用一种粗略方式的情况下,还可以产生大量的随机相位,并选择产生最小波峰系数的集合。
[0025] 为了得到可测量的限度,本发明的一个优选实施例被定义为包含了这样的音频信号的波峰系数,即所述波峰系数小于具有最大波峰系数并且/或者其中全部成分具有相等相位的参考音频信号的波峰系数的80%,特别是小于该参考音频信号的波峰系数的60%,且特别是小于该参考音频信号的波峰系数的40%。另一可能的测量限度是,在基本频率处的成分的波峰系数低于完整音频信号的波峰系数。优选地,在基本频率处的成分的波峰系数小于完整音频信号的波峰系数的80%,特别是小于60%,并且特别是小于40%。
[0026] 在本发明的一个优选实施例中,所述另外频率是所述基本频率的谐波。在此关联中,有可能的是,这些谐波是连续的谐波,或者仅将一部分谐波选作所述另外频率。优选地,仅考虑是所述基本频率的整数倍的谐波,因为此举将不会改变警报信号的可察觉的音调(pitch),并且不会引入连续差拍声(beatings)。
[0027] 优选地,设置所添加的谐波的频率上限fmax。这种上限频率的优点在于,能够将频谱保持在可听频谱范围内,并且不会在较为听不见的频率成分上浪费余量或功率。对于公共喊话系统,可选地,不仅考虑平均或中间人群的健康的听觉系统,而且应该考虑到所有年龄的人群都能够听到所述音频信号。听觉的频率上限随着年龄的增加而降低。该频率上限的优选选择会是8kHz。
[0028] 通过将所述基本频率的特定谐波用作所述另外频率,可以确保所述另外频率不会交叠,并且/或者被分隔频带所分隔开。
[0029] 但是,再一次,本发明的另一实施例优选地考虑到心理声学效应。已知的是,人类的听觉并不能听到音频信号的单一频率,而是听到放宽的频带。在心理声学中使用等效矩形带宽或ERB作为测量值,其给出了在人类听觉中的滤波器的带宽的近似,其中使用模拟所述滤波器的简化形式作为矩形带通滤波器。用于以[Hz]计的特定中心频率fc的公式为:
[0030]
[0031] 可选地,听觉滤波器可以包括一个考虑到目标人群的年龄的校正项。已知的是,听觉滤波器的带宽随着年龄的增加而变宽。一种实用的方法是,在20岁上,等效矩形带宽(ERB)大约是中心频率的11%,并且每20年增加2%。这将会影响目标人群的响度感知性。
[0032] 在另一实施例中,选择所述谐波,从而使得依据由听觉滤波器变宽的谐波而得到的频带同样不交叠。这个进一步的实施例的一种可能实现方式是使用以下脚本来实现的,该脚本可以在例如MMTLMB系统上执行,并且返回基本频率f的谐波:
[0033]
[0034]
[0035] 除了定义所述额外成分的分析方法之外,还可以设想使用查找表方法,其中,允许按照所谓的关键带标度(bark scale)的间隔的额外成分中的仅一个成分。所述关键带标度的标度范围是从1至24,且对应于听觉的前24个关键频带。随后的频带边缘是(以Hz 计 )20,100,200,300,400,510,630,770,920,1080,1270,1480,1720,2000,2320,2700,3150,3700,4400,5300,6400,7700,9500,12000,15500。
[0036] 在又另一实施例中,所建议的是,所述音频系统适于基于与时间相关的基本频率f(t)来产生音频信号。例如,很多警报声音是由扫频构成的。在扫描中,谐波的数量和位置可以由于改变基本频率而改变。此举导致了所述音频信号中的响度的不连续性以及伪声。所建议的是,通过选择固定数量的谐波来解决该问题。例如,谐波的数量小于20,优选地小于12个,特别是小于8个谐波。
[0037] 由于与较低频率相比,用于较高频率的谐波的位置和数量的定义更为关键,因此优选地,与时间相关的基本频率的最高频率定义了谐波的选择和数量,例如通过使用如上给出的脚本。因此,在扫描中的最高基本频率定义了谐波的最大数量。接下来,将最低基本频率的谐波编号与最高基本频率的谐波编号进行匹配,并且将匹配的编号选为用于扫描的谐波。应该关注的是,该选择过程的结果可以是连续的或不连续的谐波序列。
[0038] 本发明的另一主题是具有权利要求10的特征的方法,其优选地在如上所述的音频系统上执行,具有权利要求11的特征的计算机程序,以及具有权利要求12的特征的音频信号。

附图说明

[0039] 其他特征、技术效果和优点将会在本发明的实施例的详细描述和附图中变得显而易见。在附图中:
[0040] 图1是图示了作为本发明的一个实施例的音频系统的方框图
[0041] 图2是图示了根据本发明的基于固定频率声音(fixed frequency tone)来产生音频信号的方法的流程图
[0042] 图3是图示了根据本发明的基于扫频声音的频率声音来产生音频信号的方法的流程图;
[0043] 图4是示出有效谐波的分布与可能的基本频率的对比的图。

具体实施方式

[0044] 图1示出了用于产生警报信号的音频系统1的方框图。这种警报信号例如结合公共喊话系统来使用。音频系统1包括用于产生所述警报信号的在基本频率处的成分的模块2,以及用于产生所述警报信号的在所述基本频率之外的另外频率处的额外成分的模块3。
制模块4可操作来控制模块2和3,以使得所得到的警报信号在将警报信号馈入放大器5中时具有导致多种优点的特殊特性。
[0045] 图2示出了用于产生具有特定特性的警报信号的方法。所得到的音频信号是从步骤6以具有固定的基本频率f的信号开始构建的,该固定的基本频率表示该警报信号的第一成分。
[0046] 在接下来的步骤7中,确定该基本频率f的谐波,其构成了该警报信号的额外成分。所述谐波是该基本频率f的整数倍,因为此举将不会改变该警报声音的可察觉的音调,并且不会引入连续差拍声。
[0047] 由于该警报信号的收听者的听觉滤波器将所述谐波加宽至谐波频带,因此选择所述谐波,以使得所述谐波频带不交叠,以便实现所得到的警报信号的高响度。如以上所解释的,听觉滤波器可以表示为ERB滤波器,并且另外还可以具有针对上年纪的收听者的逐渐降低的听力的校正项。
[0048] 下一点是,还针对频率范围来限制可听频谱,因此优选地是使用频率上限fmax,其削除收听者完全不能听到的或收听者仅无效率地听到的成分。可能的上限频率fmax是8kHz。
[0049] 在步骤6和7之后,针对RMS和响度来定义警报信号。在步骤8中,设置成分(即在基本频率处和谐波处的信号)的相位关系。如在本说明书中已经公开的,设置相位关系,以使得警报信号的波峰系数被减小或最小化。该可变的波峰系数能够实现警报信号与所施加的放大器的最佳匹配,因为特定类型的滤波器的功率效率取决于信号的电平以及其波峰系数。现在这个新型的警报信号在与纯音(pure tone)警报相同的RMS功耗下产生了更高的可察觉响度;对于其成分的任意相位值,其将会听上去相同并且具有相同的可察觉响度,而且,通过操控其成分的相位值,其能够具有特定的波峰系数(在特定的范围内),这帮助在放大器规范中适配信号。
[0050] 使用多个频率成分相对于纯音的另一优点是,如果不是全部的频率成分都落入有问题的频率范围内,则在特定频率范围内具有听力障碍的人将仍会注意到警报音或注意信号。
[0051] 同样,在特定频率范围内存在掩盖性(masking)背景噪声(例如来自于工作中的机器)的情况下,虽然在该频率范围内的纯音不能引起注意,但是仍然可以听到警报信号。
[0052] 结合在图1中作为放大器5的MB类、G类和H类放大器,减小波峰系数尤其有益。由控制模块4来执行对谐波的选择和对相位关系的选择。
[0053] 图3示出了针对采用与时间相关的频率f(t)作为基本频率的基本信号产生警报信号的方法。再一次,在步骤6中,定义了基本信号,其例如表示扫频或汽笛。
[0054] 在接下来的步骤9中,确定该基本信号的最大或关键频率,并且采用与结合最后一个附图所描述的方式类似的方式计算谐波。与最后一个附图不同的是,针对基本信号的最大或关键频率来计算谐波,因为该频率定义了谐波的最大数量。该解决方案的基本原理在图4中给出,其中,所选择的谐波被给出为基本频率的函数。在该图中,谐波成分的频率上限为8kHz。对于全部所考虑的频率,谐波内容在相当宽的带宽上非常恒定。在一些实施例中,谐波的数量被限制为小于10。在选择了谐波之后,按照结合图2所述的,在步骤8中调整相位关系。
[0055] 产生该声音或扫描信号的另一方式是,不是在播放的同时在一个单独的阶段中产生谐波,而是仔细地定义一个包含带有所选谐波的基本频率的信号,所述所选谐波具有最佳幅度和相位关系。随后,对该人工信号产生采样波表,以固定或可变的速率从存储器中对其进行读取。
[0056] 放大器处理具有各种波峰系数的信号的方式取决于该放大器的功率原理。
[0057] 例如,D类放大器具有高效率(典型地高于90%),并且该效率针对具有低波峰系数或高波峰系数的输出信号而言变化不大。但是,当输出电压峰值接近电源电压时,低波峰系数允许在发生削波之前具有更高电平的输出信号。
[0058] MB类或B类放大器的情况是不同的。如果忽略MB类放大器的无效电流并且仅将其考虑为B类放大器,则B类放大器所具有的效率是输出电压的函数,所述输出电压是最大输出电压的一部分。理论上,对于纯正弦波,当输出电压等于最大输出电压(削波电平)时,达到最大效率。则,效率为π/4或78.5%。该效率随着输出信号调制指数k=Uout peak/Usupply而线性地减小。因此,为了效率原因,较好的是具有最大调制(k=1)并且驱动放大器接近于以具有低波峰系数的信号进行削波。这将会产生最大RMS输出功率。
[0059] 但是在很多情况中,B类放大器被设计为具有高峰值输出功率和低得多的输出功率,所述高峰值输出功率仅能够在短时间内传递,而所述低得多的输出功率则能够连续地传递。由于成本的原因,减小了放大器的电源和散热器。这是一种有效的设计目标,因为音乐和演讲信号的波峰系数典型地非常高,大约为15dB。放大器的电源和散热器被设计为与典型的音乐/演讲信号的最大RMS功率匹配,而放大器的电源电压被设计成一个与放大器应该传递的峰值输出功率匹配的值。如果使用了这种放大器,则连续的警报声仅能够在与放大器的连续RMS输出功率匹配的电平或更低的电平上传递。在这种情况中,可能有用的是,修改警报声的波形以具有高波峰系数,从而最小化放大器损耗。尽管B类放大器的效率随着调制指数k而增加到对于k=1为已描述的π/4,但是B类放大器的损耗对于k=2/π=0.637达到最大值。因此,从针对相同的RMS输出功率而最小化放大器损耗的观点看,能够有用的是,在大部分时间中保持低的警报声信号电平(k<<0.637),并且仅有短时间的峰值(k>0.637)。这样,信号仅短暂地经过高损耗区。
[0060] 经常使用的另一类放大器是G类放大器。该类放大器使用多个电源电压,并且该放大器以这样的方式被设计,即只要输出信号足够小能够避免削波就使用较低的电源电压,并且对于超过所述较低电源电压的限度的输出信号使用较高的电源电压。大多数G类放大器使用两个或三个电源电压电平。在两个电平的情况中,较低的电压经常是较高的电压的1/3或1/2(n=1/3或n=1/2)。此类放大器典型地具有比B类放大器高得多的效率,B类放大器对于相同的最大输出功率将仅具有最高电源电压。例如,见1978年8月在IEEE Transaction on Consumer Electronics,Vol.CE-24,No3中的Highest Efficiency Mnd Super Quality Mudio Mmplifier Using MOS power Fets In Class G Operation和1986年5月在IEEE Transaction on Consumer Electronics,Vol.CE-32,No2中的Mverage Efficiency of Class-G Power Amplifier。对于G类放大器,非常有益的是,使得警报信号的波峰系数低,并将峰值输出电压保持为恰好在所述较低的电源电压的电平之下。这样,能够实现高效率和低损耗。如果波峰系数对于相同的RMS级别而言略高,则k增加,并且放大器会移至所述较高的电源电压且损耗将会快速降低,虽然信号的响度将会保持相同。
[0061] 作为一个实例,图5示出了两个信号,其中,具有低波峰系数的信号(标识为优化相位)具有3.2dB的波峰系数,具有高波峰系数的信号(标识为零相位)具有7.2dB的波峰系数。该信号包含4个正弦波,一个基本频率和前3个谐波。尽管这些波形明显不同并且显然具有不同的波峰系数,但是这两个复合信号听上去是相同的。以dB计的标注是用公式2
CrestdB=10*log(Crest)得到的。
[0062] 要说明的另一点是所谓的M加权滤波器(M-weighting filter)的使用,当在该系统的试运行期间测量声压级(SPL)时使用该滤波器。与单正弦波相比,具有谐波的更为复杂的声音将会针对相同的RMS级而提供更高的读数,这是因为与在300Hz至800Hz之间的典型基本频率相比,将更多的关注放在了800Hz至8kHz之间的谐波上。这是重要的,因为在试运行期间实际测量的SPL级决定了系统是否符合规定,而不是警报声的可察觉响度。不幸的是,这些测量值并不完全地反映复杂的警报声的实际增益,因为它们并没有将人类听觉系统的响度模型考虑在内。
QQ群二维码
意见反馈