首页 / 专利库 / 控制系统 / 家庭自动化 / 重放攻击的磁检测

重放攻击的磁检测

阅读:302发布:2020-05-11

专利汇可以提供重放攻击的磁检测专利检索,专利查询,专利分析的服务。并且一种检测语音 生物 测定系统上的重放攻击的方法,包括:接收表示话音的音频 信号 ;检测 磁场 ;确定所述 音频信号 和所述磁场之间是否存在相关性;以及如果所述音频信号和所述磁场之间存在相关性,则确定所述音频信号可能是由重放攻击所导致的。,下面是重放攻击的磁检测专利的具体信息内容。

1.一种检测语音生物测定系统上的重放攻击的方法,该方法包括:
接收表示话音的音频信号
检测磁场
确定所述音频信号和所述磁场之间是否存在相关性;以及
如果所述音频信号与所述磁场之间存在相关性,则确定音频信号可能是由重放攻击所导致的。
2.根据权利要求1所述的方法,其中确定所述音频信号与所述磁场之间是否存在相关性包括:
识别所述音频信号包含话音的第一时段;
识别磁场不同于基线的第二时段;以及
确定所述第一时段和所述第二时段是否大体上相同。
3.根据权利要求2所述的方法,包括:如果所述音频信号包含话音的第一时段的60%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的60%以上与所述音频信号包含话音的第一时段重叠,则确定所述第一时段和所述第二时段大体上相同。
4.根据权利要求3所述的方法,包括:如果所述音频信号包含话音的第一时段的80%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的80%以上与所述音频信号包含话音的第一时段重叠,则确定所述第一时段和所述第二时段大体上相同。
5.根据权利要求1所述的方法,其中确定所述音频信号与所述磁场之间是否存在相关性包括:
以第一采样率对检测到的磁场进行采样;
以第二采样率对音频信号进行采样;以及
确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性。
6.根据权利要求5所述的方法,包括:
接收表示磁场强度的一系列信号值;
形成所述磁场强度在一段时间内的平均值;以及
从表示所述磁场强度的该系列信号值中减去所述磁场强度的平均值,以形成所述检测到的磁场。
7.根据权利要求5或6所述的方法,包括:
以第三采样率获得数字音频信号,且对所述数字音频信号进行欠采样,从而以所述第二采样率形成所述音频信号。
8.根据权利要求5、6或7所述的方法,其中所述第二采样率近似等于所述采样率。
9.根据权利要求5、6、7或8所述的方法,其中确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性的步骤包括:对经采样的音频信号和经采样的检测到的磁场执行数学相关运算,以获得一输出相关性函数,且确定该输出相关性函数的峰值是否超过预定阈值
10.根据权利要求1所述的方法,还包括:
确定表示话音的所述音频信号的源的方向;
确定所述磁场的源的方向;以及
如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
11.一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:
接收表示话音的音频信号;
检测磁场;
确定所述音频信号和所述磁场之间是否存在相关性;以及
如果所述音频信号与所述磁场之间存在相关性,则确定音频信号可能是由重放攻击所导致的。
12.根据权利要求11所述的系统,该系统被配置成通过以下方式确定所述音频信号与所述磁场之间是否存在相关性:
识别所述音频信号包含话音的第一时段;
识别所述磁场不同于基线的第二时段;以及
确定所述第一时段和所述第二时段是否大体上相同。
13.根据权利要求12所述的系统,该系统被配置成:如果所述音频信号包含话音的第一时段的60%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的60%以上与所述音频信号包含话音的第一时段重叠,则确定所述第一时段和所述第二时段大体上相同。
14.根据权利要求13所述的系统,该系统被配置成:如果所述音频信号包含话音的第一时段的80%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的80%以上与所述音频信号包含话音的第一时段重叠,则确定所述第一时段和所述第二时段大体上相同。
15.根据权利要求11所述的系统,该系统被配置成通过以下方式确定所述音频信号与所述磁场之间是否存在相关性:
以第一采样率对检测到的磁场进行采样;
以第二采样率对音频信号进行采样;以及
确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性。
16.根据权利要求15所述的系统,该系统被配置成:
接收表示磁场强度的一系列信号值;
形成所述磁场强度在一段时间内的平均值;以及
从表示磁场强度的该系列信号值中减去所述磁场强度的平均值,以形成所述检测到的磁场。
17.根据权利要求15或16所述的系统,该系统被配置成:
以第三采样率获得数字音频信号,且对所述数字音频信号进行欠采样,从而以所述第二采样率形成所述音频信号。
18.根据权利要求15、16或17所述的系统,其中所述第二采样率近似等于所述采样率。
19.根据权利要求15、16、17或18所述的系统,该系统被配置成通过以下方式确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性:对经采样的音频信号和经采样的检测到的磁场执行数学相关运算,以获得一输出相关性函数,且确定该输出相关性函数的峰值是否超过预定阈值。
20.根据权利要求11至19中的任一项所述的系统,该系统还被配置成:
确定表示话音的所述音频信号的源的方向;
确定所述磁场的源的方向;
如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
21.一种检测语音生物测定系统上的重放攻击的方法,该方法包括:
接收表示话音的音频信号;
检测磁场;以及
如果所述磁场的强度超过阈值,则确定所述音频信号可能是由重放攻击所导致的。
22.一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:
接收表示话音的音频信号;
检测磁场;以及
如果所述磁场的强度超过阈值,则确定所述音频信号可能是由重放攻击所导致的。
23.一种检测语音生物测定系统上的重放攻击的方法,该方法包括:
接收表示话音的音频信号;
确定表示话音的所述音频信号的源的方向;
检测磁场;
确定所述磁场的源的方向;以及
如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
24.根据权利要求23所述的方法,包括从多个麦克接收表示话音的音频信号。
25.根据权利要求23或24所述的方法,包括检测磁场在三个正交方向上的分量。
26.一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:
接收表示话音的音频信号;
确定表示话音的所述音频信号的源的方向;
检测磁场;
确定所述磁场的源的方向;以及
如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
27.根据权利要求26所述的系统,该系统被配置成从多个麦克风接收表示话音的音频信号。
28.根据权利要求26或27所述的系统,该系统被配置成检测磁场在三个正交方向上的分量。
29.一种包括根据权利要求11至20、22或26至28中的任一项所述的系统的设备。
30.根据权利要求29所述的设备,其中,所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、远程控制器设备、玩具、机器或者家庭自动化控制器或家用电器
31.一种计算机程序产品,该计算机程序产品包括计算机可读的有形介质,以及用于执行根据权利要求1至10、21或23至25中任一项所述的方法的指令。
32.一种非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质具有存储在其上的计算机可执行指令,当处理器电路系统执行该计算机可执行指令时,使处理器电路系统执行根据权利要求1至10、21或23至25中任一项所述的方法。
33.一种包括根据权利要求32所述的非暂时性计算机可读存储介质的设备。
34.根据权利要求33所述的设备,其中,所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、远程控制器设备、玩具、机器或者家庭自动化控制器或家用电器。

说明书全文

重放攻击的磁检测

技术领域

[0001] 本文所描述的实施方案涉及用于检测语音生物测定系统上的重放攻击的方法和设备。

背景技术

[0002] 语音生物测定系统正在变得越来越广泛地使用。在这种系统中,用户通过在注册阶段期间提供他们的话音样本来训练系统。在随后的使用中,系统能够区别注册用户和未登记的说话者。语音生物测定系统原则上可以用来控制对各种服务和系统的访问
[0003] 恶意方试图使语音生物测定系统失效的一种方法是获取注册用户的话音的录音,然后试图回放该录音,以冒充注册用户且以获得对旨在限于注册用户的服务的访问。
[0004] 这称为重放攻击或欺骗攻击。发明内容
[0005] 根据本发明的一个方面,提供了一种检测语音生物测定系统上的重放攻击的方法。该方法包括:接收表示话音的音频信号;检测磁场;确定所述音频信号和所述磁场之间是否存在相关性;以及,如果所述音频信号与所述磁场之间存在相关性,则确定所述音频信号可能是由重放攻击所导致的。
[0006] 确定所述音频信号与所述磁场之间是否存在相关性可以包括:识别所述音频信号包含话音的第一时段;识别磁场不同于基线的第二时段;以及,确定第一时段和第二时段是否大体上相同。
[0007] 该方法可以包括:如果所述音频信号包含话音的第一时段的60%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的60%以上与所述音频信号包含话音的第一时段重叠,则确定第一时段和第二时段大体上相同。该方法可以包括:如果所述音频信号包含话音的第一时段的80%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的80%以上与所述音频信号包含话音的第一时段重叠,则确定第一时段和第二时段大体上相同。
[0008] 确定所述音频信号与所述磁场之间是否存在相关性可以包括:以第一采样率对检测到的磁场进行采样;以第二采样率对所述音频信号进行采样;以及,确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性。
[0009] 该方法可以包括:接收表示磁场强度的一系列信号值;形成所述磁场强度在一段时间内的平均值;以及,从表示所述磁场强度的该系列信号值中减去所述磁场强度的平均值,以形成所述检测到的磁场。
[0010] 该方法可以包括:以第三采样率获得数字音频信号,且对所述数字音频信号进行欠采样,从而以所述第二采样率形成所述音频信号。
[0011] 所述第二采样率近似等于所述采样率。
[0012] 确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性的步骤包括:对经采样的音频信号与经采样的检测到的磁场执行数学相关运算,以获得一输出相关性函数,且确定该输出相关性函数的峰值是否超过一预定阈值
[0013] 该方法还可以包括:确定表示话音的所述音频信号的源的方向;确定所述磁场的源的方向;以及,如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
[0014] 根据本发明的一个方面,提供了一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:接收表示话音的音频信号;检测磁场;确定所述音频信号和所述磁场之间是否存在相关性;以及,如果所述音频信号与所述磁场之间存在相关性,则确定所述音频信号可能是由重放攻击所导致的。
[0015] 该系统可以被配置成通过以下方式来确定所述音频信号与所述磁场之间是否存在相关性:识别所述音频信号包含话音的第一时段;识别所述磁场不同于基线的第二时段;以及,确定第一时段和第二时段是否大体上相同。
[0016] 该系统可以被配置成:如果所述音频信号包含话音的第一时段的60%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的60%以上与所述音频信号包含话音的第一时段重叠,则确定第一时段和第二时段大体上相同。
[0017] 该系统可以被配置成:如果所述音频信号包含话音的第一时段的80%以上与所述磁场显著不同于基线的第二时段重叠,和/或所述磁场显著不同于基线的第二时段的80%以上与所述音频信号包含话音的第一时段重叠,则确定第一时段和第二时段大体上相同。
[0018] 该系统可以被配置成通过以下方式确定所述音频信号与所述磁场之间是否存在相关性:以第一采样率对检测到的磁场进行采样;以第二采样率对音频信号进行采样;以及,确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性。
[0019] 该系统可以被配置成:接收表示磁场强度的一系列信号值;形成所述磁场强度在一段时间内的平均值;以及,从表示所述磁场强度的该系列信号值中减去所述磁场强度的平均值,以形成所述检测到的磁场。
[0020] 该系统可以被配置成:以第三采样率获得数字音频信号,且对所述数字音频信号进行欠采样,从而以所述第二采样率形成所述音频信号。
[0021] 所述第二采样率可以近似等于所述采样率。
[0022] 该系统可以被配置成通过以下方式来确定经采样的音频信号与经采样的检测到的磁场之间是否存在相关性:对经采样的音频信号和经采样的检测到的磁场执行数学相关运算,以获得一输出相关性函数,切确定该输出相关性函数的峰值是否超过一预定阈值。
[0023] 该系统可以进一步被配置成:确定表示话音的所述音频信号的源的方向;确定所述磁场的源的方向;以及,如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
[0024] 根据本发明的一个方面,提供了一种检测语音生物测定系统上的重放攻击的方法。该方法包括:接收表示话音的音频信号;检测磁场;以及,如果所述磁场的强度超过一阈值,则确定所述音频信号可能是由重放攻击所导致的。
[0025] 根据本发明的一个方面,提供了一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:接收表示话音的音频信号;检测磁场;以及,如果所述磁场的强度超过一阈值,则确定所述音频信号可能是由重放攻击所导致的。
[0026] 根据本发明的一个方面,提供了一种检测语音生物测定系统上的重放攻击的方法。该方法包括:接收表示话音的音频信号;确定表示话音的所述音频信号的源的方向;检测磁场;确定所述磁场的源的方向;以及,如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
[0027] 该方法可以包括从多个麦克接收表示话音的音频信号。
[0028] 该方法可以包括检测磁场在三个正交方向上的分量。
[0029] 根据本发明的一个方面,提供了一种用于检测语音生物测定系统上的重放攻击的系统,该系统被配置成:接收表示话音的音频信号;确定表示话音的所述音频信号的源的方向;检测磁场;确定所述磁场的源的方向;以及,如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则确定所述音频信号可能是由重放攻击所导致的。
[0030] 该系统可以被配置成从多个麦克风接收表示话音的音频信号。
[0031] 该系统可以被配置成检测磁场在三个正交方向上的分量。
[0032] 根据本发明的一个方面,提供了一种设备,该设备包括根据以上方面中的任一项的系统。所述设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、远程控制器设备、玩具、机器或者家庭自动化控制器或家用电器
[0033] 根据本发明的一个方面,提供了一种计算机程序产品,包括计算机可读的有形介质,以及用于执行根据前述方面中的任一项所述的方法的指令。
[0034] 根据本发明的一个方面,提供了一种非暂时性计算机可读存储介质,具有存储在其上的计算机可执行指令,当处理器电路系统执行该计算机可执行指令时,使处理器电路系统执行根据前述方面中的任一项所述的方法。
[0035] 根据本发明的一个方面,提供了一种包括所述非暂时性计算机可读存储介质的设备。所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、远程控制器设备、玩具、机器或者家庭自动化控制器或家用电器。附图说明
[0036] 为了更好地理解本发明,且示出如何实施本发明,现在将参考附图,在附图中:
[0037] 图1例示了智能手机;
[0038] 图2是例示了智能手机的形式的示意图;
[0039] 图3例示了正在执行重放攻击的第一种情形;
[0040] 图4例示了正在执行重放攻击的第二种情形;
[0041] 图5是例示了根据本发明的方法的流程图
[0042] 图6是用于实施一种方法的系统的框图
[0043] 图7例示了一种方法的结果;
[0044] 图8例示了第二种方法的结果;
[0045] 图9例示了正在执行重放攻击的其他情形;以及
[0046] 图10例示了用于实施一种方法的另一系统。

具体实施方式

[0047] 下面的描述阐述了根据本公开内容的示例实施方案。对于本领域普通技术人员而言,其他示例实施方案和实施方式将是显而易见的。另外,本领域普通技术人员将认识到,可以代替下面讨论的实施方案或与下面讨论的实施方案相结合地应用各种等同技术,且所有这样的等同物应被认为是本公开内容所涵盖的。
[0048] 图1例示了智能手机10,该智能手机10具有用于检测环境声音的麦克风12。在正常使用中,麦克风当然用于检测持有智能手机10的用户的话音。
[0049] 图2是例示了智能手机10的形式的示意图。
[0050] 具体地,图2示出了智能手机10的多个相互连接的部件。应理解,智能手机10实际上将包含许多其他部件,但是以下描述对于理解本发明是足够的。
[0051] 因此,图2示出了上述麦克风12。在某些实施方案中,智能手机10设置有多个麦克风12、12a、12b等。
[0052] 图2还示出了存储器14,该存储器14实际上可以被设置为单个部件或多个部件。存储器14被设置以存储数据和程序指令。
[0053] 图2还示出了处理器16,同样该处理器16实际上可以被设置为单个部件或多个部件。例如,处理器16的一个部件可以是智能手机10的应用处理器。
[0054] 图2还示出了收发器18,该收发器18被设置用于允许智能手机10与外部网络通信。例如,收发器18可以包括用于通过WiFi局域网或通过蜂窝网络建立互联网连接的电路系统。
[0055] 图2还示出了音频处理电路系统20,用于根据需要对由麦克风12检测到的音频信号执行操作。例如,音频处理电路系统20可以对音频信号进行滤波或执行其他信号处理操作。
[0056] 图2还示出了至少一个传感器22。在本发明的实施方案中,传感器是用于检测磁场的磁场传感器。例如,传感器22可以是霍尔效应传感器,能够提供磁场强度在三个正交方向上的单独测量。
[0057] 在此实施方案中,智能手机10设置有语音生物测定功能和控制功能。因此,智能手机10能够响应于来自注册用户的话音命令(spoken command)执行多种功能。生物测定功能能够在来自注册用户的话音命令和由不同的人说出的相同命令之间进行区分。因此,本发明的某些实施方案涉及具有某种语音可操作性的智能手机或另一便携式电子设备(例如,平板或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统、家用电器等,其中在旨在执行话音命令的设备中执行语音生物测定功能)的操作。某些其他实施方案涉及在智能手机或其他设备上执行语音生物测定功能的系统,如果语音生物测定功能能够确认说话者是注册用户,则该智能手机或其他设备将命令发送到单独的设备。
[0058] 在一些实施方案中,虽然在位于靠近用户的智能手机10或其他设备上执行语音生物测定功能,但是使用收发器18将话音命令传输至远程话音识别系统,该远程语音识别系统确定话音命令的含义。例如,话音识别系统可以位于计算环境中的一个或多个远程服务器上。然后,基于话音命令的含义的信号被返回至智能手机10或其他本地设备。
[0059] 欺骗语音生物测定系统的一种尝试是以所谓的重放攻击或欺骗攻击的形式播放注册用户的语音的录音。
[0060] 图3示出了正在执行重放攻击的情况的一个实施例。因此,在图3中,智能手机10设置有语音生物测定功能。在此实施例中,智能手机10至少暂时地被拥有另一智能手机30的攻击者占有。智能手机30已经被用于记录智能手机10的注册用户的语音。使智能手机30靠近智能手机10的麦克风入口12,且回放注册用户的语音的录音。如果语音生物测定系统不能够检测它检测到的注册用户的语音是录音,则攻击者将获得对仅能由注册用户访问的一项或多项服务的访问。
[0061] 已知的是,由于尺寸限制,智能手机(诸如,智能手机30)通常设置有具有相对低质量的扬声器。因此,通过这样的扬声器回放的注册用户的语音的录音将与该用户的语音不是完美匹配,且该事实可用于识别重放攻击。例如,扬声器可以具有某些频率特性,如果可以在由语音生物测定系统所接收的话音信号中检测到这些频率特性,则可以认为该话音信号是由重放攻击所导致的。
[0062] 图4示出了正在执行重放攻击的情况的第二实施例,试图扰乱上述检测方法。因此,在图4中,智能手机10设置有语音生物测定功能。同样,在此实施例中,智能手机10至少暂时地被拥有另一智能手机40的攻击者占有。智能手机40已经被用于记录智能手机10的注册用户的语音。
[0063] 在此实施例中,智能手机40被连接至高质量扬声器50。然后,使智能手机10的麦克风入口12靠近扬声器50定位,且通过扬声器50回放注册用户的语音的录音。与之前一样,如果语音生物测定系统不能够检测它检测到的注册用户的语音是录音,则攻击者将获得对仅能由注册用户访问的一项或多项服务的访问。
[0064] 在此实施例中,扬声器50可以具有足够高的质量,以使得通过扬声器所回放的注册用户的语音的录音将不能与用户的语音可靠地区分开,因此话音信号的音频特征不能用于识别重放攻击。
[0065] 然而,应理解,许多扬声器(特别地,许多高质量的扬声器)是电磁扬声器,其中将电音频信号施加至位于永磁体的磁极之间的音圈,从而使线圈快速向后移动和向前移动。这种运动使附接至线圈的膜片向后移动和向前移动,从而产生声波。在此认识到,如果诸如智能手机10的设备在回放声音的同时靠近扬声器定位,则将存在对应的磁场的变化,这将能够被磁场传感器22检测到。
[0066] 图5是例示了检测语音生物测定系统上的重放攻击的方法的流程图,且图6是例示了语音生物测定系统中的功能的框图。
[0067] 具体地,在图5的方法的步骤60中,在图6中所示出的系统的输入80上接收音频信号。例如,在如图2所示的设备中,输入80上所接收的音频信号可以是由麦克风12检测到的音频信号,或者如果存在多于一个麦克风,则可以是麦克风检测到的音频信号的总和。
[0068] 同时,在图5的方法的步骤62中,在图6中所示出的系统的输入82上接收输入信号。输入82上所接收的输入信号接收自磁计。例如,当在诸如智能手机或平板计算机的设备中执行该方法时,该设备通常将包括三轴磁力计,该三轴磁力计生成包含磁场强度在三个正交方向上的单独测量值的输出信号
[0069] 在一些实施方案中,将接收自磁力计的输入信号传递至第一预处理块84。例如,如果接收自磁力计的信号包含磁场强度在三个正交方向上的单独测量,则可以将这些测量组合以提供磁场强度的单个测量。磁场强度的测量可以被认为是磁场强度在三个正交方向上的三个单独测量的平方和的平方根。
[0070] 此外,该系统的目的是确定附近物体(例如,扬声器)所生成的任何磁场。为了获得关于此的最有用的信息,一种可能性是处理接收自磁力计的输入信号,以消除地球磁场的影响。例如,这可以通过形成磁场强度的平均值来实现,例如在至少几秒的时段内,且在可能是几分钟或几小时的时段内,从每个个体测量中减去该平均值以获得由人造源所生成的磁场的瞬时测量。当单独考虑磁场强度在三个正交方向上的测量时,这些测量将在很大程度上取决于设备在地球磁场中的取向。可以根据设备中存在的加速度计所生成的信号确定该取向,因此在确定由附近物体(例如,扬声器)所生成的人造磁场时可以考虑该取向。
[0071] 通常,在智能手机中,磁力计生成数字信号,其中采样率在80-120Hz范围内,该数字信号可以被施加作为系统的输入82上的输入信号。
[0072] 在一些实施方案中,输入80上所接收的音频信号被传递至第二预处理块86。例如,如果音频信号以模拟形式被接收,则预处理块86可以包括用于将信号转换为数字形式的模-数转换器。
[0073] 在一些实施方案中,预处理块86可以包括数字或模拟滤波器,用于校正扬声器(该扬声器的存在被检测到)的频率响应中的预期非线性。因此,典型扬声器中的磁场与频率之间的关系将具有凹口形状,也就是说,在扬声器的机械谐振附近的一个特定频率处,磁场将特别地低。然后,预处理块86可以将具有相似特性的滤波器应用至所接收的音频信号,从而改善音频信号与磁场之间的相关程度。
[0074] 在此所例示的实施方案中,第二预处理块86包括抽取块。如果第二预处理块86中的模-数转换器以超过磁力计信号的采样率的采样率生成数字音频信号,则数字音频信号的样本被丢弃,结果是所得到的采样率近似等于磁力计信号的采样率R,例如音频采样率应在0.5R-2R范围内,更优选地,在0.8R-1.2R范围内。例如,如果接收自磁力计的输入信号具有在80-120Hz的范围内的采样率,且第二预处理块86中的模-数转换器具有40kHz的采样率(对于通常存在于诸如智能手机的设备中且可以用于模拟音频信号的精确数字表示的模-数转换器,此采样率将是典型的),则在模-数转换器的每400个样本中只有一个会被保留,使得所得到的采样率为40kHz/400=100Hz。
[0075] 替代地,通过在磁力计信号的样本之间交织血清值(sero-value)样本,可以将磁力计信号上采样至音频信号的采样率。
[0076] 在图5的方法的步骤64中,确定在音频信号与磁场之间是否存在相关性。因此,在图6中,第一预处理块84和第二预处理块86的输出被传递至相关块88。
[0077] 相关块88可以以不同的方式操作。
[0078] 图7例示了确定音频信号与磁场之间是否存在相关性的第一方法。
[0079] 因此,图7(a)例示了由第二预处理块86所生成的经抽取的音频信号的形式,而图7(b)例示了磁力计输出的形式。在图7(a)和图7(b)中,平轴线表示时间。更具体地,水平轴线上的单位是相应的数字样本的样本。在每种情况下,采样率是≈100Hz,因此1000个样本是≈10秒。在图7(a)和图7(b)中,竖直轴线表示任意单位的相应的信号的强度。在图7(b)的情况下,通过形成磁场强度的平均值(例如,在几秒的时段内)已去除了地球磁场的影响。然后将此平均值作为基线,且从每个个体测量减去此平均值。然后,图7(b)将这些个体测量示出作为与该基线的差,表示由人造源所生成的磁场的瞬时测量。
[0080] 在此实施例中,由第二预处理块86所生成的经抽取的音频信号的采样率与磁力计输出的采样率完全相同。因此,图7(示出了相同样本数目的两个信号)覆盖了这两个输入的相等时段。
[0081] 可以看出,在大约样本15-85、样本115-260、样本300-365、样本395-545等时段期间,音频信号包含显而易见的输入。例如,当样本值的量级超过阈值时,或者当在相对少数目的样本中进行平均的样本值量级超过阈值时,可以确定音频信号包含相关输入。因此,可以假定在获取这些样本的时段期间存在用户的话音。
[0082] 还可以看到,在相同的时段期间,磁力计输出也包含显而易见的输入。例如,当样本值的量级超过阈值时,或者当在相对少数目的样本中进行平均的样本值量级超过阈值时,可以确定磁力计输出包含相关输入。因此,可以假定在获取这些样本的时段期间,该设备存在产生声音的扬声器。
[0083] 如果在与麦克风检测话音相同的时间时,设备存在产生声音的扬声器,则这可能表明话音是由扬声器播放的,因此该设备是重放攻击的目标。
[0084] 因此,相关块88可以识别音频信号包含话音的第一时段,且可以识别存在显著磁场的第二时段。
[0085] 在图5的方法的步骤66中,确定音频信号是否可能是由重放攻击所导致的。因此,在图6中,相关块88的确定结果被传递至决策块90,该决策块确定第一时段和第二时段是否大体上相同。如果大体上相同,则确定音频信号可能是由重放攻击所导致的。
[0086] 例如,决策块90可以下述情况下确定第一时段和第二时段大体上相同:如果音频信号包含话音的第一时段的60%以上与存在显著磁场的第二时段重叠,和/或存在显著磁场的第二时段的60%以上与音频信号包含话音的第一时段重叠,或者音频信号包含话音的第一时段的80%以上与存在显著磁场的第二时段重叠,和/或存在显著磁场的第二时段的80%以上与音频信号包含话音的第一时段重叠。
[0087] 当音频信号和磁力计输出不经受大量噪声时,图7中所例示的方法特别地有效。图8例示了确定音频信号和磁场之间是否存在相关性的第二种方法。
[0088] 此第二种方法在第二预处理块86所生成的经抽取的音频信号与磁力计输出的样本之间形成数学互相关。也就是说,对于一个延迟值的范围,多个信号的一个信号中的样本序列与另一信号的延迟副本相关。相关程度将是延迟的函数,可以通过经延迟型式已经被延迟的采样周期的数目来方便地测量该延迟。常规地,在两个信号上执行自相关,且使任何延迟值的相关大小相对于两个信号在零延迟处的自相关大小进行归一化。
[0089] 因此,作为第二信号被延迟的样本数目n的函数,两个信号x[m]和y[m]之间的相关性Rxy[n]通过下式给出:
[0090]
[0091] 且,在归一化之后:
[0092]
[0093] 图8例示了在一个示例性实施例中获得互相关的结果。具体地,迹线100示出了当从现场用户的话音获得音频输入时所得到的结果,而迹线102示出了当通过扬声器回放用户的话音获得音频输入时所得到的结果。
[0094] 可以看出,迹线100波动,但是没有清晰的图案。迹线102以类似的方式波动,但是值得注意的是,在一个或两个特定的延迟值104处,存在非常高程度的相关性。这些特定的延迟值对应于零延迟,即两个信号相关。
[0095] 可以假定这是以下事实的结果:通过扬声器回放用户语音获得音频输入,因此扬声器正在与其所产生的声音同步地生成磁场。
[0096] 即使当音频信号和磁力计输出中的任一个或这两个都包含显著量的噪声时,此方法也可以挑选出相关性。
[0097] 在图5的方法的步骤66中,基于相关性来确定音频信号是否可能是由重放攻击所导致的。因此,在图6中,相关块88的确定结果被传递至决策块90,该决策块90确定相关性是否使得应当确定音频信号可能是由重放攻击所导致的。例如,在一些实施方案中,如果互相关的峰值(或者具体地,可能出现在一延迟值处的互相关的峰值,该延迟值对应于音频输入和所测量的磁场的同步)超过阈值,则决策块90确定音频信号可能是由重放攻击所导致的。图8示出了对数据中的一数据(例如,包括1000个样本或大约10秒)执行互相关的结果。在输入信号持续长于此的情况下,决策块90可以通过考虑多帧数据来确定音频信号可能是由重放攻击所导致的,例如,如果互相关的峰值在每帧中都超过阈值,或者如果在若干帧中进行平均的互相关的峰值超过阈值,则决策块90可以确定音频信号可能是由重放攻击所导致的。
[0098] 除了确定磁场中的变化是否与音频信号中的变化在时间上相关,还可以确定磁场的源的方向是否对应于音频信号的源的方向。
[0099] 图9例示了如何完成此操作。具体地,图9例示了正在执行重放攻击的另外两种情况。
[0100] 图9(a)示出了将扬声器120被放置在表面上且将智能手机122竖直地保持在扬声器前方以及面向它的情形。智能手机122以截面部分地示出,使得可以示出智能手机的内部部件。
[0101] 具体地,图9(a)示出了三个麦克风124、126和128,分别位于智能手机顶部边缘的中心附近、智能手机的底部左拐附近(当用户注视智能手机的前方时),以及智能手机的底部右拐角附近。
[0102] 另外,图9(a)示出了三轴磁力计130,该三轴磁力计130产生如图9(a)所示的磁场强度在x、y和z方向上的单独测量。
[0103] 扬声器120是电磁扬声器,在该电磁扬声器中通过线圈的运动产生声音,其中线圈通过磁场移动。如图9(a)所示,磁场M在扬声器120的前面132之外取向。假设智能手机122充分靠近扬声器120的前方定位,则可以假设由磁力计130所感测到的磁场的方向总体将在z方向上。因此,如果磁场强度在x、y和z方向上的测量表明,z方向上的磁场是主要的,则可以假定智能手机122以图9(a)中所例示的取向靠近扬声器120的前方定位。
[0104] 通过使用已知技术,接收自三个麦克风124、126、128的信号也可以用于确定音频信号的源的方向。例如,在图9(a)所示出的情况下,由扬声器120所生成的音频信号将基本上同时地被三个麦克风124、126、128接收。这可用于确定音频信号的源所在的大致方向。
[0105] 因此,在此实施例中,可以确定磁场的源的方向总体上对应于音频信号的源的方向。这可以用来进一步确认音频信号是重放攻击的结果。
[0106] 图9(b)示出了一种替代情形,其中将扬声器120被放置在表面上且将智能手机122面朝上放置在同一表面上。
[0107] 在这种情况下,假设智能手机122充分靠近扬声器120的前方定位,则可以假定由磁力计130所感测的磁场的方向总体在y方向上。因此,如果磁场强度在x、y和z方向上的测量表明,y方向上的磁场是主要的,则可以假定智能手机122以图9(b)中所例示的取向靠近扬声器120的前方定位。
[0108] 同样,通过使用已知技术,接收自三个麦克风124、126、128的信号也可以用于确定音频信号的源的位置。例如,在图9(b)所示的情形中,由扬声器120所生成的音频信号将在基本上相同的时间被两个麦克风126、128接收且不久之后音频信号被麦克风124接收。这可用于确定音频信号的源所在的大致方向。
[0109] 因此,再次可以确定磁场的源总体上对应于音频信号的源。这可以用于进一步确认音频信号是重放攻击的结果。
[0110] 在其他实施方案中,该方法包括接收表示话音的音频信号以及检测磁场。在这些实施方案中,如果磁场强度超过阈值,则确定音频信号可能是由重放攻击所导致的。当使用包含大磁体的扬声器生成重放攻击从而大磁场的存在指示重放攻击时,这些实施方案特别适合。在这种情况下,磁场强度可能比由地球磁场所引起的基线磁场强度大几倍,甚至可能大几个量级。因此,在这些情况下,无需确定基线磁场强度以及将其从个体测量中减去。
[0111] 在其他实施方案中,该方法包括接收表示话音的音频信号以及检测磁场。可能的是,如果使用多个麦克风检测信号,则例如可以使用波束成形技术来确定表示话音的所述音频信号的源的方向。还可以确定所述磁场的源的方向。如果表示话音的所述音频信号的源的方向对应于所述磁场的源的方向,则可以确定音频信号可能是由重放攻击所导致的。
[0112] 图10例示了一种系统,该系统用于确定磁场的源的方向是否总体上对应于表示话音的音频信号的源方向,确定该结果是否与其他方法结合被用作进一步确认音频信号是重放攻击的结果,或者确定该结果是否用作音频信号是重放攻击的结果的唯一指示。
[0113] 图10示出了处理器150。在预处理块152a、…、152n中进行适当调节之后,处理器150接收来自多个麦克风12a、…、12n的输入信号。类似地,处理器150接收来自三个磁力计
154、156、158的单独的输入信号,所述磁力计测量三个正交方向上的磁场强度,且在预处理块160、162、164中进行适当调节后再次放大。
[0114] 处理器150可以单独地计算音频信号的源的方向(例如,使用标准的波束成形技术)和磁场的源的方向,然后可以检查它们之间的相关性。
[0115] 替代地,处理器150可以是神经网络,使用相对于目标设备具有多种取向的代表性扬声器的样本对该神经网络进行预训练。
[0116] 因此,公开的方法和系统能够用于检测可以指示所接收的音频信号是重放攻击的结果的情形。
[0117] 技术人员将认识到,上文所描述的装置和方法的一些方面可以被具体化为处理器控制代码,例如,在非易失性载体介质(诸如,磁盘、CD-ROM或DVD-ROM、编程存储器诸如只读存储器(固件))上,或在数据载体(诸如,光信号载体或电信号载体)上。本发明的许多应用实施方案将被实施在DSP(数字信号处理器)、ASIC(专用集成电路)或FPGA(现场可编程阵列)上。因此,代码可以包括常规的程序代码或微代码,或例如用于设置或控制ASIC或FPGA的代码。代码还可以包括用于动态地配置可重新配置的装置(诸如,可重新编程的逻辑门阵列)的代码。类似地,代码可以包括用于硬件描述语言(诸如,Verilog TM或VHDL(超高速集成电路硬件描述语言))的代码。如技术人员将理解的,代码可以被分布在彼此通信的多个经耦合的部件之间。在适当的情况下,还可以使用在现场可(重新)编程的模拟阵列或类似设备上运行以配置模拟硬件的代码来实施所述实施方案。
[0118] 注意,如本文中所使用的,术语模块应被用来指代可以至少部分地由专用硬件部件(诸如,自定义电路系统)实施的功能单元或块,和/或至少部分地由一个或多个软件处理器或在合适的通用处理器等上运行的适当的代码实施的功能单元或块。模块本身可以包括其他模块或功能单元。模块可以由不需要被协同定位且可以被设置在不同的集成电路上和/或在不同的处理器上运行的多个部件或子模块来提供。
[0119] 实施方案可以在主机设备中实施,尤其是便携式主机设备和/或电池供电主机设备,诸如移动计算设备(例如,膝上型计算机或平板计算机)、游戏控制台、远程控制设备、家庭自动化控制器或家用电器(包括家用温度或光照控制系统)、玩具、机器(诸如,机器人)、音频播放器、视频播放器或移动电话(例如,智能手机)。
[0120] 应注意,上文所提及的实施方案例示而非限制本发明,且在不脱离所附权利要求的范围的前提下,本领域技术人员将能够设计许多替代实施方案。“包括”一词不排除权利要求中所列出的元件或步骤之外的元件或步骤的存在,“一”或“一个”不排除多个,且单个特征或其他单元可以实现权利要求中所记载的几个单元的功能。权利要求中的任何附图标记或标注不应被解释为限制其范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈