基于塞取向的波束成形

申请号 CN202280059300.X 申请日 2022-07-25 公开(公告)号 CN117897972A 公开(公告)日 2024-04-16
申请人 微软技术许可有限责任公司; 发明人 A·蔡斯金德; E·C·阿兰戈-瓦尔加斯; O-P·阿霍卡斯;
摘要 一种 耳 塞,包括:耳塞扬声器、包括多个话筒的话筒阵列、取向感测子系统和波束成形子系统。取向感测子系统被配置成输出指示耳塞的取向的取向 信号 。波束成形子系统被配置成输出经波束成形信号。经波束成形信号至少基于取向信号和来自话筒阵列中的多个话筒的多个话筒信号。经波束成形信号在空间上选择性地对该多个话筒信号进行滤波。
权利要求

1.一种塞,包括:
耳塞扬声器;
包括多个话筒的话筒阵列;
取向感测子系统,所述取向感测子系统被配置成输出指示所述耳塞的取向的取向信号;以及
波束成形子系统,所述波束成形子系统被配置成至少基于所述取向信号和来自所述话筒阵列中的所述多个话筒的多个话筒信号来输出经波束成形信号,所述经波束成形信号在空间上选择性地对所述多个话筒信号进行滤波。
2.如权利要求1所述的耳塞,其中所述波束成形子系统被配置成至少基于所述取向信号来设置所述经波束成形信号相对于所述耳塞的方向。
3.如权利要求1所述的耳塞,其中所述波束成形子系统被配置成至少基于所述取向信号来设置所述经波束成形信号的宽度。
4.如权利要求1所述的耳塞,其中所述取向感测子系统包括触摸传感器和取向估计逻辑,所述取向估计逻辑被配置成评估所述触摸传感器上的方向手势的手势角度,并且至少基于所述手势角度来输出所述取向信号。
5.如权利要求4所述的耳塞,其中所述取向估计逻辑被配置成评估与多个方向手势相对应的多个手势角度,并且至少基于所述多个手势角度来输出所述取向信号。
6.如权利要求4所述的耳塞,其中所述触摸传感器包括圆形触摸输入表面。
7.如权利要求1所述的耳塞,其中所述取向感测子系统包括加速度计以及取向估计逻辑,所述加速度计被配置成测量加速度,所述取向估计逻辑被配置成至少基于所测得的加速度来确定重向量,并且至少基于所述重力向量来输出所述取向信号。
8.如权利要求1所述的耳塞,其中所述取向感测子系统包括多个传感器以及取向估计逻辑,所述多个传感器被配置成跟踪提供对所述耳塞的取向的指示的不同信号,所述取向估计逻辑被配置成至少基于来自所述多个传感器的多个不同的被跟踪信号来输出所述取向信号。
9.如权利要求7所述的耳塞,其中所述取向估计逻辑被配置成区分用户的直立位置和非直立位置,并且在所述用户处于非直立位置时,过滤掉至少一个被跟踪传感器信号以使其不被用于输出所述取向信号。
10.一种用于控制耳塞的方法,所述方法包括:
从所述耳塞的话筒阵列中的多个话筒接收多个话筒信号;
从所述耳塞的取向感测子系统接收指示所述耳塞的取向的取向信号;以及至少基于所述取向信号和所述多个话筒信号从所述耳塞的波束成形子系统输出经波束成形信号,所述经波束成形信号在空间上选择性地对所述多个话筒信号进行滤波。
11.如权利要求10所述的方法,进一步包括:
至少基于所述取向信号来设置所述经波束成形信号的方向。
12.如权利要求10所述的方法,进一步包括:
至少基于所述取向信号来设置所述经波束成形信号的角宽度。
13.如权利要求10所述的方法,其中所述取向感测子系统包括被配置成检测触摸输入的触摸传感器,并且其中所述方法进一步包括评估所述触摸传感器上的方向手势的手势角度,并且其中所述取向信号是至少基于所述手势角度来被输出的。
14.如权利要求10所述的方法,其中所述取向感测子系统包括被配置成测量加速度的加速度计,其中所述方法进一步包括至少基于所测得的加速度来确定重力向量,并且其中所述取向信号是至少基于所述重力向量来被输出的。
15.如权利要求10所述的方法,进一步包括:
经由多个传感器来跟踪提供对所述耳塞的取向的指示的不同信号;以及至少基于来自所述多个传感器的多个不同的被跟踪信号来输出所述取向信号。

说明书全文

基于塞取向的波束成形

背景技术

[0001] 波束成形可被用于增加收到信号集合中感兴趣信号的信噪比。经波束成形信号可以将接收到的信号图案聚焦在感兴趣信号的方向上,以便减少来自其他信号的干扰并增加感兴趣信号的信噪比。例如,可以通过对话筒阵列的各个话筒输出的各个音频信号进行空间滤波来将波束成形应用于由该话筒阵列捕捉的音频信号。发明内容
[0002] 一种耳塞,包括:耳塞扬声器、包括多个话筒的话筒阵列、取向感测子系统和波束成形子系统。取向感测子系统被配置成输出指示耳塞的取向的取向信号。波束成形子系统被配置成输出经波束成形信号。经波束成形信号至少基于取向信号和来自话筒阵列中的多个话筒的多个话筒信号。经波束成形信号在空间上选择性地对多个话筒信号进行滤波。
[0003] 提供本发明内容以便以简化的形式介绍以下在具体实施方式中还描述的概念的选集。本发明内容并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任一部分中提及的任何或所有缺点的实现。附图说明
[0004] 图1‑3示出了示例耳塞。
[0005] 图4‑6示出了用于将耳塞插入用户耳朵的示例技术。
[0006] 图7示出了跨不同用户群体的示例嘴部位置变化锥和耳塞的示例话筒对准变化锥。
[0007] 图8示出了耳塞的示例框图
[0008] 图9‑10示出了用户向耳塞的触摸传感器提供触摸输入的示例场景。
[0009] 图11‑12示出了控制耳塞的示例方法。
[0010] 图13示出了示例计算系统。

具体实施方式

[0011] 图1‑3示出了被配置为将佩戴在用户左耳中的无线音频设备的示例耳塞100。耳塞100包括耳塞扬声器102,其被配置成将声音发射到用户的左耳中。耳塞100包括话筒阵列
104,该话筒阵列104被配置成捕捉从用户的嘴和周围环境发出的声音。话筒阵列104包括多个话筒104A、104B、104C。
[0012] 耳塞100被配置成提供为正佩戴耳塞100的用户动态定制的波束成形功能性。此类波束成形功能性至少基于耳塞100的取向来动态设置。例如,经波束成形信号可被配置成至少基于耳塞100的取向在空间上选择性地对话筒阵列104的多个话筒信号进行滤波。此类基于取向的波束成形功能性可以增强与从用户的嘴发出的声音相对应的音频信号,同时抑制周围环境中的背景噪声。换言之,经波束成形信号可以使用耳塞100的取向对准用户的嘴,使得由话筒阵列104捕捉的用户语音的声音质量可以相对于配置成输出非定向信号或具有固定方向的经波束成形信号的耳塞而增加。
[0013] 注意到,如本文所使用的术语“基于”和“至少基于”不一定与由单一列出的原因导致的唯一影响相关联。在一些实例中,列出或未列出的多种原因可能共同造成影响。在其他实例中,列出或未列出的多种原因可替换地造成影响。在又其他实例中,单一原因可造成影响。
[0014] 耳塞100包括壳体106。壳体106可以由任何合适的材料形成,包括但不限于塑料、金属、陶瓷、玻璃、晶体材料、复合材料或其他合适的材料。如图1所示,壳体106包括颈部108和耳塞部110。当耳塞100被放置在用户的耳朵中时,颈部108的大小和形状被调整为使得耳塞部110靠着耳甲(用户耳朵中的中空凹陷)定位。耳塞部110包括扬声器端口112。当耳塞100处于用户的耳朵中时,耳塞部110的大小和形状被调整为对准扬声器端口112,以将从耳塞扬声器102发出的声音引导到用户的耳道中。
[0015] 在所解说的实现中,话筒阵列104包括入耳式话筒104A、第一语音话筒104B和第二语音话筒104C。入耳式话筒104A毗邻于耳塞部110中的扬声器端口112定位。第一语音话筒104B和第二语音话筒104C定位在颈部108的基座处。
[0016] 入耳式话筒104A被配置成主要捕捉用户耳朵中的声音。由于入耳式话筒104A在耳朵内部,因此入耳式话筒104A可以对拾取在耳塞100与用户耳朵之间渗出的较高频背景噪声更灵敏。较低频背景噪声可以通过耳塞100贴着用户耳朵的物理密封至少部分地被阻挡。
[0017] 当耳塞100处于用户的耳朵中时,第一语音话筒104B被定位成更靠近用户的嘴。第一语音话筒104B被配置成主要捕捉从用户的嘴发出的声音。当耳塞100处于用户的耳朵中时,第二语音话筒104C被定位成远离用户的嘴。第二语音话筒104C被配置成以相对高的灵敏度主要捕捉耳塞100外部的背景噪声,以拾取可通过波束成形抵消的较低频噪声。.话筒阵列104的各种话筒可以共同捕捉可被诊断为期望的(例如,用户的语音)或不期望的(例如,背景噪声)的声音,并且可以采用波束成形技术来抵消不期望的声音。第一和第二语音话筒104B和104C可以瞄向用户的嘴,以高效地隔离从用户的嘴发出的声音。如果这种对准由于用户耳朵形状的变化而默认不发生,则耳塞100相对于用户耳朵的所估计取向可用于经由波束成形进行合适的空间滤波来高效地将第一和第二语音话筒104B和104C瞄准用户的嘴。
[0018] 话筒阵列104可包括任何合适数目的话筒,包括两个、三个、四个或更多个话筒。此外,话筒阵列104的多个话筒可被定位在耳塞100内的任何合适的位置和/或取向处。在一些示例中,阵列的不同话筒可具有主要功能/捕捉主要类型的声音(例如,较高频率、较低频率、语音),然而每个话筒也可以捕捉其他类型的声音。
[0019] 如图2和图3所示,耳塞100包括触摸传感器114,其被配置成接收来自用户手指的触摸输入。对触摸传感器114的触摸输入可用于提供耳塞100的播放控制和各种其他功能性。此外,对触摸传感器114的触摸输入可用于确定耳塞100的取向,这将在下面进一步详细讨论。在所解说的实现中,触摸传感器114包括圆形触摸输入表面116,其围绕从触摸输入表面116垂直延伸穿过圆心的轴118对称。作为结果,无论耳塞100在用户耳朵内的取向(即旋转度)如何,圆形触摸输入表面116在视觉上看起来相同,并且在触觉上对用户手指感觉相同。在其他实现中,触摸传感器114可具有非对称形状的触摸输入表面,并且对此类非对称触摸输入表面的触摸输入可用于确定耳塞100的取向。
[0020] 对应的右侧耳塞(未示出)可以佩戴在用户的右耳中,以允许用户在用户的右耳中听音频。右侧耳塞可被配置成提供与耳塞100相同的功能性,包括提供至少基于右侧耳塞在用户耳朵中的取向为用户动态定制的波束成形功能性。右侧耳塞和左侧耳塞100可以一起佩戴以提供立体声(和/或空间增强型)音频播放。在一些实现中,音频信息可以在左耳塞和右耳塞之间共享,使得波束成形功能性可以被共同提供。例如,提供波束成形功能性的话筒阵列可包括来自左耳塞和右耳塞两者的话筒。
[0021] 图4‑6示出了用于将耳塞100插入用户耳朵的示例技术。在图4中,耳塞100被取向为使得扬声器端口112指向上方(在Y方向上)。此类取向允许耳塞部110插入用户的耳朵400中。在图5中,耳塞100被示出,耳塞部110驻留在用户的耳朵400中,其中扬声器端口112仍然指向上方(在Y方向上)。在图6中,耳塞100被逆时针旋转,使得扬声器端口112指向左侧(在X方向上)。耳塞100可以以此方式旋转,以将扬声器端口112与用户的耳道对准,从而将从耳塞100发出的声音引导到用户的耳道中。附加地,以此方式旋转耳塞100导致耳塞100楔入用户的耳朵400,以防止耳塞100从用户的耳朵400中掉出,并产生允许增加用户耳朵中的隔音的密封。
[0022] 耳塞100作为非限制性示例提供。耳塞100可以采取任何合适的形状。例如,在一些实现中,触摸传感器可以采用不同的对称形状(诸如规则的八边形)、或者不同的非对称形状(诸如非正方形矩形)。在一些实现中,可以从耳塞100中省略触摸传感器。
[0023] 本文所描述的概念广泛适用于经不同大小和形状调整的耳塞(也称为耳机)。在所解说的实现中,耳塞100的大小和形状被调整为适合用户的耳朵。在其他实现中,耳塞的大小和形状可被调整为适合用户耳朵的外部或覆盖用户耳朵的至少一部分。
[0024] 不同用户耳朵的大小、形状和一般人体工程学可以变化,导致耳塞100在用户耳朵内旋转的程度因用户而异。对应地,这种变化导致耳塞100在不同用户耳朵内的取向因用户而异。
[0025] 图7示出了跨不同人类对象群体的示例嘴部位置变化锥700和耳塞701的示例话筒对准变化锥702。嘴部位置变化锥700和话筒对准变化锥702相对于法兰克福平面704定位,法兰克福平面704近似于用户耳朵705的位置,并且也近似于在对象直立且面向前方的情况下用户头骨706将处于的位置。
[0026] 嘴部位置变化锥700定义了跨人类对象群体的相对于法兰克福平面704的嘴部位置的范围。嘴部位置根据耳朵到嘴的角度来定义。在一个示例中,95%的预期偏差对应于相对于法兰克福平面704的‑28.3度的耳朵到嘴的角度,50%的预期偏差对应于‑34度的耳朵到嘴的角度。相对于法兰克福平面704的5度以及5%的预期偏差对应于相对于法兰克福平面704的‑41度的耳朵到嘴的角度。
[0027] 话筒对准变化锥702定义了包括从耳塞701输出的经波束成形信号的方向708和角宽度710的操作范围。在一个示例中,95%的预期偏差对应于相对于法兰克福平面704的‑21.3度的经波束成形信号角,50%的预期偏差对应于相对于法兰克福平面704的‑45.9度的经波束成形信号角,并且5%的预期偏差对应于相对于法兰克福平面704的‑79.8度的经波束成形信号角。
[0028] 由于跨潜在的人类对象群体的嘴部位置与话筒对准之间的预期较高变化,输出具有固定方向和固定角宽度的经波束成形信号的耳塞可能不与特定用户的嘴对准。这种未对准可能导致与从用户的嘴发出并由耳塞的话筒阵列捕捉的声音相对应的信号的信噪比降低。换言之,相对于经波束成形信号与用户的嘴对准并且足够窄以阻挡高百分比的并非源自用户嘴的声音的布置,用户的声音质量可能降低。
[0029] 图8示出了耳塞800的示例框图,该耳塞800被配置成提供为正佩戴耳塞800的用户动态定制的波束成形功能性。此类波束成形功能性至少基于耳塞800的取向来动态设置。在一个示例中,耳塞800对应于图1‑6所示的耳塞100。在其他示例中,耳塞800可以对应于其他形式的耳塞或其他类型的耳机,诸如耳挂式耳机。
[0030] 耳塞800包括至少一个耳塞扬声器802、话筒阵列804、取向感测子系统806、波束成形子系统808和通信子系统810。耳塞扬声器802被配置成将声音发射到用户的耳朵中。在一个示例中,耳塞扬声器802对应于图1‑6所示的耳塞100的耳塞扬声器102。话筒阵列804被配置成捕捉从用户的嘴和周围环境发出的声音以及耳塞扬声器802的音频播放。话筒阵列104包括多个话筒804A、804B、804C。在一个示例中,多个话筒804A、804B、804C对应于图1‑6所示的耳塞100的多个话筒104A、104B、104C。话筒阵列804可包括任何合适数目的话筒。
[0031] 取向感测子系统806被配置成输出指示耳塞的取向的取向信号812。取向信号812可用于估计用户的嘴与耳塞800之间的空间关系。通过知晓耳塞800相对于用户的嘴的位置的取向,耳塞800可以至少基于取向信号800来输出瞄准用户的嘴的经波束成形信号828,以更准确地将从用户的嘴发出的语音与其他背景噪声隔离。
[0032] 在一个示例中,耳塞800的取向可以根据相对于耳塞800的默认位置的旋转偏移来定义。取向感测子系统806包括取向估计逻辑814,其被配置成估计耳塞800的取向。在一些实例中,取向估计逻辑814可被配置成使用根据耳塞800的传感器的信号确定的取向信息的瞬时样本或快照来估计耳塞800的取向。在其他实例中,取向估计逻辑814可被配置成至少基于根据来自耳塞800的传感器的多个被跟踪信号确定的取向信息的多个样本来随时间细化对耳塞800的取向的估计。在进一步的其他实例中,取向估计逻辑814可被配置成使用传感器融合,至少基于来自耳塞800的多个传感器的多个不同的被跟踪信号来估计耳塞800的取向。取向估计逻辑814可以被配置成使用(诸)任何合适的技术来估计耳塞800的取向。
[0033] 在一些实现中,取向感测子系统806包括触摸传感器816。例如,触摸传感器816可以对应于图1‑3所示的耳塞100的触摸传感器116。在此类实现中,取向估计逻辑814可以被配置成至少基于触摸传感器816上的触摸输入来评估方向手势的手势角度818,并且至少基于手势角度818来输出取向信号812。方向手势可包括可根据其确定角度或方向(例如,平、垂直)以用于估计耳塞800的取向的任何合适的触摸输入。换言之,方向手势可包括不具有轴对称歧义性的任何手势。
[0034] 当包括在耳塞800中时,触摸传感器816可以被利用来提供双重益处,即作为用于接收触摸输入手势以控制耳塞800的操作的机构,以及作为用于接收方向手势的机构,根据该方向手势可以确定对耳塞800的取向的估计。换言之,除了提供正常的触摸输入控制功能性之外,耳塞800可以被配置成使用已经存在的触摸传感器816来估计耳塞800的取向。
[0035] 图9‑10示出了用户向耳塞的触摸传感器提供触摸输入的示例场景,该触摸输入可被评估以标识可用于估计耳塞的取向的方向手势。在图9中,用户在耳塞100的触摸传感器116上执行水平滑扫手势900。水平滑扫手势900可以是跨触摸传感器116的前向至后向滑扫,反之亦然。在一些实例中,用户可以执行水平滑扫手势900作为耳塞100的正常操作的一部分。例如,用户可以执行水平滑扫手势900以切换到播放列表中的下一首歌曲或执行某个其他控制功能。在其他实例中,用户可以响应于由取向感测子系统806呈现的请求来执行水平滑扫手势900,以便估计耳塞100的取向。例如,可以至少基于取向感测子系统806检测到耳塞800被放置在用户的耳朵中来呈现此类请求。
[0036] 在图10中,用户在耳塞100的触摸传感器116上执行垂直滑扫手势1000。垂直滑扫手势1000可以是跨触摸传感器116的上至下滑扫,反之亦然。在一些实例中,用户可以执行垂直滑扫手势1000作为耳塞100的正常操作的一部分。例如,用户可以执行垂直滑扫手势1000以增加或减少音频播放的音量或执行某个其他控制功能。在其他实例中,用户可以响应于由取向感测子系统806呈现的请求来执行垂直滑扫手势900,以便估计耳塞100的取向。
例如,可以至少基于取向感测子系统806检测到耳塞800被放置在用户的耳朵中来呈现此类请求。
[0037] 返回到图8,取向估计逻辑814被配置成将耳塞轴(X,Y)之间的相对角度与方向手势(例如,图9所示的水平滑扫手势900或图10所示的垂直滑扫手势1000)的手势角度818相关,以估计由取向信号812指示的耳塞800的取向。在其他示例中,手势角度818可以由字母(如X、T、N等)的手势来确定。
[0038] 方向手势的手势角度与耳塞的取向的相关性在触摸传感器具有对称触摸表面的实现中特别有用,因为当耳塞被放置在用户的耳朵中时,耳塞的取向不容易被用户感知。然而,根据手势角度估计耳塞取向的概念也适用于具有非对称形状的耳塞。
[0039] 在一些实例中,取向估计逻辑814可以被配置成评估与单个方向手势相对应的单个手势角度818,并至少基于单个评估的手势角度来输出取向信号812。在其他实例中,取向估计逻辑814可以被配置成评估与多个方向手势相对应的多个手势角度818,并至少基于该多个手势角度818来输出取向信号812。相对于至少基于单个手势角度评估的取向估计,多个手势角度评估可以使对取向的估计更加稳健/准确。
[0040] 在一些实现中,取向感测子系统806可包括惯性测量单元(IMU)820。IMU 820被配置成确定耳塞100的加速度和/或取向。IMU 820包括被配置成测量加速度的至少一个加速度计822。取向估计逻辑814可以被配置成至少基于由该至少一个加速度计822测得的加速度来确定指向地球质心的重向量824,并且从重力向量824推导出耳塞800置于用户耳朵中的取向,使得取向信号812至少基于该重力向量824。
[0041] 在一些示例中,取向估计逻辑814可以被配置成在相对静态的场景中(例如,在没有外部加速度的情况下)确定耳塞800的取向。在一些示例中,取向估计逻辑814可以被配置成在移动场景期间确定耳塞800的取向,在该移动场景中,取向估计逻辑814可以计及基于运动的潜在误差。此类取向确定可以结合确定用户何时处于重力向量824平行或至少接近平行于用户身体的直立位置来进行。
[0042] 在一些实例中,取向估计逻辑814可以被配置成至少基于至少根据加速度计822的测量的对重力向量824的单个确定来估计耳塞800的取向。在其他实例中,取向估计逻辑814可以被配置成随时间跟踪重力向量824,并至少基于重力向量824的多个样本来估计耳塞800的取向。
[0043] 在一些实现中,取向估计逻辑814可以被配置成区分重力向量824平行或至少接近平行于用户身体的直立位置和重力向量824不平行于用户身体的用户的非直立位置。例如,用户的位置可以至少基于由IMU 820确定的运动来确定。取向估计逻辑814可以被配置成至少基于重力向量824的采样和/或由IMU 820随时间采样的其他运动确定来随时间调整用户的位置。对用户位置的此类识别和跟踪可以允许取向估计逻辑814做出关于何时使用重力向量824来估计耳塞800的取向的智能决策。例如,取向估计逻辑814可以被配置成在用户处于直立位置时(诸如在用户行走或跑步时)使用重力向量824来估计耳塞800的取向。另一方面,取向估计逻辑814可以被配置成在用户处于非直立位置时(诸如在用户躺下或斜倚时)过滤掉重力向量824(和/或传感器的另一被跟踪信号),使其不被用于估计耳塞800的取向。当用户处于非直立位置时,重力向量824可以被过滤掉而不被使用,因为当用户不直立时,重力向量824不与耳塞800的取向准确地相关。
[0044] 在一些实现中,取向估计逻辑814可以被配置成至少基于对传感器的多个被跟踪信号(例如,手势角度818和重力向量824)的经融合考虑来输出取向信号812。例如,取向估计逻辑814可以采用传感器融合技术来协同分析手势角度818和重力向量824,以估计耳塞800的取向,使得所得到的取向估计比单独使用这些取向信息源时可能的不确定性更小。取向估计逻辑814可以采用任何合适的传感器融合技术来估计耳塞800的取向。在一个示例中,当取向估计逻辑814确定用户处于非直立位置时,取向估计逻辑814可以使用手势角度
818代替重力向量824来估计取向。在这些条件下,手势角度818可以提供比重力向量824更准确的对耳塞800的取向估计。在一些示例中,取向估计逻辑814可以采用加权算法来确定重力向量824和手势角度818中的每一者的可靠性,以供在对取向的估计中使用。
[0045] 波束成形子系统808被配置成从取向感测子系统806接收取向信号812。波束成形子系统808被配置成从话筒阵列804的多个话筒804A、804B、804C接收多个话筒信号826。波束成形子系统808被配置成至少基于取向信号812和来自话筒阵列804中的多个话筒804A、804B、804C的两个或更多个话筒信号826来输出经波束成形信号828。经波束成形信号828可在空间上选择性地对多个话筒信号826进行滤波。在一个示例中,波束成形子系统808被配置成使用末端发射波束成形算法来改进用户语音的音频质量,同时至少基于取向信号812过滤掉背景噪声。波束成形子系统808可以利用任何合适的波束成形信号处理技术来经由话筒阵列804的各种话筒捕捉用户的语音、背景噪声、音频播放和其他声音,并减去所捕捉的除用户语音之外的声音,以在经波束成形信号828中隔离用户语音。
[0046] 在一些实例中,波束成形子系统808可以被配置成至少基于取向信号812来设置经波束成形信号828相对于耳塞800的方向830。例如,经波束成形信号828的方向830可以被设置为至少基于耳塞800的取向与用户的嘴的预期位置对齐。通过将经波束成形信号828的方向830与用户的嘴对准,经波束成形信号828可以更准确地隔离从用户的嘴发出的语音,同时过滤掉相对于输出具有固定方向的经波束成形信号的耳塞的其他背景噪声。在一些实例中,经波束成形信号828的方向830可以通过至少基于取向信号812相对于默认位置动态旋转经波束成形信号828来设置。
[0047] 在一些情况下,波束成形子系统808被配置成至少基于取向信号812来设置经波束成形信号的角宽度832。例如,经波束成形信号828的角宽度832可以被设置为至少基于耳塞800的取向来覆盖用户的嘴的预期角宽度。通过将经波束成形信号828的角宽度832设置为覆盖用户的嘴的预期角宽度,经波束成形信号828可以更准确地隔离从用户的嘴发出的语音,同时过滤掉相对于输出具有固定角宽度的经波束成形信号的耳塞的其他背景噪声。在一些实例中,经波束成形信号828的角宽度832可以通过至少基于取向信号812相对于默认角宽度动态地使经波束成形信号828加宽或变窄来设置。
[0048] 通信子系统810可以被配置成将耳塞800与配套设备834通信地耦合。在一些实例中,通信子系统810可以被配置成经由有线连接(诸如蓝牙TM或Wifi)将耳塞800与配套设备834通信地耦合。在其他实例中,通信子系统810可以被配置成经由有线连接将耳塞800与配套设备834通信地耦合。配套设备834可包括任何合适类型的设备,包括但不限于智能电话、平板计算机、膝上型计算机、台式计算机、增强型现实设备、可穿戴计算设备、游戏控制台、音频源设备、通信设备或另一种类型的计算设备。
[0049] 在一些实例中,配套设备834可以向耳塞800发送音频信号,以供经由耳塞扬声器802播放。例如,此类音频信号可包括音乐、播客、与经由配套设备可视呈现的视频同步的音频、电话对话等。
[0050] 在一些实例中,配套设备834可以从耳塞800接收经波束成形信号828。配套设备834可以使用经波束成形信号828执行任何合适的操作。作为一个示例,配套设备834可以经由配套设备834的音频扬声器发射经波束成形信号828。作为另一示例,配套设备834可以执行经波束成形信号828的进一步音频处理操作。此外,在一些实例中,配套设备834可以向远程设备838发送经波束成形信号。例如,远程设备838可包括另一远程用户(诸如正与佩戴耳塞800的用户进行对话的远程用户)的配套设备。波束成形子系统808可以被配置成将经波束成形信号828输出到任何合适的目的地。
[0051] 在一些实现中,配套设备834可以被配置成输出指示用户位置(例如,直立位置或非直立位置)的位置信号836。例如,配套设备834可以采取智能电话或可穿戴设备的形式,包括传感器和被配置成确定用户位置的对应逻辑。取向感测子系统806可以被配置成经由通信子系统810从配套设备834接收位置信号836。取向估计逻辑814可以被配置为使用位置信号836(作为其他取向感测信息(例如,触摸传感器上的手势角度或加速度计的重力向量)的替换或补充)来输出指示耳塞800的取向的取向信号812。例如,当位置信号836指示用户处于非直立位置时,取向感测逻辑814可以使用位置信号836来过滤掉至少一个被跟踪传感器信号,以使其不被用于估计耳塞800的取向。在一些实例中,位置信号836可以用来作为取向估计逻辑814对用户位置的确定的替换或补充。在一些示例中,配套设备834可以被配置成确定耳塞800的取向和/或生成取向信号812。在此类实现中,取向感测子系统806可以被配置成经由通信子系统810从配套设备834接收取向信号812。波束成形子系统808可以至少基于取向信号812来设置波束成形信号。
[0052] 图11‑12示出了控制耳塞以提供为正佩戴该耳塞的用户动态定制的波束成形功能性的示例方法1100。例如,方法1100可以由图1‑6所示的耳塞100、图8所示的耳塞800或任何其他合适的耳塞或耳机来执行。
[0053] 在图11中,在1102,方法1100包括从耳塞的话筒阵列中的多个话筒接收多个话筒信号。例如,可以从图8所示的话筒阵列804接收多个话筒信号。
[0054] 在1104,方法1100包括从该耳塞的取向感测子系统接收指示该耳塞的取向的取向信号。例如,可以从图8所示的取向感测子系统806输出取向信号。
[0055] 在取向感测子系统包括多个传感器的一些实现中,在1106,方法1100可任选地可包括经由该多个传感器跟踪提供对该耳塞的取向的指示的不同信号。在一个示例中,该多个传感器可包括图8所示的触摸传感器816和加速度计822。
[0056] 在取向感测子系统包括被配置成检测触摸输入的触摸传感器的一些实现中,在1108,方法1100可任选地可包括评估该触摸传感器上的方向手势的手势角度。在此类实现中,可以至少基于手势角度来输出取向信号。
[0057] 在取向感测子系统包括被配置成检测触摸输入的触摸传感器的一些实现中,在1110,方法1100可任选地可包括评估与该触摸传感器上的多个方向手势相对应的多个手势角度。在此类实现中,可以至少基于该多个手势角度来输出取向信号。例如,可以随时间跟踪该多个手势角度,并且随着评估更多手势角度,可以以更大的置信度来估计耳塞的取向。
[0058] 在取向感测子系统包括被配置成测量加速度的加速度计的一些实现中,在1112,方法1100可任选地可包括至少基于测得的加速度来确定重力向量。在此类实现中,可以至少基于重力向量来输出取向信号。
[0059] 在取向感测子系统包括加速度计和触摸传感器的一些实现中,可以至少基于重力向量和(诸)手势角度来输出取向信号。
[0060] 转到图12,在一些实现中,在1114,方法1100可任选地可包括确定正佩戴耳塞的用户的位置(例如,至少基于重力向量)。至少基于重力向量随时间的重复采样和/或至少基于另一种形式的位置确定,可以随时间学习和跟踪用户的位置。例如,用户的位置可包括重力向量平行或至少接近平行于用户身体的直立位置(例如,行走或跑步),或者重力向量基本上不平行于用户身体的非直立位置(例如,躺下或斜倚)。
[0061] 在一些实现中,在1116,方法1100可任选地可包括经由耳塞的通信子系统从配套设备接收指示用户的位置的位置信号。例如,配套设备可包括智能电话或可穿戴设备,其包括传感器和被配置成确定用户的位置的对应逻辑。在一个示例中,可以从图8所示的配套设备834接收位置信号。
[0062] 在一些实现中,在1118,方法1100可任选地可包括确定用户的位置是否对应于非直立位置。如果用户的位置对应于非直立位置,则方法1100移动到1120。否则,方法1100移动到1122。
[0063] 在一些实现中,在1120,方法1100可任选地可包括在用户处于非直立位置时,过滤掉至少一个被跟踪传感器信号以使其不被用于输出取向信号。当用户处于非直立位置时,可以在不使用一个或多个传感器信号(例如,重力向量)的情况下估计与取向信号相对应的耳塞的取向,因为此类(诸)信号可能不指示耳塞的取向。
[0064] 在一些实现中,在1122,方法1100可任选地可包括至少基于取向信号来设置经波束成形信号的方向。
[0065] 在一些实现中,在1124,方法1100可任选地可包括至少基于该取向信号来设置经波束成形信号的角宽度。
[0066] 在1126,方法1100包括至少基于该取向信号和该多个话筒信号从该耳塞的波束成形子系统输出经波束成形信号。经波束成形信号可在空间上选择性地对该多个话筒信号进行滤波。例如,可以从图8所示的波束成形子系统808输出波束成形信号。
[0067] 可以执行方法1100以提供为正佩戴耳塞的用户动态定制的波束成形功能性。此类基于取向的波束成形功能性可以增强与从用户的嘴发出的声音相对应的音频信号,同时抑制周围环境中的背景噪声。换言之,经波束成形信号可以使用耳塞的取向对准用户的嘴,使得由话筒阵列捕捉的用户语音的声音质量可以相对于配置成输出具有固定方向和角宽度的经波束成形信号的耳塞而增加。
[0068] 在一些实现中,本文中所描述的方法和过程可以与一个或多个计算设备的计算系统绑定。具体而言,此类方法和过程可被实现为计算机应用程序或服务、应用编程接口(API)、库、和/或其他计算机程序产品。
[0069] 图13示意性地示出了可执行上述方法和过程中的一个或多个的计算系统1300的非限制性实现。以简化形式示出了计算系统1300。计算系统1300可以包含图1‑6所示的耳塞100、图7所示的耳塞701、图8所示的耳塞800、图8所示的配套设备834和图8所示的远程设备
838。计算系统1300可采取以下形式:一个或多个耳塞、耳机、个人计算机、服务器计算机、平板计算机、家庭娱乐计算机、网络计算设备、游戏设备、移动计算设备、移动通信设备(例如,智能电话)和/或其他计算设备,以及诸如智能手表、背包主计算机和头戴式增强现实设备/混合虚拟现实设备之类的可穿戴计算设备。
[0070] 计算系统1300包括逻辑处理器1302、易失性存储器1304以及非易失性存储设备1306。计算系统1300可以可任选地包括显示子系统1308、输入子系统1310、通信子系统1312和/或在图13中未示出的其他组件。
[0071] 逻辑处理器1302包括被配置成执行指令的一个或多个物理设备。例如,逻辑处理器可以被配置成执行指令,该指令是一个或多个应用、程序、例程、库、对象、组件、数据结构或其他逻辑构造的一部分。此类指令可被实现以执行任务、实现数据类型、变换一个或多个组件的状态、实现技术效果、或以其他方式得到期望的结果。
[0072] 逻辑处理器1302可包括被配置成执行软件指令的一个或多个物理处理器(硬件)。附加地或替换地,逻辑处理器可包括被配置成执行硬件实现的逻辑或固件指令的一个或多个硬件逻辑电路或固件设备。逻辑处理器1302的各处理器可以是单核的或多核的,并且其上所执行的指令可被配置成用于串行、并行和/或分布式处理。逻辑处理器的各个个体组件可任选地分布在两个或更多个分开的设备之间,这些设备可以位于远程以及/或者被配置成用于协同处理。逻辑处理器的各方面可由以计算配置进行配置的可远程访问的联网计算设备来虚拟化和执行。将理解,在这样的情形中,这些虚拟化方面在各种不同机器的不同物理逻辑处理器上运行。
[0073] 非易失性存储设备1306包括被配置成保持可由逻辑处理器执行的指令以实现本文中所描述的方法和过程的一个或多个物理设备。当实现此类方法和过程时,非易失性存储设备1306的状态可以被变换-例如以保持不同的数据。
[0074] 非易失性存储设备1306可包括是可移动的和/或内置设备的物理设备。非易失性存储设备1306可包括光学存储器(例如,CD、DVD、HD‑DVD、蓝光碟等)、半导体存储器(例如,ROM、EPROM、EEPROM、闪存等)、和/或磁性存储器(例如,硬盘驱动器软盘驱动器、磁带驱动器、MRAM等)或其他大容量存储设备技术。非易失性存储设备1306可包括非易失性、动态、静态、读/写、只读、顺序存取、位置可寻址、文件可寻址、和/或内容可寻址设备。将领会,非易失性存储设备1306被配置成即使当切断给非易失性存储设备1306的电力时也保存指令。
[0075] 易失性存储器1304可以包括包含随机存取存储器的物理设备。易失性存储器1304通常被逻辑处理器1302用来在软件指令的处理期间临时地储存信息。将领会,当切断给易失性存储器1304的电源时,易失性存储器1304通常不继续存储指令。
[0076] 逻辑处理器1302、易失性存储器1304和非易失性存储设备1306的各方面可以被一起集成到一个或多个硬件逻辑组件中。此类硬件逻辑组件可包括例如现场可编程阵列(FPGA)、程序和应用专用集成电路(PASIC/ASIC)、程序和应用专用标准产品(PSSP/ASSP)、片上系统(SOC),以及复杂可编程逻辑设备(CPLD)。
[0077] 当包括显示子系统1308时,显示子系统316可被用来呈现由非易失性存储设备1306保持的数据的视觉表示。该视觉表示可采用图形用户界面(GUI)的形式。由于本文中所描述的方法和过程改变了由非易失性存储设备保持的数据,并因而变换了非易失性存储设备的状态,因此同样可以变换显示子系统1308的状态以视觉地表示底层数据中的改变。显示子系统1308可包括利用实质上任何类型的技术的一个或多个显示设备。此类显示设备可与逻辑处理器1302、易失性存储器1304和/或非易失性存储设备1306一起组合在共享外壳中,或此类显示设备可以是外围显示设备。
[0078] 当包括输入子系统1310时,输入子系统1310可包括诸如键盘鼠标触摸屏、语言和/或语音识别麦克、相机(例如网络摄像头)或游戏控制器之类的一个或多个用户输入设备或者与上述用户输入设备对接。
[0079] 当包括通信子系统1312时,通信子系统1312可被配置成将本文描述的各种计算设备彼此通信地耦合,并且与其他设备通信地耦合。通信子系统1312可包括与一个或多个不同通信协议兼容的有线和/或无线通信设备。作为非限制性示例,通信子系统可被配置成用于经由无线电话网络或者有线或无线局域网或广域网(诸如Wi‑Fi连接上的HDMI)来进行通信。在一些实现中,通信子系统可允许计算系统1300经由诸如因特网这样的网络将消息发送至其他设备以及/或者从其它设备接收消息。
[0080] 在一示例中,一种耳塞,包括:耳塞扬声器;包括多个话筒的话筒阵列;取向感测子系统,其被配置成输出指示耳塞的取向的取向信号;以及波束成形子系统,其被配置成至少基于取向信号和来自话筒阵列中的多个话筒的多个话筒信号来输出经波束成形信号,经波束成形信号在空间上选择性地对该多个话筒信号进行滤波。在该示例和/或其他示例中,波束成形子系统可任选地可被配置成至少基于取向信号来设置经波束成形信号相对于耳塞的方向。在该示例和/或其他示例中,波束成形子系统可任选地可被配置成至少基于取向信号来设置经波束成形信号的角宽度。在该示例和/或其他示例中,取向感测子系统可任选地可包括触摸传感器和取向估计逻辑,该取向估计逻辑被配置成评估该触摸传感器上的方向手势的手势角度,并且至少基于该手势角度来输出取向信号。在该示例和/或其他示例中,取向估计逻辑可被配置成评估与多个方向手势相对应的多个手势角度,并至少基于该多个手势角度来输出取向信号。在该示例和/或其他示例中,触摸传感器可任选地可包括圆形触摸输入表面。在该示例和/或其他示例中,取向感测子系统可任选地可包括被配置成测量加速度的加速度计和被配置成至少基于测得的加速度来确定重力向量并至少基于该重力向量来输出取向信号的取向估计逻辑。在该示例和/或其他示例中,取向感测子系统可任选地可包括多个传感器以及取向估计逻辑,该多个传感器被配置成跟踪提供对耳塞的取向的指示的不同信号,该取向估计逻辑被配置成至少基于来自该多个传感器的多个不同的被跟踪信号来输出取向信号。在该示例和/或其他示例中,取向估计逻辑可任选地可被配置成区分用户的直立位置和非直立位置,并且在用户处于非直立位置时,过滤掉至少一个被跟踪传感器信号以使其不被用于输出取向信号。在该示例和/或其他示例中,该多个传感器可任选地可包括触摸传感器和被配置成测量加速度的加速度计,并且该取向估计逻辑可任选地可被配置成评估该触摸传感器上的方向手势的手势角度,至少基于测得的加速度来确定重力向量,并且至少基于该手势角度和该重力向量来输出取向信号。
[0081] 在另一示例中,一种用于控制耳塞的方法,包括:从耳塞的话筒阵列中的多个话筒接收多个话筒信号;从该耳塞的取向感测子系统接收指示该耳塞的取向的取向信号;以及至少基于该取向信号和该多个话筒信号从该耳塞的波束成形子系统输出经波束成形信号,经波束成形信号在空间上选择性地对该多个话筒信号进行滤波。在该示例和/或其他示例中,该方法可任选地可进一步包括至少基于取向信号来设置经波束成形信号的方向。在该示例和/或其他示例中,该方法可任选地可进一步包括至少基于取向信号来设置经波束成形信号的角宽度。在该示例和/或其他示例中,取向感测子系统可任选地可包括被配置成检测触摸输入的触摸传感器,并且该方法可任选地可进一步包括评估该触摸传感器上的方向手势的手势角度,并且该取向信号可任选地可至少基于该手势角度来输出。在该示例和/或其他示例中,该方法可进一步包括评估与该触摸传感器上的多个方向手势相对应的多个手势角度,并且该取向信号可任选地可至少基于该多个手势角度来输出。在该示例和/或其他示例中,取向感测子系统可任选地可包括被配置成测量加速度的加速度计,该方法可任选地可进一步包括至少基于测得的加速度来确定重力向量,并且该取向信号可任选地可至少基于该重力向量来输出。在该示例和/或其他示例中,该方法可进一步包括经由多个传感器来跟踪提供对耳塞的取向的指示的不同信号;以及至少基于来自该多个传感器的多个不同的被跟踪信号来输出取向信号。在该示例和/或其他示例中,该方法可任选地可进一步包括区分用户的直立位置和非直立位置;以及在用户处于非直立位置时,过滤掉至少一个被跟踪传感器信号以使其不被用于输出取向信号。在该示例和/或其他示例中,该多个传感器可任选地可包括触摸传感器和被配置成测量加速度的加速度计,并且该方法可任选地可进一步包括至少基于测得的加速度来确定重力向量;评估该触摸传感器上的方向手势的手势角度,并且该取向信号可任选地可至少基于该手势角度和该重力向量来输出。
[0082] 在又一示例中,一种耳塞,包括:耳塞扬声器;包括多个话筒的话筒阵列;取向感测子系统,该取向感测子系统包括触摸传感器;加速度计,该加速度计被配置成确定重力向量;以及取向估计逻辑,该取向估计逻辑被配置成评估触摸传感器上的方向手势的手势角度,以及至少基于该手势角度和该重力向量来输出指示耳塞的取向的取向信号;以及波束成形子系统,该波束成形子系统被配置成至少基于该取向信号和来自该多个话筒的多个话筒信号来输出经波束成形信号,该经波束成形信号在空间上选择性地对该多个话筒信号进行滤波。
[0083] 应当理解,本文中所描述的配置和/或办法本质上是示例性的,并且这些具体实施例或示例不应被视为具有限制意义,因为许多变体是可能的。本文中所描述的具体例程或方法可表示任何数目的处理策略中的一个或多个。由此,所解说和/或所描述的各种动作可按所解说和/或所描述的顺序执行、按其他顺序执行、并行地执行,或者被省略。同样,以上所描述的过程的次序可被改变。
[0084] 本公开的主题包括此处公开的各种过程、系统和配置以及其他特征、功能、动作和/或属性、以及它们的任一和全部等价物的所有新颖且非显而易见的组合和子组合。
QQ群二维码
意见反馈