无线电话会议的电话系统和电话网关

申请号 CN201190000737.3 申请日 2011-07-15 公开(公告)号 CN203435060U 公开(公告)日 2014-02-12
申请人 艾利佛有限公司; 发明人 格雷戈里·C·伯内特; 迈克尔·格尔茨; 尼古拉斯·佩蒂特; 景志年; 史蒂夫·弗雷斯蒂耶里; 托马斯·唐纳森;
摘要 本实用新型提供了无线电话会议的电话系统和电话网关。无线电话会议的电话系统使用身体佩带的有线或者无线的音频端点,该音频端点包括 传声 器或者传声器阵列,并且选择性地包括喇叭。这些音频端点,仅举几个例子,包含头戴式 耳 机、悬挂物、可用夹子夹住的传声器,被用于捕获用户的嗓音,并且产生的数据可以被用于去除回音以及环境噪声。每个音频端点将它的音频传输到电话网关,在电话网关处,如果还没有在音频端点上进行噪音和回音抑制,则可以出现噪音和回音抑制,并且在电话网关处,每个音频端点的输出可以被标记、与其他的音频端点集成、以及经由电话网络的一个以上的电话信道被传输。噪音和回音抑制也可以在音频端点上完成。每个用户的输出的标记可以通过外部呼叫者的电话被使用,以便空间地 定位 空间中的每个用户,增加清晰度。
权利要求

1.一种无线电话会议的电话系统,其特征在于,包括:
无线通信装置WCD,所述无线通信装置WCD在近端参与者与远端参与者电话呼叫期间被所述近端参与者佩带,其中所述WCD包含至少一个传声器;
电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道,其中所述音频处理器从接收自所述WCD的信号产生第一音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述连接部件接收来自所述远端参与者的第二音频信号;以及
喇叭,所述喇叭被耦接到所述连接部件并且输出所述第二音频信号。
2.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述至少一个传声器包括全向传声器。
3.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述至少一个传声器包括定向传声器。
4.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述至少一个传声器包括两个传声器。
5.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述WCD包括信号处理器,所述信号处理器被耦接到所述至少一个传声器。
6.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述至少一个传声器的信号进行多路分配。
7.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述至少一个传声器的信号进行回音消除。
8.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述至少一个传声器的信号进行噪音抑制。
9.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述至少一个传声器的信号进行语音活动检测。
10.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式机,所述头戴式耳机包含所述至少一个传声器和所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
11.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器以及所述信号处理器,其中所述悬挂物被佩带在近端参与者上。
12.如权利要求5所述的无线电话会议的电话系统,其特征在于,所述WCD包含喇叭,其中所述电话网关将所述第二音频信号传输到所述WCD,以及所述喇叭输出所述第二音频信号。
13.如权利要求12所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器、所述喇叭以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
14.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述WCD被硬编码到所述电话网关。
15.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述WCD包含检测器,所述检测器电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
16.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述电话网关包含所述喇叭。
17.如权利要求16所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第一音频信号。
18.如权利要求16所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第二音频信号。
19.如权利要求16所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器,其中所述悬挂物被佩带在近端参与者上。
20.如权利要求1所述的无线电话会议的电话系统,其特征在于,包括电话接口,所述电话接口被耦接到所述连接部件,其中所述电话接口被用于控制所述电话呼叫的参数。
21.如权利要求20所述的无线电话会议的电话系统,其特征在于,所述电话接口包含拨号接口。
22.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述无线收发机包括蓝牙收发机。
23.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述电话网关包含充电器,其中所述WCD耦接到所述充电器以便再充电。
24.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述WCD包含配对模式,其中在所述配对模式中,所述WCD搜索所述电话网关以及与其电配对的至少一 个其他WCD中的至少一个。
25.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的所述WCD。
26.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为瞬间的所述配对随后被所述电话网关擦除。
27.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行多路分配。
28.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行回音消除。
29.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行噪音抑制。
30.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行语音活动检测。
31.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行空间化。
32.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行均衡化。
33.如权利要求1所述的无线电话会议的电话系统,其特征在于,所述连接部件管理带有所述WCD的所述音频信道。
34.如权利要求1所述的无线电话会议的电话系统,其特征在于,包括包含所述WCD的多个无线通信装置WCD,其中所述多个WCD在所述电话呼叫期间被多个近端参与者佩带。
35.如权利要求34所述的无线电话会议的电话系统,其特征在于,所述电话网关包括包含所述无线收发机的多个无线收发机,其中所述多个无线收发机被耦接到所述音频处理器,其中每个无线收发机与所述多个WCD中的对应WCD电配对,并且提供带有所述对应WCD的专用信道。
36.如权利要求35所述的无线电话会议的电话系统,其特征在于,所述多个无线收发机包括多个蓝牙收发机。
37.如权利要求35所述的无线电话会议的电话系统,其特征在于,所述电话网关电标记来自每个WCD的每个输入信号。
38.如权利要求35所述的无线电话会议的电话系统,其特征在于,所述音频处理器集成从所述多个WCD接收到的信号以产生所述第一音频信号。
39.如权利要求38所述的无线电话会议的电话系统,其特征在于,所述音频处理器通过对于对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
40.如权利要求39所述的无线电话会议的电话系统,其特征在于,当所述近端参与者正在说话时,所述动态增益的所述计算包括计算均方根。
41.如权利要求35所述的无线电话会议的电话系统,其特征在于,所述电话网关将所述第二音频信号传输到所述多个WCD。
42.如权利要求35所述的无线电话会议的电话系统,其特征在于,包括包含所述喇叭的多个喇叭,其中所述多个WCD中的每个WCD包含所述多个喇叭中的一个喇叭,其中所述电话网关将所述第二音频信号传输到所述多个WCD,并且所述多个喇叭输出所述第二音频信号。
43.如权利要求35所述的无线电话会议的电话系统,其特征在于,所述连接部件管理带有所述多个WCD的所述专用信道。
44.如权利要求34所述的无线电话会议的电话系统,其特征在于,每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预先指定的范围内的至少一个WCD。
45.一种无线电话会议的电话系统,其特征在于,包括:
至少一个无线通信装置WCD,所述至少一个无线通信装置WCD在至少一个近端参与者与远端参与者的电话呼叫期间被所述至少一个近端参与者佩带;以及
电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
46.一种无线电话会议的电话系统,其特征在于,包括:
多个无线通信装置WCD,所述多个无线通信装置WCD在多个近端参与者与远端参与者的电话呼叫期间被所述多个近端参与者佩带;以及
电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中 的每个WCD形成专用音频信道,其中所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
47.一种电话网关,其特征在于,包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置WCD形成至少一个音频信道,所述至少一个无线通信装置WCD对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被所述至少一个近端参与者佩带,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
48.一种电话网关,其特征在于,包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置WCD形成多个音频信道,所述多个无线通信装置WCD对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被所述近端参与者佩带,其中所述音频处理器从接收自所述多个WCD的信号产生集成的音频信号,其中所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
49.一种无线电话会议的电话系统,其特征在于,包括:
多个无线通信装置WCD,其中每个WCD在近端参与者与远端参与者的电话呼叫期间被所述近端参与者佩带;以及
电话网关,包含,
多个收发机,其中每个收发机与所述多个WCD中的对应WCD电配对,并且提供带有所述对应WCD的专用信道;
处理器,所述处理器被耦接到所述多个收发机,其中所述处理器将从所述多个WCD接收到的信号集成到第一音频信号中;
电话部件,所述电话部件被耦接到所述处理器以及输送所述电话呼叫的网络,其中所述电话部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述电话部件接收来自所述远端参与者的第二音频信号;
电话接口,所述电话接口被耦接到所述电话部件,其中所述电话接口被用于控制所述电话呼叫的参数。
50.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述WCD包含至 少一个传声器。
51.如权利要求50所述的无线电话会议的电话系统,其特征在于,所述至少一个传声器包括全向传声器。
52.如权利要求50所述的无线电话会议的电话系统,其特征在于,所述至少一个传声器包括定向传声器。
53.如权利要求50所述的无线电话会议的电话系统,其特征在于,所述WCD包括信号处理器,所述信号处理器被耦接到所述至少一个传声器。
54.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自每个WCD的每个输入信号进行多路分配。
55.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自每个WCD的每个输入信号进行回音消除。
56.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自每个WCD的每个输入信号进行噪音抑制。
57.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自每个WCD的每个输入信号进行语音活动检测。
58.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述信号处理器电标记从每个WCD输出的每个信号。
59.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器和所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
60.如权利要求53所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器和所述信号处理器,其中所述悬挂物被佩带在近端参与者上。
61.如权利要求53所述的无线电话会议的电话系统,其特征在于,每个WCD包含被耦接到所述信号处理器的喇叭。
62.如权利要求61所述的无线电话会议的电话系统,其特征在于,所述电话网关将所述第二音频信号传输到所述多个WCD。
63.如权利要求62所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第二音频信号。
64.如权利要求61所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器、所述喇叭以及所述信号处理器,其 中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
65.如权利要求49所述的无线电话会议的电话系统,其特征在于,每个WCD被硬编码到所述电话网关。
66.如权利要求49所述的无线电话会议的电话系统,其特征在于,使用无线耦接,至少一个WCD被耦接到所述电话网关。
67.如权利要求49所述的无线电话会议的电话系统,其特征在于,使用有线耦接,至少一个WCD被耦接到所述电话网关。
68.如权利要求49所述的无线电话会议的电话系统,其特征在于,每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预先指定的范围内的至少一个WCD。
69.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述处理器通过对于对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
70.如权利要求69所述的无线电话会议的电话系统,其特征在于,当所述近端参与者正在说话时,所述动态增益的所述计算包括计算均方根。
71.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述电话网关包含被耦接到所述处理器的喇叭。
72.如权利要求71所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第一音频信号。
73.如权利要求71所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第二音频信号。
74.如权利要求71所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器,其中所述悬挂物被佩带在近端参与者上。
75.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述电话接口包含拨号接口。
76.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述多个收发机包括多个蓝牙收发机。
77.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述电话网关电标记来自每个WCD的每个输入信号。
78.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述电话网关包含充电器,其中所述多个WCD耦接到所述充电器以便再充电。
79.如权利要求49所述的无线电话会议的电话系统,其特征在于,至少一个WCD包含配对模式,其中在所述配对模式中,所述至少一个WCD搜索所述电话网关和与其电配 对的至少一个其他WCD中的至少一个。
80.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的至少一个WCD。
81.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述多个WCD中的一个WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为瞬间的所述配对随后被所述电话网关擦除。
82.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述处理器包括音频处理子系统。
83.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行多路分配。
84.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行回音消除。
85.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行噪音抑制。
86.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行语音活动检测。
87.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行空间化。
88.如权利要求82所述的无线电话会议的电话系统,其特征在于,所述音频处理子系统对于来自每个WCD的每个输入信号进行均衡化。
89.如权利要求49所述的无线电话会议的电话系统,其特征在于,所述处理器包括连接管理子系统,所述连接管理子系统管理带有所述多个WCD的所述专用信道。
90.一种无线电话会议的电话系统,其特征在于,包括:
无线通信装置WCD,所述无线通信装置WCD在近端参与者与远端参与者的电话呼叫期间被所述近端参与者佩带,其中所述WCD包含传声器阵列;
电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道,其中所述音频处理器从接收自所述WCD的信号产生第一音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述连接部件接收来自所述远端参与者的第二音频信号;以及
喇叭,所述喇叭被耦接到所述连接部件,并且输出所述第二音频信号。
91.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述传声器阵列包括至少一个全向传声器。
92.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述传声器阵列包括至少一个定向传声器。
93.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述传声器阵列包括两个传声器。
94.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述WCD包括信号处理器,所述信号处理器被耦接到所述传声器阵列。
95.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述传声器阵列的信号进行多路分配。
96.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述传声器阵列的信号进行回音消除。
97.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述传声器阵列的信号进行噪音抑制。
98.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述信号处理器对于来自所述传声器阵列的信号进行语音活动检测。
99.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
100.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述传声器阵列和所述信号处理器,其中所述悬挂物被佩带在近端参与者上。
101.如权利要求94所述的无线电话会议的电话系统,其特征在于,所述WCD包含喇叭,其中所述电话网关将所述第二音频信号传输到所述WCD,以及所述喇叭输出所述第二音频信号。
102.如权利要求101所述的无线电话会议的电话系统,其特征在于,所述WCD包括头戴式耳机,所述头戴式耳机包含所述传声器阵列、所述喇叭以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
103.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述WCD被硬编码到所述电话网关。
104.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述WCD包含检测器,所述检测器电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
105.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述电话网关包含所述喇叭。
106.如权利要求105所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第一音频信号。
107.如权利要求105所述的无线电话会议的电话系统,其特征在于,所述喇叭输出所述第二音频信号。
108.如权利要求105所述的无线电话会议的电话系统,其特征在于,所述WCD包括悬挂物,所述悬挂物包含所述传声器阵列,其中所述悬挂物被佩带在近端参与者上。
109.如权利要求90所述的无线电话会议的电话系统,其特征在于,包括电话接口,所述电话接口被耦接到所述连接部件,其中所述电话接口被用于控制所述电话呼叫的参数。
110.如权利要求109所述的无线电话会议的电话系统,其特征在于,所述电话接口包含拨号接口。
111.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述无线收发机包括蓝牙收发机。
112.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述电话网关包含充电器,其中所述WCD耦接到所述充电器以便再充电。
113.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述WCD包含配对模式,其中在所述配对模式中,所述WCD搜索所述电话网关以及与其电配对的至少一个其他WCD中的至少一个。
114.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的所述WCD。
115.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为瞬间的所述配对随后被所述电话网关擦除。
116.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行多路分配。
117.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行回音消除。
118.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行噪音抑制。
119.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行语音活动检测。
120.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行空间化。
121.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述音频处理器对于来自每个WCD的每个输入信号进行均衡化。
122.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述连接部件管理带有所述WCD的所述音频信道。
123.如权利要求90所述的无线电话会议的电话系统,其特征在于,包括包含所述WCD的多个无线通信装置WCD,其中所述多个WCD在所述电话呼叫期间被多个近端参与者佩带。
124.如权利要求123所述的无线电话会议的电话系统,其特征在于,所述电话网关包括包含所述无线收发机的多个无线收发机,其中所述多个无线收发机被耦接到所述音频处理器,其中每个无线收发机与所述多个WCD中的对应WCD电配对,并且提供带有所述对应WCD的专用信道。
125.如权利要求124所述的无线电话会议的电话系统,其特征在于,所述多个无线收发机包括多个蓝牙收发机。
126.如权利要求124所述的无线电话会议的电话系统,其特征在于,所述电话网关电标记来自每个WCD的每个输入信号。
127.如权利要求124所述的无线电话会议的电话系统,其特征在于,所述音频处理器集成从所述多个WCD接收到的信号以产生所述第一音频信号。
128.如权利要求127所述的无线电话会议的电话系统,其特征在于,所述音频处理器通过对于对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
129.如权利要求128所述的无线电话会议的电话系统,其特征在于,当所述近端参与者正在说话时,所述动态增益的所述计算包括计算均方根。
130.如权利要求124所述的无线电话会议的电话系统,其特征在于,所述电话网关将所述第二音频信号传输到所述多个WCD。
131.如权利要求124所述的无线电话会议的电话系统,其特征在于,包括包含所述喇 叭的多个喇叭,其中所述多个WCD中的每个WCD包含所述多个喇叭中的一个喇叭,其中所述电话网关将所述第二音频信号传输到所述多个WCD,并且所述多个喇叭输出所述第二音频信号。
132.如权利要求124所述的无线电话会议的电话系统,其特征在于,所述连接部件管理带有所述多个WCD的所述专用信道。
133.如权利要求123所述的无线电话会议的电话系统,其特征在于,每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预先指定的范围内的至少一个WCD。
134.如权利要求90所述的无线电话会议的电话系统,其特征在于,所述传声器阵列包括:
第一虚拟传声器,所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号;以及
第二虚拟传声器,所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
135.如权利要求134所述的无线电话会议的电话系统,其特征在于,所述第一和第二物理传声器是全向的。
136.如权利要求134所述的无线电话会议的电话系统,其特征在于,所述第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中所述语音是人类语音。
137.如权利要求136所述的无线电话会议的电话系统,其特征在于,所述第二虚拟传声器对于包含单个零位的语音具有第二线性响应,所述单个零位被定向在朝向语音源的方向上。
138.如权利要求137所述的无线电话会议的电话系统,其特征在于,所述单个零位是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级低的测量的响应等级的区域。
139.如权利要求137所述的无线电话会议的电话系统,其特征在于,所述第二线性响应包含被定向在远离所述语音源的方向上的主瓣。
140.如权利要求139所述的无线电话会议的电话系统,其特征在于,所述主瓣是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级大的测量的 响应等级的区域。
141.如权利要求137所述的无线电话会议的电话系统,其特征在于,所述第一物理传声器和所述第二物理传声器沿着轴被安置,并且被分开第一距离。
142.如权利要求141所述的无线电话会议的电话系统,其特征在于,所述轴的中点是离开产生所述语音的语音源的第二距离,其中所述语音源被定位在相对于所述中点由度限定的方向上。
143.如权利要求142所述的无线电话会议的电话系统,其特征在于,所述第一虚拟传声器包括从所述第一传声器信号中减去的所述第二传声器信号。
144.如权利要求143所述的无线电话会议的电话系统,其特征在于,所述第一传声器信号被延迟。
145.如权利要求144所述的无线电话会议的电话系统,其特征在于,所述延迟被升幂,所述幂与所述语音到达所述第一虚拟传声器和所述语音到达所述第二虚拟传声器之间的时间差成比例。
146.如权利要求144所述的无线电话会议的电话系统,其特征在于,所述延迟被升幂,所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
147.如权利要求143所述的无线电话会议的电话系统,其特征在于,所述第二传声器信号乘以比率,其中所述比率是第三距离比第四距离的比率,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
148.如权利要求142所述的无线电话会议的电话系统,其特征在于,所述第二虚拟传声器包括从所述第二传声器信号中减去的所述第一传声器信号。
149.如权利要求148所述的无线电话会议的电话系统,其特征在于,所述第一传声器信号被延迟。
150.如权利要求149所述的无线电话会议的电话系统,其特征在于,所述延迟被升幂,所述幂与所述语音到达所述第一虚拟传声器和所述语音到达所述第二虚拟传声器之间的时间差成比例。
151.如权利要求149所述的无线电话会议的电话系统,其特征在于,所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
152.如权利要求151所述的无线电话会议的电话系统,其特征在于,所述第一传声器信号乘以比率,其中所述比率是所述第三距离比所述第四距离的比率。
153.如权利要求137所述的无线电话会议的电话系统,其特征在于,所述单个零位与所述第一物理传声器和所述第二物理传声器中的至少一个相距一段距离,所述语音源被期望在该位置处。
154.如权利要求134所述的无线电话会议的电话系统,其特征在于,所述第一虚拟传声器包括从延迟版本的所述第一传声器信号中减去的所述第二传声器信号。
155.如权利要求154所述的无线电话会议的电话系统,其特征在于,所述第二虚拟传声器包括从所述第二传声器信号中减去的延迟版本的所述第一传声器信号。
156.一种无线电话会议的电话系统,其特征在于,包括:
至少一个无线通信装置WCD,所述至少一个无线通信装置WCD在至少一个近端参与者与远端参与者的电话呼叫期间被所述至少一个近端参与者佩带,其中所述WCD包含传声器阵列,所述传声器阵列包括第一虚拟传声器和第二虚拟传声器;以及
电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
157.如权利要求156所述的无线电话会议的电话系统,其特征在于,所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号。
158.如权利要求157所述的无线电话会议的电话系统,其特征在于,所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
159.一种无线电话会议的电话系统,其特征在于,包括:
多个无线通信装置WCD,所述多个无线通信装置WCD在多个近端参与者与远端参与者的电话呼叫期间被所述多个近端参与者佩带,其中所述WCD包含传声器阵列;以及 电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中 的每个WCD形成专用音频信道,其中所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
160.如权利要求159所述的无线电话会议的电话系统,其特征在于,所述传声器阵列包括:
第一虚拟传声器,所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号;以及
第二虚拟传声器,所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
161.一种电话网关,其特征在于,包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置WCD形成至少一个音频信道,所述至少一个无线通信装置WCD对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被所述至少一个近端参与者佩带,其中所述WCD包含传声器阵列,所述传声器阵列包括多个虚拟传声器,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
162.一种电话网关,其特征在于,包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置WCD形成多个音频信道,所述多个无线通信装置WCD对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被所述近端参与者佩带,其中所述WCD包含传声器阵列,其中所述音频处理器从接收自所述多个WCD的所述信号产生集成的音频信号,其中所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。

说明书全文

无线电话会议的电话系统和电话网关

[0001] 相关申请
[0002] 这个申请要求2010年7月15日提交的第61/364,675号美国(US)专利申请的权益。
[0003] 这个申请是2008年6月13日提交的第12/139,333号美国专利申请的部分延续。 [0004] 这个申请是2003年9月18日提交的第10/667,207号美国专利申请的部分延续。 [0005] 技术领域
[0006] 本公开在此一般地涉及被配置用于电话会议呼叫的电话,包括作为充当电话装置的个人计算机或者服务器的这种实现。
[0007] 背景技术
[0008] 常规的电话会议的电话使用一个以上的传声器来对所关心的环境中的声音进行采样,并且使用一个以上的扬声器来广播引入的通信。在这种通信系统中涉及有一些困难,包括扬声器和传声器之间的强的回音路径、在房间中清楚地传输用户语音的困难、以及几乎没有环境噪声抑制。这些问题导致了外部呼叫者难以听到和/或理解所有的用户、差的或者不可能的双路通信、以及噪音(诸如移动电话电铃以及与会议电话在同一桌子上的键盘上的打字)经由电话会议被清楚地传输给外部呼叫者——有时以比用户的语音高的平。
[0009] 引用结合
[0010] 这个说明书中提及的每个专利、专利申请和/或公报通过以相同的程度全部引用而结合在此,就好像每个单独的专利、专利申请和/或公报被具体地和逐一地表示以通过引用被结合。
[0011] 附图说明
[0012] 图1显示根据实施例的作为可用夹子夹住的传声器阵列的身体佩带的子体装置。 [0013] 图2显示根据替换实施例的作为悬挂的传声器阵列的身体佩带的子体装置。 [0014] 图3显示根据实施例的无线电话会议的电话系统,该无线电话会议的电话系统包括具有四个无线子体以及一个有线子体的母体。
[0015] 图4显示根据实施例的无线电话会议的电话系统的框图,该无线电话会议的电话系统 包括母体以及它的组件和子体/伙伴(三个头戴式机和一个扬声器)。 [0016] 图5是显示根据实施例的两个远端用户和两个近端用户之间的音频流流程图。 [0017] 图6是根据实施例的用于连接无线电话会议的电话系统的无线伙伴/子体和母体的流程图。
[0018] 图7是根据实施例的双传声器自适应噪音抑制系统。
[0019] 图8是根据实施例的阵列和语音源(S)配置。传声器被分开近似等于2d0的距离,并且语音源以度θ离开阵列的中点为距离ds。该系统是轴向对称的,因此只需要指定ds和θ。
[0020] 图9是根据实施例的使用两个全向元件O1和O2的第一级压差传声器的方框图。 [0021] 图10是根据实施例的DOMA的方框图,该DOMA包括配置成形成两个虚拟传声器V1和V2的两个物理传声器。
[0022] 图11是根据实施例的DOMA的方框图,该DOMA包括配置成形成N个虚拟传声器V1到VN的两个物理传声器,其中N是大于1的任何数。
[0023] 图12是根据实施例,如此处描述的,包括DOMA的头戴式耳机或头戴装置的实例。 [0024] 图13是根据实施例的用于使用DOMA来使声学信号降噪的流程图。
[0025] 图14是根据实施例的用于形成DOMA的流程图。
[0026] 图15是根据实施例的虚拟传声器V2对于在0.1m的距离处的1kHz语音源的线性响应的曲线图。零位在0度处,其中语音被正常定位
[0027] 图16是根据实施例的虚拟传声器V2对于在1.0m的距离处的1kHz噪音源的线性响应的曲线图。没有零位,并且检测所有的噪音源。
[0028] 图17是根据实施例的虚拟传声器V1对于在0.1m的距离处的1kHz语音源的线性响应的曲线图。没有零位,并且对于语音的响应大于图9中所示的响应。
[0029] 图18是根据实施例的虚拟传声器V1对于在1.0m的距离处的1kHz噪音源的线性响应的曲线图。没有零位,并且该响应与图10中所示的V2非常相似。
[0030] 图19是根据实施例的虚拟传声器V1对于在0.1m的距离处的100、500、1000、2000、3000和4000Hz频率的语音源的线性响应的曲线图。
[0031] 图20是显示对于实施例的阵列和对于常规的心形传声器,对于语音的频率响应的对比的曲线图。
[0032] 图21是根据实施例,ds被假定为0.1m,显示对于V1(上部,虚线)和V2(下部,实线)的语音响应对比B的曲线图。在V2中的空间零位是相对宽的。
[0033] 图22是根据实施例的显示图10中所示的V1/V2语音响应的比率对比B的曲线图。对 于所有的0.8
[0034] 图23是根据实施例,假定ds=10cm以及θ=0,B对比实际ds的曲线图。 [0035] 图24是根据实施例,ds=10cm以及假定ds=10cm,B对比θ的曲线图。
[0036] 图25是根据实施例,B=1以及D=-7.2μs,N(s)的振幅(上部)和相位(下部)响应的曲线图。结果的相位差影响高频比影响低频更明显。
[0037] 图26是根据实施例,B=1.2以及D=-7.2μs,N(s)的振幅(上部)和相位(下部)响应的曲线图。非整数B影响整个频率范围
[0038] 图27是根据实施例,q1=0度以及q2=30度,因为语音源的位置错误而对V2中的语音消除有影响的振幅(上部)和相位(下部)响应的曲线图。对于6kHz以下的频率,该消除保持在-10dB以下。
[0039] 图28是根据实施例,q1=0度以及q2=45度,因为语音源的位置错误而对V2中的语音消除有影响的振幅(上部)和相位(下部)响应的曲线图。该消除仅仅对于大约2.8kHz以下的频率是-10dB以下,并且预期性能降低。
[0040] 图29显示根据实施例,在非常大声(~85dBA)的音乐/语音噪音环境中,对于在Bruel和Kjaer头和躯干模拟器(HATS)上使用0.83的线性β的2d0=19mm阵列的实验结果。噪音已经降低大约25dB,并且语音几乎不受影响,没有显著的失真。
[0041] 图30是根据实施例的降噪系统的方框图。
[0042] 图31是假定单个噪音源以及到传声器的直接路径,根据实施例的降噪系统,包括噪音去除算法的部件的方框图。
[0043] 图32是包括概括成n个有差别的噪音源(这些噪音源可以是彼此的反射或者回音)的实施例的噪音去除算法的前端部件的方框图。
[0044] 图33是在有n个不同噪音源以及信号反射的一般情况下,包括实施例的噪音去除算法的前端部件的方框图。
[0045] 图34是根据实施例的降噪方法的流程图。
[0046] 图35显示在包括许多其他人类说话者以及公众广播的机场终端噪音存在的情况下,用于美式英语的女性说话者的实施例的噪音抑制算法的结果。
[0047] 图36A是根据实施例的语音活动检测器(VAD)系统的方框图,该语音活动检测器(VAD)系统包括用于接收和处理与VAD有关的信号的硬件
[0048] 图36B是根据替换实施例的VAD系统的方框图,该VAD系统使用用于接收VAD信息的耦合噪音抑制系统的硬件。
[0049] 图37是根据实施例的用于使用基于加速计的VAD来判定浊语音和清语音的方法的流程图。
[0050] 图38显示根据实施例的包括嘈杂的音频信号(现场录音)以及相应的基于加速计的VAD信号、相应的加速计输出信号、和接着使用VAD信号通过噪音抑制系统处理的经降噪的音频信号的曲线图。
[0051] 图39显示根据实施例的包括嘈杂的音频信号(现场录音)以及相应的基于SSM的VAD信号、相应的SSM输出信号、和接着使用VAD信号通过噪音抑制系统处理的经降噪的音频信号的曲线图。
[0052] 图40显示根据实施例的包括嘈杂的音频信号(现场录音)以及相应的基于GEMS的VAD信号、相应的GEMS输出信号、和接着使用VAD信号通过噪音抑制系统处理的经降噪的音频信号的曲线图。

具体实施方式

[0053] 电话会议的电话,也被称为免提电话,是现今商业中的重要工具。常规的免提电话典型地使用单个扬声器来传输远端语音,以及使用一个以上的传声器来捕获近端语音。扬声器与传声器的邻近需要有效的回音消除和/或半双向操作。同样,在两端的用户的清晰度往往是差的,并且取决于他们到免提电话的传声器的距离,在用户之间的音级上可能有非常大的差异。另外,近端的有效噪音抑制是不可能,并且各种噪音(像移动电话铃声)在呼叫期间产生大的噪扰。
[0054] 在此描述了一种无线电话会议的电话系统,该无线电话会议的电话系统致于常规的电话会议的电话的许多问题。代替使用在电话会议的电话上的或者在电话会议的电话附近的传声器,此处描述的实施例使用身体佩带的有线或者无线的音频端点(例如,包括传声器,以及选择性地包括扬声器)。这些身体佩带的音频端点(例如,头戴式耳机、悬挂物、可用夹子夹住的传声器等等)被用于捕获用户的嗓音,并且结果的数据可以被用于去除回音以及环境噪声。每个头戴式耳机或者悬挂物将它的音频传输到电话会议的电话,其中,如果噪音和回音抑制还没有在身体佩带的单元上进行,则可以出现,并且其中每个头戴式耳机或者悬挂物的输出可以被标记、与其他的头戴式耳机和/或悬挂物集成、以及在电话网络上经由一个以上的电话信道被传输。噪音和回音抑制也可以在头戴式耳机或者悬挂物上完成。每个用户的输出的标记可以被外部呼叫者的电话使用,以便空间地定位空间中的每个用户,增加清晰度。
[0055] 在以下描述中,许多具体细节被介绍以提供对无线电话会议的电话系统和方法的实施 例的彻底了解,以及能够实现对于无线电话会议的电话系统和方法的实施例的描述。然而,相关领域中的一个技术人员将认识到,在没有一个以上的具体细节或者利用其它部件、系统等等的情况下,可以实践这些实施例。在其它情况中,众所周知的结构或操作没有被显示,或者没有被详细地描述,以避免模糊揭示的实施例的方面。
[0056] 除非另有规定,以下术语具有除了它们可以传达给本领域的技术人员的任何含义或理解之外的相应含义。
[0057] 术语“电话会议呼叫”被限定为电话装置的使用,该电话装置被设计成允许一个以上的近端用户连接到随后将经由模拟或者数字电话网络连接到另一个电话的电话。 [0058] 术语“全向传声器”意指同等地响应于来源于任何方向的声波的物理传声器。 [0059] 术语“近端”指的是声学邻近该电话会议呼叫系统的电话呼叫侧。
[0060] 术语“远端”指的是没有声学邻近该电话会议呼叫系统的电话呼叫侧。 [0061] 术语“噪音”意指在电话会议的电话的环境中的不需要的环境噪声。 [0062] 术语“虚拟传声器(VM)”或“虚拟定向传声器”意指使用两个以上的全向传声器以及关联的信号处理来构造的传声器。
[0063] 术语“子体”指的是一个以上的身体佩带的音频端点(例如,包含至少一个传声器的传声器阵列和可选择的扬声器的头戴式耳机或者悬挂物或者其他的身体佩带的装置)。它们可以是有线的或者无线的。子体被硬编码到母体,因此它们无法容易地与其他装置一起使用。如果需要的话,为了有效和方便,它们可以在母体上被再充电。
[0064] 术语“伙伴”指的是可以与母体但不局限于母体一起使用的头戴式耳机或者其他相似装置。它们可以是有线的或者无线的。实例是诸如利佛(Aliph)的Jawbone Icon头戴式耳机(http://www.jawbone.com)的蓝牙装置以及诸如罗技(Logitech)的ClearChat Comfort USB头戴式耳机的USB装置。
[0065] 术语“母体”指的是电话会议的电话的主体,其中接收、集成以及处理来自每个子体的不同的有线流和/或无线流。母体将引入的声学信息广播给子体和伙伴,或者选择性地,使用常规的扬声器。
[0066] 术语HCI是主机控制器接口(Host Controller Interface)的缩写。 [0067] 术语HFP是免提规范(Hands-Free Profile),用于基于蓝牙的通信装置的无线接口规格的缩写。
[0068] 术语PSTN是公用交换电话网(Public Switched Telephone Network)的缩写。 [0069] 术语SDF是服务发现协议(Service Discovery Protocol)的缩写。
[0070] 术语SIP是会话发起协议(Session Initiate Protocol)的缩写。
[0071] 术语SPI总线是串行外设接口(Serial Peripheral Interface)总线的缩写。 [0072] 术语UART是通用异步接收机/发射机的缩写。
[0073] 术语USART是通用同步/异步接收器/发射机的缩写。
[0074] 术语USB是通用串行总线的缩写。
[0075] 术语UUID是通用唯一标识符的缩写。
[0076] 术语VoIP是基于网络电话(Voice over Internet Protocol)的缩写。 [0077] 此处描述的无线电话会议的电话系统包括在有或者没有扬声器的情况下传输引入语音和引出语音两者的可佩带的有线和/或无线装置,以确保所有用户的语音被适当地捕获。噪音和/或回音抑制可以在无线装置或者母体装置上出现。一些装置可以被限制成只能在母体上使用,以简化操作。还支持诸如传声器和扬声器的其他无线装置,并且可以单独地或者组合地使用任何无线传输协议。
[0078] 实施例的无线电话会议的电话系统包括固定的或者移动的会议单元以及多个身体佩带的无线电话单元或者端点。固定的或者移动的会议单元包括电话终端,该电话终端用作(借助于PSTN、VoIP以及相似的)多个电话呼叫的端点。固定的或者移动的会议单元包括无线终端,该无线终端用作多个无线音频会话(例如,蓝牙HFP音频会话)的网关。固定的或者移动的会议单元包括音频信号处理单元,该音频信号处理单元尤其将多个电话呼叫合并并且优化到多个无线音频会话中,反之亦然。选择性地,固定的或者移动的会议单元包括扬声器。
[0079] 实施例的身体佩带的无线电话单元包括无线通信系统,该无线通信系统维持与会议单元(诸如,能够通过HFP协议的蓝牙无线系统)的音频会话。身体佩带的无线电话单元包括用户语音检测和传输系统(例如,传声器系统)。身体佩带的无线电话单元选择性地包括将音频呈现给用户的设备。身体佩带的无线电话单元选择性地包括信号处理器,该信号处理器优化传输到会议单元的用户语音(例如,通过去除回音和/或环境噪音)。身体佩带的无线电话单元选择性地包括信号处理器,该信号处理器优化呈现给用户的接收到的音频。 [0080] 将传声器从扬声器的附近移动到用户的身体是关键性的改进。采用用户身体上的传声器,对于所有的近端用户,信噪比(SNR)显著地较高并且相似。使用像能够从加利福尼亚州旧金山的艾利佛有限公司(Aliph,Inc.)得到的双重全向传声器阵列(DOMA)(在此以及在2008年6月13日提交的第12/139,333号美国专利申请中被详细描述)的技术,两个以上的传声器可以被用于捕获音频,该音频可被用于去除噪声(包括其他用户的说话)以及回音(如果扬声器仍然被用于广播远端语音)。根据此处的实施例,信号处理不需要 在用户随身携带的装置上完成,因为来自传声器的记录的音频可以被传输,用于在母体装置上处理。如果无线头戴式耳机装置被用于收容传声器,则引入的远端语音也可以被广播给头戴式耳机,而不使用扬声器。这改进了回音抑制,并且允许纯双向的、高清晰的、私人的会议会话出现。
[0081] 下面详细描述无线电话会议的电话系统的部件。虽然为了清楚而单独地描述每个部件,但是每个部件可以与一个以上的其他部件组合以形成完整的电话会议呼叫系统。 [0082] 可佩带的装置(子体)
[0083] 术语“子体”指的是一个以上的身体佩带的音频端点(例如,包含至少一个传声器的传声器阵列和可选择的扬声器的头戴式耳机或者悬挂物或者其他的身体佩带的装置)。它们可以是有线的或者无线的。子体被硬编码到母体,因此它们无法容易地与其他装置一起使用。如果期望的话,为了有效和方便,它们可以在母体上被再充电。
[0084] 实施例的可佩带的装置包含单个传声器(例如,全向传声器、定向传声器等等)、模数转换器(ADC)以及数字信号处理器。可佩带的装置还包括无线通信部件(例如,蓝牙等等),用于将数据或者信息传送到该可佩带的装置/传送来自该可佩带的装置的数据或者信息。无线通信部件能够实现母体和子体之间的固定配对,因此不会使子体从母体去除。为了协助这个,当子体从母体的附近被去除时,可以使得子体嘟嘟响和/或闪光和/或关闭。为了最好的效果,子体可以在母体上再充电。可以使用任何数目的子体;对于大多数的电话会议而言,四个到八个应该是足够。选择性地,也可以支持诸如头戴式耳机、传声器和扬声器的有线装置。
[0085] 替换实施例的可佩带的装置包含两个以上的传声器,该两个以上的传声器形成传声器阵列(例如,能够从加利福尼亚州旧金山的艾利佛有限公司得到的DOMA(此处以及在2008年6月13日提交的第12/139,333号美国专利申请中被详细描述))。使用物理传声器阵列,来构造增加用户的语音的SNR的虚拟定向传声器。可以使用自适应噪音抑制算法,例如,能够从加利福尼亚州旧金山的艾利佛有限公司得到的并且在此处以及在2003年9月18日提交的第10/667,207号美国专利申请中详细描述的导航器,来处理语音。支持DOMA、导航器以及回音抑制而使用的处理可以在子体上进行,或者,可以在母体上进行。如果使用母体扬声器并且在子体上完成回音抑制,则母体可以借助于无线通信将说话者输出传递到子体,以便参与回音抑制处理。
[0086] 子体可以是头部佩带的(像头戴式耳机),在这种情况下,子体扬声器可被用于将远端语音广播到用户的耳朵中,或者子体可以是身体佩带的,在这种情况下,将需要母体使用扬声器来广播远端语音。身体佩带的装置可以夹在用户的衣服上,或者像悬挂物一样被 悬挂于头部。悬挂物可以使用低变应原性物质来构造环绕颈部的结构,因为它可以与用户的皮肤接触。如果头戴式耳机被用作子体,则出于卫生学的考虑,推荐在耳内式安装之上的耳上式安装。
[0087] 作为实例,图1显示根据实施例的作为可用夹子夹住的传声器阵列的身体佩带的子体装置。该装置利用所示的鳄鱼夹(120)附接到用户,但是本实施例不局限于此。使用包括孔(110)的单个定向传声器(150),并且收发机装置(130)、电池(130)以及信号处理(130)全部被收容在传声器的小箱中。但是,子体不限于这些部件或者这个配置。根据实施例,该装置包括多用途按钮(140),该多用途按钮(140)可以被用于使该装置置于配对/可发现模式中、中断与母体的连接、使装置传声器静音等等。
[0088] 作为另一个实例,图2显示根据替换实施例的作为悬挂的传声器阵列的身体佩带的子体装置。两个全向传声器(O1和O2)与诸如DOMA阵列的系统一起使用。该装置/传声器包括用于O1传声器(210)和O2传声器(250)的孔。收发机装置(240)、电池(240)和信号处理(240)全部被收容在悬挂体中,该悬挂体像项链(220)一样佩带在颈部周围。 [0089] 不考虑物理实施例,为了延长电池寿命、简化构造和更新、以及减少子体的成本,用于实施例的回音和噪音抑制的大多数处理可以在母体中完成。在这种情况下,适当地,子体记录引入的音频、在超过一个传声器的情况下多路传输音频信号、以及将它们传输到母体用于处理。
[0090] 在实施例中,可以通过在子体上进行计算精确的语音活动检测(VAD)信号的处理来延长电池寿命。然后,子体只有在检测来自它的用户的语音时才进行传输。同样地,当VAD信号指示用户没有说话时,子体可以使用较低的带宽和/或传输功率。一般地,只有使用免提电话的一两个人会上交谈,并且无线传输(TX)是大电力用户,因此可以使用这些方法来实现相当大的电力节省。还可以经由在母体上使用的用于各种算法(诸如,不同说话者的空间化位置、不同说话者语音数据的集成等等)的许多常规方法(例如,音调多路复用),与母体共享VAD。
[0091] 对子体有用的可选择的扩展是子体检测彼此、以及彼此直接共享信息、诸如它们是否在使用中的能力。例如,这可以使用蓝牙询问以及适当的SDP记录来完成。例如,一个子体可以检测另一个子体在范围内并且在使用中(在这种情况下,一个子体的物理用户可能在其他子体的物理用户的可听范围内),并且对它的音频处理作修改(如果有的话),以便例如提高回音抑制。
[0092] 母体
[0093] 术语“母体”指的是电话会议的电话的主体,其中接收、集成以及处理来自每个子体 的不同的有线流和/或无线流。母体将引入的声学信息广播给子体以及伙伴,或者选择性地,使用常规的扬声器。母体装置耦接或者连接到电话网络,具有拨号接口,以及使用有线和/或无线协议来与它的“子体”(只能与母体一起使用的装置)和“伙伴”(可以与母体一起使用的其他装置)通信。下面详细描述母体装置的实施例。
[0094] 第一实施例的母体装置包括常规的扬声器和传声器,并且能够实现蓝牙和/或其他无线连接。母体装置可以具有子体,但是子体不是必要的。这个配置对免提电话提供了增加的改进,因为没有蓝牙或者相似装置的任何人将不会看到任何好处。只有当所有的近端用户经由伙伴装置连接到母体时,这个配置才排除对母体扬声器的需要。因此,扬声器将不得不用于许多呼叫,并且它的回音可能难以从伙伴装置传声器数据中去除。 [0095] 第二实施例的母体装置显著地不同于常规的免提电话,并且提供明显较好的性能。第二实施例的母体不包含扬声器或者传声器,因此它具有比常规的免提电话小的尺寸形状系数。母体具有4个和8个之间的子体,并且能够耦接或者连接到4个到8个伙伴。虽然母体和多个子体/伙伴之间的耦接是可能的,但是16个连接将可以应付大多数的免提电话用户的需要。母体将远端语音广播给所有的子体和伙伴,并且因为相同的信息正广播给所有的子体和伙伴,所以为了节省带宽,母体使用单个无线出站信道。母体接收引入的无线传输,并且将它们集成到单个引出传输中。对于没有机载处理(onboard processing)的子体,母体多路分配引入信号(如果使用超过一个的传声器)并且进行信号处理任务,该信号处理任务诸如是回音消除、噪音抑制、语音活动检测、以及在与其他的无线信号集成之前所需的任何其他的处理。
[0096] 引入的子体和伙伴音频信道一起集成到单个引出流中包括对每个信道计算动态增益,以致来自子体和伙伴两者的所有的引出流大致处于相同的水平。这通过使用均方根(RMS)计算来实现,在实施例中,只有当用户正在说话时,才计算该均方根计算。 [0097] 例如,在图3中显示了第二配置的实施例,图3显示了根据实施例的无线电话会议的电话系统,该无线电话会议的电话系统包括具有四个无线子体(392)和一个有线子体(360)的母体(310)。这个实施例包括用于子体的子体再充电坞站(390)。在这个实施例中,四个子体是无线耳上式头戴式耳机(392),以及一个子体是有线头戴式耳机(360)。母体提供接口,该接口被配置用于实施例的期望特征,该实施例的期望特征包括拨号盘(340)、功能按钮(330)以及消息窗口(320)。母体进一步提供对电源以及电话网络(380)的耦接。 [0098] 当伙伴被配对到母体时,实现了实用性中的进一步的增加。为了简化配对,母体的询问电力(询问信号的电力,询问信号搜索要配对的装置)可以被降低到仅在一米以下之内 可通过伙伴检测的程度。希望与母体配对的任何伙伴装置应该被置于配对模式中,然后被带入这个新的降低的配对范围,在这里,它可以与母体配对。这减少了不希望配对的数目。另外,该配对可以被归类为瞬间的,以致该配对的记录将在下一次通电/断电或者充电周期被擦除。这防止了伙伴的配对记录变得不必要地混乱。
[0099] 使用一个以上的母体和子体/伙伴的至少一个按钮和/或开关,来将实施例的单元置于配对模式中。根据替换实施例,摇动要被配对的装置,并且在一定数目和强度的摇动之后,使用加速计来触发配对模式。
[0100] 虽然在实施例中可以使用任何无线协议,蓝牙的使用允许了辅助装置的添加,辅助装置诸如是蓝牙扬声器和传声器,该蓝牙扬声器和传声器可以被用于其中母体既不具有扬声器也不具有传声器的实施例。经由使用蓝牙装置而允许的灵活性是史无前例的,因为它使得系统能够包括从母体和单个子体到母体的任何东西、蓝牙扬声器、以及直至16个以上的蓝牙头戴式耳机的蓝牙传声器。
[0101] 实例实施例
[0102] 图4显示根据实施例的无线电话会议的电话系统的框图,该无线电话会议的电话系统包括母体(405)以及它的组件和子体/伙伴(三个头戴式耳机(425、445)以及一个扬声器(450))。显示了电话会议呼叫母体(405)被耦接或者连接到两个无线头戴式耳机(445)、有线头戴式耳机(425)以及扬声器(450),该电话会议呼叫母体(405)结合有网络连接性(410)、多个电话连接(415)、多个无线收发机(440)、以及多路呼叫子系统(420)。另外,支持子体和伙伴两者。推荐最少4个子体/伙伴,并且最多16个子体/伙伴对于大多数使用而言应该是足够的。将通过无线协议以及所选定的相应的堆栈来确定可能的最大数目。还支持诸如头戴式耳机、传声器和扬声器的有线装置。如果近端用户进入和离开电话会议,则子体和/或伙伴的数目可以在单个呼叫的持续时间内变化。
[0103] 母体包括适当的微处理器,该微处理器具有嵌入式的外围设备以及在印刷电路板上的适当的外部的外围设备。在实施例中,这些可以是ARM11微处理器,该ARM11微处理器具有嵌入式的以太网连接和足够数目的UART、USART、SPI、USB或者相似总线以及用于期望数目的连接的适当内存。
[0104] 可以通过一个以上的以太网连接和/或一个以上的Wifi连接来提供网络连接性,但是本实施例不局限于此。可以使用蓝牙收发机装置来实现每个无线收发机,蓝牙收发机装置利用提供的微处理器通过UART或者USART或者USB使用HCI协议。
[0105] 可以通过在母体微处理器上运行以实现电话协议的适当的软件代码来提供电话连接。例如,可以通过使用SIP软件栈,诸如市场上买得到的PJSIP软件栈,来提供多个SIP电 话连接。在这种情况下,将理解,SIP软件栈可能需要经由网络向SIP服务器注册,并且进行这种本领域的那些技术人员众所周知的其他任务,以便提供SIP连接,该SIP连接可以使用SIP协议来进行和/或接收电话呼叫。
[0106] 母体的多路呼叫子系统(420)提供连接管理(430)以及音频流管理(435)。可以通过在微处理器上运行的适当的软件代码来提供这些功能。音频处理子系统(435)处理并且传递来自蓝牙收发机以及电话连接的音频,并且还可以被用于进行附加的音频处理任务,该附加的音频处理任务诸如是空间化、均衡化、噪音抑制、回音抑制及其他任务。连接管理子系统(430)管理音频流进入电话会议的连接和断开(包括来自伙伴和子体的电话连接以及无线和/或有线连接)。
[0107] 实施例的子体和/或伙伴可以是任何数目的可得到的蓝牙头戴式耳机,诸如由艾利佛制造的Jawbone蓝牙头戴式耳机。如果期望的话,也可以使用其他无线协议(例如,ZigBee等等),并且还支持有线连接。
[0108] 在无线收发机是蓝牙收发机并且电话会议呼叫子体和/或伙伴是蓝牙头戴式耳机的实施例中,有效的实现为每个子体/伙伴提供一个蓝牙收发机。母体收发机和子体/伙伴之间的通信可以使用专有的协议子集(profile)或者市场上买得到的协议子集,诸如在蓝牙规格中限定的蓝牙头戴式耳机协议子集。在实施例中,母体中的蓝牙收发机担当蓝牙受控角色,但是本实施例不局限于此。这将允许每个子体/伙伴与母体形成它自己的微微网(piconet),导致好的灵活性。但是,本领域中的那些技术人员已知的其他配置是可能的。
[0109] 图5是显示根据实施例的在两个远端用户(510、540)和两个近端用户(520、530)之间的音频流。这个流程图图解了实施例中的音频流的连接性,在该实施例中,两个远端用户借助于电话被远程地连接到电话会议(在这种情况下,使用SIP),以及两个近端用户在同一房间内作为使用伙伴和/或子体的母体。假定在同一房间内作为母体的近端用户能够直接地听到彼此,因此来自他们中的每一个的音频将不会被传递到另一个人的头戴式耳机。如果房间大得难以相互听到,那么可以将每个头戴式耳机的输出传递到其他的输入,但是大多数情形中,不期望被需要。
[0110] 图6是根据实施例的用于连接无线电话会议的电话系统的无线伙伴/子体(604)和母体(608)的流程图。这个流程图图解了无线伙伴或者子体可以被添加到电话会议的处理。用户(602)进入正在召开会议的房间,该会议包括母体(608)。经由用户操作(例如,按钮按压)或者经由进入房间的纯粹动作(例如,头戴式耳机总是在可发现模式中,但是仅仅在短的无线范围内,所以只有当在母体附近时才变成是可发现的),他们正在使用的伙伴或者子体变成对于电话会议呼叫单元是可发现的。例如,可以通过进入蓝牙可发 现模式(即,开始扫描蓝牙询问和页面,如蓝牙规格中限定)的伙伴,来实现这种可发现性。 [0111] 同样地,母体定期地搜索最新可用的子体或者伙伴(638)。这种搜索可以是连续的、通过用户按钮按压来启动的、和/或通过简单地拾取配备有传感加速计的子体来启动的,传感加速计可以被用于感测正在被用户拾取。一旦处于搜索模式中,母体就将通过发出蓝牙询问以及倾听响应来定期地搜索可用的子体。当母体通过接收对于它的询问的适当响应(例如,给予装置的适当的蓝牙种类,或者适当的蓝牙硬件地址或者适当的预先同意的UUID或者扩展询问响应中的其他数据)来发现伙伴/子体时(614),母体可以使用蓝牙规格中限定的处理来尝试连接(616)。子体自动地接受这个邀请(618),并且被连接到母体,但是伙伴应该确认它想要被连接到母体以减少不需要的母体/伙伴配对(诸如当近端用户在他或者她人上具有蓝牙装置、但是希望使用子体来连接到母体时)。因此,母体向伙伴以及关联的用户(602)发出音频连接请求(620)。如果接受配对(622),则母体将尝试将伙伴/子体连接到电话会议(624)。因为这个实施例使用蓝牙,所以如果它是尝试连接的无线装置,那么将使用如蓝牙头戴式耳机或者免提协议子集中限定的RING命令。有线装置可以在没有来自所需用户的进一步的输入的情况下被连接。伙伴/子体可以向用户指示母体正在尝试连接音频(例如,播放可听音),并且用户可以接受这个连接(例如通过按压按钮),结果,将获得母体到伙伴/子体的音频连接(626)。然后,用户可以参与电话会议(628)。 [0112] 一旦伙伴/子体接受进入电话会议的音频连接,多路呼叫子系统就可以连接音频到具有如图5中描述的其他音频流的伙伴/子体/可以连接来自具有如图5中描述的其他音频流的伙伴/子体的音频。
[0113] 这个配置允许近端用户亲自与正巧在房间内的伙伴和/或子体的其他近端用户谈话,以及清楚地听到连接到母体的远端用户。反之,使用伙伴和/或子体,远端用户将能够清楚地听到所有的近端用户。这与常规的免提电话形成对比,在常规的免提电话中,远端用户可能很难清楚地听到所有的近端用户。另外,如果伙伴和子体配备有噪音抑制,则诸如电话铃声、打字、以及其他声学噪音的环境噪音将在传输之前被抑制。同样,即使没有噪音抑制,因为每个近端用户与伙伴和/或子体的传声器之间的距离将比现今在常规系统中使用的台式安装的传声器更高,所以信噪比(SNR)也将显著地较高。
[0114] 近端用户也将能够清楚地听到所有的远程用户,并且远程用户也将能够彼此谈话。结果是,具有极好的清晰度和音频质量的清楚的详尽的会议。仅仅通过使他们的伙伴/子体静音,或者使用母体上的按钮来使所有的子体和伙伴都静音,房间内的参与者之间的私人 谈话也是可能的。如果伙伴和子体包含足够强度的噪音抑制(例如,能够从加利福尼亚州旧金山的艾利佛有限公司得到的Jawbone蓝牙头戴式耳机),则一个人也可以通过使他们的伙伴/子体静音以及正常地说话,来向房间内的所有其他人说一些私人的事情。其他近端用户的伙伴和子体将去除其他人的语音,因此它不被传输到远端。同样地,没有传声器(只有扬声器)的子体或者伙伴可以被用于监视远端语音。反之,没有扬声器(只有传声器)的子体或者伙伴可以被用于将近端用户的语音广播给远端。
[0115] 无线近端用户可以中断与母体的连接(632),或者可以在任何时候通过使用子体/朋友上的按钮挂断通话、将子体放回到它的再充电托架中、或者简单地通过离开房间或者走出母体的范围(630),来退出电话会议(632)。配备有加速计或者相似装置的子体可以被编程,以便在通过用户被置于桌子上或者被轻拍的时候离开该通话。选择性地,在断开(632、634)之后,母体可以借助于预定的电话号码来进行对断开用户的电话连接(例如SIP通话),以便允许他们在期望的情况下远程地继续(636)。因此,亲自参加电话会议的用户可以将该电话会议传递到他的移动电话,以便在他的车内继续该电话会议。
[0116] 这些实施例使用蓝牙作为它们的无线协议,但是不被如此限制。
[0117] 双重全向传声器阵列(DOMA)
[0118] 此处描述了提供改进的噪音抑制的双重全向传声器阵列(DOMA)。与设法通过使噪音源归零来减少噪音的常规的阵列和算法相比,实施例的阵列被用于形成两个有差别的虚拟定向传声器,这两个虚拟定向传声器被配置成具有非常相似的噪音响应以及非常不相似的语音响应。由DOMA形成的仅有的零位是用于从V2中去除用户语音的那个。实施例的两个虚拟传声器可以与自适应滤波器算法和/或VAD算法配对,以便显著地减少噪音而不使语音失真,高于常规的噪音抑制系统,显著地提高了期望语音的SNR。此处描述的实施例在操作上是稳定的,相对于虚拟传声器模式选择是灵活的,并且已经证明相对于语音源到阵列的距离和方位以及温度和校准技术是稳固的。
[0119] 在以下描述中,许多具体细节被介绍以提供对DOMA的实施例的彻底了解,以及能够实现对于DOMA的实施例的描述。然而,相关领域中的一个技术人员将认识到,在没有一个以上的具体细节或者利用其它部件、系统等等的情况下,可以实践这些实施例。在其他情况中,众所周知的结构或操作没有被显示,或者没有被详细地描述,以避免模糊揭示的实施例的方面。
[0120] 除非另有规定,以下术语具有除了它们可以传达给本领域的技术人员的任何含义或理解之外的相应含义。
[0121] 术语“渗透(bleedthrough)”意指在语音期间不希望存在的噪音。 [0122] 术语“降噪”意指从Mic1中去除不需要的噪音,并且还指的是以分贝(dB)为单位的信号中的噪音能量的减少量。
[0123] 术语“清音化”意指从Mic1中去除期望语音/使期望语音失真。
[0124] 术语“定向传声器(DM)”意指在传感膜片两侧上开孔的物理定向传声器。 [0125] 术语“Mic1(M1)”意指通常包含语音比噪音多的自适应噪音抑制系统传声器的统称。
[0126] 术语“Mic2(M2)”意指通常包含噪音比语音多的自适应语音抑制系统传声器的统称。
[0127] 术语“噪音”意指不需要的环境噪声。
[0128] 术语“零位”意指在物理或者虚拟定向传声器的空间响应中的零或者最小值。 [0129] 术语“O1”意指用于形成传声器阵列的第一物理全向传声器。
[0130] 术语“O2”意指用于形成传声器阵列的第二物理全向传声器。
[0131] 术语“语音”意指用户的期望语音。
[0132] 术语“皮肤表面传声器(SSM)”是在耳机(例如,能够从加利福尼亚州旧金山的艾利佛得到的Jawbone耳机)中使用以检测用户皮肤上的语音振动的传声器。
[0133] 术语“V1”意指没有零位的虚拟定向“语音”传声器。
[0134] 术语“V2”意指对于用户语音具有零位的虚拟定向“噪音”传声器。 [0135] 术语“语音活动检测(VAD)信号”意指指示用户语音在什么时候被检测的信号。 [0136] 术语“虚拟传声器(VM)”或者“虚拟定向传声器”意指使用两个以上的全向传声器以及关联的信号处理来构造的传声器。
[0137] 图7是根据实施例的双传声器自适应噪音抑制系统700。包括物理传声器MIC1和MIC2的组合以及传声器耦接的处理或电路部件(以下详细描述,但在这个图中没有显示)的双传声器系统700在此被参考作为双重全向传声器阵列(DOMA)710,但是本实施例不局限于此。参考图7,在分析单个噪音源701以及到传声器的直接路径的过程中,进入MIC1(702,可以是物理或虚拟传声器)的总声学信息由m1(n)表示。进入MIC2(703,也可以是物理或虚拟传声器)的总声学信息同样地被标记为m2(n)。在z(数字频率)域中,这些被表示为M1(z)和M2(z)。然后,
[0138] M1(z)=S(z)+N2(z)
[0139] M2(z)=N(z)+S2(z)
[0140] 以及
[0141] N2(z)=N(z)H1(z)
[0142] S2(z)=S(z)H2(z),
[0143] 因此
[0144] M1(z)=S(z)+N(z)H1(z)
[0145] M2(z)=N(z)+S(z)H2(z)。 等式1
[0146] 这对于所有的双传声器系统而言是普通情况。等式1具有四个未知数和仅仅两个已知的关系,因此不能被明确地求解。
[0147] 但是,有另一种方式来求出等式1中的一些未知数。该分析从研究没有语音正在被产生的情况开始,没有语音正在被产生的情况即来自VAD子系统704(可选择的)的信号等于零的情况。在这种情况下,s(n)=S(z)=0,并且等式1减少到
[0148] M1N(z)=N(z)H1(z)
[0149] M2N(z)=N(z),
[0150] 其中M变量上的N下标指示只有噪音正在被接收。这导致
[0151] M1N(z)=M2N(z)H1(z)
[0152] 等式2
[0153] 可以使用任何可用的系统识别算法来计算函数H1(z),并且当系统确信只有噪音正在被接收时,传声器才输出。该计算可以被自适应地完成,因此系统可以对于噪音中的变化作出反应。
[0154] 对于等式1中的一个未知数H1(z),解法是现有的。可以通过使用正在制造语音并且VAD等于一的情况来确定最后的未知数H2(z)。当这个正在出现,但是传声器的最近(或许小于1秒)的历史指示了低噪音水平时,可以假定n(s)=N(z)~0。然后,等式1减少成 [0155] M1S(z)=S(z)
[0156] M2S(z)=S(z)H2(z),
[0157] 这随后导致
[0158] M2S(z)=M1S(z)H2(z)
[0159]
[0160] 其是H1(z)计算的倒数。但是,注意,不同的输入正在被使用(现在只有语音正在出现,而之前只有噪音出现)。在计算H2(z)的同时,被计算用于H1(z)的值被保持不变(反之亦然),并且假定噪音水平没有足够高到造成H2(z)计算中的误差。
[0161] 在计算H1(z)和H2(z)之后,它们被用于去除信号中的噪音。如果等式1被重写为 [0162] S(z)=M1(z)-N(z)H1(z)
[0163] N(z)=M2(z)-S(z)H2(z)
[0164] S(z)=M1(z)-[M2(z)-S(z)H2(z)]H1(z)
[0165] S(z)[l-H2(z)H1(z)]=M1(z)-M2(z)H1(z),
[0166] 那么可以如所示的代入N(z)以求出S(z)为
[0167] 等式3
[0168] 如果可以用足够的精确度来描述传递函数H1(z)和H2(z),那么可以完全去除噪音,并且恢复原始信号。不管噪音的振幅或光谱特性,这仍然是成立的。如果有来自语音源的极少的泄漏或者没有泄漏进入到M2中,那么H2(z)≈0并且等式3减少成
[0169] S(z)≈M1(z)-M2(z)H1(z)。 等式4
[0170] 假定H1(z)是稳定的,等式4更简单地实现并且非常稳定。但是,如果显著的语音能量处于M2(z),则清音化可能出现。为了构造良好执行的系统并且使用等式4,对以下条件给予考虑:
[0171] R1.在嘈杂的条件下的理想的(或者至少非常好的)VAD的可用性
[0172] R2.足够精确的H1(z)
[0173] R3.非常小的(理论上是零的)H2(z)。
[0174] R4.在语音制造期间,H1(z)基本上不能改变。
[0175] R5.在噪音期间,H2(z)基本上不能改变。
[0176] 如果期望语音对于不需要的噪音的SNR足够高,则条件R1容易满足。“足够”意指取决于VAD产生的方法的不同事物。如果使用如伯内特(Burnett)7,256,048中的VAD振动传感器,则处于非常低的SNR(-10dB以下)的精确的VAD是可能的。使用来自O1和O2的信息的仅声学的方法也可以返回精确的VAD,但是为了适当的性能而被限制在~3dB以上的SNR。
[0177] 条件R5通常易于满足,因为对于大多数应用而言,传声器不会经常或者快速地改变相对于用户嘴的位置。在可能发生的那些应用(诸如,免提会议系统)中,它可以通过配置Mic2来满足,以致H2(z)≈0。
[0178] 满足条件R2、R3和R4是更加困难的,但是可以给予V1和V2的正确组合。已经证明对满足以上条件、导致实施例中的极好噪音抑制性能和最小语音去除和失真有效的方法在下面被研究。
[0179] 各种实施例中的DOMA可以与导航系统(Pathfinder system)一起使用作为自适应滤波器系统或者噪音去除。在此处引用的其他专利和专利申请中详细描述了能够从加利福尼 亚州旧金山的艾利佛卡姆(AliphCom)得到的导航系统。或者,任何自适应滤波器或噪音去除算法可以在一个以上的各种替换实施例或配置中与DOMA一起使用。
[0180] 当DOMA与导航系统一起使用时,导航系统通常通过在时域中滤波以及求和以组合两个传声器信号(例如,Mic1、Mic2),来提供自适应噪音消除。自适应滤波器通常使用从DOMA的第一传声器接收到的信号,以去除来自从DOMA的至少一个其他传声器接收到的语音的噪音,这依赖噪音源的两个传声器之间的缓慢变化的线性传递函数。继DOMA的两个信道的处理之后,如以下详细描述的,产生其中噪音内容相对于语音内容衰减的输出信号。 [0181] 图8是根据实施例的包括阵列801/802和语音源S配置的概括的双传声器阵列(DOMA)。图9是根据实施例的用于使用两个全向元件O1和O2来产生或者制造第一级压差传声器V的系统900。实施例的阵列包括分开距离2d0放置的两个物理传声器801和802(例如,全向传声器),并且以角度θ离开语音源800距离ds。因为这个阵列是轴向对称的(至少在自由空间中),所以不需要其他角度。如图9中示范的,来自每个传声器801和802的输出可以被延迟(z1和z2),乘以增益(A1和A2),然后与另一个求和。如以下详细描述的,阵列的输出是至少一个虚拟传声器或者形成至少一个虚拟传声器。这个操作可以遍及期望的任何频率范围。通过改变延迟和增益的幅度和符号,可以实现在此还被称为虚拟定向传声器的多种虚拟传声器(VM)。对于本领域中的那些技术人员而言,已知有用于构造VM的其他方法,但是这是通用的一个并且将在以下实现中被使用。
[0182] 作为实例,图10是根据实施例的DOMA1000的方框图,DOMA1000包括配置为形成两个虚拟传声器V1和V2的两个物理传声器。根据实施例,DOMA包括使用两个传声器或元件O1和O2(801和802)的输出形成的两个第一级压差传声器V1和V2。如以上参考图8和9描述的,实施例的DOMA包括作为全向传声器的两个物理传声器801和802。来自每个传声器的输出被耦接到处理部件1002或者电路,并且该处理部件输出代表或者对应于虚拟传声器V1和V2的信号。
[0183] 在这个实例系统1000中,物理传声器801的输出被耦接到处理部件1002,该处理部件1002包括第一处理路径和第二处理路径,该第一处理路径包括第一延迟z11和第一增益A11的应用,该第二处理路径包括第二延迟z12和第二增益A12的应用。物理传声器802的输出被耦接到处理部件1002的第三处理路径和第四处理路径,第三处理路径包括第三延迟z21和第三增益A21的应用,第四处理路径包括第四延迟z22和第四增益A22的应用。第一和第三处理路径的输出被求和以形成虚拟传声器V1,而且第二和第四处理路径的输出被求和以形成虚拟传声器V2。
[0184] 如以下详细描述的,改变处理路径的延迟和增益的幅度和符号导致可以实现在此还被称为虚拟定向传声器的多种虚拟传声器(VM)。虽然在这个实例中描述的处理部件1002包括产生两个虚拟传声器或者传声器信号的四个处理路径,但是该实施例不局限于此。例如,图11是根据实施例的DOMA1100的方框图,DOMA1100包括配置成形成N个虚拟传声器V1到VN的两个物理传声器,其中N是大于一的任何数。因此,DOMA可以包括处理部件1102,该处理部件1102适当地具有任何数目的处理路径,以形成N个虚拟传声器。 [0185] 实施例的DOMA可以被耦接或者连接到一个以上的远程装置。在系统配置中,DOMA将信号输出到远程装置。远程装置包括但不局限于,移动电话、卫星电话、携带式电话、有线电话、因特网电话、无线收发机、无线通信收发机、个人数字助理(PDA)、个人计算机(PC)、头戴式耳机装置、头戴装置和耳机中的至少一个。
[0186] 此外,实施例的DOMA可以是与主机装置集成的部件或者子系统。在这个系统配置中,DOMA将信号输出到主机装置的部件或者子系统。主机装置包括但不局限于,移动电话、卫星电话、携带式电话、有线电话、因特网电话、无线收发机、无线通信收发机、个人数字助理(PDA)、个人计算机(PC)、头戴式耳机装置、头戴装置和耳机中的至少一个。 [0187] 作为实例,图12是根据实施例的包括此处描述的DOMA的头戴式耳机或者头戴装置1200的实例。实施例的头戴式耳机1200包括外壳,该外壳具有容纳和保持两个传声器(例如,O1和O2)的两个区域或者容器(未显示)。头戴式耳机1200通常是说话者1202能够佩带的装置,例如将传声器安置或者保持在说话者的嘴附近的头戴式耳机或者耳机。实施例的头戴式耳机1200将第一物理传声器(例如,物理传声器O1)置于说话者的嘴唇附近。第二物理传声器(例如,物理传声器O2)被置于第一物理传声器之后的一距离内。实施例的距离处于第一物理传声器之后的几厘米的范围内或者如此处描述的(例如,参考图7-11描述的)。DOMA是对称的,并且以与单个近距离交谈的传声器相同的配置或者方式被使用,但是不局限于此。
[0188] 图13是根据实施例的用于使用DOMA来使声学信号降噪1300的流程图。降噪1300从在第一物理传声器和第二物理传声器处接收声学信号1302开始。响应于该声学信号,从第一物理传声器输出第一传声器信号,以及从第二物理传声器输出第二传声器信号1304。通过产生第一传声器信号和第二传声器信号的第一组合来形成第一虚拟传声器1306。通过产生第一传声器信号和第二传声器信号的第二组合来形成第二虚拟传声器1308,并且第二组合不同于第一组合。第一虚拟传声器和第二虚拟传声器是对于噪音具有 基本上相似的响应、以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。通过组合来自第一虚拟传声器和第二虚拟传声器的信号,降噪1300产生输出信号1310,并且该输出信号包括比声学信号少的噪声。
[0189] 图14是根据实施例的用于形成DOMA1400的流程图。DOMA的形成1400包括形成物理传声器阵列1402,该物理传声器阵列包括第一物理传声器和第二物理传声器。第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号。形成包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列1404。第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合。第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,并且第二组合不同于第一组合。虚拟传声器阵列包括单个零位,该单个零位被定向在朝向人类说话者的语音源的方向上。
[0190] 用于实施例的自适应噪音抑制系统的VM的构造在V1和V2中包括基本上相似的噪音响应。此处使用的基本上相似的噪音响应意指H1(z)易于建立模型,并且在语音期间不会改变很多,满足上面描述的条件R2和R4并且允许强降噪以及最小化的渗透。 [0191] 用于实施例的自适应噪音抑制系统的VM的构造对于V2包括相对小的语音响应。对于V2的相对小的语音响应意指H2(z)≈0,这将满足上面描述的条件R3和R5。 [0192] 用于实施例的自适应噪音抑制系统的VM的构造进一步包括对于V1的足够的语音响应,因此干净的语音将具有比O1捕获的原始语音显著高的SNR。
[0193] 随后的描述假定,已经使全向传声器O1和O2对于同一声源的响应标准化,以致它们对那个源具有完全相同的响应(振幅和相位)。这可以使用精通本领域的技术人员众所周知的标准传声器阵列方法(诸如基于频率的校准)来实现。
[0194] 参考用于实施例的自适应噪音抑制系统的VM的构造包括对于V2的相对小的语音响应的情况,可见,对于分离的系统,V2(z)可以被表示为:
[0195] V2(z)=O2(z)-z-γβO1(z)
[0196] 其中
[0197]
[0198] (采样)
[0199]
[0200]
[0201] 距离d1和d2分别是从O1和O2到语音源的距离(参见图8),以及γ是它们的差除以音速 c并乘以采样频率fs。因此,γ是在采样中,但不必是整数。对于非整数γ,可以使用分数延迟滤波器(精通本领域的技术人员众所周知的)。
[0202] 重要的是,注意,上面的β不是用于表示自适应波束形成中的VM的混合的常规β;它是取决于内部传声器距离d0(固定的)以及可能改变的距离ds和角度θ的系统的物理变量。如以下所示,对于适当校准的传声器,系统不必被编程为具有阵列的准确的β。实际的β中的近似10-15%的误差(即,由算法使用的β不是物理阵列的β)已经被使用,具有极少的质量下降。β的算法值可以被计算,并且为特定用户而设定,或者当几乎没有噪音存在时,可以在语音制造期间被自适应地计算。但是,在使用期间的自适应对于标称性能是不需要的。
[0203] 图15是根据实施例的具有β=0.8的虚拟传声器V2对于在0.1m距离处的1kHz语音源的线性响应的曲线图。虚拟传声器V2对于语音的线性响应中的零位被定位在0度处,其中典型地期望语音被定位。图16是根据实施例的具有β=0.8的虚拟传声器V2对于在1.0m处的1kHz噪音源的线性响应的曲线图。V2对于噪音的线性响应缺乏或者不包括零位,意味着检测所有的噪音源。
[0204] 以上用于V2(z)的公式在语音位置具有零位,因此将显现对于语音的最小响应。对于具有d0=10.7mm的阵列以及在阵列的轴(θ=0)上10cm(β=0.8)处的语音源,这在图15中被显示。注意,对于如图16所示的具有近似1米距离的噪音源的相同传声器,零度处的语音零位对于远场中的噪音是不存在的。这保证了在用户面前的噪音将被检测,以致它可以被去除。这不同于常规系统,常规系统可能难以去除在用户的嘴的方向上噪音。 [0205] 可以使用V1(z)的通式来使V1(z)公式化:
[0206]
[0207] 因为
[0208] V2(z)=O2(z)-z-γβO1(z)
[0209] 以及,因为对于前向中的噪音
[0210] O2N(z)=O1N(z)·z-γ
[0211] 然后
[0212] V2N(z)=O1N(z)·z-γ-z-γβO1N(z)
[0213] V2N(z)=(1-β)(O1N(z)·z-γ)
[0214] 然后,如果这被设定成等于上面的V1(z),则结果是
[0215]
[0216] 因此,我们可以设定
[0217] dA=γ
[0218] dB=0
[0219] αA=1
[0220] αB=β
[0221] 以得到
[0222] V1(z)=O1(z)·z-γ-βO2(z)
[0223] 以上对V1和V2的定义意味着对于噪音H1(z)是:
[0224]
[0225] 如果幅度噪音响应是大致相同的,则其具有全通滤波器的形式。这具有特别是在幅度响应中容易和精确地被建立模型、满足R2的优点。
[0226] 这个公式保证了噪音响应将尽可能地相似,并且语音响应将与(1-β2)成比例。因为β是从O1和O2到语音源的距离的比率,所以它受到阵列大小以及从阵列到语音源的距离的影响。
[0227] 图17是根据实施例的具有β=0.8的虚拟传声器V1对于在0.1m的距离处的1kHz语音源的线性响应的曲线图。虚拟传声器V1对于语音的线性响应缺乏或者不包括零位,并且对于语音的响应大于图10中所显示的。
[0228] 图18是根据实施例的具有β=0.8的虚拟传声器V1对于在1.0m的距离处的1kHz噪音源的线性响应的曲线图。虚拟传声器V1对于噪音的线性响应缺乏或者不包括零位,并且该响应与图11中显示的V2非常相似。
[0229] 图19是根据实施例的具有β=0.8的虚拟传声器V1对于在0.1m的距离处的100、500、1000、2000、3000和4000Hz频率的语音源的线性响应的曲线图。图20是显示对于实施例的阵列和对于常规的心形传声器,对于语音的频率响应的对比的曲线图。
[0230] V1对于语音的响应被显示在图17中,而且对于噪音的响应被显示在图18中。注意,与V2相比的语音响应的差异被显示在图15中,而且噪音响应的相似性被显示在图16中。同样注意,图17中显示的对于V1的语音响应的方位完全地与常规系统的方位相反,在常规系统中,通常响应的主瓣被定向为朝向语音源。实施例中V1的语音响应的主瓣被定向为远离语音源的方位意指,V1的语音敏感性比正常的定向传声器低,但是对于在阵列的轴的近似+-30度内的所有频率是平坦的,如图19所示。这个对于语音的平坦性意指不需要成形的后置滤波器来修复全向频率响应。这得到了代价——如图20所示,图20显示了具有β=0.8的V1的语音响应和心形传声器的语音响应。对于近似16000Hz的采样频率,在近似500和7500Hz之间,V1的语音响应是近似0到~13dB,小于正常的定向传声器,以及在近 似500Hz以下和7500Hz以上,V1的语音响应是近似0到10+dB,大于定向传声器。但是,使用这个系统使得高级噪音抑制是可能的,大于对初始较差的SNR的补偿。 [0231] 应当注意,图15-18假定了语音被定位在近似0度以及近似10cm,β=0.8,以及处于所有角度的噪音离开阵列的中点近似1.0米。通常,噪音距离不要求是1m以上,但是降噪对于那些距离是最好的。对于小于近似1m的距离,降噪因为V1和V2的噪音响应的较大的不相似性而不会是有效的。这没有证明在实际使用中是阻碍——事实上,它可以被看作特征。远离耳机~10cm的任何“噪音”源很可能期望被捕获和传输。
[0232] V2的语音零位意指VAD信号不再是关键成分。VAD的目的是确保系统将不会对准语音,然后接着去除它,导致语音失真。但是,如果V2不包含语音,则自适应系统无法对准语音并且无法去除它。结果,系统可以一直进行降噪而不必忧虑清音化,然后结果的干净音频可以被用于产生在后续的诸如频谱相减的单信道噪音抑制算法中使用的VAD信号。另外,即使检测到语音,H1(z)的绝对值上的约束(即,将它限制成小于二的绝对值)也可以阻止系统完全地对准语音。然而,实际上,语音可能因为错误定位的V2零位和/或回音或者其他现象而存在,并且推荐VAD传感器或者其他仅声学的VAD,以使语音失真最小化。 [0233] 取决于应用,β和γ可以在噪音抑制算法中被固定,或者当该算法指示语音制造在几乎没有噪音的情况下发生时,可以估计它们。在任一情况中,在系统的实际β和γ的估计中可能有误差。以下描述研究了这些误差以及它们对系统的性能的影响。如上,系统的“好的性能”指示有足够的降噪以及最小的清音化。
[0234] 通过研究以上定义,可以看到不正确的β和γ对V1和V2的响应的影响: [0235]
[0236]
[0237] 其中βT和γT表示噪音抑制算法中使用的β和γ的理论估计值。实际上,O2的语音响应是
[0238]
[0239] 其中,βR和γR表示物理系统的真实的β和γ。β和γ的理论和实际值之间的差异可以起因于语音源的错误位置(它不在假定的位置)和/或气温的改变(其改变了音速)。将O2对于语音的实际响应插入到以上用于V1和V2的等式,得到
[0240]
[0241]
[0242] 如果相位差由以下等式代表
[0243] γR=γT+γD
[0244] 并且振幅差为
[0245] βR=BβT
[0246] 那么
[0247] 等式5
[0248]
[0249] V2中的语音消除(直接影响清音化的程度)以及V1的语音响应将取决于B和D两者。接下来是D=0的情况的研究。图21是根据实施例,假定ds为0.1m,显示对于V(1 上部,虚线)和V2(下部,实线)的语音响应对比B的曲线图。这个曲线图显示了在V2中的空间零位是相对宽的。图22是根据实施例的显示图16中所示的V1/V2语音响应的比率对比B的曲线图。对所有的0.8
[0250] 在图21中,当ds被认为是近似10cm并且θ=0时,V1(上部,虚线)和V2(下部,实线)与O1相比的语音响应被显示对比B。当B=1时,V2缺少语音。在图22中,显示图16中的语音响应的比率。当0.8
[0253] 其中,再次,T下标指示理论值以及R下标指示实际值。在图23中,假定ds=10cm以及θ=0,系数B相对于实际的ds被制图。因此,如果语音源在阵列的同轴上,则实际距离可以从近似5cm变化到18cm,而不显著地影响性能——大量。同样地,图24显示如果语音源被定位在近似10cm的距离但不在阵列的轴上,则发生什么。在这种情况下,角度可以变化直至近似+-55度,并且仍然导致B小于1.1,保证好的性能。这是大量的容许角偏差。如果有角度和距离误差两者,则上面的等式可以被用于判定偏差是否将导致足够的性能。
当然,如果允许βT的值在语音期间更新,基本上跟踪语音源,那么B可以对于几乎所有的配置被保持成接近整数。
[0254] 接着研究B是整数而D是非零的情况。如果语音源不在它被认为的地方或者如果音速不同于它被认为的,则这可能发生。从以上等式5,可以看出,对于语音,使V2中的语音 零位减弱的系数是
[0255]
[0256] 或者在连续s域中
[0257] N(s)=Be-Ds-1。
[0258] 因为γ是语音到达V1与V2相比之间的时间差,所以它可以是在语音源相对于阵列的轴的角度位置估计中的和/或通过温度变化的误差。研究温度敏感性,音速随着温度而变化为
[0259] C=331.3+(0.606T)m/s
[0260] 其中T是摄氏温度。当温度降低时,音速也降低。设定20C作为设计温度,并且将最大期望温度范围设定为-40C到+60C(-40F到140F)。在20C处的设计音速是343m/s,并且在-40C,最慢音速将是307m/s,以及在60C,最快音速将是362m/s。设定阵列长度(2d0)为21mm。对于阵列的轴上的语音源,对于音速的最大变化的传播时间差是
[0261]
[0262] 或者近似7微秒。图25中显示了对于给予的B=1以及D=7.2μs的N(s)的响应。图25是根据实施例,随着B=1以及D=-7.2μs,N(s)的振幅(上部)和相位(下部)响应的曲线图。结果的相位差影响高频比影响低频更明显。对于所有的小于7kHz的频率,振幅响应小于近似-10dB,并且在8kHz处,振幅响应仅为大约-9dB。因此,假定B=1,这个系统将可能在直至近似8kHz的频率处运行得很好。这意指适当补偿的系统在格外宽(例如,-40C到
80C)的温度范围内,即使直至8kHz,也将工作很好。注意,因为延迟估计误差而引起的相位失配使得N(s)在高频处比在低频处大很多。
[0263] 如果B不是整数,则因为来自非整数B的影响随着非零D的累加而累加,所以降低了系统的稳固性。图26显示了对于B=1.2以及D=7.2μs的振幅和相位响应。图26是根据实施例,随着B=1.2以及D=-7.2μs,N(s)的振幅(上部)和相位(下部)响应的曲线图。非整数B影响整个频率范围。现在,N(s)仅仅对于小于近似5kHz的频率是低于近似-10dB,并且在低频处的响应更大。这种系统低于5kHz将仍然运行得很好,并且对于5kHz之上的频率将仅仅受到稍微升高的清音化。为了最终的性能,温度传感器可以被集成到系统中以允许算法随着温度变化而调整γT。
[0264] D可能是非零的另一个情形是在语音源不在被认为的地方的时候——具体地,从阵列的轴到语音源的角度是不正确的。到该源的距离也可能是不正确的,但是那个引入B中的误差,而不是D中的误差。
[0265] 参考图8,可见,对于两个语音源(各自具有它们自己的ds和θ),语音到达O1和语 音到达O2之间的时间差是
[0266]
[0267] 其中
[0268]
[0269]
[0270]
[0271]
[0272] 图27中显示了对于θ1=0度和θ2=30度并且假定B=1的V2语音消除响应。图27是根据实施例,随着q1=0度以及q2=30度,因为语音源的位置错误而对V2中的语音消除有影响的振幅(上部)和相位(下部)响应的曲线图。注意,对于低于6kHz的频率,该消除仍然是低于-10dB。因为该消除对于低于近似6kHz的频率仍然是低于近似-10dB,所以这个类型的误差不会显著地影响系统的性能。但是,如图28所示,如果θ2被增加到近似45度,则该消除仅仅对于低于近似2.8kHz的频率是低于近似-10dB。图28是根据实施例,随着q1=0度以及q2=45度,因为语音源的位置错误而对V2中的语音消除有影响的振幅(上部)和相位(下部)响应的曲线图。现在,该消除仅仅对于低于大约2.8kHz的频率是低于-10dB,并且预期性能降低。近似4kHz之上的差的V2语音消除可能导致对于那些频率的显著清音化。
[0273] 以上描述已经假定,传声器O1和O2被校准,因此对于被定位成远离相同距离的源,它们对于振幅和相位两者的响应是等同的。这并不总是可行的,所以以下呈现更加实用的校准过程。它不是精确的,但是更加易于实现。从定义滤波器α(z)开始,以致 [0274] O1C(z)=α(z)O2C(z)
[0275] 其中,“C”下标指示已知的校准源的使用。使用的最简单的一个是用户的语音。那么
[0276] O1S(z)=α(z)O2C(z)
[0277] 现在,传声器定义是:
[0278] V1(z)=O1(z)·z-γ-β(z)α(z)O2(z)
[0279] V2(z)=α(z)O2(z)-z-γβ(z)O1(z)
[0280] 系统的β应该是固定的并且尽可能接近于真实值。在实践中,系统对于β的变化不敏感,并且容易容忍近似+-5%的误差。在用户正在制造语音但几乎没有噪音时的期间,系统可以对准α(z)以去除尽可能多的语音。这伴随有:
[0281] 1.利用“MIC1”位置上的βO1S(z)z-γ、“MIC2”位置上的O2S(z)以及H1(z)位置上的α(z),来构造如图7所示的自适应系统。
[0282] 2.在语音期间,使α(z)适应以使系统的残余最小化。
[0283] 3.如上构造V1(z)和V2(z)。
[0284] 简单的自适应滤波器可以被用于α(z),因此只有传声器之间的关系被良好地建立模型。只有当用户正在制造语音时,实施例的系统才对准。像SSM的传感器对判定什么时候在无噪音的情况下正在制造语音是不可缺少的。如果语音源被固定在适当的位置并且将不会在使用期间(诸如当阵列在耳机上时)显著地变化,则自适应应该是不常见的并且更新缓慢,以便使由对准期间存在的噪音引入的任何误差最小化。
[0285] 以上公式工作得非常好,因为V1和V2的噪音(远场)响应是非常相似的,而语音(近场)响应是非常不同的。但是,用于V1和V2的公式可能变化,并且总体上仍然导致系统的好的性能。如果从以上获得V1和V2的定义并且新份变量B1和B2被插入,则结果是: [0286]
[0287]
[0288] 其中,B1和B2两者都是正数或者零。如果B1和B2被设定成等于整数,则最优系统结果如上所述。如果允许B1从整数变化,则V1的响应被影响。接着是B2被保留在1并且B1被减少的情况的研究。当B1减少到近似零时,V1变得越来越少地定向,直到当B1=0时,它变成简单的全向传声器。因为B2=1,语音零位保持在V2中,所以对于V1和V2的非常不同的语音响应保持。但是,噪音响应更加不相似,所以降噪将不会是有效的。然而,实际上,系统仍然很好地运行。B1也可以从整数被增加,并且再一次,系统将仍然很好地进行降噪,只不过是没有B1=1时的好。
[0289] 如果允许B2变化,则V2中的语音零位受影响。只要语音零位仍然足够地深,系统仍然将运行得很好。实际上,降至近似B2=0.6的值已经显示了足够的性能,但是为了最佳性能,建议将B2设定成接近于整数。
[0290] 类似地,变量ε和Δ可以被引入,因此:
[0291] V1(z)=(ε-β)O2N(z)+(1+Δ)O1N(z)z-γ
[0292] V2(z)=(1+Δ)O2N(z)+(ε-β)O1N(z)z-γ
[0293] 这个公式也允许虚拟传声器响应变化,但保持H1(z)的全通特性。
[0294] 总之,系统足够灵活以便在各种B1值操作得很好,但是为了最好的性能,B2值应该接近于整数以限制清音化。
[0295] 图29中显示了在非常大声(~85dBA)的音乐/语音噪音环境中,对于在Bruel和Kjaer头和躯干模拟器(HATS)上使用0.83的线性β以及B1=B2=1的2d0=19mm阵列的实验结果。上面论述的替换传声器校准技术被用于校准传声器。噪音已经降低大约25dB,并且语 音几乎不受影响,没有显著的失真。明显地,该技术显著地增加了原始语音的SNR,远胜过常规的噪音抑制技术。
[0296] DOMA可以是单个系统、多个系统和/或地理上分开的系统的部件。DOMA也可以是单个系统、多个系统和/或地理上分开的系统的子部件或者子系统。DOMA可以被耦接到主机系统的或者耦接到该主机系统的系统的一个以上的其它部件(未显示)。
[0297] DOMA的一个以上的部件和/或耦接或者连接DOMA的相应的系统或者应用程序包括处理系统,和/或在处理系统下运行,和/或与处理系统相关联地运行。如本领域中已知的,处理系统包括基于处理器的装置或者一起操作的计算装置,或者处理系统或装置的部件的任何集合。例如,处理系统可以包括在通信网络和/或网络服务器中操作的一个以上的便携式计算机、便携式通信装置。便携式计算机可以是从个人计算机、蜂窝式移动电话、个人数字助理、便携式计算装置和便携式通信装置中选择的装置的任何数量和/或组合,但是不会被如此限制。处理系统可以包括在大的计算机系统之内的部件。
[0298] 实施例的处理系统包括至少一个处理器以及至少一个存储装置或者子系统。处理系统也可以包括或者被耦接到至少一个数据库。通常使用的术语“处理器”在此指的是任何逻辑处理单元,诸如一个以上的中央处理单元(CPU)、数字信号处理器(DSP)、专用集成电路(ASIC)等等。处理器和存储器可以被统一地集成在单个芯片之上,被分布在许多芯片或者部件当中,和/或通过一些算法的组合被提供。在此描述的方法可以在一个以上的软件算法、程序、固件、硬件、部件、电路中以任何组合被实现。
[0299] 包括DOMA的任何系统的部件可以在一起或者可以位于分开的位置上。通信路径耦接该部件并且包含用于通信或者传送该部件当中的文件的任何介质。通信路径包括无线连接、有线连接以及混合的无线/有线连接。通信路径还包含对网络的耦接或者连接,该网络包括局域网(LAN)、城域网(MAN)、广域网(WAN)、专有网络、局间或者后端网络、以及因特网。此外,通信路径包含可移动的固定介质,如软盘硬盘驱动器和CD-ROM磁盘,以及闪速RAM、通用串行总线(USB)连接、RS-232连接、电话线路、总线以及电子邮件消息。 [0300] 此处描述的DOMA的实施例包含传声器阵列,该传声器阵列包括:包括第一传声器信号和第二传声器信号的第一组合的第一虚拟传声器,其中第一传声器信号通过第一物理传声器产生,以及第二传声器信号通过第二物理传声器产生;以及包括第一传声器信号和第二传声器信号的第二组合的第二虚拟传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0301] 实施例的第一和第二物理传声器是全向的。
[0302] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中该语音是人类语音。
[0303] 实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上。
[0304] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0305] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0306] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0307] 实施例的第一物理传声器和第二物理传声器沿着轴被安置,并且相隔第一距离。 [0308] 实施例的轴的中点是离开产生语音的语音源的第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0309] 实施例的第一虚拟传声器包括从第一传声器信号中减去的第二传声器信号。 [0310] 实施例的第一传声器信号被延迟。
[0311] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0312] 实施例的延迟被升幂,该幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。
[0313] 实施例的第二传声器信号乘以比率,其中该比率是第三距离比第四距离的比率,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0314] 实施例的第二虚拟传声器包括从第二传声器信号中减去的第一传声器信号。 [0315] 实施例的第一传声器信号被延迟。
[0316] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0317] 实施例的幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。 [0318] 实施例的第一传声器信号乘以比率,其中该比率是第三距离比第四距离的比率。 [0319] 实施例的单个零位离开第一物理传声器和第二物理传声器中的至少一个一距离,期望 语音源在该距离处。
[0320] 实施例的第一虚拟传声器包括从延迟版本的第一传声器信号中减去的第二传声器信号。
[0321] 实施例的第二虚拟传声器包括从第二传声器信号中减去的延迟版本的第一传声器信号。
[0322] 此处描述的DOMA的实施例包含传声器阵列,该传声器阵列包括:由第一传声器信号和第二传声器信号的第一组合形成的第一虚拟传声器,其中通过第一全向传声器产生第一传声器信号,以及通过第二全向传声器产生第二传声器信号;以及由第一传声器信号和第二传声器信号的第二组合形成的第二虚拟传声器,其中第二组合不同于第一组合;其中第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声器对于具有单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上,其中该语音是人类语音。
[0323] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0324] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0325] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0326] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0327] 此处描述的DOMA的实施例包含装置,该装置包括:输出第一传声器信号的第一传声器和输出第二传声器信号的第二传声器;以及被耦接到第一传声器信号和第二传声器信号的处理部件,该处理部件产生虚拟传声器阵列,该虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器,其中第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应。
[0328] 此处描述的DOMA的实施例包含装置,该装置包括:输出第一传声器信号的第一传声器和输出第二传声器信号的第二传声器,其中第一传声器和第二传声器是全向传声器;以及包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列,其中第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是有差别的虚拟定向传声器。
[0329] 此处描述的DOMA的实施例包含装置,该装置包括:产生第一传声器信号的第一物理传声器;产生第二传声器信号的第二物理传声器;以及被耦接到第一传声器信号和第二传声器信号的处理部件,该处理部件产生虚拟传声器阵列,该虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器;其中第一虚拟传声器包括从延迟版本的第一传声器信号中减去的第二传声器信号;其中第二虚拟传声器包括从第二传声器信号中减去的延迟版本的第一传声器信号。
[0330] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中该语音是人类语音。
[0331] 实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上。
[0332] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0333] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0334] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0335] 实施例的第一物理传声器和第二物理传声器沿着轴被安置,并且被分开第一距离。
[0336] 实施例的轴的中点离开产生语音的语音源第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0337] 实施例的一个以上的第一传声器信号和第二传声器信号被延迟。
[0338] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0339] 实施例的幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。 [0340] 实施例的一个以上的第一传声器信号和第二传声器信号乘以增益系数。 [0341] 此处描述的DOMA的实施例包含传感器,该传感器包括:包含第一物理传声器和第二物理传声器的物理传声器阵列,第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号;包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合;虚拟传声器阵列包括单个零位,该单个零位被定向在朝向人类说话者的语音源的方向上。 [0342] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声 器对于包含单个零位的语音具有第二线性响应。
[0343] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0344] 实施例的单个零位是对于语音的第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0345] 实施例的对于语音的第二线性响应包含被定向在远离语音源的方向上的主瓣。 [0346] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0347] 实施例的单个零位被定位在离开物理传声器阵列的一距离处,期望语音源在该距离处。
[0348] 此处描述的DOMA的实施例包含装置,该装置包括:包含至少一个扬声器的头戴式耳机,其中该头戴式耳机附接到人类头部的区域;被连接到头戴式耳机的传声器阵列,该传声器阵列包含输出第一传声器信号的第一物理传声器和输出第二传声器信号的第二物理传声器;以及被耦接到传声器阵列并且产生虚拟传声器阵列的处理部件,虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应。
[0349] 实施例的第一和第二物理传声器是全向的。
[0350] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中该语音是人类语音。
[0351] 实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上。
[0352] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0353] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0354] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0355] 实施例的第一物理传声器和第二物理传声器沿着轴被安置,并且分开第一距离。 [0356] 实施例的轴的中点是离开产生语音的语音源的第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0357] 实施例的第一虚拟传声器包括从第一传声器信号中减去的第二传声器信号。 [0358] 实施例的第一传声器信号被延迟。
[0359] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0360] 实施例的延迟被升幂,该幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0361] 实施例的第二传声器信号乘以比率,其中该比率是第三距离比第四距离的比率,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0362] 实施例的第二虚拟传声器包括从第二传声器信号中减去的第一传声器信号。 [0363] 实施例的第一传声器信号被延迟。
[0364] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0365] 实施例的幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。 [0366] 实施例的第一传声器信号乘以比率,其中该比率是第三距离比第四距离的比率。 [0367] 实施例的第一虚拟传声器包括从延迟版本的第一传声器信号中减去的第二传声器信号。
[0368] 实施例的第二虚拟传声器包括从第二传声器信号中减去的延迟版本的第一传声器信号。
[0369] 实施例的产生语音的语音源是佩带头戴式耳机的人类的嘴。
[0370] 实施例的装置包括被耦接到处理部件的语音活动检测器(VAD),该VAD产生语音活动信号。
[0371] 实施例的装置包括被耦接到处理部件的自适应噪音去除应用程序,该自适应噪音去除应用程序接收来自第一和第二虚拟传声器的信号并且产生输出信号,其中输出信号是经降噪的声学信号。
[0372] 实施例的传声器阵列接收声学信号,该声学信号包含声学语音和噪声。 [0373] 实施例的装置包括被耦接到处理部件的通信信道,该通信信道包括无线信道、有线信道、和混合的无线/有线信道中的至少一个。
[0374] 实施例的装置包括借助于通信信道被耦接到头戴式耳机的通信装置,该通信装置包括一个以上的移动电话、卫星电话、携带式电话、有线电话、因特网电话、无线收发机、无 线通信收发机、个人数字助理(PDA)、和个人计算机(PC)。
[0375] 此处描述的DOMA的实施例包含装置,该装置包括:外壳;被连接到该外壳的扬声器;被连接到该外壳的第一物理传声器和第二物理传声器,第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号,其中第一和第二物理传声器是全向的;包括第一传声器信号和第二传声器信号的第一组合的第一虚拟传声器;以及包括第一传声器信号和第二传声器信号的第二组合的第二虚拟传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0376] 此处描述的DOMA的实施例包含装置,该装置包括:包含扬声器的外壳,其中该外壳是便携式的并且被配置用于附接到移动对象;以及被连接到头戴式耳机的物理传声器阵列,该物理传声器阵列包含第一物理传声器和第二物理传声器,第一物理传声器和第二物理传声器形成虚拟传声器阵列,虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器;第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中通过第一物理传声器产生第一传声器信号,以及通过第二物理传声器产生第二传声器信号;以及第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合;其中第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声器对于具有单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上,其中该语音是人类语音。
[0377] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0378] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0379] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0380] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0381] 此处描述的DOMA的实施例包含装置,该装置包括:被附接到人类说话者的区域的外壳;被连接到该外壳的扬声器;以及包含被连接到外壳的第一物理传声器和第二物理传声器的物理传声器阵列,第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号,第一物理传声器和第二物理传声器组合形成虚拟传声器阵列;虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合;虚拟传声器阵列包括单个零位,该单个零位被定向 在朝向人类说话者的语音源的方向上。
[0382] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声器对于包含单个零位的语音具有第二线性响应。
[0383] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0384] 实施例的单个零位是对于语音的第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0385] 实施例的对于语音的第二线性响应包含被定向在远离语音源的方向上的主瓣。 [0386] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0387] 实施例的单个零位被定位在离开物理传声器阵列的一距离处,期望语音源在该距离处。
[0388] 此处描述的DOMA的实施例包含系统,该系统包括:包含第一物理传声器和第二物理传声器的传声器阵列,第一物理传声器输出第一传声器信号,第二物理传声器输出第二传声器信号;被耦接到传声器阵列并且产生虚拟传声器阵列的处理部件,虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应;以及自适应噪音去除应用程序,该自适应噪音去除应用程序被耦接到处理部件,并且通过形成从第一虚拟传声器和第二虚拟传声器输出的信号的多个组合,来产生经降噪的输出信号,其中经降噪的输出信号包含比在传声器阵列处接收到的声学信号少的噪声。
[0389] 实施例的第一和第二物理传声器是全向的。
[0390] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中该语音是人类语音。
[0391] 实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上。
[0392] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0393] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0394] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0395] 实施例的第一物理传声器和第二物理传声器沿着轴被安置,并且被分开第一距离。
[0396] 实施例的轴的中点是离开产生语音的语音源的第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0397] 实施例的第一虚拟传声器包括从第一传声器信号中减去的第二传声器信号。 [0398] 实施例的第一传声器信号被延迟。
[0399] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0400] 实施例的延迟被升幂,该幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0401] 实施例的第二传声器信号乘以比率,其中该比率是第三距离比第四距离的比率,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0402] 实施例的第二虚拟传声器包括从第二传声器信号中减去的第一传声器信号。 [0403] 实施例的第一传声器信号被延迟。
[0404] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0405] 实施例的幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。 [0406] 实施例的第一传声器信号乘以比率,其中该比率是第三距离比第四距离的比率。 [0407] 实施例的第一虚拟传声器包括从延迟版本的第一传声器信号中减去的第二传声器信号。
[0408] 实施例的第二虚拟传声器包括从第二传声器信号中减去的延迟版本的第一传声器信号。
[0409] 实施例的系统包括被耦接到处理部件的语音活动检测器(VAD),该VAD产生语音活动信号。
[0410] 实施例的系统包括被耦接到处理部件的通信信道,该通信信道包括无线信道、有线信道、和混合的无线/有线信道中的至少一个。
[0411] 实施例的系统包括借助于通信信道被耦接到处理部件的通信装置,该通信装置包括一个以上的移动电话、卫星电话、携带式电话、有线电话、因特网电话、无线收发机、无线通信收发机、个人数字助理(PDA)、和个人计算机(PC)。
[0412] 此处描述的DOMA的实施例包含系统,该系统包括:由第一传声器信号和第二传声器信号的第一组合形成的第一虚拟传声器,其中通过第一物理传声器产生第一传声器信号,以及通过第二物理传声器产生第二传声器信号;由第一传声器信号和第二传声器信号的第二组合形成的第二虚拟传声器,其中第二组合不同于第一组合;其中第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声器对于具有单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上,其中该语音是人类语音;自适应噪音去除应用程序,该自适应噪音去除应用程序被耦接到第一和第二虚拟传声器,并且通过形成从第一虚拟传声器和第二虚拟传声器输出的信号的多个组合,来产生经降噪的输出信号,其中经降噪的输出信号包含比在第一和第二物理传声器处接收到的声学信号少的噪声。
[0413] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0414] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0415] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0416] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0417] 此处描述的DOMA的实施例包含系统,该系统包括:输出第一传声器信号的第一传声器,以及输出第二传声器信号的第二传声器,其中第一传声器和第二传声器是全向传声器;包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列,其中第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是有差别的虚拟定向传声器;以及自适应噪音去除应用程序,该自适应噪音去除应用程序被耦接到虚拟传声器阵列,并且通过形成从第一虚拟传声器和第二虚拟传声器输出的信号的多个组合,来产生经降噪的输出信号,其中经降噪的输出信号包含比在第一传声器和第二传声器处接收到的声学信号少的噪声。
[0418] 此处描述的DOMA的实施例包含系统,该系统包括:产生第一传声器信号的第一物理传声器;产生第二传声器信号的第二物理传声器;被耦接到第一传声器信号和第二传声器信号的处理部件,该处理部件产生虚拟传声器阵列,该虚拟传声器阵列包括第一虚拟传声器和第二虚拟传声器;并且其中第一虚拟传声器包括从延迟版本的第一传声器信号中减去的第二传声器信号;其中第二虚拟传声器包括从第二传声器信号中减去的延迟版本的第一传声器信号;被耦接到处理部件并且产生经降噪的输出信号的自适应噪音去除应用程 序,其中经降噪的输出信号包含比在第一物理传声器和第二物理传声器处接收到的声学信号少的噪声。
[0419] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中该语音是人类语音。
[0420] 实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上。
[0421] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0422] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0423] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0424] 实施例的第一物理传声器和第二物理传声器沿着轴被安置,并且被分开第一距离。
[0425] 实施例的轴的中点是离开产生语音的语音源的第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0426] 实施例的一个以上的第一传声器信号和第二传声器信号被延迟。
[0427] 实施例的延迟被升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0428] 实施例的幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。 [0429] 实施例的一个以上的第一传声器信号和第二传声器信号乘以增益系数。 [0430] 实施例的系统包括被耦接到处理部件的语音活动检测器(VAD),该VAD产生语音活动信号。
[0431] 实施例的系统包括被耦接到处理部件的通信信道,该通信信道包括无线信道、有线信道、和混合的无线/有线信道中的至少一个。
[0432] 实施例的系统包括借助于通信信道被耦接到处理部件的通信装置,该通信装置包括一个以上的移动电话、卫星电话、携带式电话、有线电话、因特网电话、无线收发机、无线通信收发机、个人数字助理(PDA)、和个人计算机(PC)。
[0433] 此处描述的DOMA的实施例包含系统,该系统包括:包含第一物理传声器和第二物理传声器的物理传声器阵列,第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号;包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传 声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合;虚拟传声器阵列包含单个零位,该单个零位被定向在朝向人类说话者的语音源的方向上;以及自适应噪音去除应用程序,该自适应噪音去除应用程序被耦接到虚拟传声器阵列,并且通过形成从虚拟传声器阵列输出的信号的多个组合,来产生经降噪的输出信号,其中经降噪的输出信号包含比在物理传声器阵列处接收到的声学信号少的噪声。
[0434] 实施例的第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中实施例的第二虚拟传声器对于包含单个零位的语音具有第二线性响应。
[0435] 实施例的第一虚拟传声器和第二虚拟传声器对于噪音具有基本上相似的线性响应。
[0436] 实施例的单个零位是对于语音的第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0437] 实施例的对于语音的第二线性响应包含被定向在远离语音源的方向上的主瓣。 [0438] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0439] 实施例的单个零位被定位在离开物理传声器阵列的一距离处,期望语音源在该距离处。
[0440] 此处描述的DOMA的实施例包含系统,该系统包括:包括第一传声器信号和第二传声器信号的第一组合的第一虚拟传声器,其中从第一物理传声器输出第一传声器信号,以及从第二物理传声器输出第二传声器信号;包括第一传声器信号和第二传声器信号的第二组合的第二虚拟传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器;以及被耦接到第一和第二虚拟传声器的处理部件,该处理部件包含自适应噪音去除应用程序,该自适应噪音去除应用程序接收来自第一虚拟传声器和第二虚拟传声器的声学信号并且产生输出信号,其中该输出信号被经降噪的声学信号。 [0441] 此处描述的DOMA的实施例包含方法,该方法包括:通过产生第一传声器信号和第二传声器信号的第一组合来形成第一虚拟传声器,其中通过第一物理传声器产生第一传声器信号,以及通过第二物理传声器产生第二传声器信号;以及通过产生第一传声器信号和第二传声器信号的第二组合来形成第二虚拟传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0442] 实施例的形成第一虚拟传声器包含形成对于缺少零位的语音具有第一线性响应的第一虚拟传声器,其中该语音是人类语音。
[0443] 实施例的形成第二虚拟传声器包含形成对于包含单个零位的语音具有第二线性响应的第二虚拟传声器,该单个零位被定向在朝向语音源的方向上。
[0444] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0445] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0446] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0447] 实施例的方法包括沿着轴安置第一物理传声器和第二物理传声器,并且使第一和第二物理传声器分开第一距离。
[0448] 实施例的轴的中点是离开产生语音的语音源的第二距离,其中该语音源被定位在相对于该中点通过角度限定的方向上。
[0449] 实施例的形成第一虚拟传声器包括减去从第一传声器信号中减去的第二传声器信号。
[0450] 实施例的方法包括延迟第一传声器信号。
[0451] 实施例的方法包括使该延迟升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0452] 实施例的方法包括使该延迟升幂,该幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。
[0453] 实施例的方法包括使第二传声器信号乘以比率,其中该比率是第三距离比第四距离的比率,第三距离是在第一物理传声器和语音源之间,以及第四距离是在第二物理传声器和语音源之间。
[0454] 实施例的形成第二虚拟传声器包括从第二传声器信号中减去第一传声器信号。 [0455] 实施例的方法包括延迟第一传声器信号。
[0456] 实施例的方法包括使该延迟升幂,该幂与语音到达第一虚拟传声器和语音到达第二虚拟传声器之间的时间差成比例。
[0457] 实施例的方法包括使该延迟升幂,该幂与乘以等于第四距离减去第三距离的量的采样频率成比例,第三距离在第一物理传声器和语音源之间,以及第四距离在第二物理传声器和语音源之间。
[0458] 实施例的方法包括使第一传声器信号乘以比率,其中该比率是第三距离比第四距离的比率。
[0459] 实施例的形成第一虚拟传声器包括从延迟版本的第一传声器信号中减去第二传声器 信号。
[0460] 实施例的形成第二虚拟传声器包括:通过延迟第一传声器信号来形成量;以及从第二传声器信号中减去该量。
[0461] 实施例的第一和第二物理传声器是全向的。
[0462] 此处描述的DOMA的实施例包含方法,该方法包括:接收来自第一全向传声器的第一传声器信号,以及接收来自第二全向传声器的第二传声器信号;通过产生第一传声器信号和第二传声器信号的第一组合来产生第一虚拟定向传声器;以及通过产生第一传声器信号和第二传声器信号的第二组合来形成第二虚拟定向传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0463] 此处描述的DOMA的实施例包括形成传声器阵列的方法,该方法包括:通过产生第一传声器信号和第二传声器信号的第一组合来形成第一虚拟传声器,其中通过第一全向传声器产生第一传声器信号,以及通过第二全向传声器产生第二传声器信号;以及通过产生第一传声器信号和第二传声器信号的第二组合来形成第二虚拟传声器,其中第二组合不同于第一组合;其中第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中第二虚拟传声器对于具有单个零位的语音具有第二线性响应,该单个零位被定向在朝向语音源的方向上,其中该语音是人类语音。
[0464] 实施例的形成第一和第二虚拟传声器包括形成对于噪音具有基本上相似的线性响应的第一虚拟传声器和第二虚拟传声器。
[0465] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0466] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0467] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0468] 此处描述的DOMA的实施例包含方法,该方法包括:在第一物理传声器和第二物理传声器处接收声学信号;响应于该声学信号,从第一物理传声器输出第一传声器信号,以及从第二物理传声器输出第二传声器信号;通过产生第一传声器信号和第二传声器信号的第一组合来形成第一虚拟传声器;通过产生第一传声器信号和第二传声器信号的第二组合来形成第二虚拟传声器,其中第二组合不同于第一组合,其中第一虚拟传声器和第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器;通过组合来自第一虚拟传声器和第二虚拟传声器的信号来产生输出 信号,其中该输出信号包含比声学信号少的噪声。
[0469] 实施例的第一和第二物理传声器是全向传声器。
[0470] 实施例的形成第一虚拟传声器包含形成对于缺少零位的语音具有第一线性响应的第一虚拟传声器,其中该语音是人类语音。
[0471] 实施例的形成第二虚拟传声器包含形成对于包含单个零位的语音具有第二线性响应的第二虚拟传声器,该单个零位被定向在朝向语音源的方向上。
[0472] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0473] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0474] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0475] 实施例的形成第一虚拟传声器包括从延迟版本的第一传声器信号中减去第二传声器信号。
[0476] 实施例的形成第二虚拟传声器包括:通过延迟第一传声器信号来形成量;以及从第二传声器信号中减去该量。
[0477] 此处描述的DOMA的实施例包含方法,该方法包括:形成包含第一物理传声器和第二物理传声器的物理传声器阵列,第一物理传声器输出第一传声器信号,以及第二物理传声器输出第二传声器信号;以及形成包括第一虚拟传声器和第二虚拟传声器的虚拟传声器阵列,第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,第二虚拟传声器包括第一传声器信号和第二传声器信号的第二组合,其中第二组合不同于第一组合;虚拟传声器阵列包括单个零位,该单个零位被定向在朝向人类说话者的语音源的方向上。 [0478] 实施例的形成第一和第二虚拟传声器包括形成对于噪音具有基本上相似的线性响应的第一虚拟传声器和第二虚拟传声器。
[0479] 实施例的单个零位是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0480] 实施例的第二线性响应包含被定向在远离语音源的方向上的主瓣。
[0481] 实施例的主瓣是第二线性响应中具有比该第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0482] 实施例的单个零位被定位在离开物理传声器阵列的一距离处,期望语音源在该距离处。
[0483] 基于语音活动检测器(VAD)的多传声器噪声抑制
[0484] 在以下描述中,“信号”代表期望的任何声学信号(诸如人类语音),以及“噪音”是不期望的任何声学信号(可以包含人类语音)。实例将是人正在移动电话上交谈,并且在背景中有收发机。期望人的语音,不期望来自收发机的声能。另外,“用户”描述了正在使用装置并且期望其语音被系统捕获的人。
[0485] 同样,“声学”通常被限定为在空气中传播的声波。声波在除了空气之外的介质中的传播将这样被注意。对于“语音”或者“嗓音”的引用泛指包含浊语音、清语音和/或浊语音和清语音的组合的人类语音。清语音或者浊语音在必要处被区分。术语“噪音抑制”通常描述了减少或者排除电子信号中的噪音的任何方法。
[0486] 此外,术语“VAD”通常被限定为以一些方式代表语音在数字或者模拟域中出现的矢量或者阵列信号、数据、或者信息。VAD信息的通用表示是以与相应的声学信号相同的速率被采样的一比特数字信号,具有表示在相应的时间采样期间没有语音出现的零值,以及指示在相应的时间采样期间有语音出现的整数值。虽然此处描述的实施例通常被描述在数字域中,但是该描述同样对模拟域有效。
[0487] 图30是实施例的降噪系统3000的方框图,降噪系统3000使用从关于调声活动的生理信息中获得的语音什么时候出现的知识。系统1000包含将信号提供给至少一个处理器3030的传声器3010和传感器3020。该处理器包含降噪子系统或者算法3040。 [0488] 图31是包含实施例噪音去除算法3100的部件的方框图。假定单个噪音源以及到传声器的直接路径。使用单个信号源3130以及单个噪音源3131来提供实施例的噪音去除算法3100的操作上的描述,但是不会如此限制。这个算法3100使用两个传声器:“信号”传声器1(“MIC1”)以及“噪音”传声器2(“MIC2”),但是不会如此限制。信号传声器MIC1被假定为主要捕获具有一些噪音的信号,而MIC2主要捕获具有一些信号的噪音。用s(n)表示从信号源3130到MIC1的数据,其中s(n)是来自源3130的模拟信号的离散样本。用s2(n)表示从信号源3130到MIC2的数据。用n(n)表示从噪音源3131到MIC2的数据。用n2(n)表示从噪音源3131到MIC1的数据。类似地,用m1(n)表示从MIC1到噪音去除元件3105的数据,以及用m2(n)表示从MIC2到噪音去除元件3105的数据。
[0489] 噪音去除元件3105还接收来自语音活动检测(VAD)元件3104的信号。VAD3104使用生理学信息来确定说话者在什么时候说话。在各种实施例中,VAD可以包含加速计、与用户的皮肤物理接触的皮肤表面传声器、人类组织振动检测器、射频(RF)振动和/或运动检测器/装置、舌动电流描记器(electroglottograph)、超声装置、用于检测与直接来自用户皮肤(身体上的任何地方)的用户的语音相对应的声频信号的声学传声器、气流检测器、以及激光振动检测器中的至少一个。
[0490] 从信号源3130到MIC1的传递函数以及从噪音源3131到MIC2的传递函数被假定为整数。用H2(z)表示从信号源3130到MIC2的传递函数,以及用H1(z)表示从噪音源3131到MIC1的传递函数。整数传递函数的假定不阻碍这个算法的通用性,因为信号、噪音以及传声器之间的实际关系只不过是比率,并且为了简单起见,该比率被如此重新定义。 [0491] 在常规的双传声器噪音去除系统中,来自MIC2的信息被用于尝试去除来自MIC1的噪音。但是,(通常未说出口的)假定VAD元件3104从不完美,因而必须慎重地进行降噪,免得和噪音一起去除太多的信号。但是,如果VAD3104被假定为理想的,以致它在用户没有制造语音的时候等于零、并且在语音被制造的时候等于一,可以获得噪音去除上的实质改进。
[0492] 在分析单个噪音源3131以及到传声器的直接路径的过程中,参考图31,用m1(n)表示进入MIC1的总声学信息。进入MIC2的总声学信息类似地被标记为m2(n)。在z(数字频率)域中,这些被表示为M1(z)和M2(z)。那么,
[0493] M1(z)=S(z)+N2(z)
[0494] M2(z)=N(z)+S2(z)
[0495] 以及
[0496] N2(z)=N(z)H1(z)
[0497] S2(z)=S(z)H2(z),
[0498] 因此
[0499] M1(z)=S(z)+N(z)H1(z)
[0500] M2(z)=N(z)+S(z)H2(z)。 等式6
[0501] 这对于所有的双传声器系统而言是普通情况。在实际系统中,总是会有一些噪音泄漏到MIC1中,以及一些信号泄漏到MIC2中。等式6具有四个未知数和仅仅两个已知的关系,因此不能被明确地求解。
[0502] 但是,有另一种方式来求出等式6中的一些未知数。该分析从研究没有语音正在被产生的情况开始,没有语音正在被产生的情况就是来自VAD元件3104的信号等于零并且没有语音正在被制造的情况。在这种情况下,s(n)=S(z)=0,并且等式6减少到 [0503] M1n(z)=N(z)H1(z)
[0504] M2n(z)=N(z),
[0505] 其中M变量上的n下标指示只有噪音正在被接收。这导致
[0506] M1n(z)=M2n(z)H1(z)
[0507] 等式7
[0508] 可以使用任何可用的系统识别算法来计算函数H1(z),并且当系统确信只有噪音正在被接收时,传声器才输出。该计算可以被自适应地完成,因此系统可以对噪音的变化作出反应。
[0509] 对于等式6中的一个未知数,解法是现有的。可以通过使用VAD等于一并且正在制造语音的情况来确定另一个未知数,H2(z)。当这个正在发生,但是传声器的最近(或许小于1秒)的历史指示了低噪音水平时,可以假定n(s)=N(z)~0。然后,等式6减少成 [0510] M1s(z)=S(z)
[0511] M2s(z)=S(z)H2(z),
[0512] 这随后导致
[0513] M2s(z)=M1s(z)H2(z)
[0514]
[0515] 它是H1(z)计算的倒数。但是,注意,不同的输入正在被使用(现在只有信号正在出现,而之前只有噪音出现)。在计算H2(z)的同时,为了H1(z)而计算的值被保持不变,反之亦然。因此,假定在H1(z)和H2(z)中的一个正在被计算的同时,没有被计算的那一个基本上不变化。
[0516] 在计算H1(z)和H2(z)之后,它们被用于从信号中去除噪音。如果等式6被重写为 [0517] S(z)=M1(z)-N(z)H1(z)
[0518] N(z)=M2(z)-S(z)H2(z)
[0519] S(z)=M1(z)-[M2(z)-S(z)H2(z)]H1(z)′
[0520] S(z)[l-H2(z)H1(z)]=M1(z)-M2(z)H1(z),
[0521] 那么可以如所示的代入N(z)以求出S(z)作为
[0522] 等式8
[0523] 如果可以用足够的精确度来描述传递函数H1(z)和H2(z),那么可以完全去除噪音,并且恢复原始信号。不管噪音的振幅或光谱特性,这仍然是成立的。仅仅做出的假定包含使用理想的VAD、足够精确的H1(z)和H2(z)、而且当正在计算H1(z)和H2(z)中的一个时另一个基本上不变化。实际上,已经证明这些假定是合理的。
[0524] 此处描述的噪音去除算法被容易地概括成包含任何数目的噪音源。图32是包含概括成n个有差别的噪音源的实施例的噪音去除算法的前端部件3200的方框图。这些有差别 的噪音源可以是彼此的反射或者回音,但是不会如此限制。显示有一些噪音源,每个噪音源对于每个传声器具有传递函数或者路径。以前命名的路径H2已经重新标记为H0,因此标记噪音源2到MIC1的路径是更方便的。每个传声器的输出在被变换到z域的时候是: [0525] M1(z)=S(z)+N1(z)H1(z)+N2(z)H2(z)+…Nn(z)Hn(z)
[0526] M2(z)=S(z)H0(z)+N1(z)G1(z)+N2(z)G2(z)+…Nn(z)Gn(z)。 等式9 [0527] 当没有信号(VAD=0)时,那么(为了清楚而抑制z)
[0528] M1n=N1H1+N2H2+…NnHn
[0529] M2n=N1G1+N2G2+…NnGn。 等式10
[0530] 新的传递函数现在可以被限定为
[0531] 等式11
[0532] 其中 是对以上H1(z)的模拟。因此 仅仅取决于噪音源以及它们各自的传递函数,并且可以在没有信号正在被传输的任何时间被计算。同样,在传声器输入上的“n”下标表示只有噪音正在被检测,而“s”下标表示只有信号正在被传声器接收。
[0533] 研究等式9,同时假定没有噪音制造
[0534] M1s=S
[0535] M2s=SH0。
[0536] 因此,可以如前所述的使用任何可用的传递函数计算算法来求出H0。然后,数学上,
[0537]
[0538] 使用等式11中限定的 来重写等式9,提供,
[0539] 等式12
[0540] 求解S,得到,
[0541] 等式13
[0542] 它与等式8相同,用H0代替H2,以及用 代替H1。因此,噪音去除算法仍然在数学上对包含噪音源的多个回音的任何数目的噪音源有效。此外,如果H0和 可以被估算到足够高的精确度,并且保持以上只有一条从信号到传声器的路径的假定,则可以完全地去除噪音。
[0543] 最普遍的情况涉及多个噪音源和多个信号源。图33是在有n个有差别的噪音源以及信号反射的最普遍的情况下,包括实施例的噪音去除算法的前端部件3300的方框图。这里,信号反射进入传声器MIC1和MIC2两者。这是最普遍的情况,可以与简单的附加噪 音源一样,精确地建立进入传声器MIC1和MIC2的噪音源的反射的模型。为了清楚,从信号到MIC2的直接路径从H0(z)变化到H00(z),并且分别用H01(z)和H02(z)来表示到MIC1和MIC2的反射路径。
[0544] 进入传声器的输入现在变成
[0545] M1(z)=S(z)+S(z)H01(z)+N1(z)H1(z)+N2(z)H2(z)+…Nn(z)Hn(z)
[0546] M2(z)=S(z)H00(z)+S(z)H02(z)+N1(z)G1(z)+N2(z)G2(z)+…Nn(z)Gn(z)。 等式14 [0547] 当VAD=0时,输入变成(再次抑制z)
[0548] M1n=N1H1+N2H2+…NnHn
[0549] M2n=N1G1+N2G2+…NnGn,
[0550] 它与等式10相同。因此,如期望的那样,等式11中的 的计算没有变化。在研究没有噪音的情形中,等式14减少成
[0551] M1s=S+SH01
[0552] M2s=SH00+SH02。
[0553] 这导致 的定义为
[0554] 等式15
[0555] 再次使用(如等式12中的) 的定义来重写等式14,提供
[0556] 等式16
[0557] 一些代数操作,得到
[0558]
[0559]
[0560]
[0561] 并且最后
[0562] 等式17
[0563] 等式17与等式13相同,用 替换H0,并且在左侧添加了(1+H01)系数。这个额外的系数(1+H01)意指在这个情形中不能直接地求出S,但是对于该信号可以产生加上它所有的回音的添加的解法。这不是如此坏的情形,因为有许多用于处理回音抑制的常规方法,并且即使回音没有被抑制,它们也不见得会影响任何有意义程度的语音的可理解性。需要更复杂的 的计算来解决MIC2中的充当噪音源的回音。
[0564] 图34是根据实施例的降噪算法的流程图3400。操作中,在方框3402,接收声学信号。 此外,在方框3404,接收与人类调声活动相关联的生理学信息。在方框3406,一旦确定在至少一个指定的时段内声学信号中不存在调声信息,就计算表示声学信号的第一传递函数。在方框3408,一旦确定在至少一个指定的时段内声学信号中存在调声信息,就计算表示声学信号的第二传递函数。在方框3410,使用第一传递函数和第二传递函数的至少一个组合,制造经降噪的声学数据流,以从声学信号中去除噪音。
[0565] 此处从具有直接路径的单个噪音源的最简单的情况到具有反射和回音的多个噪音源,描述了用于噪音去除的算法或者降噪算法。此处已经显示该算法在任何环境条件下是可行的。如果已经对 和 做出了良好的估算,并且如果在一个基本上不变化的同时计算另一个,则噪音的类型和数量是无关紧要的。如果用户环境存在回音,则在它们来自噪音源的情况下,它们可以被补偿。如果还存在信号回音,则它们将影响干净的信号,但是在大多数环境中该影响应该是可以忽略的。
[0566] 操作中,实施例的算法已经在处理各种噪声类型、振幅和方位的方面显示了极好的结果。但是,当从数学概念移动到工程应用时,总有不得不做出的近似值和调整。在等式8中做出了一个假定,其中H2(z)被假定为小,因此H2(z)H1(z)≈0,以致等式8减少成 [0567] S(z)≈M1(z)-M2(z)H1(z)
[0568] 这意指只有H1(z)必须被计算,加快了处理并且相当大地减少了所需的计算的数目。随着传声器的适当选择,容易地实现这个近似值。
[0569] 另一个近似值涉及实施例中使用的滤波器。实际的H1(z)将无疑地具有极点和零点两者,但是为了稳定性和简单性,使用全零有限脉冲响应(FIR)滤波器。利用足够的分接头,实际的H1(z)的近似值可以是非常好的。
[0570] 为了进一步地增加噪音抑制系统的性能,感兴趣的光谱(通常大约125到3700Hz)被分成次能带。必须计算传递函数的频率范围越宽,就越难精确地计算它。因此,声学数据被分成16个次能带,然后将降噪算法依次应用于每个次能带。最后,16个经降噪的数据流被重新组合,以得到经降噪的声学数据。这工作得非常好,但是可以使用次能带的任何组合(即,4、6、8、32、等距的、感知间隔的等等),并且已经发现全部都比单个次能带工作得好。 [0571] 在实施例中抑制噪音的振幅,因此使用的传声器不渗透(即,在线性响应区域外操作)。重要的是,传声器线性地操作以确保最好的性能。即使采用这个限制,也可以使非常低的信噪比(SNR)信号降噪(降至-10dB以下)。
[0572] 使用最小均方(LMS)方法,通用的自适应传递函数,每10毫秒实现H1(z)的计算。可以由Widrow和Steams在Prentice-Hall、ISBN0-13-004029-0发表的“自适应信号处理 (Adaptive Signal Processing)(1985)”中找到说明。为了示范的目的而使用LMS,但是许多其他的系统识别技术可以被用于识别图31中的H1(z)和H2(z)。
[0573] 用于实施例的VAD来源于射频传感器和两个传声器,对于浊语音和清语音两者得到非常高的精确度(>99%)。实施例的VAD使用射频(RF)振动检测器干涉计来检测与人类语音制造相关联的组织动作,但是不会如此限制。来自RF装置的信号完全是无噪声的,并且能够在任何噪声环境中起作用。简单的RF信号的能量测量可以被用于判定是否出现浊语音。可以使用常规的基于声学的方法,通过接近于使用RF传感器或者相似的调声传感器判定的浊音部分,或者经由以上的组合,来判定清语音。因为在清语音中有很少的能量,所以它的检测精确度对于好的噪音抑制性能没有浊语音关键。
[0574] 采用可靠检测的浊语音和清语音,可以实现实施例的算法。再次,对于重复有用的是,噪音去除算法不取决于如何获得VAD,而仅仅取决于它尤其对于浊语音是精确的。如果没有检测语音并且对准出现在语音上,则随后的经降噪的声学数据可能失真。 [0575] 在四个信道中收集数据,一个信道用于MIC1、一个信道用于MIC2、以及两个信道用于检测与浊语音相关联的组织动作的射频传感器。数据在40kHz处被同步采样,然后被数字滤波并且被骤降至8kHz。使用高采样率来减少可能由模数处理引起的任何混叠。四信道国家仪器(National Instruments)A/D板与虚拟仪器(Labview)一起使用来捕获和存储数据。然后,该数据被读入C程序并且每10毫秒被降噪一次。
[0576] 图35显示根据实施例的当将实施例的噪音抑制算法应用到不干净的声学信号3504时输出的经降噪的音频3502信号。不干净的声学信号3504包含说美式英语的女性在有航站楼噪音的情况下的语音,其中该噪音包含许多其他人类说话者以及公众广播。说话者在适度的航站楼噪音当中正在发出数字“4065562”。不干净的声学信号3504每10毫秒被降噪一次,并且在降噪10毫秒数据之前,不干净的声学信号3504从50到3700Hz被前置滤波。近似17dB的噪音减少是明显的。在这个样本上没有实行后置滤波;因此,实现的所有的降噪都归因于实施例的算法。显然,该算法立即调节该噪音,并且能够去除其他人类说话者的非常难的噪音。已经测试包含街道噪音、直升飞机、音乐和正弦波的许多不同类型的噪音全部都具有相似的结果。同样,噪音的方位可能实质上变化,而不显著地改变噪音抑制性能。最后,干净的语音的失真非常低,确保了用于语音识别引擎和类似人类接收器的好的性能。
[0577] 已经显示了实施例的噪音去除算法在任何环境条件下是可行的。如果已经对和 做出了良好的估算,则噪音的类型和数量是无关紧要的。如果用户环境存在回音,则在它们来自噪音源的情况下,可以被补偿。如果还存在信号回音,则它们将影响干净的信号, 但是在大多数环境中该影响应该是可以忽略的。
[0578] 当使用此处描述的具有噪音抑制系统的VAD装置和方法时,VAD信号独立于噪音抑制系统被处理,因此VAD信息的接收和处理独立于与噪音抑制相关联的处理,但是本实施例不会如此限制。物理上获得这个独立性(即,在接收和处理与VAD和噪音抑制有关的信号的过程中使用不同的硬件),但是不会如此限制。
[0579] 此处描述的VAD装置/方法通常包含振动和移动传感器,但是不会如此限制。在一个实施例中,为了检测与人类语音相关的皮肤表面振动,加速计被置于皮肤上。这些记录的振动然后被用于计算VAD信号,该VAD信号在抑制来自同步(几毫秒内)记录的声学信号的环境噪声的过程中供或者由自适应噪音抑制算法使用。
[0580] 此处描述的VAD装置/方法的另一个实施例包含利用膜片修改的声学传声器,因此该传声器不再有效地检测空气中的声学振动。然而,该膜片允许传声器检测与它物理接触(允许良好的机械阻抗匹配)的对象,诸如人类皮肤中的声学振动。也就是说,声学传声器以某些方式被修改,以致它不再检测空气中的声学振动(其中它不再具有良好的物理的阻抗匹配),而是仅仅检测与该传声器接触的对象中的声学振动。这像加速计一样,配置该传声器来检测与那个人类的语音制造相关联的人类皮肤的振动,而没有有效地检测空气中的声学环境噪音。如以下详述的,检测到振动被处理以形成用于噪音抑制系统的VAD信号。 [0581] 此处描述的VAD的又一个实施例使用检测皮肤振动的电磁式振动传感器,诸如射频振动计(RF)或者激光振动计。此外,RF振动计检测身体内的组织的移动,诸如面颊或者气管壁的内表面的移动。如以下详述的,与语音制造相关联的外部皮肤和内部组织振动两者都可以被用于形成用于噪音抑制系统的VAD信号。
[0582] 图36A是根据实施例的VAD系统3602A的方框图,VAD系统3602A包含用于接收和处理与VAD有关的信号的硬件。VAD系统3602A包含VAD装置3630,该VAD装置3630被耦接以便将数据提供到相应的VAD算法3640。注意,替换实施例的噪音抑制系统可以以对本领域中的那些技术人员而言是显而易见的任何方式来使VAD算法的一些或者全部功能与噪音抑制处理集成。例如,参考图30,调声传感器3020包含VAD系统3602A,但是不会如此限制。例如,参考图31,VAD包含VAD系统3602A,但是不会如此限制。
[0583] 图36B是根据实施例的VAD系统3602B的方框图,VAD系统3602B使用用于接收VAD信息3664的关联的噪音抑制系统3601的硬件。VAD系统3602B包含VAD算法3650,VAD算法3650接收来自相应的信号处理系统3600的MIC1和MIC2或者其他部件的数据3664。噪音抑制系统的替换实施例可以以对本领域中的那些技术人员而言是显而易见的 任何方式来使VAD算法的一些或者全部功能与噪音抑制处理集成。
[0584] 此处描述的基于振动/移动的VAD装置包含用于接收和处理与VAD和噪音抑制有关的信号的物理硬件装置。当说话者或者用户制造语音时,产生的振动经由说话者的组织传播,并且因此可以使用各种方法在皮肤上以及在皮肤下面被检测。这些振动是极好的VAD信息源,因为它们与浊语音和清语音两者强大地关联(虽然清语音振动很弱并且难以检测),并且通常仅仅稍微受环境噪声的影响(一些装置/方法,例如以下描述的电磁式振动计不受环境噪声的影响)。使用多个VAD装置来检测这些组织振动或者移动,多个VAD装置例如包含基于加速计的装置、皮肤表面传声器(SSM)装置以及电磁式(EM)振动计装置,电磁式(EM)振动计装置包含射频(RF)振动计以及激光振动计两者。
[0585] 基于加速计的VAD装置/方法
[0586] 加速计可以检测与语音相关联的皮肤振动。照此,并且参考图31和图36A,实施例的VAD系统3602A包含基于加速计的装置3630,该基于加速计的装置3630将皮肤振动的数据提供到关联的算法3640。如此处描述的,实施例的算法3640使用能量计算技术以及阈值比较,但是不会如此限制。注意,对于本领域中的那些技术人员而言,更复杂的基于能量的方法是可用的。
[0587] 图37是根据实施例的用于使用基于加速计的VAD来判定浊语音和清语音的方法的流程图3700。通常,通过限定出现该计算的标准的窗口大小以及对随着时间过去的振幅的平方进行求和来计算能量,作为
[0588]
[0589] 其中i是数字采样下标,并且范围是从窗口的开始到窗口的结束。
[0590] 参考图37,在方框3702,一旦接收到加速计数据,就开始操作。在方框3704,与VAD相关联的处理包含对来自加速计的数据进行滤波以排除混叠,并且使经滤波的数据数字化而用于处理。在方框3706,数字化的数据被分割成长度20毫秒(ms)的窗口,并且每8毫秒使该数据步进一次。在方框3708,该处理进一步包含对窗口数据进行滤波,以去除搀杂了噪音或者其他多余物的光谱信息。在方框3710,如上所述,通过对振幅的平方求和来计算每个窗口中的能量。经计算的能量值可以通过以窗口长度划分能量值来被标准化;但是,这涉及额外的计算,并且只要窗口长度不改变,就不是必需的。
[0591] 在方框3712,经计算的或者标准化的能量值与阈值比较。在方框3714,当加速计数据的能量处于阈值或者超过阈值时,与加速计数据相对应的语音被指定为浊语音。同样地,在方框3716,当加速计数据的能量低于阈值时,与加速计数据相对应的语音被指定为清语 音。替换实施例的噪音抑制系统可以使用多个阈值来指示调声信号的相对强度或者可靠度,但是不会被如此限制。多个次能带也可以被处理用于增加的精确度。
[0592] 图38显示根据实施例的包括嘈杂的音频信号(现场录音)3802以及相应的基于加速计的VAD信号3804、相应的加速计输出信号3812、和接着使用VAD信号3804通过噪音抑制系统处理的经降噪的音频信号3822的曲线图。这个实施例的噪音抑制系统包含来自PCB Piezotronics的加速计(型号352A24),但是不会如此限制。在这个实例中,加速计数据已经在500和2500Hz之间被带通滤波,以便去除可能在500Hz以下耦接到该加速计的多余的噪声。使用传声器组以及标准加速计,在一侧测量为六(6)英尺并且具有八(8)英尺的室内净高的室内,在多路串扰噪音环境中,记录音频信号3802。该传声器组例如能够从加利福尼亚州布里斯班的艾利佛得到。噪音抑制系统被实时地实现,具有近似10毫秒的延迟。原始的音频信号3802和经降噪的音频信号3822中的差异显示了近似在25-30dB范围内的噪音抑制,具有很少的期望语音信号的失真。因此,使用基于加速计的VAD信息的降噪是非常有效的。
[0593] 皮肤表面传声器(SSM)VAD装置/方法
[0594] 再次参考图31和图36A,实施例的VAD系统3602A包含SSM VAD装置3630,该SSM VAD装置3630将数据提供到关联的算法3640。SSM是被修改成防止空气传播的声学信息与传声器的检测元件耦接的常规的传声器。树脂层或者其他覆盖物改变了传声器的阻抗,并且显著程度地防止了空气传播的声学信息被检测到。因此,这个传声器屏蔽了空气传播的声能,但是只要它维持与介质的物理接触,就能够检测在除了空气之外的介质中传播的声波。硅树脂或者相似的材料允许传声器机械地与用户的皮肤有效地耦接。
[0595] 在语音期间,当SSM被置于面颊或者颈部上时,与语音制造相关联的振动被容易地检测。但是,空气传播的声学数据没有被SSM显著地检测。如以上参考与基于加速计的VAD信号一起使用的能量/阈值方法和图37描述的,一旦被SSM检测到,组织传播的声学信号就被用于在处理感兴趣的信号和使感兴趣的信号降噪的过程中产生VAD信号。 [0596] 图39显示根据实施例的包括嘈杂的音频信号(现场录音)3902以及相应的基于SSM的VAD信号3904、相应的SSM输出信号3912、和接着使用VAD信号3904通过噪音抑制系统处理的经降噪的音频信号3922的曲线图。使用艾利佛传声器组以及标准加速计,在一侧测量为六(6)英尺并且具有八(8)英尺的室内净高的室内,在多路串扰噪音环境中,记录音频信号3902。噪音抑制系统被实时地实现,具有近似10毫秒的延迟。原始的音频信号3902和经降噪的音频信号3922中的差异清楚地显示了近似在20-25dB范围内的噪音抑制,具有很少的期望语音信号的失真。因此,使用基于SSM的VAD信息的降噪是 有效的。 [0597] 电磁式(EM)振动计VAD装置/方法
[0598] 回到图31和图36A,实施例的VAD系统3602A包含EM振动计VAD装置3630,该EM振动计VAD装置3630将数据提供到关联的算法3640。EM振动计装置还检测组织振动,但是可以在一段距离处这样做并且没有与作为测量目标的组织直接接触。此外,一些EM振动计装置可以检测人体的内部组织的振动。EM振动计不受噪声影响,使得它们是用于高的噪音环境的良好的选择。实施例的噪音抑制系统接收来自EM振动计的VAD信息,EM振动计包括但不限于RF振动计以及激光振动计,下面依次描述每个振动计。
[0599] RF振动计在到电磁波谱的微波部分的无线电中操作,并且能够测量与语音制造相关联的内部人类组织的相对运动。内部人类组织包含气管、面颊、颌和/或鼻/鼻部通道的组织,但是不会如此限制。RF振动计使用低功率无线电波来感测移动,并且已经显示来自这些装置的数据与校准目标对应得非常好。作为RF振动计信号中不存在噪声的结果,实施例的VAD系统使用来自这些装置的信号,以便使用上面参考基于加速计的VAD和图37描述的能量/阈值方法来构造VAD。
[0600] RF振动计的实例是能够从位于加利福尼亚州布里斯班的艾利佛得到的通用电磁式运动传感器(GEMS)无线电振动计。其他的RF振动计在相关的申请中以及由Gregory C.Burnett(格雷戈里·C·伯内特)1999年1月在加州大学戴维斯分校的哲学博士论文“The Physiological Basis of Glottal Electromagnetic Micropower Sensors(GEMS)and Their Use in Defining an Excitation Function Excitation Function for the Human Vocal Tract(声电磁式微功率传感器(GEMS)的生理基础以及它们在限定用于人类声道的激发函数中的使用)”中被描述。
[0601] 激光振动计在光的可见频率处或者附近操作,并且因此与上面描述的加速计和SSM相似,仅仅被局限于表面振动检测。与RF振动计一样,没有与激光振动计的信号相关联的噪声。因此,实施例的VAD系统使用来自这些装置的信号,以便使用上面参考基于加速计的VAD和图37描述的能量/阈值方法来构造VAD。
[0602] 图40显示了根据实施例的包括嘈杂的音频信号(现场录音)4002以及相应的基于GEMS的VAD信号4004、相应的GEMS输出信号4012、和接着使用VAD信号4004通过噪音抑制系统处理的经降噪的音频信号4022的曲线图。从来自加利福尼亚州布里斯班的艾利佛的气管安装的GEMS无线电振动计中接收基于GEMS的VAD信号4004。使用艾利佛传声器组,在一侧测量为六(6)英尺并且具有八(8)英尺的室内净高的室内,在多路串扰噪音环境中,记录音频信号4002。噪音抑制系统被实时地实现,具有近似10毫秒 的延迟。原始的音频信号4002和经降噪的音频信号4022中的差异清楚地显示了在近似20-25dB范围内的噪音抑制,具有很少的期望语音信号的失真。因此,使用基于GEMS的VAD信息的降噪是有效的。显然,即使GEMS没有检测清语音,VAD信号和降噪两者也都是有效的。清语音通常能量足够低,以致它不会显著地影响H1(z)的收敛以及因此的经降噪的语音的质量。 [0603] 此处描述的实施例包含一种系统,所述系统包括多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述WCD包含至少一个传声器。所述系统包含电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道。所述音频处理器从接收自所述WCD的信号产生第一音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者。所述连接部件接收来自所述远端参与者的第二音频信号。所述系统包含喇叭,所述喇叭被耦接到所述连接部件并且输出所述第二音频信号。
[0604] 此处描述的实施例包含一种系统,所述系统包括:无线通信装置(WCD),所述无线通信装置(WCD)在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带,其中所述WCD包含至少一个传声器;电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道,其中所述音频处理器从接收自所述WCD的信号产生第一音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述连接部件接收来自所述远端参与者的第二音频信号;以及喇叭,所述喇叭被耦接到所述连接部件并且输出所述第二音频信号。
[0605] 实施例的所述至少一个传声器包括全向传声器。
[0606] 实施例的所述至少一个传声器包括定向传声器。
[0607] 实施例的所述至少一个传声器包括两个传声器。
[0608] 实施例的所述WCD包括信号处理器,所述信号处理器被耦接到所述至少一个传声器。
[0609] 实施例的所述信号处理器对于来自所述至少一个传声器的信号进行多路分配。 [0610] 实施例的所述信号处理器对于来自所述至少一个传声器的信号进行回音消除。 [0611] 实施例的所述信号处理器对于来自所述至少一个传声器的信号进行噪音抑制。 [0612] 实施例的所述信号处理器对于来自所述至少一个传声器的信号进行语音活动检测。
[0613] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。 [0614] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器以及所述信号处理器,其中所述悬挂物被佩带在所述近端参与者上。
[0615] 实施例的所述WCD包含所述喇叭,其中所述电话网关将所述第二音频信号传输到所述WCD,以及所述喇叭输出所述第二音频信号。
[0616] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器、所述喇叭以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
[0617] 实施例的所述WCD被硬编码到所述电话网关。
[0618] 实施例的所述WCD包含检测器,所述检测器电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
[0619] 实施例的所述电话网关包含所述喇叭。
[0620] 实施例的所述喇叭输出所述第一音频信号。
[0621] 实施例的所述喇叭输出所述第二音频信号。
[0622] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器,其中所述悬挂物被佩带在所述近端参与者上。
[0623] 实施例的所述系统包括电话接口,所述电话接口被耦接到所述连接部件,其中所述电话接口被用于控制所述电话呼叫的参数。
[0624] 实施例的所述电话接口包含拨号接口。
[0625] 实施例的所述无线收发机包括蓝牙收发机。
[0626] 实施例的所述电话网关包含充电器,其中所述WCD耦接到所述充电器以便再充电。
[0627] 实施例的所述WCD包含配对模式,其中在所述配对模式中,所述WCD搜索所述电话网关以及与其电配对的至少一个其他的WCD中的至少一个。
[0628] 实施例的所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的所述WCD。
[0629] 实施例的在所述WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为瞬间的所述配对随后通过所述电话网关被擦除。
[0630] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行多路分配。 [0631] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行回音消除。 [0632] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行噪音抑制。 [0633] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行语音活动检测。 [0634] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行空间化。 [0635] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行均衡化。 [0636] 所述连接部件管理与所述WCD的所述音频信道。
[0637] 实施例的系统包括包含所述WCD的多个无线通信装置(WCD),其中所述多个WCD在所述电话呼叫期间被多个近端参与者佩带。
[0638] 实施例的所述电话网关包括包含所述无线收发机的多个无线收发机,其中所述多个无线收发机被耦接到所述音频处理器,其中每个无线收发机与所述多个WCD中的对应WCD电配对并且提供与所述对应WCD的专用信道。
[0639] 实施例的所述多个无线收发机包括多个蓝牙收发机。
[0640] 实施例的所述电话网关电标记来自每个WCD的每个输入信号。
[0641] 实施例的所述音频处理器集成从所述多个WCD接收到的信号以产生所述第一音频信号。
[0642] 实施例的所述音频处理器通过为对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
[0643] 当所述近端参与者正在说话时,实施例的所述动态增益的所述计算包括计算均方根。
[0644] 实施例的所述电话网关将所述第二音频信号传输到所述多个WCD。
[0645] 实施例的系统包括包含所述喇叭的多个喇叭,其中所述多个WCD中的每个WCD包含所述多个喇叭中的一个喇叭,其中所述电话网关将所述第二音频信号传输到所述多个WCD,并且所述多个喇叭输出所述第二音频信号。
[0646] 实施例的所述连接部件管理与所述多个WCD的所述专用信道。
[0647] 实施例的每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预先指定的范围内的至少一个WCD。
[0648] 此处描述的实施例包含一种系统,所述系统包括至少一个无线通信装置(WCD),所述至少一个无线通信装置(WCD)在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带。所述系统包含电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道。所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0649] 此处描述的实施例包含一种系统,所述系统包括:至少一个无线通信装置(WCD),所述至少一个无线通信装置(WCD)在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带;以及电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0650] 此处描述的实施例包含一种系统,所述系统包括多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述系统包含电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中的每个WCD形成专用音频信道。所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0651] 此处描述的实施例包含一种系统,所述系统包括:多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带;以及电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中的每个WCD形成专用音频信道,其中所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0652] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置(WCD)形成至少一个音频信道,所述至少一个无线通信装置(WCD)对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带。所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与 者。 [0653] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置(WCD)形成至少一个音频信道,所述至少一个无线通信装置(WCD)对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0654] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置(WCD)形成多个音频信道,所述多个无线通信装置(WCD)对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带。所述音频处理器从接收自所述多个WCD的信号产生集成的音频信号。所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0655] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置(WCD)形成多个音频信道,所述多个无线通信装置(WCD)对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带,其中所述音频处理器从接收自所述多个WCD的所述信号产生集成的音频信号,其中所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0656] 此处描述的实施例包含一种系统,所述系统包括多个无线通信装置(WCD)。每个WCD在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述系统包含电话网关,所述电话网关包含多个收发机。每个收发机与所述多个WCD中的对应WCD电配对并且提供与所述对应WCD的专用信道。所述系统包含处理器,所述处理器被耦接到所述多个收发机。所述处理器将从所述多个WCD接收到的信号集成到所述第一音频信号中。所述系统包含电话部件,所述电话部件被耦接到所述处理器以及输送所述电话呼叫的网络。所述电话部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者。所述电话部件接收来自所述远端参与者的第二音频信号。所述系统包含电话接口,所述电话接口被耦接到所述电话部件。所述电话接口被用于控制所述电话呼叫的参数。
[0657] 此处描述的实施例包含一种系统,所述系统包括:多个无线通信装置(WCD),其中 每个WCD在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带;以及电话网关,所述电话网关包含多个收发机,其中每个收发机与所述多个WCD中的对应WCD电配对并且提供与所述对应WCD的专用信道;处理器,所述处理器被耦接到所述多个收发机,其中所述处理器将从所述多个WCD接收到的信号集成到第一音频信号中;电话部件,所述电话部件被耦接到所述处理器以及输送所述电话呼叫的网络,其中所述电话部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述电话部件接收来自所述远端参与者的第二音频信号;电话接口,所述电话接口被耦接到所述电话部件,其中所述电话接口被用于控制所述电话呼叫的参数。
[0658] 实施例的所述WCD包含至少一个传声器。
[0659] 实施例的所述至少一个传声器包括全向传声器。
[0660] 实施例的所述至少一个传声器包括定向传声器。
[0661] 实施例的所述WCD包括信号处理器,所述信号处理器被耦接到所述至少一个传声器。
[0662] 实施例的所述信号处理器对于来自每个WCD的每个输入信号进行多路分配。 [0663] 实施例的所述信号处理器对于来自每个WCD的每个输入信号进行回音消除。 [0664] 实施例的所述信号处理器对于来自每个WCD的每个输入信号进行噪音抑制。 [0665] 实施例的所述信号处理器对于来自每个WCD的每个输入信号进行语音活动检测。 [0666] 实施例的所述信号处理器电标记从每个WCD输出的每个信号。
[0667] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。 [0668] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器以及所述信号处理器,其中所述悬挂物被佩带在所述近端参与者上。
[0669] 实施例的每个WCD包含喇叭,所述喇叭被耦接到所述信号处理器。
[0670] 实施例的所述电话网关将所述第二音频信号传输到所述多个WCD。
[0671] 实施例的所述喇叭输出所述第二音频信号。
[0672] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器、所述喇叭以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。
[0673] 实施例的每个WCD被硬编码到所述电话网关。
[0674] 使用无线耦接,实施例的至少一个WCD被耦接到所述电话网关。
[0675] 使用有线耦接,实施例的至少一个WCD被耦接到所述电话网关。
[0676] 实施例的每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预 先指定的范围内的至少一个WCD。
[0677] 实施例的所述处理器通过为对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
[0678] 当所述近端参与者正在说话时,实施例的所述动态增益的所述计算包括计算均方根。
[0679] 实施例的所述电话网关包含喇叭,所述喇叭被耦接到所述处理器。
[0680] 实施例的所述喇叭输出所述第一音频信号。
[0681] 实施例的所述喇叭输出所述第二音频信号。
[0682] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述至少一个传声器,其中所述悬挂物被佩带在所述近端参与者上。
[0683] 实施例的所述电话接口包含拨号接口。
[0684] 实施例的所述多个收发机包括多个蓝牙收发机。
[0685] 实施例的所述电话网关电标记来自每个WCD的每个输入信号。
[0686] 实施例的所述电话网关包含充电器,其中所述多个WCD耦接到所述充电器以便再充电。
[0687] 实施例的至少一个WCD包含配对模式,其中在所述配对模式中,所述至少一个WCD搜索所述电话网关以及与其电配对的至少一个其他的WCD中的至少一个。
[0688] 实施例的所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的至少一个WCD。
[0689] 实施例的在所述多个WCD中的一个WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为瞬间的所述配对随后通过所述电话网关被擦除。
[0690] 实施例的所述处理器包括音频处理子系统。
[0691] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行多路分配。 [0692] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行回音消除。 [0693] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行噪音抑制。 [0694] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行语音活动检测。
[0695] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行空间化。 [0696] 实施例的所述音频处理子系统对于来自每个WCD的每个输入信号进行均衡化。 [0697] 实施例的所述处理器包括连接管理子系统,所述连接管理子系统管理带有所述多个WCD的所述专用信道。
[0698] 此处描述的实施例包含一种方法,所述方法包括建立多个无线通信装置(WCD)和电 话网关之间的电配对,所述电话网关对于所述多个WCD是远程的。所述多个WCD被多个近端参与者佩带。所述方法包含在所述电话网关处接收来自所述多个WCD的音频信号。所述方法包含响应于所述音频信号产生第一音频信号。所述产生包括集成来自所述多个WCD的所述音频信号。所述方法包含通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0699] 此处描述的实施例包含一种方法,所述方法包括:建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的,其中所述多个WCD被多个近端参与者佩带;在所述电话网关处接收来自所述多个WCD的音频信号;响应于所述音频信号产生第一音频信号,所述产生包括集成来自所述多个WCD的所述音频信号;以及通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0700] 此处描述的实施例包含一种方法,所述方法包括建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的。所述多个WCD在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述方法包含在所述电话网关处接收来自所述多个WCD的音频信号。所述方法包含响应于所述音频信号产生第一音频信号。所述产生包括集成来自所述多个WCD的所述音频信号。所述方法包含将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者。所述方法包含在所述电话网关处接收来自所述远端参与者的第二音频信号;以及在被耦接到所述电话网关的喇叭处输出所述第二音频信号。
[0701] 此处描述的实施例包含一种方法,所述方法包括:建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的,其中所述多个WCD在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带;在所述电话网关处接收来自所述多个WCD的音频信号;响应于所述音频信号产生第一音频信号,所述产生包括集成来自所述多个WCD的所述音频信号;将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者;在所述电话网关处接收来自所述远端参与者的第二音频信号;以及在被耦接到所述电话网关的喇叭处输出所述第二音频信号。
[0702] 实施例的所述电配对的所述建立包括建立所述电话网关的至少一个无线收发机和所述多个WCD中的对应WCD之间的电配对,其中所述电配对提供所述电话网关和所述对应WCD之间的专用信道。
[0703] 实施例的所述音频信号的所述集成包括为对应于每个WCD的每个专用信道计算动态 增益。
[0704] 当所述近端参与者正在说话时,实施例的所述动态增益的所述计算包括计算均方根。
[0705] 实施例的所述方法包括电标记来自每个WCD的每个信号。
[0706] 实施例的每个WCD包括至少一个传声器。
[0707] 实施例的所述至少一个传声器包括全向传声器。
[0708] 实施例的所述至少一个传声器包括定向传声器。
[0709] 实施例的所述至少一个传声器包括两个传声器。
[0710] 实施例的所述方法包括多路分配在每个WCD处接收到的信号。
[0711] 实施例的所述方法包括对在每个WCD处接收到的信号进行回音消除。
[0712] 实施例的所述方法包括对在每个WCD处接收到的信号进行噪音抑制。
[0713] 实施例的所述方法包括对在每个WCD处接收到的信号进行语音活动检测。 [0714] 实施例的所述方法包括将所述喇叭定位在每个WCD中。实施例的所述方法包括将所述第二音频信号传输到每个WCD以及借助于所述喇叭输出所述第二音频信号。 [0715] 实施例的所述方法包括将所述喇叭定位在该电话网关中。
[0716] 实施例的所述方法包括借助于所述喇叭输出所述第一音频信号。
[0717] 实施例的所述方法包括借助于所述喇叭输出所述第二音频信号。
[0718] 实施例的所述方法包括将每个WCD硬编码到所述电话网关。
[0719] 实施例的所述方法包括电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
[0720] 实施例的所述方法包括使用所述电话网关的电话接口来控制所述电话呼叫的参数。
[0721] 实施例的所述无线收发机包括蓝牙收发机。
[0722] 实施例的所述方法包括使用所述WCD的充电器使每个WCD在所述电话网关处再充电。
[0723] 实施例的所述方法包括每个WCD搜索与其电配对的至少一个其他的WCD。 [0724] 实施例的所述方法包括每个WCD搜索与其建立所述电配对的所述电话网关。 [0725] 实施例的所述方法包括所述电话网关搜索与其建立所述电配对的WCD。 [0726] 实施例的所述方法包括将至少一个WCD和所述电话网关之间的所述电配对归类为瞬间的。实施例的所述方法包括在完成所述电话呼叫之后擦除所述电配对的信息。 [0727] 实施例的所述方法包括在所述电话网关处多路分配来自每个WCD的每个输入信号。
[0728] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行回音消除。
[0729] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行噪音抑制。
[0730] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行语音活动检测。
[0731] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行空间化。
[0732] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行均衡化。
[0733] 实施例的所述方法包括在所述电话网关处管理和控制带有所述WCD的所述音频信道。
[0734] 此处描述的实施例包含一种系统,所述系统包括多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述WCD包含传声器阵列。所述系统包含电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道。所述音频处理器从接收自所述WCD的信号产生第一音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者。所述连接部件接收来自所述远端参与者的第二音频信号。所述系统包含喇叭,所述喇叭被耦接到所述连接部件并且输出所述第二音频信号。
[0735] 此处描述的实施例包含一种系统,所述系统包括:无线通信装置(WCD),所述无线通信装置(WCD)在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带,其中所述WCD包含传声器阵列;电话网关,所述电话网关对于所述WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到无线收发机,所述无线收发机与所述WCD形成音频信道,其中所述音频处理器从接收自所述WCD的信号产生第一音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者,其中所述连接部件接收来自所述远端参与者的第二音频信号;以及喇叭,所述喇叭被耦接到所述连接部件并且输出所述第二音频信号。
[0736] 实施例的所述传声器阵列包括至少一个全向传声器。
[0737] 实施例的所述传声器阵列包括至少一个定向传声器。
[0738] 实施例的所述传声器阵列包括两个传声器。
[0739] 实施例的所述WCD包括信号处理器,所述信号处理器被耦接到所述传声器阵列。 [0740] 实施例的所述信号处理器对来自所述传声器阵列的信号进行多路分配。 [0741] 实施例的所述信号处理器对来自所述传声器阵列的信号进行回音消除。 [0742] 实施例的所述信号处理器对来自所述传声器阵列的信号进行噪音抑制。 [0743] 实施例的所述信号处理器对来自所述传声器阵列的信号进行语音活动检测。 [0744] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述至少一个传声器以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。 [0745] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述传声器阵列以及所述信号处理器,其中所述悬挂物被佩带在所述近端参与者上。
[0746] 实施例的所述WCD包含所述喇叭,其中所述电话网关将所述第二音频信号传输到所述WCD,以及所述喇叭输出所述第二音频信号。
[0747] 实施例的所述WCD包括头戴式耳机,所述头戴式耳机包含所述传声器阵列、所述喇叭以及所述信号处理器,其中所述头戴式耳机被佩带在所述近端参与者的头部区域中。 [0748] 实施例的所述WCD被硬编码到所述电话网关。
[0749] 实施例的所述WCD包含检测器,所述检测器电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
[0750] 实施例的所述电话网关包含所述喇叭。
[0751] 实施例的所述喇叭输出所述第一音频信号。
[0752] 实施例的所述喇叭输出所述第二音频信号。
[0753] 实施例的所述WCD包括悬挂物,所述悬挂物包含所述传声器阵列,其中所述悬挂物被佩带在所述近端参与者上。
[0754] 实施例的所述系统包括电话接口,所述电话接口被耦接到所述连接部件,其中所述电话接口被用于控制所述电话呼叫的参数。
[0755] 实施例的所述电话接口包含拨号接口。
[0756] 实施例的所述无线收发机包括蓝牙收发机。
[0757] 实施例的所述电话网关包含充电器,其中所述WCD耦接到所述充电器以便再充电。
[0758] 实施例的所述WCD包含配对模式,其中在所述配对模式中,所述WCD搜索所述电话网关以及与其电配对的至少一个其他的WCD中的至少一个。
[0759] 实施例的所述电话网关包含配对模式,其中在所述配对模式中,所述电话网关搜索与其电配对的所述WCD。
[0760] 实施例的在所述WCD和所述电话网关之间的电配对被归类为瞬间的,其中被归类为 瞬间的所述配对随后通过所述电话网关被擦除。
[0761] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行多路分配。 [0762] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行回音消除。 [0763] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行噪音抑制。 [0764] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行语音活动检测。 [0765] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行空间化。 [0766] 实施例的所述音频处理器对于来自每个WCD的每个输入信号进行均衡化。 [0767] 所述连接部件管理带有所述WCD的所述音频信道。
[0768] 实施例的系统包括包含所述WCD的多个无线通信装置(WCD),其中所述多个WCD在所述电话呼叫期间被多个近端参与者佩带。
[0769] 实施例的所述电话网关包括包含所述无线收发机的多个无线收发机,其中所述多个无线收发机被耦接到所述音频处理器,其中每个无线收发机与所述多个WCD中的对应WCD电配对并且提供与所述对应WCD的专用信道。
[0770] 实施例的所述多个无线收发机包括多个蓝牙收发机。
[0771] 实施例的所述电话网关电标记来自每个WCD的每个输入信号。
[0772] 实施例的所述音频处理器集成从所述多个WCD接收到的信号以产生所述第一音频信号。
[0773] 实施例的所述音频处理器通过为对应于每个WCD的每个专用信道计算动态增益来集成从所述多个WCD接收到的信号。
[0774] 当所述近端参与者正在说话时,实施例的所述动态增益的所述计算包括计算均方根。
[0775] 实施例的所述电话网关将所述第二音频信号传输到所述多个WCD。
[0776] 实施例的系统包括包含所述喇叭的多个喇叭,其中所述多个WCD中的每个WCD包含所述多个喇叭中的一个喇叭,其中所述电话网关将所述第二音频信号传输到所述多个WCD,并且所述多个喇叭输出所述第二音频信号。
[0777] 实施例的所述连接部件管理与所述多个WCD的所述专用信道。
[0778] 实施例的每个WCD包含检测器,其中WCD的所述检测器电检测在所述WCD的预先指定的范围内的至少一个WCD。
[0779] 实施例的传声器阵列包括第一虚拟传声器,所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号。实施例的传声器阵列包括第二虚拟传声器,所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述 第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0780] 实施例的所述第一和第二物理传声器是全向的。
[0781] 实施例的所述第一虚拟传声器对于缺少零位的语音具有第一线性响应,其中所述语音是人类语音。
[0782] 实施例的第所述二虚拟传声器对于包含单个零位的语音具有第二线性响应,所述单个零位被定向在朝向语音源的方向上。
[0783] 实施例的所述单个零位是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级低的测量的响应等级的区域。
[0784] 实施例的所述第二线性响应包含被定向在远离所述语音源的方向上的主瓣。 [0785] 实施例的所述主瓣是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级大的测量的响应等级的区域。
[0786] 实施例的所述第一物理传声器和所述第二物理传声器沿着轴被安置,并且被分开第一距离。
[0787] 实施例的所述轴的中点是离开产生所述语音的语音源的第二距离,其中所述语音源被定位在相对于所述中点由角度限定的方向上。
[0788] 实施例的所述第一虚拟传声器包括从所述第一传声器信号中减去的所述第二传声器信号。
[0789] 实施例的所述第一传声器信号被延迟。
[0790] 实施例的所述延迟被升幂,所述幂与所述语音到达所述第一虚拟传声器和所述语音到达所述第二虚拟传声器之间的时间差成比例。
[0791] 实施例的所述延迟被升幂,所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0792] 实施例的所述第二传声器信号乘以比率,其中所述比率是第三距离比第四距离的比率,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0793] 实施例的所述第二虚拟传声器包括从所述第二传声器信号中减去的所述第一传声器信号。
[0794] 实施例的所述第一传声器信号被延迟。
[0795] 实施例的所述延迟被升幂,所述幂与所述语音到达所述第一虚拟传声器和所述语音到达所述第二虚拟传声器之间的时间差成比例。
[0796] 实施例的所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0797] 实施例的所述第一传声器信号乘以比率,其中所述比率是所述第三距离比所述第四距离的比率。
[0798] 实施例的所述单个零位被定位在离开所述第一物理传声器和所述第二物理传声器中的至少一个的一段距离处,在所述距离处,期望是语音源。
[0799] 实施例的所述第一虚拟传声器包括从延迟版本的所述第一传声器信号中减去的所述第二传声器信号。
[0800] 实施例的所述第二虚拟传声器包括从所述第二传声器信号中减去的延迟版本的所述第一传声器信号。
[0801] 此处描述的实施例包含一种系统,所述系统包括至少一个无线通信装置(WCD),所述至少一个无线通信装置(WCD)在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带。所述WCD包含传声器阵列,所述传声器阵列包括第一虚拟传声器和第二虚拟传声器。所述系统包含电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道。所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0802] 此处描述的实施例包含一种系统,所述系统包括:至少一个无线通信装置(WCD),所述至少一个无线通信装置(WCD)在与远端参与者的电话呼叫期间被至少一个近端参与者佩带,其中所述WCD包含传声器阵列,所述传声器阵列包括第一虚拟传声器和第二虚拟传声器;以及电话网关,所述电话网关对于所述至少一个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述至少一个WCD形成至少一个音频信道,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0803] 实施例的所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号。
[0804] 实施例的所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0805] 此处描述的实施例包含一种系统,所述系统包括多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带。所述WCD包含传声器阵列。该系统包含电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中的每个WCD形成专用音频信道。所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0806] 此处描述的实施例包含一种系统,所述系统包括:多个无线通信装置(WCD),所述多个无线通信装置(WCD)在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带,其中所述WCD包含传声器阵列;以及电话网关,所述电话网关对于所述多个WCD是远程的,并且包含音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与所述多个WCD中的每个WCD形成专用音频信道,其中所述音频处理器从接收自所述多个WCD的所述多个信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0807] 实施例的传声器阵列包括第一虚拟传声器,所述第一虚拟传声器包括第一传声器信号和第二传声器信号的第一组合,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号。实施例的传声器阵列包括第二虚拟传声器,所述第二虚拟传声器包括所述第一传声器信号和所述第二传声器信号的第二组合,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0808] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置(WCD)形成至少一个音频信道,所述至少一个无线通信装置(WCD)对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带。所述WCD包含传声器阵列,所述传声器阵列包括多个虚拟传声器。所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号。所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络。所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0809] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与至少一个无线通信装置(WCD)形成至少一个音频信道,所述至少一个无线通信装置(WCD)对于所述电话网关是远程的,并且在至少一个近端参与者与远端参与者的电话呼叫期间被至少一个近端参与者佩带,其中所述WCD包含传声器阵列,所述传声器阵列包括多个虚拟传声器,其中所述音频处理器从接收自所述至少一个WCD的信号产生集成的音频信号,其中所述电话网关包括连接部件,所述连接部件被耦接到所述音频处理器以及输送所述电话呼叫的网络,其中所述连接部件将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。 [0810] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置(WCD)形成多个音频信道,所述多个无线通信装置(WCD)对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带。所述WCD包含传声器阵列。所述音频处理器从接收自所述多个WCD的信号产生集成的音频信号。所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。
[0811] 此处描述的实施例包含一种电话网关,所述电话网关包括音频处理器,所述音频处理器被耦接到至少一个无线收发机,所述至少一个无线收发机与多个无线通信装置(WCD)形成多个音频信道,所述多个无线通信装置(WCD)对于所述电话网关是远程的,并且在近端参与者与远端参与者的电话呼叫期间被近端参与者佩带,其中所述WCD包含传声器阵列,其中所述音频处理器从接收自所述多个WCD的所述信号产生集成的音频信号,其中所述电话网关将所述集成的音频信号耦接到所述网络,用于传输给所述远端参与者。 [0812] 此处描述的实施例包含一种方法,所述方法包括建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的。所述多个WCD被多 个近端参与者佩带。所述方法包含使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号。所述方法包含响应于所述音频信号产生第一音频信号。所述产生包括集成来自所述多个WCD的所述音频信号。所述方法包含通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0813] 此处描述的实施例包含一种方法,所述方法包括:建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的,其中所述多个WCD被多个近端参与者佩带;使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号;响应于所述音频信号产生第一音频信号,所述产生包括集成来自所述多个WCD的所述音频信号;以及通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0814] 此处描述的实施例包含一种方法,所述方法包括建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的。所述多个WCD被多个近端参与者佩带。所述方法包含使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号。所述方法包含响应于所述音频信号产生第一音频信号。所述产生包括集成来自所述多个WCD的所述音频信号。所述方法包含通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0815] 此处描述的实施例包含一种方法,所述方法包括:建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的,其中所述多个WCD被多个近端参与者佩带;使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号;响应于所述音频信号产生第一音频信号,所述产生包括集成来自所述多个WCD的所述音频信号;以及通过将所述第一音频信号耦接到网络来建立所述多个近端参与者和远端参与者之间的电话会议,所述网络将所述第一音频信号传输给所述远端参与者。
[0816] 此处描述的实施例包含一种方法,所述方法包括建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的。所述多个WCD在与远端参与者的电话呼叫期间被多个近端参与者佩带。所述方法包含使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号。所述方法包含响应于所述音频信号产生第一音频信号。所述产生包括 集成来自所述多个WCD的所述音频信号。所述方法包含将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者。所述方法包含在所述电话网关处接收来自所述远端参与者的第二音频信号;所述方法包含在被耦接到所述电话网关的喇叭处输出所述第二音频信号。 [0817] 此处描述的实施例包含一种方法,所述方法包括:建立多个无线通信装置(WCD)和电话网关之间的电配对,所述电话网关对于所述多个WCD是远程的,其中所述多个WCD在多个近端参与者与远端参与者的电话呼叫期间被多个近端参与者佩带;使用所述WCD的传声器信号在每个WCD处形成虚拟传声器阵列,并且在所述电话网关处接收来自所述多个WCD的音频信号;响应于所述音频信号产生第一音频信号,所述产生包括集成来自所述多个WCD的所述音频信号;将所述第一音频信号耦接到所述网络,用于传输给所述远端参与者;在所述电话网关处接收来自所述远端参与者的第二音频信号;以及在被耦接到所述电话网关的喇叭处输出所述第二音频信号。
[0818] 实施例的所述电配对的所述建立包括建立所述电话网关的至少一个无线收发机和所述多个WCD中的对应WCD之间的电配对,其中所述电配对提供所述电话网关和所述对应WCD之间的专用信道。
[0819] 实施例的所述音频信号的所述集成包括为对应于每个WCD的每个专用信道计算动态增益。
[0820] 当所述近端参与者正在说话时,实施例的所述动态增益的所述计算包括计算均方根。
[0821] 实施例的所述方法包括电标记来自每个WCD的每个信号。
[0822] 实施例的每个WCD包括至少一个传声器。
[0823] 实施例的所述至少一个传声器包括全向传声器。
[0824] 实施例的所述至少一个传声器包括定向传声器。
[0825] 实施例的所述至少一个传声器包括两个传声器。
[0826] 实施例的所述方法包括多路分配在每个WCD处接收到的信号。
[0827] 实施例的所述方法包括对于在每个WCD处接收到的信号进行回音消除。 [0828] 实施例的所述方法包括对于在每个WCD处接收到的信号进行噪音抑制。 [0829] 实施例的所述方法包括对于在每个WCD处接收到的信号进行语音活动检测。 [0830] 实施例的所述方法包括将所述喇叭定位在每个WCD中。实施例的所述方法包括将所述第二音频信号传输到每个WCD以及借助于所述喇叭输出所述第二音频信号。 [0831] 实施例的所述方法包括将所述喇叭定位在所述电话网关中。
[0832] 实施例的所述方法包括借助于所述喇叭输出所述第一音频信号。
[0833] 实施例的所述方法包括借助于所述喇叭输出所述第二音频信号。
[0834] 实施例的所述方法包括将每个WCD硬编码到所述电话网关。
[0835] 实施例的所述方法包括电检测在所述WCD的预先指定的范围内的至少一个其他的WCD。
[0836] 实施例的所述方法包括使用所述电话网关的电话接口来控制所述电话呼叫的参数。
[0837] 实施例的所述无线收发机包括蓝牙收发机。
[0838] 实施例的所述方法包括使用所述WCD的充电器使每个WCD在所述电话网关处再充电。
[0839] 实施例的所述方法包括每个WCD搜索与其电配对的至少一个其他的WCD。 [0840] 实施例的所述方法包括每个WCD搜索与其建立所述电配对的所述电话网关。 [0841] 实施例的所述方法包括所述电话网关搜索与其建立所述电配对的WCD。 [0842] 实施例的所述方法包括将至少一个WCD和所述电话网关之间的所述电配对归类为瞬间的。实施例的所述方法包括在完成所述电话呼叫之后擦除所述电配对的信息。 [0843] 实施例的所述方法包括在所述电话网关处多路分配来自每个WCD的每个输入信号。
[0844] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行回音消除。
[0845] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行噪音抑制。
[0846] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行语音活动检测。
[0847] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行空间化。
[0848] 实施例的所述方法包括在所述电话网关处对于来自每个WCD的每个输入信号进行均衡化。
[0849] 实施例的所述方法包括在所述电话网关处管理和控制带有所述WCD的所述音频信道。
[0850] 实施例的所述虚拟传声器阵列的所述形成包括通过产生第一传声器信号和第二传声器信号的第一组合来形成第一虚拟传声器,其中由第一物理传声器产生所述第一传声器信号,以及由第二物理传声器产生所述第二传声器信号。实施例的所述虚拟传声器阵列的所述形成包括通过产生所述第一传声器信号和所述第二传声器信号的第二组合来形成第二虚拟传声器,其中所述第二组合不同于所述第一组合,其中所述第一虚拟传声器和所述第 二虚拟传声器是对于噪音具有基本上相似的响应以及对于语音具有基本上不相似的响应的有差别的虚拟定向传声器。
[0851] 实施例的形成所述第一虚拟传声器包含形成对于缺少零位的语音具有第一线性响应的所述第一虚拟传声器,其中所述语音是所述近端参与者的人类语音。
[0852] 实施例的形成所述第二虚拟传声器包含形成对于包含单个零位的语音具有第二线性响应的所述第二虚拟传声器,所述单个零位被定向在朝向所述近端参与者的语音源的方向上。
[0853] 实施例的所述单个零位是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级低的测量的响应量级的区域。
[0854] 实施例的所述第二线性响应包含被定向在远离所述语音源的方向上的主瓣。 [0855] 实施例的所述主瓣是所述第二线性响应中具有比所述第二线性响应的任何其他区域的测量的响应等级大的测量的响应量级的区域。
[0856] 实施例的所述方法包括沿着所述轴安置所述第一物理传声器和所述第二物理传声器,并且使所述第一和第二物理传声器分开第一距离。
[0857] 实施例的所述轴的中点是离开产生所述语音的语音源的第二距离,其中所述语音源被定位在相对于所述中点通过角度限定的方向上。
[0858] 实施例的形成所述第一虚拟传声器包括减去从所述第一传声器信号中减去的所述第二传声器信号。
[0859] 实施例的所述方法包括延迟所述第一传声器信号。
[0860] 实施例的所述方法包括使所述延迟升幂,所述幂与所述语音到达所述第一虚拟传声器和所述语音到达所述第二虚拟传声器之间的时间差成比例。
[0861] 实施例的所述方法包括使所述延迟升幂,所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0862] 实施例的所述方法包括使所述第二传声器信号乘以比率,其中所述比率是第三距离比第四距离的比率,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0863] 实施例的形成所述第二虚拟传声器包括从所述第二传声器信号中减去所述第一传声器信号。
[0864] 实施例的所述方法包括延迟所述第一传声器信号。
[0865] 实施例的所述方法包括使所述延迟升幂,所述幂与所述语音到达所述第一虚拟传声器 和所述语音到达所述第二虚拟传声器之间的时间差成比例。
[0866] 实施例的所述方法包括使所述延迟升幂,所述幂与乘以等于第四距离减去第三距离的量的采样频率成比例,所述第三距离是在所述第一物理传声器和所述语音源之间,以及所述第四距离是在所述第二物理传声器和所述语音源之间。
[0867] 实施例的所述方法包括使所述第一传声器信号乘以比率,其中所述比率是所述第三距离比所述第四距离的比率。
[0868] 实施例的形成所述第一虚拟传声器包括从延迟版本的所述第一传声器信号中减去所述第二传声器信号。
[0869] 实施例的形成所述第二虚拟传声器包括通过延迟所述第一传声器信号形成量。实施例的形成所述第二虚拟传声器包括从所述第二传声器信号中减去所述量。
[0870] 实施例的所述第一和第二物理传声器是全向的。
[0871] 无线电话会议的电话系统的实施例可以是单个系统、多个系统和/或地理上分开的系统的部件。无线电话会议的电话系统也可以是单个系统、多个系统和/或地理上分开的系统的子部件或者子系统。无线电话会议的电话系统可以被耦接到主机系统的或者耦接到该主机系统的系统的一个以上的其它部件(未显示)。
[0872] 无线电话会议的电话系统的一个以上的部件和/或耦接或者连接无线电话会议的电话系统的相应的系统或者应用程序包括处理系统,和/或在处理系统下运行,和/或与处理系统相关联地运行。如本领域中已知的,处理系统包括基于处理器的装置或者一起操作的计算装置,或者处理系统或装置的部件的任何集合。例如,处理系统可以包括在通信网络和/或网络服务器中操作的一个以上的便携式计算机、便携式通信装置。便携式计算机可以是从个人计算机、蜂窝式移动电话、个人数字助理、便携式计算装置和便携式通信装置中选择的装置的任何数量和/或组合,但是不会被如此限制。处理系统可以包括在大的计算机系统之内的部件。
[0873] 实施例的处理系统包括至少一个处理器以及至少一个存储装置或者子系统。处理系统也可以包括或者被耦接到至少一个数据库。通常使用的术语“处理器”在此指的是任何逻辑处理单元,诸如一个以上的中央处理单元(CPU)、数字信号处理器(DSP)、专用集成电路(ASIC)等等。处理器和存储器可以被统一地集成在单芯片之上,被分布在许多芯片或者部件当中,和/或通过一些算法的组合被提供。在此描述的方法可以在一个以上的软件算法、程序、固件、硬件、部件、电路中以任何组合被实现。
[0874] 包括无线电话会议的电话系统的任何系统的部件可以被定位在一起或者可以被定位在分开的位置上。通信路径耦接该部件并且包含用于通信或者传送该部件当中的文件的任 何介质。通信路径包括无线连接、有线连接以及混合的无线/有线连接。通信路径还包含对网络的耦接或者连接,该网络包括局域网(LAN)、城域网(MAN)、广域网(WAN)、专有网络、局间或者后端网络、以及因特网。此外,通信路径包含可移动的固定介质,如软盘、硬盘驱动器和CD-ROM磁盘,以及闪速RAM、通用串行总线(USB)连接、RS-232连接、电话线路、总线以及电子邮件消息。
[0875] 此处描述的无线电话会议的电话系统以及对应的系统和方法的方面可以被实现为被编程到任何各种电路中的功能,各种电路包含诸如现场可编程门阵列(FPGA)、可编程阵列逻辑(PAL)装置、电可编程逻辑和存储装置、以及基于标准元件的装置的可编程逻辑装置(PLD),以及专用集成电路(ASIC)。用于实现无线电话会议的电话系统以及对应的系统和方法的方面的一些其他可能性包含:具有存储器(诸如电可擦可编程只读存储器(EEPROM))的微控制器、嵌入式微处理器、固件、软件等等。此外,无线电话会议的电话系统以及对应的系统和方法的方面可以体现在具有基于软件的电路仿真、离散逻辑(序列的和组合的)、常规装置、模糊(神经)逻辑、量子装置以及混合任何以上装置类型的微处理器中。当然,可以提供各种部件类型的下层装置技术,例如,如互补金属化物半导体(CMOS)的金属氧化物半导体场效应晶体管(MOSFET)技术,如发射极耦合逻辑(ECL)的双极技术,聚合体技术(例如,硅共轭聚合物以及金属共轭聚合物金属结构),模拟与数字混合的技术等等。 [0876] 除非上下文另外清楚地需要,贯穿整个说明书,文字“包含”、“包括”等等将被视为包括在内的意义,与排他或者详尽的意义相对;换句话说,在某种意义上是“具有,但不局限于此”。使用单数或者复数数字的措辞还分别地包含复数或者单数数字。另外,措辞“此处”、“在此之下”、“以上”、“以下”、和类似含意的文字,在这个申请中被使用时,指的是这整个申请,而不是指的是这个申请的任何特定的部分。当使用文字“或者”来关系到两个以上的项目的列表时,那个文字覆盖所有以下词的解释:列表中的任何项目、列表中的所有项目以及列表中的项目的任何组合。
[0877] 无线电话会议的电话系统以及对应的系统和方法的实施例的以上描述不意指是详尽的或者将该系统和方法限制为精确公开的形式。虽然无线电话会议的电话系统以及对应的系统和方法的具体实施例和实例是为了说明性的目的而在此被描述,但是如相关领域中的其他些技术人员将认识到,各种等效变形在其他系统和方法的范围内是可能的。在此提供的无线电话会议的电话系统以及对应的系统和方法的教导可以被应用于其他的系统和方法,不仅仅用于上述的系统和方法。
[0878] 上述各种实施例的要素和动作可以被组合以提供更多的实施例。按照以上详细的描 述,可以对无线电话会议的电话系统以及对应的系统和方法做出这些及其他改变。
QQ群二维码
意见反馈