分布式电话会议多信道架构、系统、方法和计算机程序产品

申请号 CN200780048835.2 申请日 2007-12-13 公开(公告)号 CN101573955A 公开(公告)日 2009-11-04
申请人 诺基亚公司; 发明人 J·维罗莱南; L·拉克索南; A·阿玛涅米; P·瓦尔韦;
摘要 提供了使用一个或者多个主控设备和/或集中式会议交换机的用于分布式电话会议的多信道架构、系统、方法和 计算机程序 产品。多信道增强主控设备在分布式电话会议中的功能并且允许与具有3D功能的电话会议兼容。多信道分布式电话会议涉及到多信道、单声道和/或数目固定的上行链路和下行链路信道。多信道分布式电话会议系统可以进行对近端参与方的活跃通话方检测并且在上行链路信道上传送标识活跃近端参与方的ID 信号 。多信道分布式电话会议系统也可以在下行链路信道上接收标识活跃远端参与方的ID信号。多信道分布式电话会议系统可以进行各种上行链路和下行链路处理。上行链路处理可以涉及多路混合和空间 定位 。多路混合可以用来分离近端参与方的话音信号。也在下行链路处理中使用的空间定位引入对活跃参与方的空间分离。
权利要求

1.一种会议设备,用于在多个参与方之间运用分布式架构来实 现分布式会议会话,至少第一参与方和第二参与方在第一位置,其 中所述第一位置是共用声学空间,并且至少第三参与方在远程位置, 所述会议设备包括:
处理单元,配置用于接收来自所述第一参与方的第一音频信号 和来自所述第二参与方的第二音频信号并且将所述第一音频信号和 第二音频信号提供给所述第三参与方,其中所述处理单元从将所述 会议设备与所述第一参与方和第二参与方进行连接的共用声学空间 网络接收所述第一音频信号和第二音频信号,并且其中所述处理单 元还被配置用于通过与所述第三参与方的多信道会议连接将所述第 一音频信号和第二音频信号提供给所述第三参与方,所述处理单元 还被配置用于从所述第三参与方接收第三音频信号并且将所述第三 音频信号提供给所述第一参与方和第二参与方。
2.根据权利要求1所述的会议设备,其中所述处理单元还被配 置用于从第四参与方接收第四音频信号,其中所述第三参与方和第 四参与方在共用声学空间中并且通过由另一会议设备实现的共用声 学网络参与所述会议会话,并且其中所述处理单元通过多信道会议 连接从为所述第三参与方和第四参与方实现所述共用声学空间网络 的所述另一会议设备接收所述第三音频信号和第四音频信号。
3.根据权利要求2所述的会议设备,其中所述处理单元通过固 定两个信道的会议连接来接收所述第三音频信号和第四音频信号。
4.根据权利要求3所述的会议设备,其中所述处理单元还接收 代表所述参与方的标识的ID信号,所述参与方代表通过所述固定两 个信道的会议连接来接收的活跃信号。
5.根据权利要求4所述的会议设备,其中所述处理单元还被配 置用于执行对通过所述固定两个信道的会议连接所接收的所述第三 音频信号和第四音频信号的下行链路处理,并且其中所述下行链路 处理包括执行对通过所述固定两个信道的会议连接所接收的所述第 三音频信号和第四音频信号的空间定位
6.根据权利要求2所述的会议设备,其中所述处理单元还被配 置用于从第五参与方接收第五音频信号,其中所述第五参与方没有 参与所述第一参与方和第二参与方的所述共用声学空间网络或者所 述第三参与方和第四参与方的另一所述共用声学空间网络。
7.根据权利要求1所述的会议设备,其中所述处理单元通过单 声道会议连接来接收所述第三音频信号。
8.根据权利要求1所述的会议设备,其中所述处理单元通过固 定两个信道的会议连接将所述第一音频信号和第二音频信号提供给 所述第三参与方。
9.根据权利要求8所述的会议设备,其中第四参与方也在所述 第一参与方和第二参与方的所述共用声学空间网络中,其中所述处 理单元还被配置用于多路混合至少所述第一音频信号和第二音频信 号以及从用于所述第四参与方的所述共用声学空间网络接收的第四 音频信号,并且还被配置用于将从所述共用声学空间网络接收的至 少三个音频信号中的不多于两个的音频信号标识为用以通过所述固 定两个信道的电话会议连接提供给所述第三方的活跃信号。
10.根据权利要求9所述的会议设备,其中所述处理单元还被 配置用于:标识代表所述活跃信号的参与方;生成代表所述参与方 的标识的ID信号,所述参与方代表所述活跃信号;并且将所述ID 信号提供给至少所述第三参与方。
11.根据权利要求1所述的会议设备,其中所述处理单元通过 多信道会议连接来接收所述第三音频信号,其中所述信号为空间定 位的信号。
12.根据权利要求1所述的会议设备,其中所述处理单元还被 配置用于标识所述共用声学空间的参与方、生成代表所述共用声学 空间网络的参与方的标识的ID信号并且将所述ID信号提供给所述 第三参与方。
13.根据权利要求1所述的会议设备,其中所述处理单元还被 配置用于执行上行链路处理,并且其中所述上行链路处理包括执行 将接收的在所述共用声学空间内的参与方的信号多路混合成用于向 在所述共用声学空间网络以外的一个或者多个参与方输出的至少两 个信道的信号。
14.根据权利要求13所述的会议设备,其中所述多路混合包括 执行对从所述共用声学空间中的参与方接收到的音频信号的特征提 取、信道排序和并行混合操作。
15.根据权利要求13所述的会议设备,其中所述多路混合包括 执行自动音量控制(AVC)。
16.根据权利要求13所述的会议设备,其中所述多路混合包括 执行对从所述共用声学空间中的参与方接收到的音频信号的同时通 话检测(STD)、对从所述共用声学空间中的参与方接收到的音频 信号和对从位于所述共用声学空间以外的参与方接收到的音频信号 的语音活动检测(VAD)、以及对从所述共用声学空间中的参与方 接收到的音频信号和对从位于所述共用声学空间以外的参与方接收 到的音频信号的双重通话检测(DTD)。
17.根据权利要求13所述的会议设备,其中所述多路混合还包 括执行对从所述共用声学空间中的参与方接收到的音频信号的空间 定位。
18.根据权利要求1所述的会议设备,其中所述共用声学空间 网络为邻近网络。
19.根据权利要求1所述的会议设备,其中所述共用声学空间 网络为电路交换连接网络。
20.一种用于在处于多个位置的参与方之间实现会议会话的方 法,至少第一参与方和第二参与方在第一位置,并且至少第三参与 方在远程位置,所述方法包括:
在处于所述第一位置的共用声学空间网络与所述会议会话的另 一会议设备之间建立多信道会议连接,其中所述第一参与方和第二 参与方通过在所述第一位置的所述共用声学空间网络连接到所述会 议会话的所述另一会议设备;
接收来自所述第一参与方的第一音频信号和来自所述第二参与 方的第二音频信号,其中从所述共用声学空间接收所述第一音频信 号和第二音频信号;
将所述第一音频信号和第二音频信号提供给所述第三参与方;
从所述第三参与方接收第三音频信号;以及
将所述第三音频信号提供给所述第一参与方和第二参与方。
21.根据权利要求20所述的方法,还包括:
在处于所述远程位置的共用声学空间网络与所述会议会话的所 述另一会议设备或所述第一位置的所述共用声学空间网络之间建立 多信道会议连接,其中所述第三参与方和第四参与方通过在所述远 程位置的所述共用声学空间网络参与所述会议会话;以及
通过与所述第三参与方和第四参与方的所述多信道会议连接从 第四参与方接收第四音频信号,并且其中也通过与所述第三参与方 和第四参与方的所述多信道会议连接来接收来自所述第三参与方的 所述第三音频信号。
22.根据权利要求21所述的方法,还包括执行对通过所述多信 道会议连接来接收的所述第三音频信号和第四音频信号的处理,其 中所述下行链路处理包括对所述第三音频信号和第四音频信号的空 间定位。
23.根据权利要求20所述的方法,还包括:
多路混合至少所述第一音频信号和第二音频信号以及从所述共 用声学空间网络接收的第三音频信号;
将从所述共用声学空间网络接收的至少三个音频信号中的并非 所有音频信号标识为用以提供到所述第三参与方的活跃信号;
将被标识为活跃信号的从所述共用声学空间网络接收的至少三 个音频信号中的所述并非所有音频信号提供给所述第三参与方。
24.根据权利要求23所述的方法,还包括:
标识代表所述活跃信号的所述参与方;
生成代表所述参与方的标识的ID信号,所述参与方代表所述活 跃信号;并且
将所述ID信号提供给所述第三参与方。
25.根据权利要求20所述的方法,还包括执行上行链路处理, 其中所述上行链路处理包括执行将接收的在所述共用声学空间内的 参与方的信号多路混合成用于向在所述共用声学空间网络以外的一 个或者多个参与方输出的至少两个混合信号。
26.根据权利要求25所述的方法,其中所述多路混合包括执行 对从所述共用声学空间中的参与方接收到的音频信号的特征提取、 信道排序和并行混合操作。
27.根据权利要求25所述的方法,其中所述多路混合包括执行 对从所述共用声学空间网络中的参与方接收到的音频信号的同时通 话检测(STD)、对从所述共用声学空间中的参与方接收到的音频 信号和对从位于所述共用声学空间以外的参与方接收到的音频信号 的语音活动检测(VAD)、对从所述共用声学空间中的参与方接收 到的音频信号和对从位于所述共用声学空间以外的参与方接收到的 音频信号的双重通话检测(DTD)。
28.根据权利要求25所述的方法,其中所述多路混合还包括执 行对从所述共用声学空间中的参与方接收到的音频信号的空间定 位。
29.根据权利要求20所述的方法,还包括执行对接收的所述音 频信号的下行链路处理,其中所述下行链路处理包括执行对通过所 述多信道会议连接接收的所述第三音频信号和第四音频信号的空间 定位。
30.一种包括计算机可用介质的计算机程序产品,所述计算机 可用介质具有存储于其中的控制逻辑,所述控制逻辑用于在处于多 个位置的参与方之间实现会议会话,至少第一参与方和第二参与方 在第一位置,并且至少第三参与方在远程位置,所述控制逻辑包括:
第一代码,配置用于在处于所述第一位置的共用声学空间网络 与所述会议会话的另一会议设备之间建立多信道会议连接,其中所 述第一参与方和第二参与方通过在所述第一位置的所述共用声学空 间网络连接到所述会议会话的所述另一会议设备;
第二代码,配置用于接收来自所述第一参与方的第一音频信号 和来自所述第二参与方的第二音频信号,其中从所述共用声学空间 网络接收所述第一音频信号和第二音频信号;
第三代码,配置用于将所述第一音频信号和第二音频信号提供 给所述第三参与方;
第四代码,配置用于从所述第三参与方接收第三音频信号;以 及
第五代码,配置用于将所述第三音频信号提供给所述第一参与 方和第二参与方。
31.根据权利要求30所述的计算机程序产品,还包括:
第六代码,配置用于在处于所述远程位置的共用声学空间网络 与所述会议会话的所述另一会议设备或所述第一位置的所述共用声 学空间网络之间建立多信道会议连接,其中所述第三参与方和第四 参与方通过在所述远程位置的所述共用声学空间网络参与所述会议 会话;以及
第七代码,配置用于通过与所述第三参与方和第四参与方的所 述多信道会议连接从第四参与方接收第四音频信号,并且其中也通 过与所述第三参与方和第四参与方的所述多信道会议连接来接收来 自所述第三参与方的所述第三音频信号。
32.根据权利要求31所述的计算机程序产品,还包括:第八代 码,配置用于执行对通过所述多信道会议连接来接收的所述第三音 频信号和第四音频信号的处理,其中所述下行链路处理包括对所述 第三音频信号和第四音频信号的空间定位。
33.根据权利要求30所述的计算机程序产品,还包括:
第六代码,配置用于多路混合至少所述第一音频信号和第二音 频信号以及从所述共用声学空间网络接收的第三音频信号;
第七代码,配置用于将从所述共用声学空间网络接收的至少三 个音频信号中的并非所有音频信号标识为用以提供给所述第三参与 方的活跃信号;
第八代码,配置用于将被标识为活跃信号的从所述共用声学空 间网络接收的至少三个音频信号中的所述并非所有音频信号提供给 所述第三参与方。
34.根据权利要求33所述的计算机程序产品,还包括:
第九代码,配置用于标识代表所述活跃信号的所述参与方;
第十代码,配置用于生成代表所述参与方的标识的ID信号,所 述参与方代表所述活跃信号;以及
第十一代码,配置用于将所述ID信号提供给所述第三参与方。
35.根据权利要求30所述的计算机程序产品,还包括:第六代 码,配置用于进行上行链路处理,其中所述上行链路处理包括执行 将接收的在所述共用声学空间内的参与方的信号多路混合成用于向 在所述共用声学空间网络以外的一个或者多个参与方输出的至少两 个混合信号。
36.根据权利要求35所述的计算机程序产品,其中所述多路混 合包括执行对从所述共用声学空间中的参与方接收到的音频信号的 特征提取、信道排序和并行混合操作。
37.根据权利要求35所述的计算机程序产品,其中所述多路混 合包括执行对从所述共用声学空间中的参与方接收到的音频信号的 同时通话检测(STD)、对从所述共用声学空间中的参与方接收到 的音频信号和对从位于所述共用声学空间以外的参与方接收到的音 频信号的语音活动检测(VAD)、对从所述共用声学空间中的参与 方接收到的音频信号和对从位于所述共用声学空间以外的参与方接 收到音频信号的双重通话检测(DTD)。
38.根据权利要求30所述的计算机程序产品,还包括:第六代 码,配置用于执行对接收的所述音频信号的下行链路处理,其中所 述下行链路处理包括执行对通过所述多信道会议连接来接收的所述 第三音频信号和第四音频信号的空间定位。
39.一种用于在多个参与方之间运用分布式架构来实现分布式 会议会话的会议设备,所述会议设备包括:
处理单元,配置用于通过多信道连接来发送和接收会议信号,
其中所述处理单元还被配置用于发送代表多个参与方的会议信 号,
其中所述处理单元还被配置用于接收代表多个参与方的会议信 号,并且
其中所述处理单元还被配置用于建立与以下其它会议设备中的 至少一个会议设备的所述多信道连接:共用声学空间网络的主控设 备、会议交换机、多个独立终端。
40.根据权利要求39所述的会议设备,其中所述会议设备包括 共用声学空间网络的主控设备。
41.根据权利要求40所述的会议设备,其中所述其它会议设备 为另一共用声学空间网络的另一主控设备。
42.根据权利要求40所述的会议设备,其中所述会议设备包括 移动站。
43.根据权利要求39所述的会议设备,其中所述会议设备包括 会议交换机。

说明书全文

技术领域

发明实施例主要地涉及电话会议系统,并且具体地涉及一 种使用一个或者多个主控设备和/或集中式会议交换机的用于分布式 电话会议的多信道架构以及相关系统、方法和计算机程序产品。

背景技术

会议呼叫是至少三方参与其中的电话呼叫。电话会议系统广泛 地用以独立于参与方的物理位置而将参与方连接在一起进行会议呼 叫。电话会议呼叫通常以集中方式来布置、但是也可以用备选方式 来布置,比如如下文进一步描述的布置于分布式电话会议架构中。
现在参照图1,该图图示了多个参与方经由会议交换机来实现 集中式电话会议会话的示意框图。该图示代表了传统集中式电话会 议系统,该系统将位于数个地点A、B和C的参与方102、104、106 连接到会议呼叫,这意味着数个位置与一个到n个会议参与方连接。 在各地点的终端或者设备作为呼叫的独立会议参与方连接到会议交 换机100。也称为会议桥接器的会议交换机100对来自各地点的传入 话音信号进行混合并且将混合的信号发送回各地点。通常从发送回 当前地点的混合信号中去除来自这同一地点的话音信号。
另一类集中式电话会议系统是集中式3D电话会议系统。在图 2中示出了典型的集中式3D电话会议系统。集中式3D电话会议系 统允许使用较单声道电话会议系统而言提供明显优点的空间化音 频。在集中式3D电话会议系统中,将参与方终端112、114、116、 118的发言方呈现为可以在收听方周围空间定位于不同位置的虚拟 声源。3D空间定位通常使用头部相关的传递函数(HRTF)滤波来 实现并且包括人为场所效果,尽管3D处理的其它示例包括波场合 成、高保真度立体声响复制、VBAP(矢量基幅度平移)、SIRR(空 间冲激响应表现)、DirAC(定向音频编码)和BCC(双声道提示 编码)。在典型集中式3D电话会议系统中,如图2中所示,在会议 桥接器110中处理来自所有参与终端112、114、116、118的单声道 话音信号。例如,该处理可以涉及到自动增益控制、活跃流检测、 混合和空间定位。会议桥接器110然后将3D处理后的信号传输回到 终端112、114、116、118。可以传输立体声信号作为如结合用户终 端112所示两个单独编码的单路信号或者作为如结合用户终端118 所示一个立体声编码信号
3D电话会议的附加备选实施包括集中器和分散式架构。图3 图示了典型集中器集中式3D电话会议系统。在集中器3D电话会议 架构中,终端122、124、126将话音信号发送到会议桥接器100,该 桥接器100将信号转发到参与会议呼叫的所有终端122、124、126。 在这一类集中器集中式3D电话会议架构中,各参与方提供通向会议 桥接器的单声道上行链路并且从会议桥接器接收多个下行链路信 道,各下行链路信道代表单声道上行链路之一。图4图示了典型的 分散式3D电话会议系统。在分散式架构中,各终端132、134、136 具有通向会议呼叫中的所有其它终端132、134、136的点到点连接 而无需会议交换机。在这一类分散式电话会议架构中,各参与方通 常提供多播单声道上行链路并且从其他参与方接收多个下行链路信 道。在两种情况下,3D处理在终端本身中发生。用于集中器3D电 话会议和分散式3D电话会议的这两种架构的一个弊端在于更高的 带宽消耗。
另一类电话会议架构是分布式布置,该布置涉及到主控设备为 一个或者多个从属终端提供通向会议呼叫的连接接口。并且在分布 式电话会议架构中,一个或者多个会议参与方可以处于共用的声学 空间中,比如一个或者多个从属终端通过主控设备连接到会议呼叫。 结合图5进一步描述这一类分布式布置,该图图示了分布式电话会 议会话中的多个参与方的示意图,其中经由会议交换机148实现会 议并且来自共用声学空间的数个参与方通过主控设备140经由从属 终端142、144、146参与会议。图6图示了与分布式电话会议系统 中的主控设备相关的更具体功能框图。分布式电话会议这一概念当 在本申请中定义和使用该术语时指代这样的电话会议架构,其中至 少一些会议参与方共同定位并且使用通过主控设备(比如会议参与 方之一的移动终端既充当用于该会议参与方的终端又充当主控设 备,或者另一计算机设备向所有从属终端提供通信,比如个人或者 膝上型计算机或者专用会议设备)连接的个人从属终端(比如使用 他们自己的移动设备和/或自动对讲头戴式机作为他们的个人麦克 和/或扬声器)来参与会议会话。在这样的实例中,可以根据多种 不同通信技术如RF、BT、Wibree、IrDA中的任何技术和/或多种不 同无线和/或有线联网技术如LAN、WLAN、WiMAX和/或UWB技 术中的任何技术来建立共用声学空间网络如邻近网络。例如,可以 在场所中的移动设备140、142、144、146之间形成WLAN ad hoc 邻近网络而设备之一140充当主控设备。可以例如使用WLAN ad hoc 简档或者使用单独接入点来进行通信。主控设备140连接到会议交 换机148(或者连接到另一主控设备或者例如直接地连接到在第二位 置147的远程参与方设备149),并且主控设备140从场所141中的 所有其它(从属)终端142、144、146接收麦克风信号,如果也充 当用于会议呼叫的参与方终端则也从主控设备140接收麦克风信号。 为了便于为邻近网络中的参与方实现会议会话,主控设备140能够 通过对应的上行链路编码器152和解码器154、156、158以及对应 的下行链路编码器162和解码器160来操作混合器150。混合器可以 包括可由相应网络实体(例如主控设备140)操作的软件或者可以代 之以包括固件和/或硬件。另外,虽然混合器通常与共用声学空间网 络的主控设备共同定位,但是混合器可以代之以远离主控设备,比 如在会议交换机内。主控设备140运行用于混合器的混合算法,该 算法由所有个别从属终端麦克风信号生成组合的上行链路信号。根 据主控设备所用的混合算法,上行链路信号可以是增强的上行链路 信号。在下行链路方向,主控设备从电话会议连接接收话音信号并 且与其它(从属)终端共享这一信号,比如以便由空间中的所有终 端的自动对讲扬声器再现。例如使用这一类分布式电话会议来改进 在远端这一侧的话音质量,因为麦克风接近参与方。在近端这一侧, 当多个扬声器用来再现话音时需要收听方较少的收听工作。
在分布式会议会话期间,会议会话的参与方(包括一个或者多 个相应共用声学空间网络内的参与方)可以用多种不同方式交换语 音通信。例如,共用声学空间网络的至少一些(如果不是所有)参 与方可以独立于相应的共用声学空间网络、但是经由参与方之一(例 如主控设备)或者经由与参与方进行通信的实体(比如当参与方之 一的设备或者共用声学空间网络内的另一设备能够作为扬声器来工 作时可以是这样的情况)来与其他参与方交换语音通信。又例如, 共用声学空间网络的至少一些(如果不是所有)参与方可以经由共 用声学空间网络和参与方之一(例如主控设备)或者共用声学空间 网络内与参与方进行通信(比如以与参与方交换数据通信相同的方 式)的另一实体来与其他参与方交换语音通信。在另一示例中,共 用声学空间网络内的至少一些参与方可以独立于共用声学空间网络 和任何参与方(例如主控设备)或者与参与方进行通信的另一实体 来与其他参与方交换语音通信。然后应当理解,虽然可以参照在会 议会话期间的数据交换来示出和描述参与方,但是那些参与方通常 也可以用多种不同方式中的任何方式交换语音通信。
关于进一步公开的分布式电话会议架构、系统、设备、方法和 计算机程序产品,在通过整体引用而将内容结合于此、标题为 “Systems for Conference Call and Corresponding Devices,Method and Program Products”的国际专利申请号PCT/FI2005/050264中进一步描 述一种分布式电话会议架构。
传统的和近来开发的电话会议解决方案(包括集中式3D电话 会议和分布式电话会议)从音频处理的观点来看目前互不兼容。例 如,在集中式3D电话会议中,用户终端应当能够从会议网络接收立 体声或者多信道信号,而分布式电话会议是基于单声道连接。当会 议呼叫中的一些参与方使用分布式电话会议来参与而其他参与方使 用集中式3D电话会议来参与时结果为次优。具有3D功能终端的参 与方由于分布式系统的单声道上行链路连接而不能空间上分离来自 分布式电话会议系统的那些参与方的语音。例如因为在同时话音期 间的空间分离由于单声道下行链路连接而不可能,所以分布式系统 的性能有限。
虽然已经开发用于在分布式布置和集中式布置中实现会议会 话并且用于实现能够表示会议3D效果的会议系统的技术,但是希望 改进这些现有技术。例如,在本领域中需要用于提供分布式电话会 议与具有3D功能的电话会议系统之间兼容性的改进架构、系统、方 法和计算机程序产品。

发明内容

鉴于前述背景,本发明的实施例提供了使用一个或者多个主控 设备和/或集中式会议交换机的用于分布式电话会议的多信道架构、 系统、方法和计算机程序产品。本发明提供一种增强主控设备在分 布式电话会议系统(比如共用声学空间的邻近网络或者其它网络) 中的功能的多信道音频架构。本发明的实施例允许在分布式电话会 议系统与具有3D功能的电话会议系统如集中式3D电话会议系统之 间的兼容性。因此,具有3D功能的终端和作为分布式电话会议系统 的一部分的终端可以参与为所有参与方(其中包括参与分布式电话 会议系统的参与方)实现3D音频特征的相同电话会议会话。
提供本发明的分布式电话会议系统的如下实施例,这些实施例 包括多信道会议通信。一个实施例可以包括多信道上行链路和单声 道下行链路。另一实施例可以包括多信道上行链路和多信道下行链 路。其它实施例可以包括数目固定的上行链路信道,比如两个信道 的上行链路和多信道或者单声道下行链路。其它实施例可以包括多 信道上行链路和数目固定的下行链路信道,比如两个信道的下行链 路。备选实施例可以包括多信道上行链路或者数目固定的上行链路 信道如两个信道的上行链路以及包括单声道下行链路、多信道下行 链路或者数目固定的下行链路信道中的任一种。
在具有数目固定的上行链路信道的一个实施例中,系统也可以 进行对活跃参与方的ID检测(活跃通话方检测(ATD))并且传送 对用于任何数目的活跃参与方的上行链路信号进行标识的ID信号。 在下行链路信道数目固定的一个实施例中,会议设备可以接收标识 下行链路信号的ID信号,其中在下行链路信号中代表活跃参与方。
提供本发明的分布式电信系统的如下实施例,这些实施例进行 上行链路处理和下行链路处理中的至少一种处理。上行链路处理可 以涉及单路混合、求和、信号选择、多路混合、多路复用、空间定 位、自动音量控制(AVC)、同时通话检测(STD)、双重通话检 测(DTD)、语音活动检测(VAD)和其它上行链路信号处理。下 行链路处理可以涉及空间定位和其它下行链路信号处理。针对上行 链路处理进行多路混合的实施例对于具有单声道和多信道上行链路 的分布式电话会议系统是有利的。
多路混合可以用来比如分离同时通话近端参与方的话音信号。 所得信号可以通过多信道连接来传输到上行链路方向。上行链路多 路混合在同时近端话音期间为具有3D能的远端收听方提高话音 可识度。上行链路多路混合也提高同时话音在单声道分布式电话会 议系统中的收听可识度。可选活跃通话方指示(通话方ID)信号可 以与上行链路信号或者类似地与下行链路信号一起发送。并且可以 对从会议网络接收的多信道信号应用下行链路混合以比如在远端参 与方的同时通话期间引入空间分离。结果是参与会议呼叫的具有3D 功能的终端可以对来自分布式电话会议系统的话音信号进行空间定 位。下行链路混合在具有3D电话会议能力的参与方的同时远端话音 期间为近端环境中的参与方提高话音可识度并且允许在分布式网络 中使用3D终端。
提供本发明的分布式电信系统的实施例,其中会议设备如主控 设备从共用声学空间中的多个从属终端接收信号从而实现共用声学 网络并且与(i)一个或者多个其它主控设备、(ii)一个或者多个 会议交换机、(iii)一个或者多个声学空间中的一个或者多个终端 或者(iv)任何数目的任何前述会议设备的组合中的任意一个具有多 信道会议连接。
也提供本发明的分布式电信系统的实施例,其中会议设备如会 议交换机支持来自多个参与方的连接,这些连接包括接收(i)来自 共用声学空间网络的一个或者多个主控设备的单声道或者多信道信 号、(ii)来自一个或者多个声学空间中的一个或者多个终端的单声 道或者多信道信号和/或(iii)任何数目的任何前述信号的组合。如 果会议交换机从共用声学空间中的终端接收多个信号,则会议交换 机可以对这些上行链路信号进行多路混合。
下文描述本发明的这些特征以及附加细节。类似地,下文也描 述用于分布式电话会议的本发明的多信道架构以及有关系统、方法 和计算机程序产品的对应和附加实施例。
附图说明
已经这样概括性地描述了本发明的实施例,现在将参照未必按 比例绘制的以下附图:
图1是多个参与方经由会议交换机实现集中式电话会议会话 的示意框图;
图2是集中式3D会议系统的功能框图;
图3是集中器集中式3D会议系统的功能框图;
图4是分散式3D会议系统的功能框图;
图5是实现分布式电话会议会话的多个参与方的示意框图,其 中经由会议交换机实现会议并且通过主控终端连接数个参与方;
图6是图5的分布式电话会议系统的主控设备的功能框图;
图7是使用多路混合和自动音量控制来增强单声道上行链路 信道的本发明一个实施例的分布式电话会议系统的主控设备的功能 框图;
图8是能够多路混合多个信号的根据本发明一个实施例的混 合器的功能框图;
图9是使用多信道上行链路连接的根据本发明一个实施例的 分布式电话会议系统的主控设备的功能框图;
图10是将两个信道的上行链路连接与活跃通话检测和活跃通 话ID信令一起使用的本发明一个实施例的分布式电话会议系统的主 控设备的功能框图;
图11是对上行链路信道进行空间定位的本发明一个实施例的 分布式电话会议系统的主控设备的功能框图;
图12是与对来自参与方的接收信道进行空间定位的本发明一 个实施例的多信道分布式电话会议系统相兼容的会议交换机的功能 框图;
图13是与对来自参与方的接收信道进行空间定位并且利用活 跃通话方ID信令对来自多信道分布式电话会议系统的信道的空间定 位进行控制的本发明一个实施例的多信道分布式电话会议系统相兼 容的会议交换机的功能框图;
图14是与集中多个输入信号(包括来自主控设备的多信道信 号)的本发明一个实施例的与多信道分布式电话会议系统相兼容的 会议交换机的功能框图;
图15是具有含两个信道的下行链路连接的本发明一个实施例 的分布式电话会议系统的主控设备的功能框图;
图16是具有多信道下行链路连接(代表来自远端参与方的逻 辑信道)的本发明一个实施例的分布式电话会议系统的主控设备的 功能框图;
图17是与各种类型的电话会议系统相兼容的本发明一个实施 例的会议交换机的功能框图;
图18是将从本发明实施例中受益的网络框架的框图;
图19是根据本发明一个实施例的能够作为终端、计算系统和/ 或会议服务器来操作的实体的示意框图;并且
图20是根据本发明一个实施例的能够作为终端、计算系统和/ 或会议服务器来操作的移动站的示意框图。

具体实施方式

下文将参照其中示出本发明的一些但是并非所有实施例的附 图更完全地描述本发明的实施例。事实上,本发明的实施例可以用 许多不同形式来实现而不应当理解为限于这里阐述的实施例;实际 上,提供这些实施例是为了这一公开将满足可适用的法律要求。相 似标号通篇地指代相似单元。
根据下文将认识到可以与本发明一起运用许多类型的设备,比 如这里称为移动站的设备,这些移动站例如包括移动电话、寻呼机、 手持数据终端和个人数据助理(PDA)、游戏系统和其它电子设备, 这些电子设备例如包括个人计算机、膝上型计算机、电话会议电话、 电话会议服务器、电话会议软件系统以及其它电子消费品和计算机 产品。另外,尽管下文参照用于在共用声学空间中建立邻近网络的 WLAN和蓝牙(BT)无线接入和通信协议来描述本发明,但是本发 明对用于建立共用声学空间网络的有线以及其它无线接入和通信协 议也是适用的,这些协议例如包括WiMAX和UWB无线协议。另外, 本发明一个实施例的会议设备如从属终端可以包括话音增强功能并 且包括例如用于声学回音消除、噪声抑制和对应信号处理的硬件和/ 或软件。
另外,尽管已经提到在共用物理位置处的分布式电话会议由邻 近网络实现,但是本发明的实施例可以与支持位于共用声学空间中 的多个终端和/或多个参与方的任一类分布式电话会议网络一起工 作,这些网络例如包括邻近网络或者3G电路交换连接网络,这里统 称为共用声学空间网络。共同定位于共用声学空间中的多个终端和/ 或多个参与方的物理性为主控设备提供了用以通过从共用声学空间 中的多个终端接收信号和向这些终端发送信号来实现分布式电话会 议的能力,由此实现共用声学空间网络。
另外,除了仅涉及到音频信号的传统电话会议呼叫之外,会议 呼叫也可以涉及到视频信号。为求简化,本申请仅涉及在涉及到音 频信号(简称为语音、语音信号、话音或者话音信号)的电话会议 呼叫的背景中的会议呼叫。然而,本发明的实施例可以使用在视频 会议应用中,其中在会议通信的数据传送中也包括视频信号。类似 地,本发明的实施例可以使用在会议应用中,其中在会议通信的传 送中也包括数据。另外,常常通过会议交换机从一个或者多个参与 方向一个或者多个其他参与方提供、交换或者以别的方式传送音频、 视频和/或数据通信(或者运送或者代表音频、视频和/或数据通信的 信号)。然而应当理解,这里可以互换地使用术语“提供”、“交换” 和“传送”,并且提供、交换或者传送音频、视频和/或数据通信可以 例如包括移动或者复制音频、视频和/或数据通信而不脱离本发明的 精神和范围。
将认识到本发明的实施例对于IP语音(VOIP)会议呼叫可能 特别地有用。然而,本发明的实施例不限于VOIP会议呼叫应用而是 可以应用于任何电话会议系统中,这些系统包括具有电路交换连接 的系统和具有支持多信道传输的电话会议通信网络的系统。另外, 虽然在本发明实施例的图中在多信道信号的各个单独信道上示出了 单独编码的分立编码解码器实例,但是可能可以与本发明的实施例 一起使用多信道编码解码器。另外,对于立体声或者多信道信号, 可以使用单路编码解码器对单独信道进行编码,或者可以使用实际 立体声或者多信道编码解码器。
如这里使用的那样,术语“参与方”一般可互换地指代参与方和 与该参与方相关联的会议设备或者支持该参与方参与会议呼叫的一 个或者多个会议设备。例如,提及会议中的参与方一般也指代与该 参与方相关联或者实现该参与方进行参与的会议设备,比如用户终 端。对近端参与方和远端参与方的提及提供了用于与会议呼叫中的 本地和远程参与方有关的传输的概念方向。如这里使用的那样,术 语“多路复用”指代从N个输入信号“选择”K个输出信号
本发明的实施例提供一种以分布式电话会议系统中的主控设 备这一概念为基础的新型电话会议架构,该分布式电话会议系统具 有通向网络的多信道会议连接,该网络将分布式电话会议系统连接 到无论是否与分布式电话会议系统共同定位、但是没有利用主控设 备来参与共用声学空间网络或者位置远离分布式电话会议系统的其 他参与方。通过具有多信道会议连接,主控设备能够发送和接收用 于实现会议呼叫的多个信号,比如发送多个信号到会议交换机、一 个或者多个其它终端和/或其他参与方以及从会议交换机、一个或者 多个其它终端和/或其他参与方接收多个信号。本发明的一个实施例 也可以将多信道信号发送到本地终端,其也称为在共用声学空间网 络中的那些终端。
本发明的实施例也可以包括对上行链路和下行链路信号处理 操作的改进。例如,可以对主控终端通过多信道会议通信从从属设 备接收的和向网络发送的各个麦克风信号进行上行链路处理操作。 主控设备在将一个或者多个处理的信号发送到会议交换机或者一个 或者多个其他远程参与方之前进行上行链路处理操作。类似地,可 以对主控终端从网络接收的和为了由从属设备的扬声器再现而发送 的各个信号进行下行链路处理操作。
与共用声学空间网络如邻近网络或者3G电路交换连接网络的 分布式电话会议系统的主控设备特别相关的上行链路处理的一个方 面是对从共用声学空间网络的从属终端接收到的多个信号进行多路 混合的操作。分布式电话会议通常依赖于单声道混合或者将共用声 学空间网络的多个信号混合成单个单声道上行链路信号。将从属终 端的单独的麦克风信号组合成单声道上行链路信号的一种或者多种 混合算法是任何电话会议系统的一个重要方面。例如,混合算法可 以在限定可用于在远程位置广播的传输的声音质量和远端参与方的 收听体验时发挥重要作用。一种混合算法通常涉及组合一个或者多 个最相关的信号并且由此创建如下上行链路信号,该上行链路信号 代表近端参与方用于远端参与方的相对应复制的声学环境。
混合算法的一个示例是求和算法,其中通过将所有输入麦克风 信号求和来形成输出。求和算法的一个弊端在于降低的信噪比和由 于输入信号之间的少量延迟差异而增加的回响效果。混合算法的另 一示例是在给定时间仅选择确定的最好信号(例如仅有活跃信号、 最响亮信号、比如信噪比(SNR)最高的最清楚信号等)的选择算 法。选择算法的一个弊端在于一次仅可以听到一个活跃发言方,并 且例如选择算法可能面临无法找到与扬声器最近的麦克风信号。这 样,使用多个麦克风的一些益处可能丧失。因而,混合算法可以是 将求和算法和单选算法的益处进行组合的智能复合式混合算法。这 样的智能复合式混合算法可以获得提高的信噪比和降低的由不同的 源到麦克风的传输时间的延迟造成的回响效果而又提供改进的可识 度和允许支持同时通话。
通过与从多个信号输入获得单个信号输出的单声道混合比较, 多路混合通过对多信道分布式电话会议同时进行多个并行混合操作 来提供对典型混合算法的增强。多路混合在两人或者更多人在共用 声学空间中同时进行通话时特别地有利。例如,一个混合器可以被 配置成拾取第一通话方的话音,而另一混合器可以被配置成拾取第 二通话方的话音。原则上,可以缩放多路混合操作,从而可以并行 运行多个同时混合操作,然而两个信号的多路混合通常可能是足够 的,因为同时有共用声学空间中的多于两个参与方的同时话音相对 地罕见。
如果主控设备仅具有通向会议网络的单声道连接,则多路混合 仍然可以用来增强系统,比如使用自动音量控制(AVC)功能来增 强同时话音信号的电平。例如,图7是使用多路混合和自动音量控 制来增强单声道上行链路信道的本发明一个实施例的分布式电话会 议系统的主控设备的功能框图。在上行链路方向上发送单声道信号 之前,混合器或者混合软件模可以执行多个输入信号与至少两个 所得输出信号的多路混合。可以对来自多路混合的两个所得输出信 号进行自动音量控制(AVC)功能以获得单个单声道上行链路信号。 例如,如果同时通话的两个参与方之一具有比另一通话参与方响亮 得多的语音或者具有如下麦克风,则多路混合单声道分布式电话会 议系统可以是有益的,该麦克风与第一通话参与方比该麦克风与第 二通话参与方近得多。收听同时通话参与方的平衡单声道混合的远 端参与方可以更容易跟随两个近端通话参与方中的任一或者两个参 与方。如果感知两个近端通话参与方同样响亮地通话,则不考虑参 与方语音的原有响度和/或与通话参与方有关的麦克风配置的任何差 别。因而,多路混合对于改进其中至少一个会议设备仅具有单声道 上行链路或者单声道下行链路会议连接的分布式电话会议系统也可 以是有益的。
当使主控设备能够用于上行链路方向上的多信道会议连接时, 来自多路混合的多个输出可以各自在它们的自有上行链路信道中传 输到会议网络。在本发明的执行多路混合从而在上行链路方向上获 得两个输出信号的一个实施例中,在两个参与方的同时通话期间, 第一输出可以包括第一参与方的话音的大部分和第二参与方的话音 的少部分,而第二输出可以包括第二参与方的话音的大部分和第一 参与方的话音的少部分。
在本发明一个实施例的一对一多路混合实施中,各多路混合信 号输出可以代表并且对应于共用声学空间网络中的会议呼叫的不同 参与方的话音信号。一个备选实施例例如可以涉及来自共用声学空 间网络的参与方的N个输入信号以及获得少于N的K个输出信号的 多路混合。另外,在N:K实施中,在多路混合之后进行的自动音 量控制功能还可以减少为上行链路方向提供的最终输出信号,比如 其中多路混合获得K个输出信号而自动音量控制功能获得少于K的 M个输出信号。这样的实施例可以称为N:K:M实施。又一备选 实施例例如可以涉及来自共用声学空间网络的参与方的N个输入信 号和获得N个输出信号的多路混合,而后续自动音量控制功能将多 路混合输出信号减少到为上行链路方向提供的M个输出信号。这样 的实施例可以称为N:N:M实施。
图8是根据本发明一个实施例、能够并且配置用于多路混合来 自共用声学空间网络类的参与方的多个信号的因此也称为多路混合 器的混合器或者软件混合模块78的功能框图。图8中所示多路混合 的示例实施包括通向多路混合器的N个输入信号信道和来自多路混 合器的K个输出信道。各输入信号可以先在特征提取过程84由软件 特征提取模块处理。提取和/或检测的特征然后可以在信道排序过程 90由软件信道排序模块对信道进行排序,比如对话音活动在对应麦 克风附近的估计概率进行排序。然后,可以并行运行K个单独混合 操作或者单独软件混合子例程模块188A、188B、188K以获得K个 输出信号,比如其中K个输出信号中的各个输出信号代表一个活跃 发言参与方。如果多路混合是基于线性组合,则例如以下方程可以 说明多路混合:
s 1 . . . s K = a 11 a 12 . . . a 1 N a 21 a 22 . . . a 2 N . . . . . . a 11 a 11 . . . a KN m 1 m 2 . . . m N
方程1
其中s1至K是并行K个混合器的输出信号,a11至KN是混合系数,而 m1至N是N个输入信号。然而将认识到可以使用许多不同混合算法来 实施本发明的实施例,这些混合算法包括在单声道分布式电话会议 中使用和/或为单声道分布式电话会议而设计的混合算法。另外取决 于实施,当前使用和/或可用传输信道,来自多路混合的输出信号的 数目可以从一变化至N。在一些示例实施例中,多路混合输出的数 目可以固定,而在其它示例实施例中,多路混合输出的数目可以例 如根据比如共用声学空间网络中的活跃通话参与方的数目和用于多 信道会议连接的可用带宽这样的因素来实时增加或者减少。当K为 来自多路混合的输出信号的数目时,如果K为1,则多路混合对应 于单声道混合实施例。如果K大于或者等于二而小于或者等于N-1 (2≤K≤N-1),则多路混合器进行2-(N-1)个并行混合操作,其中第 一输出信号代表在排序最高的从属终端附近的参与方、第二输出信 号代表在排序第二高的从属终端附近的参与方等等。一种典型实施 可以包括来自多路混合器的K个输出信号,其中K等于2,这代表 不多于两个发言方在共用声学空间网络的位置同时通话的常见情 形。如果K等于N,从而输出信号的数目等于输入信号的数目,则 多路混合器的各个混合器计算多个输入信号的线性组合,从而各个 输出信号代表在用于输入信号的对应麦克风附近发言的参与方。与 K=N情形对应的简易混合矩阵是简易地输出对应输入信号的对矩 阵。
如可以在单声道混合操作中包括的那样,多路混合操作也可以 包括用于不同情形的不同语音活动矩阵。对于这样的实施,或者为 了进一步增强多路混合操作,可以包括如下附加功能过程和对应软 件模块,该附加功能过程和对应软件模块用于同时通话检测(STD) 186A、活跃通话方标识检测(ID、Tx ID或者ATD)180、来自共用 声学空间网络中的参与方的输入信号在上行链路方向上的语音活动 检测(VAD)(Tx-VAD)186B和来自会话中不在共用声学空间网 络中的其他参与方的接收信号在下行链路方向上的语音活动检测 (VAD)(Rx-VAD)186C以及双重通话检测(DTD)186D。用于 混合矩阵的语音活动类可以例如包括至少以下情况:
●当在共用声学空间网络中没有活跃发言参与方时,无活跃通 话方(话音暂停);
●当在共用声学空间网络中有一个活跃发言参与方时,有上行 链路话音活动(Tx通话);
●当在共用声学空间网络中有多个(至少两个)活跃发言参与 方时,有同时通话(ST);
●当在共用声学空间网络以外有至少一个活跃发言参与方时, 有下行链路话音活动(Rx通话);
●当在共用声学空间网络中有一个活跃发言参与方而在共用 声学空间网络以外有至少一个活跃发言参与方时,有双重通话(DT); 以及
●当在共用声学空间网络中有多个(至少两个)活跃发言参与 方而在共用声学空间网络以外有至少一个活跃发言参与方时,有同 时/双重通话(SDT)。
本发明的一个实施例也可以包括用于平衡参与方的响度电平 (音量)的自动音量控制过程或者软件模块92。如上文关于本发明 的N:K:M实施所述,从多路混合到自动音量控制操作的信号数目 可以不同于上行链路方向上的输出信号数目。如果上行链路方向上 的输出是单声道信号并且多路混合在共用声学空间网络中的参与方 同时通话情形期间用于自动音量控制目的,则这一点尤其成立。
本发明的另一实施例可以将波束成形技术用于多路混合上行 链路处理,比如使用到达时间延迟(TDOA)和线性组合。此外,如 果希望更好地彼此分离话音信号或者更好地分离话音信号与背景噪 声,本发明的一个实施例可以使用盲来源分离技术,比如ICA(独 立分量分析),因为在幅度混合中所有同时发言方的所有语音泄漏 到所有混合输出。盲来源分离技术可以用来自适应地发现例如用于 混合矩阵如方程1的系数。
在共用声学空间中的活跃发言参与方之间的分离越好,在对应 混合器输出之间的相关性就越小。因而,在本发明的又一实施例中, 可以通过去相关方法、比如在多路混合之后并且如果为上行链路方 向则在传输信号之前使用互补梳状滤波或者音调移位来人为地减少 在多路混合的输出信号之间的相关性。这样的实施例在共用声学空 间网络中的两个同时通话参与方均远离麦克风时的情形中是可以有 益的。如果相关性过高,则有可能这些信号在接收器中的空间定位 在幻影图像生成很强时可能没有如期望的那样起作用。去相关有助 于解决这一问题。可以通过估计在混合器输出之间的相关性来控制 对去相关的使用,而如果多路混合器输出的相关性比希望的更高, 则可以应用去相关。
如上文已经描述的那样,可以用多种方式实施多信道分布式电 话会议,这些方式例如包括这里示出和描述的不同实施的各种组合, 比如图17的会议交换机,该会议交换机支持通向用于不同声学空间 中的参与方的多个不同类型的会议设备的会议连接。然而,某些实 施指定使用支持特定实施的附加特征。例如,图9是使用多信道上 行链路连接的本发明一个实施例的分布式电话会议系统的主控设备 的功能框图。在图9中,各上行链路信道从主控设备逻辑上地连接 到会议交换机。因而,需要与用于近端参与方的从属设备一样多的 上行链路信道或者与检测到的近端参与方一样多的上行链路信道。 因此,用于流(或者逻辑信道)的标识符同时是用于从属终端的标 识符(或者通话方ID),并且将ID检测默认地构建到多信道多路混 合中,尽管也可以如图10中所示地,在上行链路方向上传输通话方 ID信号。如果使用单独实时传送协议(RTP)流,则流需要由接收 器如会议交换机或者主控设备进行同步。在实践中,可以通过数目 更少的物理信道、例如通过最多三个信道来传输逻辑信道,而不连 续传输(DTX)功能可以用来减少带宽。这一类实施的简易示例是 传输作为多信道上行链路流之一的所有输入麦克风信号。在进行活 跃通话方标识检测时,检测算法可以考虑与话音信号有关的特征, 诸如估计的音高、格式频率等。
如上所述,某些实施指定使用支持该特定实施的附加特征。又 例如,图10是将固定两个信道的上行链路连接与活跃通话检测和活 跃通话ID信令一起使用的本发明一个实施例的分布式电话会议系统 的主控设备的功能框图。数目有限而固定的逻辑上行链路信道可以 传输到会议网络。在图10中,主控设备被配置成提供固定两个信道 的上行链路会议连接,并且逻辑和物理信道的数目相同,均为两个 信道。多路混合器200在所有多路混合输出信道中选择两个活跃信 道,然后多路复用器202将这两个活跃信道多路复用成两个上行链 路信道。对于这样的实施,主控设备也提供与各信道相关联的标识 符用以指示活跃从属终端(或者参与方)的标识(或者通话方ID)。 为了提供该标识符,主控设备比如通过活跃通话方标识检测软件模 块204来进行活跃通话方标识检测。用于各信道的标识符在活跃通 话参与方改变时改变,而主控设备持续地监视活跃通话参与方以针 对与活跃通话参与方对应的各信道提供标识符。当有同时通话参与 方时,不同标识符可以用于信道。在一个示例性实施例中,可以使 用运送多信道信号的实时协议流。在另一示例实施例中,可以在两 个可用上行链路信道上传输被检测为具有最高能量(通话参与方的 音量)的两个输入麦克风信号。
如上文简述,本发明的实施例也可以进行作为混合操作的一部 分或者与混合操作并行的同时通话检测(STD)。同时通话检测用 来检测有多少近端参与方在进行活跃通话并且由此有可能确定有多 少活跃信号由主控设备传输到会议网络。例如在图10的实施例中, 当在共用声学空间网络中仅有一个活跃通话参与方时,第一信道可 以运送第一(并且唯一)通话参与方的多路混合信号,第一活跃通 话参与方的通话方ID与第一信道相关联,而第二信道可以被静音或 者用来运送比如先前可能已经通话过的参与方这样的另一(沉默) 参与方的话音。当在共用声学空间网络中的第二参与方开始同时与 第一通话参与方活跃地进行通话时,同时通话检测可以激活多路混 合操作以多路混合用于此第二活跃通话参与方的输入麦克风信号。 多路混合器然后可以在第二信道上传输用于第二活跃通话参与方的 多路混合信号,并且用于第二活跃通话参与方的通话方ID可以与第 二信道相关联。因此,当有最多两个同时活跃通话参与方时,可以 在相应上行链路信道上传输用于两个活跃通话参与方的输入麦克风 信号。如果有比可用上行链路信道更多的活跃通话参与方,则某一 形式的优先化可以被用来选择哪些活跃通话参与方将被多路混合到 可用上行链路信道。
活跃通话方标识(或者活跃通话方标识确定)对于各种目的可 能是有利的,这些目的包括控制对哪些参与方正在进行活跃通话而 进行3D空间定位和可视化。身份检测功能(用于活跃通话方标识) 可以在本发明的各种实施例中采用不同形式。例如,根据如何在主 控设备中实施身份检测功能,与上行链路信道相关联的通话方ID可 以是如下从属设备的标识,即上行链路信道上的信号主要从该从属 设备组成,或者与上行链路信道相关联的通话方ID可以是在共用声 学空间网络中的活跃通话参与方的标识。在与上行链路信道相关联 的通话方ID是在共用声学空间网络中的活跃通话参与方的标识这一 后者的情况下,在主控设备中实施的身份检测功能可以能够并且配 置用于检测比在共用声学空间网络中的从属设备更多的、在共用声 学空间网络中的参与方的身份。例如,通话方ID可以与各参与方特 有的SIP用户URI如johnsmith@session123.telco.com相关联。这一 类身份检测功能一般需要身份检测算法以使主控设备能够识别共用 声学空间网络中的参与方。可以与本发明的实施例一起使用的身份 检测算法可以例如基于二进制矢量、比例或者概率矢量和/或实时协 议具体信令。二进制矢量身份检测算法的示例是[1,0,1,0,0,0], 其中共用声学空间网络包括六个参与方,并且第一个和第三个参与 方在目前身份检测估计期间活跃地进行通话。比例或者概率矢量身 份检测算法的示例是[0.5,0.0,0.7,0.0,0.0,0.0],其中共用声学 空间网络包括六个参与方,并且第一个参与方活跃通话的概率为 0.5,而第三个参与方活跃通话的概率为0.7。实时协议具体信令身份 检测算法的示例涉及到(a)一个实时协议流,该实时协议流运送多 信道信号,该信号具有贡献来源(CSRC)列表中的第一同步来源 (SSRC)标识符,该标识符描述哪个参与方作为主活跃来源活跃地 进行通话;以及(b)多个实时协议流,用来运送多信道信号,这些 信号具有贡献来源(CSRC)列表中的第一同步来源(SSRC)标识 符,该标识符描述哪个参与方作为主活跃来源活跃地进行通话,其 中如果第一个来源对于所有流是相同的,则第一同步来源可以用来 表明仅一个参与方活跃地进行通话,并且其中至少两个流上的不同 同步来源表明在共用声学空间网络中有同时活跃通话参与方。
在分布式电话会议系统中运用多信道上行链路使接收参与方 能够对从多信道分布式电话会议系统接收到的话音信号进行空间定 位。可以在各种位置并且通过会议系统中的各种会议设备进行方位 3D处理(空间定位)。例如,可以在主控设备中、在集中式会议交 换机中和在接收设备中进行3D处理。例如,图11是对上行链路空 间信道进行定位的、本发明一个实施例的分布式电话会议系统的主 控设备的功能框图。图12是对来自参与方的接收信道进行空间定位 的、本发明一个实施例的与多信道分布式电话会议系统相兼容的会 议交换机的功能框图。图13是对来自参与方的接收信道进行空间定 位并且利用活跃通话方ID信令对来自多信道分布式电话会议系统的 信道的空间定位进行控制的、本发明一个实施例的与多信道分布式 电话会议系统相兼容的会议交换机的框图。并且图14是集中多个输 入信号(包括来自主控设备的多信道信号)的、本发明一个实施例 的与多信道分布式电话会议系统相兼容的会议交换机的功能框图。
图11的实施例代表其中在主控设备中进行3D处理的第一种 情况。主控设备包括处理多路混合信号并且通过两个上行链路信道 在两个信道上将3D信号如双声道信号发送到会议网络的3D处理器 或者3D处理软件模块210。为了实施主控设备对上行链路信号进行 3D处理的实施例,特别是如果两个上行链路信道代表双声道信号而 不是单独信道上的两个分立话音信号,则接收设备也将需要知道将 来自多信道分布式电话会议系统的上行链路信号解释为3D信号。当 会议连接在单个具有3D功能的接收终端与主控设备之间或者在两 个主控设备之间时,其中两个上行链路信道用来传输双声道信号的 一个实施例可能特别地有利。
图12和图13的实施例代表其中在集中式会议交换机中进行 3D处理的第二种情况。图12的实施例代表其中逻辑信道的数目与 通话方ID的数目相同的情形。在这样的情形中,可以认为各设备(或 者通话方)通过它的自有逻辑信道来进行传输,并且各逻辑信道默 认地代表用于对应设备(或者通话方)的通话方ID。这样,会议交 换机无需来自共用声学空间网络的主控设备的单独活跃通话方标识 信令,并且会议交换机可以根据信道(或者流)标识符对所有接收 的逻辑信道进行3D处理。图13的实施例代表其中共用声学空间网 络的主控设备进行活跃通话方标识信令发送并且向会议交换机提供 用以指示各信道的通话方ID(用于设备或者通话方)的ID信号的情 形。从用于共用声学空间网络的多信道分布式电话会议系统的主控 设备接收到的ID信息由会议交换机用来控制对多信道信号的信道的 空间定位。在两种情形中,会议交换机包括进行3D处理操作的3D 处理器或者3D处理软件模块212、214。在两种情形中,会议交换 机也需要知道信号来自多信道分布式电话会议系统的相同主控设 备。这允许会议交换机从由会议交换机向多信道分布式电话会议系 统的主控设备发送的信号(这些信号代表不是多信道分布式电话会 议系统的共用声学空间网络一部分的、会议呼叫的其他参与方的话 音信号)中排除来自多信道分布式电话会议系统的上行链路信号。 也就是说,会议交换机可以从不是用于共用声学空间网络一部分的 终端的信号中分离出用于共用声学空间网络中的终端的信号,以免 将来自共用声学空间网络中的终端的信号重传回到共用声学空间网 络并且由此重传回到那些相同终端。
图14的实施例代表用于其中在接收终端中进行3D处理的第 三种情况的会议交换机。可以是分布式电话会议系统中的主控设备 的比如由图3的用户终端122、124代表的接收终端如图14中所示, 包括处理从会议交换机接收的多路复用信号的3D处理器或者3D处 理软件模块。图14中的会议交换机包括多路复用器或者软件模块中 的多路复用器216并且充当集中器,该集中器从会议呼叫中的参与 方收集所有上行链路信号并且例如将上至最多所有接收的上行链路 信号发送到其他参与方。比如当会议交换机仅将用于活跃通话参与 方的信号发送到其他参与方时,可以向其他参与方发送少于所有接 收的上行链路信号。如上所言,可以在接收终端处理下行链路方向 上对接收信号的3D处理。
如先前所言,本发明一个实施例的主控设备也可以对从会议交 换机或者在共用声学空间网络以外的其他参与方接收的信号进行下 行链路处理以例如重新生成接收的声音的3D属性或者受益于邻近 网络中的立体声IHF从属终端的功能。在这样的实施例中,主控设 备在将接收的信号重传到共用声学空间网络中的从属终端之前进行 下行链路处理。与在上行链路方向上一样,本发明一个实施例的主 控设备可以能够并且被配置用于在下行链路方向上实现多信道会议 连接。也就是说,主控设备或者其它会议设备如会议交换机或者用 户终端也可以接收多信道信号。可以直接地从能够并且被配置用于 在上行链路方向上实现多信道会议连接的另一主控设备、从支持多 信道传输的会议交换机(比如图3或者图14的集中器会议交换机) 或者从多个用户终端接收下行链路多信道信号。类似于在上行链路 方向上的传输,本发明的各种实施例可以实施活跃通话方标识信令。 例如,图15是具有两个信道的下行链路连接的本发明一个实施例的 分布式电话会议系统的主控设备的功能框图。在图15的实施例中, 主控设备接收活跃通话方标识信号以识别通过两个下行链路信道接 收的信号的活跃通话参与方(设备或者通话方)。类似地,例如图 16是具有多信道下行链路连接(代表来自远端参与方的逻辑信道) 的本发明一个实施例的分布式电话会议系统的主控设备的功能框 图。不同于图15的实施例的主控设备,图16的实施例中的主控设 备无需活跃通话方ID信令,因为信道(或者流)标识符本身可以表 明下行链路信号的来源。在图17的实施例中,会议交换机从声学空 间C的共用声学空间网络的主控设备接收活跃通话方标识信号并且 将至少所示的活跃通话方标识信号传输到声学空间C的共用声学空 间网络的主控设备。注意如下文进一步所述,已经简化图17的框图 以仅示出对去往声学空间C的共用声学空间网络的主控设备的下行 链路信号进行混合操作,尽管在实践中也将对所有接收设备进行相 当的混合操作。
在本发明的各种实施例中,当仅有一个活跃通话参与方时,所 有下行链路信号可以相同(这与在单声道分布式电话会议系统的现 有技术情况中一样)并且无需下行链路混合。在这样的情况下或者 在其中将相同信号从主控设备发送到共用声学空间网络中的所有从 属设备的情况下,主控设备可以发送广播信号。然而,当有同时活 跃通话参与方时,主控设备可以使用下行链路混合以生成增强的下 行链路信号以便从属终端并且也可能是主控设备再现来自不在共用 声学空间网络中的参与方的话音。例如,由于多信道下行链路信号 可以由从属终端的扬声器再现,所以可以用如下方式混合同时活跃 通话参与方使得在共用声学空间中的收听方可以感知同时活跃通话 参与方局部化于不同地方。这样的3D处理(空间定位和在下行链路 混合期间进行的其它3D处理)可以特别是在同时活跃通话来源(参 与方)之间感知空间分离时提高用于共用声学空间中的收听参与方 的话音可识度。在本发明的又一实施例中,主控设备(或者会议桥 接器)可以如图15和图16中所示具有通向共用声学空间网络中具 有至少一个其它终端的单个参与方的多信道连接。就此而言,主控 设备(或者会议服务器)可以通过单声道信号、多信道信号或者双 声道信号来与共用声学空间网络中具有至少一个其它终端的参与方 的一个终端进行通信。例如,如果终端配备有立体声集成自动对讲 或者立体声头戴受话器,则该终端可以接收多信道信号或者双声道 信号以再现接收的信号的3D表示。
本发明的一个备选实施例可以将主控设备和会议交换机的功 能组合到单个会议设备网络实体中,比如其中共用声学空间网络的 各从属终端具有通向组合式主控设备/会议交换机网络实体的连接。 为了区分在共用声学空间网络中的从属终端的会议连接和不在共用 声学空间网络中、但是通过会议网络连接来连接到组合式主控设备/ 会议交换机网络实体的参与方,本发明的这样的实施例可以运用在 共用声学空间网络中的从属终端与组合式主控设备/会议交换机网络 实体之间的共用声学空间网络模式表明信令。这样的共用声学空间 网络模式表明信令可以向组合式主控设备/会议交换机网络实体表明 从属设备在与其它从属终端的共用声学空间网络中。因而,组合式 主控设备/会议交换机网络实体然后可以按照用于该从属设备和在共 用声学空间网络中的其它从属设备的传统主控设备的方式来工作, 从而比如从下行链路信号排除共用声学空间网络中已经在相同物理 位置的从属终端的信号,由此向在共用声学空间网络中的从属终端 提供仅代表来自不在共用声学空间网络中的参与方的话音的下行链 路信号。类似地,比如下文结合图17所述的,本发明的一个实施例 可以包括由单个会议桥接器或者组合式主控设备/会议交换机网络实 体支持的数个共用声学空间网络,比如多个邻近网络。
图17是与各种类型的电话会议系统相兼容的本发明一个实施 例的会议交换机的功能框图。该会议交换机从数个声学空间A、B、 C和D接收上行链路信号,其中在至少一个声学空间中有多个终端。 多个终端位于三个共用声学空间A、B和C中,并且这多个终端中 的任何终端都可以通过用于相应共用声学空间的共用声学空间网络 连接到会议桥接器。单个终端位于声学空间D中。如先前所述,会 议交换机可以能够进行上行链路混合和下行链路混合中的任一种或 者两种混合。例如,图17中的会议交换机对从共用声学空间A中的 终端接收的信号进行上行链路混合而对从共用声学空间B中的终端 接收的信号进行上行链路多路混合。通过比较,在共用声学空间C 中的主控终端为在共用声学空间C中的终端提供共用声学空间并且 在将多信道信号与通话方ID一起传输到会议交换机之前对来自这些 终端的信号的上行链路进行混合。
虽然会议交换机将向提供上行链路信号给会议交换机的所有 会议设备提供下行链路信号,但是在图17中仅描绘用于声学空间C 的共用声学空间网络的会议设备的下行链路信号。另外,描绘的下 行链路信号代表去往声学空间C的共用声学空间的主控设备的多信 道信号。会议交换机进行下行链路混合并且传输来自共用声学空间A 中的终端、来自共用声学空间B中的终端和声学空间D的终端的代 表活跃通话方(终端和/或参与方)的两个信号。活跃通话方ID在下 行链路方向上由会议交换机提供以标识由两个(或者更多)下行链 路信号代表的终端。对各个参与终端单独地进行由会议交换机执行 的下行链路混合以例如如上所述从用于终端的下行链路信号取出用 于相同终端的上行链路信号。
参照图18,提供将从本发明中受益的一类终端和系统的图示。 将主要地结合移动通信系统来描述本发明的系统、方法和计算机程 序产品。然而应当理解可以在移动通信产业中和在移动通信产业以 外结合各种其它应用来利用本发明实施例的系统、方法和计算机程 序产品。例如,可以结合有线和/或无线网络(例如因特网)应用来 利用本发明实施例的系统、方法和计算机程序产品。
如图所示,一个或者多个终端10各自可以包括用于发送信号 到基站点或者基站(BS)14以及用于从基站点或者基站(BS)14 接收信号的天线12。基站是一个或者多个蜂窝网络或者移动网络的 一部分,其中各网络包括为了操作该网络而需要的单元,比如移动 交换中心(MSC)16。如本领域技术人员众所周知,移动网络也可 以称为基站/MSC/互相作用功能(BMI)。在操作中,MSC能够在终 端进行和接收呼叫时为去往和来自终端的呼叫寻路由。当在呼叫中 涉及到终端时,MSC也可以提供通向陆线干线的连接。此外,MSC 可以能够控制对去往和来自终端的消息的转发并且也可以控制对用 于终端的去往和来自消息接发中心的转发。
MSC 16可以耦合到数据网络,比如局域网(LAN)、城域网 (MAN)和/或广域网(WAN)。MSC可以直接地耦合到数据网络。 然而在一个典型实施例中,MSC耦合到GTW 18,而GTW耦合到 WAN,比如因特网20。诸如处理单元(例如个人计算机、服务器计 算机等)之类的设备又可以经由因特网耦合到终端10。例如,如下 文说明的那样,处理单元可以包括与计算系统22(图18中示出两 个)、会议服务器24(图18中示出一个)等相关联的一个或者多个 处理单元,如下文说明的那样。
BS 14也可以耦合到信令GPRS(通用分组无线电服务)支持 节点(SGSN)26。如本领域技术人员所知,SGSN通常能够进行与 用于分组交换服务的MSC 16相似的功能。SGSN类似于MSC可以 耦合到数据网络,比如因特网20。SGSN可以直接地耦合到数据网 络。然而在一个更典型的实施例中,SGSN耦合到分组交换核心网络, 比如GPRS核心网络28。分组交换核心网络然后耦合到另一GTW, 比如GTW GPRS支持节点(GGSN)30,而GGSN耦合到因特网。 除了GGSN之外,分组交换核心网络也可以耦合到GTW 18。GGSN 也可以耦合到消息接发中心。就此而言,GGSN和SGSN类似于MSC 可以能够控制对消息如MMS消息的转发。GGSN和SGSN也可以能 够控制对用于终端的去往和来自消息接发中心的消息的转发。
此外,通过将SGSN 26耦合到GPRS核心网络28和GGSN 30, 诸如计算系统22和/或会议服务器24的设备可以经由因特网20、 SGSN和GGSN耦合到终端10。就此而言,诸如计算系统和/或会议 服务器的设备可以跨SGSN、GPRS和GGSN与终端进行通信。通过 将终端和其它设备(例如计算系统、会议服务器等)直接地或者间 接地连接到因特网,终端可以比如根据超文本传送协议(HTTP)与 其它设备进行通信和相互进行通信以由此实现终端的各种功能。
虽然这里没有示出和描述每个可能的移动网络的每个单元,但 是应当认识到终端10可以通过BS 14耦合到多个不同网络中的任何 一个或者多个网络。就此而言,一个或者多个网络可以能够支持根 据多个第一代(1G)、第二代(2G)、2.5G和/或第三代(3G)移 动通信协议等中的任何一个或者多个协议的通信。例如,一个或者 多个网络可以能够支持根据2G无线通信协议IS-136(TDMA)、GSM 和IS-95(CDMA)的通信。又例如,一个或者多个网络可以能够支 持根据2.5G无线通信协议GPRS、增强型数据GSM环境(EDGE) 等的通信。再例如,一个或者多个网络可以能够支持根据3G无线通 信协议的通信,比如运用宽带码分多址(WCDMA)无线电接入技术 的通用移动电话系统(UMTS)网络。如双模或者更高模式的移动站 (例如数字/模拟或者TDMA/CDMA/模拟电话)应当的那样,一些 窄带AMPS(NAMPS)以及TACS网络也可以从本发明的实施例中 受益。
终端10还可以耦合到一个或者多个无线接入点(AP)32。AP 可以包括配置成根据如下技术与终端进行通信,这些技术例如是射 频(RF)、蓝牙(BT)、红外线(IrDA)或者多种不同无线联网技 术中的任何技术,这些无线联网技术包括无线LAN(WLAN)技术 如IEEE 802.11(例如802.11a、802.11b、802.11g、802.11n等)、 WiMAX技术如IEEE 802.16和/或超宽带(UWB)技术如IEEE 802.15 等。AP可以耦合到因特网20。与MSC 16类似,AP可以直接地耦 合到因特网。然而在一个实施例中,AP经由GTW 18间接地耦合到 因特网。如将认识到的那样,通过将终端和计算系统22、会议服务 器24和/或多个其它设备中的任何设备直接地或者间接地耦合到因 特网,终端可以相互进行通信、与计算系统等进行通信以由此实现 终端的各种功能,比如将数据、内容等传输到计算系统和/或从计算 系统接收内容、数据等。如这里使用的那样,术语“数据”、“内容”、 “信息”和类似术语可以互换地用来指代配置用于根据本发明的实施 例来发送、接收和/或存储的数据。因此,对任何这样的术语的使用 不应理解为限制本发明的精神实质和范围。
虽然在图18中未示出,但是除了跨因特网20将终端10耦合 到计算系统22之外或者取而代之,终端和计算系统可以相互耦合并 且根据例如RF、BT、IrDA或者包括LAN、WLAN、WiMAX和/或 UWB技术的多种不同有线或者无线通信技术中的任何技术来进行 通信。除此之外或者取而代之,一个或者多个计算系统还可以包括 用于存储可以随后向终端传送的内容的可拆卸存储器。另外,终端 10可以耦合到一个或者多个电子设备,比如打印机、数字投影仪和/ 或其它多媒体捕获、产生和/或存储设备(或者其它终端)。与计算 系统22类似,终端可以被配置成根据例如RF、BT、IrDA或者包括 USB、LAN、WLAN、WiMAX和/或UWB技术的多种不同有线或者 无线通信技术中的任何技术来与便携电子设备进行通信。
现在参照图19,根据本发明一个实施例示出了能够作为终端 10、计算系统22和/或会议服务器24来操作的实体的框图。虽然表 示为单独实体,但是在一些实施例中一个或者多个实体可以支持逻 辑上分离、但是共同定位于这一个或者多个实体内的终端、会议服 务器和/或计算系统中的一个或者多个。例如,单个实体可以支持逻 辑上分离、但是共同定位的计算系统和会议服务器。同样,例如, 单个实体可以支持逻辑上分离、但是共同定位的终端和计算系统。 此外,例如,单个实体可以支持逻辑上分离、但是共同定位的终端 和会议服务器。
能够作为终端10、计算系统22和/或会议服务器24来操作的 实体包括用于根据本发明的示例性实施例来执行一个或者多个功能 的装置,包括这里更具体示出和描述的各种装置。然而应当理解, 一个或者多个实体可以包括用于执行一个或者多个类似功能的备选 装置而不脱离本发明的精神实质和范围。具体而言,例如如图19中 所示,实体可以包括连接到存储器36的处理器、控制器或者类似处 理单元34。存储器可以包括易失性和/或非易失性存储器并且通常存 储内容、数据等。例如,存储器通常存储从实体发送和/或由实体接 收的内容。又例如,存储器通常存储用于处理器进行与根据本发明 实施例的实体的操作相关联的步骤的、比如用于操作系统和客户机 应用的计算机程序代码。存储器36可以例如是只读存储器(ROM)、 随机存取存储器(RAM)、闪速驱动、硬驱动和/或其它固定数据存 储器或者存储设备。
如这里所述,一个或者多个客户机应用可以各自包括由相应实 体操作的软件。然而应当理解,这里描述的客户机应用中的任何一 个或者多个可以代之以包括固件或者硬件而不脱离本发明的精神实 质和范围。一般而言,终端10、计算系统22和/或会议服务器24可 以包括用于执行一个或者多个客户机应用的各种功能的一个或者多 个逻辑单元。如将认识到的那样,可以用多种不同方式中的任何方 式来实施逻辑单元。就此而言,执行一个或者多个客户机应用的功 能的逻辑单元可以实施于集成电路组件中,该组件包括一个或者多 个集成电路,该集成电路与相应网络实体(即终端、计算系统、会 议服务器等)或者更具体而言例如与相应网络实体的处理器34一体 化或者进行通信。集成电路的设计大体上是高度自动化的过程。就 此而言,复杂而强大的软件工具可用于将逻辑级的设计转换成准备 好在半导体衬底上蚀刻和形成的半导体电路设计。这些软件工具(比 如由加利福尼亚弗里蒙特的Avant!公司和加利福尼亚圣何塞的 Cadence Design提供的软件工具)使用建立好的设计规则以及庞大的 预存设计模块库在半导体芯片上自动对导体进行布线并且对部件进 行定位。一旦已经完成用于半导体电路的设计,标准化电子格式(例 如Opus、GDSII等)的所得设计可以传输到半导体制作设施或者“制 作室”进行制作。
除了存储器36之外,处理器34也可以连接到用于显示、发送 和/或接收数据、内容等的至少一个接口或者其它装置。就此而言, 一个或者多个接口可以包括用于发送和/或接收数据、内容等的至少 一个通信接口38或者其它装置。如下文说明的那样,例如一个或者 多个通信接口可以包括用于连接到第一网络的第一通信接口和用于 连接到第二网络的第二通信接口。当实体提供无线通信以在无线网 络如蓝牙网络、无线网络或者其它移动网络中操作时,处理器34可 以与接口38的无线通信子系统一起操作。除了一个或者多个通信接 口之外,一个或者多个接口也可以包括至少一个用户接口,该用户 接口包括一个或者多个耳机和/或扬声器39、显示器40和/或用户输 入设备接口42。用户输入接口又可以包括允许实体从用户接收数据 的多个设备中的任何设备,比如麦克风、键区、触摸显示器、操纵 杆或者其它输入设备。一个或者多个处理器、存储器、存储设备和 其它计算单元可以作为相同平台的部分由计算机系统和子系统共有 地使用,或者处理器可以作为多个平台的部分分布于计算机系统与 子系统之间。
如果实体例如是主控设备或者其它具有电话会议功能的通信 设备,则实体也可以包括连接到处理器34的电话会议连接模块82、 特征提取模块84、检测模块86和混合器或者混合模块88。这些模 块可以是软件和/或软件-硬件部件。例如,电话会议连接模块82可 以包括能够建立主控设备与会议交换机之间的多信道会议连接并且 管理其间通信的软件和/或软件-硬件部件。特征提取模块84可以包 括能够从相应信号提取或者确定描述特征集或者特征矢量集的软 件。检测模块86可以包括能够进行比如活跃通话方身份检测、双重 通话检测(DTD)、同时通话检测(STD)和语音活动检测(VAD) 这样的音频检测功能的软件。混合器或者混合模块88可以包括能够 处理相应信号以比如组合多个信号和对多个信号实现混合算法以求 多信道连接的软件和/或软件-硬件部件。
现在参照图20,该图图示了将从本发明的实施例中受益的一 类终端10。然而应当理解,图示的和下文描述的终端仅说明将从本 发明中受益的一类终端、因此不应理解为限制本发明的范围。尽管 出于举例目的而图示了并且下文将描述本发明的数个实施例,但是 其它类型的终端如便携数字助理(PDA)、寻呼机、膝上型计算机、 移动电话、移动站、个人游戏设备、个人计算机、游戏控制台和其 它类型的电子系统可以容易地运用本发明。
终端10包括用于根据本发明的示例实施例执行一个或者多个 功能的各种装置、包括这里更具体示出和描述的各种装置。然而应 当理解,终端可以包括用于进行一个或者多个类似功能的备选装置 而不脱离本发明的精神实质和范围。具体而言,例如如图20中所示, 除了天线12之外,终端10还包括发送器44、接收器46以及提供信 号给发送器和从接收器接收信号的控制器48。这些信号包括根据适 用蜂窝系统空中接口标准的信令信息并且也包括用户话音和/或由用 户生成的数据。就此而言,终端可以被配置用于按照一个或者多个 空中接口标准、通信协议、调制类型和接入类型来进行操作。具体 而言,终端可以被配置用于根据多个第一代(1G)、第二代(2G)、 2.5G和/或第三代(3G)通信协议等中的任何协议来进行操作。例如, 终端可以被配置用于根据2G无线通信协议IS-136(TDMA)、GSM 和IS-95(CDMA)来进行操作。又例如,终端可以被配置用于根据 2.5G无线通信协议GPRS、增强型数据GSM环境(EDGE)等来进 行操作。再例如,终端可以被配置用于根据3G无线通信协议来进行 操作,比如运用宽带码分多址(WCDMA)无线电接入技术的通用移 动电话系统(UMTS)网络。如双模或者更高模式的电话(例如数字 /模拟或者TDMA/CDMA/模拟电话)应当的那样,一些窄带AMPS (NAMPS)以及TACS移动终端也可以从本发明的教导中受益。
可以理解,控制器48包括为了实施终端10的音频和逻辑功能 而需要的电路。例如,控制器可以包括数字信号处理器设备、微处 理器设备以及各种模拟到数字转换器、数字到模拟转换器和其它支 持电路。终端的控制和信号处理功能根据它们的相应能力在这些设 备之间分配。控制器还可以包括内部语音编码器(VC)48A并且可 以包括内部数据调制解调器(DM)48B。另外,控制器可以包括用 以操作可以存储于存储器中的一个或者多个软件程序的功能。例如, 控制器可以被配置用于操作连接程序,比如常规Web浏览器。连接 程序然后可以允许终端例如根据HTTP和/或无线应用协议(WAP) 来发送和接收Web内容。
终端10也包括用户接口,该用户接口包括全部耦合到控制器 48的一个或者多个输出设备,比如耳机和/或扬声器50、响铃器52、 显示器54和用户输入接口。允许终端接收数据的用户输入接口可以 包括允许终端接收数据的多个设备中的任何设备,比如麦克风56、 键区58、触摸显示器和/或其它输入设备。在包括键区的实施例中, 该键区包括常规数字键(0-9)和有关键(#、*)以及用于操作终端 的其它键。取而代之或者除此之外,键区还可以包括QUERTY键区 布置。终端也可以包括电池如振动电池包,该电池用于向为了操作 终端而需要的各种电路供电以及可选地提供作为可检测的输出的机 械振动。
终端10也可以包括用于共享和/或获得数据的一个或者多个装 置。例如,终端可以包括近程射频(RF)收发器或者询问器60,从 而可以根据射频技术与电子设备共享数据和/或从电子设备获得数 据。除此之外或者取而代之,终端还可以包括其它近程收发器,例 如红外线(IR)收发器62和/或使用由蓝牙(BT)专兴趣组开发 的蓝牙品牌无线技术来操作的蓝牙收发器64。因而除此之外或者取 而代之,终端还可以被配置用于根据这样的技术发送数据到电子设 备和/或从电子设备接收数据。虽然未示出,但是除此之外或者取而 代之,终端还可以被配置用于根据包括WLAN、WiMAX、UWB技 术等的多种不同无线联网技术发送数据到电子设备和/或从电子设备 接收数据。
终端10还可以包括通常存储与移动用户有关的信元的存储 器,比如用户标识模块(SIM)66、可拆卸用户标识模块(R-UIM) 等。除了SIM之外,终端还可以包括其它可拆卸和/或固定存储器。 就此而言,终端可以包括易失性存储器68,比如包括用于临时存储 数据的高速缓存区的易失性随机存取存储器(RAM)。终端也可以 包括可以是嵌入的和/或者可以是可拆卸的其它非易失性存储器70。 除此之外或者取而代之,非易失性存储器还可以包括比如可从加利 福尼亚谷的SanDisk公司或者加利福尼亚弗里蒙特的Lexar Media 公司获得的EEPROM、闪存等。存储器可以存储由终端用来实施终 端功能的多条信息和数据中的任何信息和数据。例如,存储器可以 存储能够比如向MSC 16唯一地标识移动站的诸如国际移动设备标 识(IMEI)代码、国际移动用户标识(IMSI)代码、移动站综合服 务数字网络(MSISDN)代码(移动电话号码)、会话发起协议(SIP) 地址等标识符。此外,存储器还可以存储配置用于在终端上操作的 一个或者多个客户机应用。
根据本发明的示例实施例,可以经由会议服务器24在分布式 或者集中式布置中经由多个设备(例如终端10、计算系统22等)在 多个参与方之间建立会议会话。参与方可以位于各自包括至少一个 参与方的多个远程位置。对于包括多个参与方的至少一个位置,那 些参与方可以在共用声学空间中形成网络。在会议会话期间,参与 方的设备然后可以生成代表与相应设备相邻并且因此由相应设备拾 取的音频或者话音活动的信号。信号然后可以混合成用于向会议会 话的其他参与方通信的输出信号。
根据本发明的一个方面,包括上述装置的各种装置如硬件和/ 或固件(例如混合器88)可以独自和/或在计算机程序产品的控制之 下进行由系统的一个或者多个实体如终端10、计算系统22或者会议 服务器24执行的功能。用于进行本发明实施例的一个或者多个功能 的计算机程序产品包括计算机可读存储介质如非易失性存储介质以 及软件,该软件包括实施于计算机可读存储介质中的计算机可读程 序代码部分,比如一连串计算机指令。类似地,本发明的实施例可 以并入于硬件和软件系统和子系统、硬件系统和子系统的组合中以 及软件系统和子系统的组合中并且并入于其网络设备和系统及其移 动站中。在这些网络设备和系统以及移动站以及能够使用如上所述 本发明系统或者实现所述本发明方法的其它设备和系统中的各网络 设备和系统以及移动站中,网络设备和系统以及移动站一般可以包 括计算机系统,该计算机系统包括能够在软件控制之下进行操作以 提供上述技术的一个或者多个处理器。
就此而言,功能框图或者流程图的各个块或者步骤以及功能框 图或者流程图中的块的组合可以由各种装置来实施,这些装置比如 是硬件、固件和/或包括一个或者多个计算机程序指令的软件。如将 认识到的那样,任何这样的计算机程序指令可以加载到计算机或者 其它可编程装置(即硬件)上以产生机器,从而在计算机或者其它 可编程装置上执行的指令产生用于实施在功能框图和流程图的一个 或者多个块或者一个或者多个步骤中指明的功能的装置。这些计算 机程序指令也可以存储于计算机可读存储器中,该存储器可以指导 计算机或者其它可编程装置以特定方式工作,从而存储于计算机可 读存储器中的指令产生如下制造产品,该制造产品包括实施在功能 框图和流程图的一个或者多个块或者一个或者多个步骤中指定的功 能的指令装置。计算机程序指令也可以加载到计算机或者其它可编 程装置上以造成在计算机或者其它可编程装置上进行一连串操作步 骤以产生计算机实施的过程,从而在计算机或者其它可编程装置上 执行的指令提供用于实施在功能框图和流程图的一个或者多个块或 者一个或者多个步骤中指定的功能的步骤。
因而,功能框图和流程图的块或者步骤支持用于执行指定功能 的装置的组合、用于执行指定功能的步骤的组合并且支持用于执行 指定功能的程序指令装置。也将理解功能框图和流程图的一个或者 多个块或者步骤和在功能框图和流程图中的块或者步骤的组合可以 由执行指定功能或者步骤的基于专用硬件的计算机系统或者专用硬 件和计算机指令的组合来实施。
这里提供了使用一个或者多个主控设备和/或集中式会议交换 机的用于分布式电话会议的改进的电话会议架构、系统、方法和计 算机程序。多信道增强主控设备在分布式电话会议中的功能并且允 许与具有3D功能的电话会议相兼容,由此使作为多信道分布式电话 会议系统一部分的具有3D功能的电话会议设备和终端能够参与实 现有3D音频特征的相同会议会话。多信道分布式电话会议涉及多信 道上行链路、单声道上行链路或者数目固定的上行链路信道并且涉 及多信道下行链路、单声道下行链路或者数目固定的下行链路信道。 多信道分布式电话会议系统可以进行对近端参与方的活跃通话方检 测并且在上行链路信道上传送标识着活跃近端参与方的ID信号。多 信道分布式电话会议系统也可以在下行链路信道上接收标识着活跃 远端参与方的ID信号。多信道分布式电话会议系统可以进行各种上 行链路和下行链路处理。上行链路处理可以涉及多路混合和空间定 位。多路混合可以用来分离近端参与方的话音信号。也在下行链路 处理中使用的空间定位引入对活跃参与方的空间分离。
从在前文描述和相关联的附图中呈现的教导中受益的、在这里 阐述的与发明有关的领域中的技术人员将想到这些发明的许多修改 和其它实施例。因此将理解本发明不限于所公开的具体实施例并且 将使修改和其它实施例包含于所附权利要求的范围内。虽然这里运 用了具体措辞,但是仅按照通用和描述的意义而不是出于限制的目 的来使用它们。
QQ群二维码
意见反馈