声通信的方法和系统

申请号 CN200580010857.0 申请日 2005-03-29 公开(公告)号 CN1939040A 公开(公告)日 2007-03-28
申请人 瑞士电信流动电话公司; 发明人 R·里特; E·劳帕;
摘要 用于声通信的系统和方法,其中眼镜架(10)包含至少一个用于捕获用户(21)的语音 信号 的依方向而定的 传声 器(13,15,16)以及用于向外部 电子 设备(30)传输信号的通信装置(12),使得可以自适应地以用户特定的方式调整至少一个传声器(13,15,16)的方向依赖性。特别是所述依方向而定的传声器可以被实施成传声器阵列和/或用MEMS技术实施,以及采用 接触 传声器。
权利要求

1.用于声通信的系统,其中眼镜架(10)包含至少一个用于捕 获用户(21)的语音信号的依方向而定的传声器(13,15,16)以及 用于向外部电子设备(30)传输信号的通信装置(12),其特征在 于,
可以动态地以用户特定的方式调整至少一个传声器(13,15,16) 的方向依赖性。
2.如权利要求1所述的用于声通信的系统,其特征在于,控制模 (11)包含用于根据由至少一个第二依方向而定的传声器(13, 15)所捕获的语音信号自适应地以用户特定的方式调整至少一个第 一依方向而定的传声器(13,16)的方向依赖性的装置。
3.如权利要求1或2之一所述的用于声通信的系统,其特征在 于,所述至少一个第二依方向而定的传声器(15)是接触传声器。
4.如权利要求1所述的用于声通信的系统,其特征在于,可以借 助于由第三传声器(13)所捕获的信号对由第一依方向而定的传声 器(16)所捕获的信号进行滤波。
5.如权利要求1至4之一所述的用于声通信的系统,其特征在 于,可以借助于由第三传声器(15)所捕获的信号调节放大器(48)。
6.如权利要求1至5之一所述的用于声通信的系统,其特征在 于,可以在基准滤波器基础上处理由依方向而定的传声器(15) 所捕获的信号。
7.如权利要求1至6之一所述的用于声通信的系统,其特征在 于,所述至少一个依方向而定的传声器(13,15,16)被实施成传 声器阵列。
8.如权利要求7所述的用于声通信的系统,其特征在于,所述至 少一个传声器阵列用MEMS技术实施。
9.如权利要求1至8之一所述的用于声通信的系统,其特征在 于,外部设备(30)包含移动无线电设备。
10.如权利要求1至9之一所述的用于声通信的系统,其特征在 于,所述眼镜架(10)包含用于视网膜扫描显示的装置。
11.如权利要求10所述的用于声通信的系统,其特征在于,所述 眼镜架(10)包含用于捕获视向的装置。
12.如权利要求1至11之一所述的用于声通信的系统,其特征在 于,所述系统包含用于借助于所述至少一个依方向而定的传声器 (13,15,16)捕获语音命令的语音识别模块。
13.如权利要求1至12之一所述的用于声通信的系统,其特征在 于,所述通信系统包含Bluetooth和/或ZigBee和/或GSM和/或UMTS 接口(12,33)。
14.如权利要求1至13之一所述的用于声通信的系统,其特征在 于,所述系统包含电源(14)用的光电池
15.用于声通信的方法,其中由至少一个安装在眼镜架(10)上 的依方向而定的传声器(13,15,16)捕获用户(21)的语音信号并 且通过无线接口(17)向外部设备(30)传输,其特征在于,动态 地以用户特定的方式调整所述至少一个传声器(13,15,16)的方 向依赖性。
16.如权利要求13所述的用于声通信的方法,其特征在于,
借助于至少一个第一依方向而定的传声器(13,15)捕获用户的 语音信号,并且
根据由所述至少一个第一依方向而定的传声器(13,15)所捕获 的用户(21)的语音信号自适应地以用户特定的方式调整至少一个 第二依方向而定的传声器(13,16)的方向依赖性。
17.如权利要求15或16之一所述的用于声通信的方法,其特征 在于,所述至少一个第二依方向而定的传声器(15)被实施成接触 传声器。
18.如权利要求13所述的用于声通信的方法,其特征在于,借助 于由第三传声器(13)所捕获的信号对由第一依方向而定的传声器 (16)所捕获的信号进行滤波。
19.如权利要求13至18之一所述的用于声通信的方法,其特征 在于,借助于由第三传声器(15)所捕获的信号调节放大器(48)。
20.如权利要求13至19之一所述的用于声通信的方法,其特征 在于,在基准滤波器的基础上处理由依方向而定的传声器(15)所 捕获的信号。
21.如权利要求13至20之一所述的用于声通信的方法,其特征 在于,所述至少一个依方向而定的传声器(13,15,16)被实施成 传声器阵列。
22.如权利要求21所述的用于声通信的方法,其特征在于,所述 至少一个传声器阵列用MEMS技术实施。
23.如权利要求13至22之一所述的用于声通信的方法,其特征 在于,向移动无线电设备(30)传输所捕获的信号(22,24)。
24.如权利要求13至23之一所述的用于声通信的方法,其特征 在于,利用视网膜扫描显示对所述用户向视网膜上投射图像数据。
25.如权利要求24所述的用于声通信的方法,其特征在于,借助 于模块捕获用户的视向。
26.如权利要求13至25之一所述的用于声通信的方法,其特征 在于,借助于语音识别模块捕获语音命令。
27.如权利要求13至26之一所述的用于声通信的方法,其特征 在于,通过Bluetooth和/或ZigBee和/或GSM和/或UMTS接口向所 述外部设备传输所捕获的信号。
28.如权利要求13至27之一所述的用于声通信的方法,其特征 在于,通过光电池供应电源(14)。

说明书全文

发明涉及用于声通信的方法和系统,其中眼镜架包含至少一个 用于捕获用户的语音信号的依方向而定的传声器、以及用于向外部 的电子设备传输信号的通信装置。特别地,本发明涉及一种通信系 统,其中可以动态地以用户特定的方式调整至少一个传声器的方向 依赖性。

当今,移动通信终端设备起越来越重要的作用。如今新型的移动 通信终端设备不仅仅用于简单的语音或者数据通信,而是日益转变 成复杂的多媒体设备,借助于所述复杂的多媒体设备例如可以接收 音频或者视频广播,玩游戏或者访问网络(譬如因特网或者移动无 线电网络)内部的信息。对所述复杂的移动通信终端设备的控制、 特别是对可供使用的数据和/或数据组或者运行模式的选择以及数据 和/或命令输入经常证实是费事的,并且经常与昂贵且不轻便的辅助 装置(譬如键盘、记录笔、跟踪球、触摸屏等等)的使用相结合。 在此方面也必需分别手持移动通信设备,这极大地限制了不用手且 方便地使用现代通信终端设备。

因此,在现有技术中已经公知基于语音识别的解决方案。所述语 音识别或者自动语音识别从事于使自动机(譬如计算机)能够识别 所讲的语言或者使其转换成字符序列并且加以处理的方法的研究和 开发。在此期间,语音识别也被用在技术应用中,例如被用在自动 对话系统(譬如行车时刻表查询等等)中。在只使用有限的词汇的 那里到处都成功地运用了自动语音识别。然而在自动化语音识别的 情况下,声音接收的质量起着决定性的作用,并且因此重要的是尽 可能地改善接收质量,以便能够达到高得多的识别精度

文献WO03/062906和WO02/086599例如说明传声器和微型扬 声器被安置在眼镜架上的装置。于是通过电缆连接把所述眼镜架与 外部的电子设备连接。然而所提及的装置的问题是难以为用户特定 的声音和音调记录实现可接受的噪声抑制并且尤其难以把用户的语 音命令与处于附近的其他人的声音区分开。

在文献EP0 219 026 B1中说明如何可以把助听器安装在眼镜架 中。通过在眼镜架上的多个传声器的确定的空间分布可以达到定向 和定位效果,所述定向和定位效果应当能够使听障碍者对于声学 事件获得空间定向。所有声学和电子部件都被安装在眼镜上。至外 部电子设备的发射和/或接收连接未被设置。

在公开文献US2002/0197961 A1中公开了一种眼镜架,其中安 装有传声器、微型扬声器、电源(电池)和用于向移动无线电设 备或者其他外部电子设备传输信号的发射器或者接收器。可代替 地,还可以把所述的部件安装在夹子中,所述夹子可以被固定在眼 镜架上并且又可以被取下或者可以固定在帽子或者戴在头上的类似 物品上。所述传声器还可以被安装在可调的臂上。然而在具有响的 且不恒定的干扰噪声的环境中使用最后述及的布置的情况下,仍然 不能够保证有用信号以足够的电平施加在传声器上。

本发明的任务是,建议一种不具有现有技术的上述问题的用于声 通信的新系统和新方法。尤其是所述系统应当能够方便地不用手地 使用移动无线电设备,以及在充满噪声的环境中结合IVR系统(交 互式语音应答)可靠且方便地输入语音命令和交互式语音控制。

根据本发明,该目标尤其通过独立权利要求的要素来实现。此外 其他有利的实施方式由从属权利要求说明书中得出。

尤其是这些目标通过本发明通过以下方式来实现,即眼镜架包含 至少一个用于捕获用户的语音信号的依方向而定的传声器、以及用 于向外部的电子设备传输信号的通信装置,其中可以动态地以用户 特定的方式调整所述至少一个传声器的方向依赖性。此外该实施变 型的优点是,有效的噪声抑制并且从而所捕获的语音信号的高得多 的质量对于每个单个用户而言都是可能的。尤其为了识别用户的语 音命令这可能是必要的前提。其他的优点是以不用手的方式输入语 音指令,以及由于被结合在眼镜架中使输入装置几乎不可见。

在另一实施变型中,所述系统包含控制模,所述控制模块用于 根据由至少一个第二依方向而定的传声器所捕获的语音信号自适应 地以用户特定的方式调整所述至少一个第一依方向而定的传声器的 方向依赖性。此外该实施变型的优点是,对依方向而定的传声器的 方向依赖性的调整可以根据由其他传声器所捕获的信号来进行。从 而可以实现更好的用户特定的调整,所述调整导致提高的语音质量 和对于在具有高干扰噪声的环境中使用本发明的系统和方法的更好 前提。

在另一实施变型中,至少一个第二依方向而定的传声器是接触传 声器。此外该实施变型的优点是,由讲话的用户所发出的语音信号 不仅在空气中传播以后、而且在用户的身体中传播以后能够被捕 获。由此在相应的处理和加工以后可以达到对噪声抑制的进一步改 善。尤其是还可以借助于接触传声器非常简单地确定用户是否正在 讲话,由此能够在实际上消除与在附近讲话的其他用户的可能的混 淆。此外,由接触传声器所捕获的信号最适于由控制模块用于自适 应地以用户特定的方式调整其他依方向而定的传声器的方向依赖 性。

在又一实施变型中,借助于由第三传声器(13)所捕获的信号对 由第一依方向而定的传声器(16)所捕获的信号进行滤波。此外该 实施变型的优点是,由另一传声器所捕获的环境噪声可以被用于对 由第一依方向而定的传声器所捕获的信号进行滤波和信号质量改 善。由此把依方向而定的传声器的积极特性与通过滤波的噪声抑制 的积极特性以最佳的方式结合,这导致更好的语音质量。

在另一实施变型中,所述至少一个依方向而定的传声器被实施成 传声器阵列。至少一个传声器阵列例如可以有利地用MEMS技术实 施。此外该实施变型的优点是,由此实现一种特别有效并且强化的 定向作用。通过使用传声器组还可以充分利用声波的许多空间特 性,所述空间特性在简单的传声器情况下不能被利用。该实施变型 的其他优点是低得多的制造成本和高的集成度,由此可以实现特别 小而紧凑的结构。

在另一实施变型中,所述外部设备包含移动无线电设备。在此所 述移动无线电设备例如可以被集成在所述眼镜架中或者也可以作为 独立的设备存在。此外该实施变型的优点是,如本发明所述的系统 和如本发明所述的方法可以被用于通过移动无线电网络进行语音通 信。同样地,戴眼镜者可以由此通过所述眼镜架与一个或者多个连 接在所述移动无线电网络上的服务器通信或者输入声音指令。因 此,该戴眼镜者不必使用附加的对讲电话装置,由此他们能够更有 利地且更方便地通信。

在另一实施变型中,所述眼镜架包含用于视网膜扫描显示的装 置。视网膜扫描显示器是一种显示装置,其中光束直接地被投射到 视网膜进入眼睛中。通过相应的光调制和光束的快速光栅化 (Rastering)可以显示整个图像。所述眼镜架此外还可以包含用于 捕获视向的其他装置。此外该实施变型的优点是,由此可以构造一 种复杂的系统,使得用户能够直接地看和听信息,而不用靠外部的 输出装置。同时可以通过视线捕获把数据输入的另一可能性集成到 系统中。

在另一实施变型中,所述系统包含用于借助于至少一个依方向而 定的传声器捕获语音命令的语音识别模块。该实施变型的优点是, 可以借助于所述语音命令由用户简单地控制和/或选取信息。其他的 优点是更少的电流消耗,原因在于所有的装置都被集成在相同的架 中。

在另一实施变型中,所述通信系统包含Bluetooth和/或ZigBee 和/或GSM和/或UMTS和/或WLAN接口。所述接口例如可以被集 成在通信终端设备中和/或眼镜架的通信装置中。这另外具有以下优 点,即可以借助于所述通信系统接入通用的工业标准。

在此处应当坚持的是,本发明除了如本发明所述的系统之外还涉 及用于声通信的方法。

下面借助于例子来描述本发明的实施变型。该实施例将通过以下

附图来说明:

图1示出示意性地说明用于声通信的如本发明所述的系统和方 法的框图

图2示出眼镜架的侧视图,所述眼镜架可以被用于实施图1的如 本发明所述的系统和方法。

图3示出示意性地说明用于声通信的如本发明所述的系统和方 法的另一实施方式的的框图。

图4示出示意性地说明图1所示的用于声通信的本发明系统的结 构的框图。

图5示出示意性地说明图3所示的用于声通信的本发明的系统的 另一实施方式的结构的框图。

图6示出人类头颅骨的分解图,其中示出所佩戴的眼镜架的大致 的典型位置,所述眼镜架可以被用于实施如本发明所述的系统和方 法。

在图1中,附图标记10涉及由近视或者远视患者所佩戴的眼镜 架(例如带有矫正镜片的眼镜架)、或者带有发暗镜片的太阳镜架。 该眼镜架10在能够捕获从用户20的嘴所发出的声波21的位置处包 括至少一个依方向而定的声传感器16。通过所述传感器16的方向依 赖性尤其可以特别良好地捕获从用户20的嘴沿直传播线所发出的声 波22。所述依方向而定的声传感器16例如可以被实施成简单的传声 器,然而也可以被实施成传声器组或者所谓的传声器阵列。通过使 用传声器阵列可以充分利用声场的空间特性并且从而显著地改进所 捕获的信号的质量或清晰度。同样也可以在眼镜架10上例如在眼镜 架10的两侧对称地安装多个这样的传声器或者传声器阵列16。

如在图1或者图2中进一步所示,该眼镜架10此外还可以包含 一个或者多个其他的依方向而定的声传感器15。所述其他的依方向 而定的声传感器15被安装在该依方向而定的声传感器15能够良好地 捕获用户的体声(krperschall)信号的位置上。所述体声信号如此 产生,即在讲话时在用户的喉头处产生声波,所述声波然后通过用 户的身体传播。用于接收和捕获体声信号的特别有利的位置是位于 人类头颅60两侧的颞骨66(如在图6中所示)。眼镜架10的镜腿 通常被戴在邻近于颞骨处,这能够有助于所捕获的体声波的高质 量。所述依方向而定的传感器15同样也可以被实施成简单的传声器 或者被实施成传声器组或者所谓的传声器阵列。

此外,在图1和图2中,附图标记13涉及一个或者多个其他的 依方向而定的声传感器13。所述一个或者多个其他的依方向而定的 声传感器13被安装在眼镜架10的尤其能够特别好地捕获从用户的环 境中所发出的杂音的位置上。该依方向而定的传感器13同样也可以 被实施成简单的传声器或者被实施成用于所捕获的信号的更好质量 的传声器阵列,并且也可以在眼镜架10上安装多个对准杂音的依方 向而定的传声器或者传声器阵列13。

传声器或者传声器阵列13、15、16尤其可以用所谓的MEMS技 术(微电子机械系统)实施。MEMS被理解为具有一定的逻辑部分 和至少一定可运动部分的最小芯片。因此,MEMS一般是带有机械 部分的处理器,所述处理器既可以采集数据,也可以执行从这些信 息所得出的处理。从而可以通过采用MEMS技术制造非常小的传声 器或者传声器阵列,这些非常小的传声器或者传声器阵列能够在达 到小的结构尺寸的同时达到更好的音质,由此它们特别好地适于装 入在眼镜架10中。

在图1中,附图标记11涉及控制模块。该控制模块能够获得和 分析来自依方向而定的声传感器13、15、16的信号。但是所述控制 模块11同样也可以与所述依方向而定的声传感器13、15、16通信并 且控制它们。尤其是可以通过采用MEMS技术而特别简单地且以无 大的费用的方式来控制依方向而定的声传感器13、15、16。在此, 例如可能影响依方向而定的声传感器13、15、16的位置、灵敏度和/ 或方向依赖性。例如,所述控制模块11可以根据由依方向而定的声 传感器13、15、16所捕获的语音信号来控制另一依方向而定的声传 感器13、15、16。在眼镜架10中和尤其在控制模块11中可以安装 所有的为信号处理、信号放大和其他信号加工所要求的部件,譬如 放大器46、48、51、调整元件43、调节电路44、54或者延迟元件 47。

在本发明解决方案的实施变型中,例如在讲话的用户的情况下在 喉头处产生体声波并且通过身体传播。该体声波或者语音信号还被 传播到头颅骨并且传播到颞骨,其中所述体声波或者语音信号被所 述依方向而定的传感器15捕获。被捕获的语音信号由控制模块11 解释和分析,并且根据分析以用户特定的方式对依方向而定的声传 感器16进行调整。尤其是所述控制模块11可以改变用MEMS技术 所实施的依方向而定的声传感器16的位置,使得所述声传感器更好 地考虑用户的外貌。同样地,所述控制模块11可以以用户特定的方 式如此改变依方向而定的声传感器16的灵敏度,使得在体声波到达 颞骨时所述依方向而定的声传感器特别灵敏地对从用户20的嘴所传 出的语音信号作出反应。

在本发明解决方案的另一实施变型中,在讲话的用户情况下,由 依方向而定的声传感器13不仅捕获体声波而且还捕获来自环境的杂 音。由所述控制模块11解释和分析由第一依方向而定的声传感器15 所捕获的体声信号和由第二依方向而定的声传感器13所捕获的环境 噪声信号,并且基于所述分析以用户特定的方式调整依方向而定的 声传感器16。尤其是可能出现以下情况,即在保持恒定的环境噪声 的情况下需要自适应地或者动态地以用户特定的方式调整依方向而 定的声传感器16的方向依赖性:例如用户可能突然比较小声地讲 话,因为该用户现在论述有保密性质并且不被附近的人员所察觉的 主题。于是,自适应的用户特定的调整被理解为一种动态调整,其 中例如通过采用MEMS传声器以动态的方式使传声器的方向依赖性 与最佳值相适应。

尤其是所述眼镜架10还配备有物理的网络接口12,借助于所述 物理的网络接口可以通过通信信道17在眼镜架10与移动通信终端设 备30之间交换语音和/或数据信息。所述网络接口12可以支持多个 不同的网络标准,例如以Bluetooth或者ZigBee的名称公知的本地 无线网络标准、以及GSM(全球移动通信系统)、GPRS(通用分 组无线电业务)、UMTS(通用移动通信系统)、WLAN(无线局域 网)802.11、红外线或者任何其他的无接触通信技术。但是原则上网 络接口12还可以是任何的有接触接口,例如USB或者火线接口或者 至以太网、令牌环(Token Ring)或者任何其他有线LAN(局域网) 的接口。所述接口当然不仅可以包含譬如直接使用网络协议(例如 以太网或者令牌环)的分组交换接口、而且还可以包含线路交换接 口,所述线路交换接口借助于譬如PPP(点对点协议)、SLIP(串 行线路因特网协议)或者GPRS(通用分组无线电业务)的协议被使 用,也就是说所述接口例如不具有网络地址,如MAC地址或者DLC 地址。原则上必须强调,只要存在本发明的特征,根据本发明的系 统和/或方法就不受特定的网络标准约束,而是可以利用一个或者多 个任意网络、尤其也通过在不同的通信技术之间透明地转换或者路 由语音和/或数据传输来实现。此外在眼镜架10中还可以安装其他所 需要的部件,例如扬声器和电源。

在图1中,附图标记30涉及移动通信终端设备或者任意的所谓 客户端设备(CPE)。移动通信终端设备30可以是任何的移动无线 电网络的任一移动无线电设备;所述移动无线电设备例如是GSM移 动无线电网络的GSM设备、或者UMTS网络的UMTS设备、或者 是卫星网络的卫星设备。但是移动通信终端设备30在原则上还可以 是商业上通用的个人计算机(PC)、便携式PC、固定网电话、移动 无线电设备用的充电设备、游戏站或者具有电子联网部件的任一其 他设备。移动通信终端设备30例如包含用于输入数据元的输入单元 32。移动通信终端设备30可以具有通常的键盘或者根据移动无线电 话类型的类似输入装置,其例如由数字键和控制键组成,其中数字 键可以切换到字母输入。为了授权和鉴权的目的,例如在电信中计 费的情况下,移动通信终端设备30一般包含可拆卸的识别模块、例 如SIM(用户识别模块)卡34,所述识别模块在这里在终端设备30 之下被示出,而在运行时以接触的方式接触移动通信终端设备的内 部。此外,所述移动通信终端设备30还可以包含用于显示数据元的 显示装置31。天线35以公知的方式用于通过电信网络传输数据,所 述电信网络通常为移动无线电网络,例如GSM(全球移动通信系统) 网络、UMTS(通用移动通信系统)网络或者WLAN(无线电局域 网)网络。在移动通信终端设备30上例如安装有无接触的接口33, 通过所述无接触的接口33可以接收和发射来自眼镜架10的无接触接 口12的数据和命令。

如本发明所述的系统和如本发明所述的方法的一种实施变型的 结构在图4中被示出。由第一依方向而定的声传感器16首先接收来 自用户22的嘴部的语音信号,而第二依方向而定的声传感器13首先 对准来自环境的杂音。第三依方向而定的声传感器15如此被调节和 定位,使得它们能够首先捕获来自用户的体声的语音信号。由第一 和第二依方向而定的声传感器13、16所捕获的语音信号由信号调整 模块43和调节电路44调节到差分放大器46的输出端处的最小杂音 电平。放大调节器48如此使用由第三依方向而定的声传感器15所捕 获的语音信号,使得在″体声”的情况下不是太强烈地放大由第 一依方向而定的声传感器16所捕获的语音信号的放大率。但是在″ 在体声”的情况下如此地调节放大器,使得相对于由第二依方向而定 的声传感器13所捕获的语音信号来放大由第一依方向而定的声传感 器16所捕获的语音信号。为了不随时间产生失真,可以设置信号延 迟模块47。

在3中示出如本发明所述的系统和如本发明所述的方法的另一 实施变型。附图标记10也涉及眼镜架,所述眼镜架包含一个或者多 个依方向而定的声传感器15,所述声传感器被安装在可以由该依方 向而定的声传感器15良好地捕获用户的体声信号的位置上。该依方 向而定的声传感器15同样也可以被实施成简单的传声器或者被实施 成传声器组或者所谓的传声器阵列和/或用MEMS技术实施。由至少 一个依方向而定的声传感器15、50所捕获的语音信号被引导到控制 模块11上。如在图5中所示,由所述依方向而定的声传感器15所捕 获的语音信号由控制模块11中的放大器51放大,在电平和频率方面 由信号处理模块52并且接着由基准和调节电路54如此处理,使得所 捕获的传声器信号在特性上对应于由通常的传声器所捕获的语音信 号。接着把语音信号加到移动通信终端设备30的音频路径53上。基 准和调节电路54的基准例如在移动通信终端设备30中通过设备的传 声器针对相应的用户被记录。所述信号处理模块52以及基准和调节 电路54既可以被布置在眼镜架10中也可以被布置在移动通信终端设 备中。

用于对电子系统馈电的电源14的能源尤其可以通过被汽化 在眼镜镜片上的未示出的光电池来实现。但是,此外所述能源也可 以通过集成在眼镜架10中或者与之连接的通常的电池来实现。

QQ群二维码
意见反馈