一种用户语音检测装置、方法及耳机专利检索-能量物理专利检索查询-专利查询网

一种用户语音检测装置、方法及耳机

阅读：1发布：2021-07-19

专利汇可以提供一种用户语音检测装置、方法及耳机专利检索，专利查询，专利分析的服务。并且本发明公开了一种用户语音检测装置，本申请考虑到用户在讲话时，耳道与耳机组成的封闭腔也即耳腔内会有通过咽喉内部传入的声波，该声波会推动喇叭振动，喇叭振动时喇叭内线圈切割磁场产生声波电流，基于此，处理器在接收到喇叭的音频信号输入端口的电流后会提取里面的声波电流，从而根据声波电流去判断用户是否发出语音。可见，本申请中，无需添加额外的语音数据采集装置，而是利用耳机中已有的喇叭来实现对用户语音的检测，对喇叭实现了复用，降低了耳机的成本，减小了耳机的体积。本发明还公开了一种用户语音检测方法和耳机，具有与上述用户语音检测装置相同的有益效果。，下面是一种用户语音检测装置、方法及耳机专利的具体信息内容。

权利要求

1.一种用户语音检测装置，应用于包括喇叭的耳机，其特征在于，包括：
电流采集模块，用于采集所述喇叭的音频信号输入端口的电流；
处理器，用于从所述电流中提取出声波电流，并基于所述声波电流判断用户是否发出语音；所述声波电流为所述喇叭受耳腔内声波推动下振动产生的电流。
2.如权利要求1所述的用户语音检测装置，其特征在于，所述电流采集模块包括：
一端分别与所述喇叭的音频信号输入端口及所述处理器连接，另一端接地的检测电阻，用于将所述喇叭的音频信号输入端口的电流转换为电压；
设置于所述喇叭的音频信号输入回路上的电流防反模块，用于防止所述声波电流倒灌至所述音频信号输入回路。
3.如权利要求2所述的用户语音检测装置，其特征在于，所述电流防反模块为二极管。
4.如权利要求2所述的用户语音检测装置，其特征在于，还包括：
设置于所述检测电阻与所述处理器之间的电压放大器，用于对所述检测电阻输出的电压进行放大。
5.如权利要求2所述的用户语音检测装置，其特征在于，从所述电流中提取出声波电流，包括：
判断所述喇叭是否还接收到音频信号，如果是，则将所述电压与所述音频信号的电压的差值作为所述声波电流对应的声波电压，否则，直接将所述电压作为所述声波电流对应的声波电压。
6.如权利要求5所述的用户语音检测装置，其特征在于，基于所述声波电流判断用户是否发出语音，包括：
提取预设时间内的预设频段的声波电压；
求取所述预设时间内的预设频段的声波电压的能量；
判断所述能量是否大于预设值，如果是，则判定用户发出语音，否则，判定用户没有发出语音。
7.如权利要求1至6任一项所述的用户语音检测装置，其特征在于，在基于所述声波电流判断用户是否发出语音之前，所述处理器还用于判断所述声波电流是否为脉冲电流且所述脉冲电流的方向与所述音频信号输入端口的极性满足预设佩戴状态对应关系，如果是，基于所述脉冲电流的方向确定所述耳机的佩戴状态，否则，进入后续步骤。
8.如权利要求7所述的用户语音检测装置，其特征在于，所述音频信号输入端口的正端与所述电流采集模块连接，负端接地；
基于所述脉冲电流的方向确定所述耳机的佩戴状态，包括：
当所述脉冲电流的方向为正向时，判定所述耳机处于佩戴状态；
当所述脉冲电流的方向为反向时，判定所述耳机处于非佩戴状态。
9.一种耳机，包括喇叭，其特征在于，还包括如权利要求1至8任一项所述的用户语音检测装置。
10.一种用户语音检测方法，其特征在于，应用于如权利要求9所述的耳机，所述用户语音检测方法包括：
获取所述喇叭的音频信号输入端口的电流；
从所述电流中提取出声波电流，所述声波电流为所述喇叭在受耳腔内声波推动下振动产生的电流；
基于所述声波电流判断用户是否发出语音。

说明书全文

一种用户语音检测装置、方法及耳机

技术领域

[0001] 本发明涉及语音检测技术领域，特别是涉及一种用户语音检测装置、方法及耳机。

背景技术

[0002] 现有的一些耳机在进行语音通话或者语音交互时，都会通过VAD(Voice Activity Detection，语音活动检测)提高通话性能。VAD能够检测用户是否说话，也即用户是否发出语音。现有技术中为实现对用户是否发出语音的检测，通常在耳机中增加额外的加速度计或者骨传导麦克风，通过加速度计或者骨传导麦克风采集到的数据进行语音检测。但该种方式在实现语音检测的同时也增加了额外的语音数据采集装置，增大了耳机的体积和成本。

发明内容

[0003] 本发明的目的是提供一种用户语音检测装置、方法及耳机，降低了耳机的成本，减小了耳机的体积。

[0004] 为解决上述技术问题，本发明提供了一种用户语音检测装置，应用于包括喇叭的耳机，包括：

[0005] 电流采集模块，用于采集所述喇叭的音频信号输入端口的电流；

[0006] 处理器，用于从所述电流中提取出声波电流，并基于所述声波电流判断用户是否发出语音；所述声波电流为所述喇叭受耳腔内声波推动下振动产生的电流。

[0007] 优选地，所述电流采集模块包括：

[0008] 一端分别与所述喇叭的音频信号输入端口及所述处理器连接，另一端接地的检测电阻，用于将所述喇叭的音频信号输入端口的电流转换为电压；

[0009] 设置于所述喇叭的音频信号输入回路上的电流防反模块，用于防止所述声波电流倒灌至所述音频信号输入回路。

[0010] 优选地，所述电流防反模块为二极管。

[0011] 优选地，还包括：

[0012] 设置于所述检测电阻与所述处理器之间的电压放大器，用于对所述检测电阻输出的电压进行放大。

[0013] 优选地，从所述电流中提取出声波电流，包括：

[0014] 判断所述喇叭是否还接收到音频信号，如果是，则将所述电压与所述音频信号的电压的差值作为所述声波电流对应的声波电压，否则，直接将所述电压作为所述声波电流对应的声波电压。

[0015] 优选地，基于所述声波电流判断用户是否发出语音，包括：

[0016] 提取预设时间内的预设频段的声波电压；

[0017] 求取所述预设时间内的预设频段的声波电压的能量；

[0018] 判断所述能量是否大于预设值，如果是，则判定用户发出语音，否则，判定用户没有发出语音。

[0019] 优选地，在基于所述声波电流判断用户是否发出语音之前，所述处理器还用于判断所述声波电流是否为脉冲电流且所述脉冲电流的方向与所述音频信号输入端口的极性满足预设佩戴状态对应关系，如果是，基于所述脉冲电流的方向确定所述耳机的佩戴状态，否则，进入后续步骤。

[0020] 优选地，所述音频信号输入端口的正端与所述电流采集模块连接，负端接地；

[0021] 基于所述脉冲电流的方向确定所述耳机的佩戴状态，包括：

[0022] 当所述脉冲电流的方向为正向时，判定所述耳机处于佩戴状态；

[0023] 当所述脉冲电流的方向为反向时，判定所述耳机处于非佩戴状态。

[0024] 为解决上述技术问题，本发明还提供了一种耳机，包括喇叭，还包括如上述所述的用户语音检测装置。

[0025] 为解决上述技术问题，本发明还提供了一种用户语音检测方法，应用于如上述所述的耳机，所述用户语音检测方法包括：

[0026] 获取所述喇叭的音频信号输入端口的电流；

[0027] 从所述电流中提取出声波电流，所述声波电流为所述喇叭在受耳腔内声波推动下振动产生的电流；

[0028] 基于所述声波电流判断用户是否发出语音。

[0029] 本发明提供了一种用户语音检测装置，本申请考虑到用户在讲话时，耳道与耳机组成的封闭腔也即耳腔内会有通过咽喉内部传入的声波，该声波会推动喇叭振动，喇叭振动时喇叭内线圈切割磁场产生声波电流，基于此，处理器在接收到喇叭的音频信号输入端口的电流后会提取里面的声波电流，从而根据声波电流去判断用户是否发出语音。可见，本申请中，无需添加额外的语音数据采集装置，而是利用耳机中已有的喇叭来实现对用户语音的检测，对喇叭实现了复用，降低了耳机的成本，减小了耳机的体积。

[0030] 本发明还提供了一种用户语音检测方法和耳机，具有与上述用户语音检测装置相同的有益效果。附图说明

[0031] 为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0032] 图1为本发明提供的一种用户语音检测装置的结构示意图；

[0033] 图2为本发明提供的一种耳机佩戴至用户耳道后与耳道形成的声学结构示意图；

[0034] 图3为本发明提供的一种具体地用户语音检测装置的结构示意图；

[0035] 图4为本发明提供的一种提取声波电流对应的声波电压的原理图；

[0036] 图5为本发明提供的一种用户语音检测方法的流程图。

具体实施方式

[0037] 本发明的核心是提供一种用户语音检测装置、方法及耳机，降低了耳机的成本，减小了耳机的体积。

[0038] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0039] 请参照图1和图2，图1为本发明提供的一种用户语音检测装置的结构示意图，图2为本发明提供的一种耳机佩戴至用户耳道后与耳道形成时的声学结构佩戴示意图。

[0040] 该用户语音检测装置应用于包括喇叭3的耳机，包括：

[0041] 电流采集模块1，用于采集喇叭3的音频信号输入端口的电流；

[0042] 处理器2，用于从电流中提取出声波电流，并基于声波电流判断用户是否发出语音；声波电流为喇叭3受耳腔内声波推动下振动产生的电流。

[0043] 与现有技术中额外在耳机中增加语音数据采集装置不同的是，本申请充分考虑到，耳机在处于佩戴状态时，耳道与耳机组成的封闭腔内会有通过咽喉内部传入的声波，声波推动喇叭3振动，喇叭3振动时，喇叭3内的线圈会切割磁场并产生声波电流，该声波电流会从音频信号输入端口输出，站在这个角度，此时的喇叭3可等效为一个电源。基于此，本申请将耳机中已有的喇叭3作为语音数据采集装置，从而避免增加额外的语音数据采集装置，降低了耳机的成本，减小了耳机的体积。

[0044] 又考虑到喇叭3的音频信号输入端口原本是用于输入音频信号，喇叭3在接收到音频信号后通过振动产生声音。因此，喇叭3的音频信号输入端口的电流可能为声波电流和音频信号的电流之和。基于此，处理器2(可以但不仅限为DSP(digital signal processor，数字信号处理器))在接收到音频信号输入端口的电流后，会从该电流中提取出声波电流。处理器2在提取出声波电流后还会继续根据声波电流去判断用户是否发出语音，例如具体根据声波电流的能量等去判断用户是否发出语音，以避免将用户咳嗽等误判为用户发出语音，尽可能地减小误判。

[0045] 此外，本申请中，处理器2可以为用于输出音频信号的处理器2，这样，便无需再额外增加处理器2，实现了处理器2的复用，进一步降低了耳机的成本，减小了耳机的体积。

[0046] 综上，本申请中，无需添加额外的语音数据采集装置，而是利用耳机中已有的喇叭3来实现对用户语音的检测，对喇叭3实现了复用，降低了耳机的成本，减小了耳机的体积。

[0047] 请参照图3，图3为本发明提供的一种具体地用户语音检测装置的结构示意图。

[0048] 在上述实施例的基础上：

[0049] 作为一种优选地实施例，电流采集模块1包括：

[0050] 一端分别与喇叭3的音频信号输入端口及处理器2连接，另一端接地的检测电阻R，用于将喇叭3的音频信号输入端口的电流转换为电压；

[0051] 设置于喇叭3的音频信号输入回路上的电流防反模块D，用于防止声波电流倒灌至音频信号输入回路。

[0052] 本实施例中，在音频信号输入回路上设置了电流防反模块D，一方面，可以防止声波电流倒灌至音频信号输入回路，影响后续用户语音检测精度，另一方面，避免其对音频信号的影响。由于电流防反模块D的存在，喇叭3的音频信号输入端口的电流均会通过检测电阻R流向地。喇叭3的音频信号输入端口的电流会在检测电阻R上产生电压，并输出至处理器2，后续处理器2便可以基于电压判断用户是否发出语音。

[0053] 可见，本实施例提供的电流采集模块1可以提高用户语音的检测精度，且尽可能地减小对音频信号的影响。当然，这里的电流采集模块1还可以为其他结构，本申请在此不作特别的限定。

[0054] 作为一种优选地实施例，电流防反模块D为二极管。

[0055] 电流防反模块D可以为二极管，二极管的阴极与喇叭3的音频信号输入端口连接，二极管的阳极与处理器2连接，从而有效防止了声波电流倒灌至音频信号输入回路。二极管具有结构简单、成本低且可靠性较高的优点。当然，这里的电流防反模块D还可以为其他类型的电流防反模块D，本申请在此不作特别的限定。

[0056] 作为一种优选地实施例，还包括：

[0057] 设置于检测电阻R与处理器2之间的电压放大器，用于对检测电阻R输出的电压进行放大。

[0058] 具体地，考虑到声波电流可能会比较小，为方便处理器2进行信号处理，还可以在检测电阻R与处理器2之间设置电压放大器，用于对检测电压将电流转换后的电压进行放大，以便于后续的数据处理。

[0059] 作为一种优选地实施例，从电流中提取出声波电流，包括：

[0060] 判断喇叭3是否还接收到音频信号，如果是，则将电压与音频信号的电压的差值作为声波电流对应的声波电压，否则，直接将电压作为声波电流对应的声波电压。

[0061] 具体地，上述实施例中提到，喇叭3的音频信号输入端口的电流除了包括用户发出语音时产生的声波电流外，如果此时耳机正在播放音频信号，则该端口还会包括音频信号对应的电流，又由于检测电阻R将这两个总电流转换成了电压，则处理器2接收到的电压中除了包括声波电流对应的电压，还包括音频信号的电压，因此，为了得到纯净的声波电流对应的声波电压，此时需要判断喇叭3是否还接收到音频信号，如果喇叭3此时还接收到音频信号，则将处理器2接收到的电压减去音频信号的电压，并将其差值作为声波电流对应的声波电压(也即声波电流经过检测电阻R后在检测电阻R两端形成的电压)。如果此时喇叭3没有接收到音频信号，则直接将处理器2接收到的电压作为声波电流对应的声波电压。通过该种方式，便可简单可靠地提取出纯净的声波电流对应的声波电压，以便于后续根据该声波电压判断用户是否发出语音。

[0062] 对于如何判断喇叭3是否还接收到音频信号则有多种方式，例如通过电流采集装置采集的音频信号输入回路的电流来判断音频信号输入回路上是否存在音频信号的电流，或者，通过输出音频信号的处理器2是否输出输出音频信号来判断，其中，当输出音频信号的处理器2与本申请中从电流中提取出声波电流，并基于声波电流判断用户是否发出语音的处理器2复用时，则该处理器2可以直接通过判断自身是否输出音频信号进行判断。

[0063] 此外，请参照图4，图4为本发明提供的一种提取声波电流对应的声波电压的原理图。

[0064] 还需要说明的是，当通过处理器2得到音频信号的电压且音频信号输入回路上存在用于对音频信号进行放大的放大器A时，则需要滤波器将电压-(处理器2输出的音频信号的电压*放大器的增益G)＝差值作为声波电流对应的声波电压。

[0065] 作为一种优选地实施例，基于声波电流判断用户是否发出语音，包括：

[0066] 提取预设时间内的预设频段的声波电压；

[0067] 求取预设时间内的预设频段的声波电压的能量；

[0068] 判断能量是否大于预设值，如果是，则判定用户发出语音，否则，判定用户没有发出语音。

[0069] 在得到声波电流对应的声波电压后，可以提取出预设时间内的预设频段的声波电压，并得到该时间段及频段的声波电压的能量。其中，这里的预设时间可以但不仅限为50ms，在实际应用中，可以实时地提取出声波电压，并每隔预设时间(例如每50ms)进行一次声波信号的能量的计算，此外，考虑到人说话的声音的频率在经过耳道后变得较窄且集中于低频段，因此，这里的预设频段可以但不仅限为20-1000Hz，对于预设时间和预设频段的具体数值可以根据实际情况来定。

[0070] 在得到预设时间内的预设频段的声波电压的能量后，判断能量是否大于预设值，如果是，则说明此时用户发出了语音，否则，则说明用户没有发出语音。通过该种方式能够简单可靠地对用户是否发出语音进行检测，且可有效避免将用户咳嗽(对应地能量较小)等误判为用户发出语音。

[0071] 作为一种优选地实施例，在基于声波电流判断用户是否发出语音之前，处理器2还用于判断声波电流是否为脉冲电流且脉冲电流的方向与音频信号输入端口的极性满足预设佩戴状态对应关系，如果是，基于脉冲电流的方向确定耳机的佩戴状态，否则，进入后续步骤。

[0072] 用户在佩戴耳机及摘下耳机时，会造成耳腔内声压的变化，进而导致线圈切割磁感线工作并产生电流，但由于耳机摘下和佩戴时造成的耳腔内声压变化的时间很短，因此，产生的电流为脉冲电流(延续时间比声波电流的延续时间小很多)，又脉冲电流的方向(包括正向和反向，其中，这里的正向也可以理解为正值，负向可以理解为负值)与音频信号输入端口的极性相关，因此，若声波电流为脉冲电流且脉冲电流的方向与音频信号输入端口的极性满足预设佩戴状态对应关系，则可根据脉冲电流的方向确定耳机的佩戴状态。

[0073] 可见，采用本申请提供的方案，除了能够利用喇叭3实现对用户语音的检测，还能实现对耳机佩戴和摘下的检测，进一步实现了对喇叭3的复用，降低了耳机的成本，减小了耳机的体积。

[0074] 作为一种优选地实施例，音频信号输入端口的正端与电流采集模块1连接，负端接地；

[0075] 基于脉冲电流的方向确定耳机的佩戴状态，包括：

[0076] 当脉冲电流的方向为正向时，判定耳机处于佩戴状态；

[0077] 当脉冲电流的方向为反向时，判定耳机处于非佩戴状态。

[0078] 具体地，如果音频信号输入端口的正端与电流采集模块1连接，负端接地，则当脉冲电流的方向为正向时，判定耳机处于佩戴状态；当脉冲电流的方向为反向时，判定耳机处于非佩戴状态。反过来，如果音频信号输入端口的负端与电流采集模块1连接，正端接地，则当脉冲电流的方向为正向时，判定耳机处于非佩戴状态；当脉冲电流的方向为反向时，判定耳机处于佩戴状态。可见，通过该种方式可以有效地对耳机的佩戴状态进行检测。

[0079] 本发明还提供了一种耳机，包括喇叭3，还包括如上述的用户语音检测装置。

[0080] 对于本发明提供的耳机中的用户语音检测装置的介绍请参照上述实施例，本发明在此不再赘述。

[0081] 请参照图5，图5为本发明提供的一种用户语音检测方法的流程图。

[0082] 该方法应用于如上述的耳机，用户语音检测方法包括：

[0083] S11：获取喇叭的音频信号输入端口的电流；

[0084] S12：从电流中提取出声波电流，声波电流为喇叭在受耳腔内声波推动下振动产生的电流；

[0085] S13：基于声波电流判断用户是否发出语音。

[0086] 对于本发明提供的用户语音检测方法的介绍请参照上述实施例，本发明在此不再赘述。

[0087] 需要说明的是，在本说明书中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

[0088] 对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

标题	发布/更新时间	阅读量
面向电磁纳米网络的自适应偏转路由控制方法	2022-12-05	0
用于体育视频识别的快速对象跟踪框架	2020-06-01	0
整车控制与电池控制集成系统	2020-10-13	2
一种基于量子点丝网印刷导光板补色结构	2021-05-24	1
基于频率信息的指纹图像方向场提取方法	2023-04-12	1
基于FHOG和颜色特征的目标跟踪方法及GPU加速	2022-08-22	0
用于月壤水分提取的一体化取样机构及月壤水分提取方法	2020-05-22	1
一种应用于PCB插件孔防焊油墨入孔的改善方法	2021-01-18	1
多挡位混合动力传动装置	2020-07-11	2
一种电杆钢筋笼绞丝装置	2020-12-07	2

一种用户语音检测装置、方法及耳机

一种用户语音检测装置、方法及耳机

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：