首页 / 专利库 / 电脑零配件 / 计算机系统 / 软件 / 智能音箱、声音采集设备及智能音箱系统

智能音箱、声音采集设备及智能音箱系统

阅读:538发布:2024-02-20

专利汇可以提供智能音箱、声音采集设备及智能音箱系统专利检索,专利查询,专利分析的服务。并且本公开是关于一种智能音箱、声音采集设备及智能音箱系统,用以解决相关技术中智能音箱拾音距离较短的问题。其中,智能音箱包括:第一通信模 块 ,用于接收第一声音采集设备发送的声音 信号 ,该第一声音采集设备与智能音箱彼此独立; 语音识别 模块,用于对 声音信号 进行语音识别,得到语音识别结果。本公开 实施例 提供的智能音箱与声音采集设备为彼此独立的两个 单体 设备,使得声音采集功能不局限于在智能音箱所在区域执行,扩大了智能音箱的拾音范围。,下面是智能音箱、声音采集设备及智能音箱系统专利的具体信息内容。

1.一种智能音箱,其特征在于,所述智能音箱包括:
第一通信模,用于接收第一声音采集设备发送的声音信号,所述第一声音采集设备与所述智能音箱彼此独立;
语音识别模块,用于对所述声音信号进行语音识别,得到语音识别结果;
处理器,用于根据所述语音识别结果生成控制指令,所述控制指令中包括目标被控设备的标识;
第二通信模块,用于根据智能音箱与目标被控设备之间的通信路径的通信质量直接向所述目标被控设备发送所述控制指令,或者
向第二声音采集设备或端发送所述控制指令,以使所述第二声音采集设备或所述云端将所述控制指令转发至所述目标被控设备,其中,所述第二声音采集设备与所述智能音箱彼此独立。
2.根据权利要求1所述的智能音箱,其特征在于,
所述第二声音采集设备在最优通信路径上与所述智能音箱相邻,所述最优通信路径为从所述智能音箱至所述目标被控设备之间的信号质量最优的通信路径。
3.根据权利要求1所述的智能音箱,其特征在于,
在所述目标被控设备为所述智能音箱时,所述处理器控制所述智能音箱响应所述控制指令。
4.根据权利要求1至3任一项所述的智能音箱,其特征在于,所述处理器还用于:
当所述语音识别模块在预设时间段内识别到至少两个相同的语音识别结果时,根据其中一个语音识别结果生成控制指令。
5.一种声音采集设备,其特征在于,所述声音采集设备包括:
声音采集模块,用于采集声音信号;
第三通信模块,用于将所述声音信号发送至智能音箱,所述声音采集设备与所述智能音箱彼此独立,其中,所述智能音箱为权利要求1-4任一项所述的智能音箱。
6.根据权利要求5所述的声音采集设备,其特征在于,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:
在接收到第二声音采集设备发送的声音信号后,将接收到的声音信号转发至最优通信路径上与所述第一声音采集设备相邻的第三声音采集设备或所述智能音箱,所述最优通信路径为从所述第一声音采集设备至所述智能音箱之间的信号质量最优的通信路径。
7.根据权利要求5所述的声音采集设备,其特征在于,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:
将采集到的声音信号发送至最优通信路径上与所述第一声音采集设备相邻的其他声音采集设备或所述智能音箱,所述最优通信路径为所述第一声音采集设备至所述智能音箱之间的信号质量最优的通信路径。
8.根据权利要求5所述的声音采集设备,其特征在于,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:
在所述声音采集模块采集到声音信号后,获取所述第一声音采集设备与所述智能音箱之间的第一通信质量,将所述第一通信质量告知采集到相同声音信号的其他声音采集设备,以及获取所述其他声音采集设备对应的第二通信质量,所述第二通信质量为所述其他声音采集设备与所述智能音箱之间的通信质量;
在所述第一通信质量高于所述第二通信质量时,将所述声音信号发送至所述智能音箱。
9.根据权利要求6至8任一项所述的声音采集设备,其特征在于,所述第三通信模块还用于:
在将采集到的声音信号发送至所述智能音箱或者其他声音采集设备时,在所述声音信号中携带所述第一声音采集设备的标识。
10.一种智能音箱系统,其特征在于,包括如权利要求1-3任一项所述的智能音箱以及如权利要求5-9任一项所述的声音采集设备。
11.根据权利要求10所述的智能音箱系统,其特征在于,所述声音采集设备为至少两个。

说明书全文

智能音箱、声音采集设备及智能音箱系统

技术领域

[0001] 本公开涉及通信技术领域,尤其涉及一种智能音箱、声音采集设备及智能音箱系统。

背景技术

[0002] 相关技术中,目前,智能音箱产品在市场上出现了各种各样的形态,其在传统音箱的基础上增加了智能化的功能,在技术上,其提供了wifi/BT(蓝牙)等无线连接的功能,可以进行无线通信,在功能上,其提供了音乐、有声读物等互联网服务,还提供了场景化的智能家居控制服务。
[0003] 目前的智能音箱一般为包括语音输入部分、语音识别部分以及语音输出部分的单体设备,其最大拾音距离一般不超过10米,仅能实现短距离内的语音交互的体验,仅能满足用户在智能音箱所在的房间内使用该音箱进行语音交互,无法满足用户在其他房间时使用该音箱进行语音交互的需求。发明内容
[0004] 为克服相关技术中存在的智能音箱拾音距离较短的问题,本公开提供一种智能音箱、声音采集设备及智能音箱系统。
[0005] 根据本公开的第一方面,提供了一种智能音箱,所述智能音箱包括:第一通信模,用于接收第一声音采集设备发送的声音信号,所述第一声音采集设备与所述智能音箱彼此独立;语音识别模块,用于对所述声音信号进行语音识别,得到语音识别结果。
[0006] 可选地,所述智能音箱还包括:处理器,用于根据所述语音识别结果生成控制指令,所述控制指令中包括目标被控设备的标识;第二通信模块,用于向所述目标被控设备发送所述控制指令,或者向第二声音采集设备或端发送所述控制指令,以使所述第二声音采集设备或所述云端将所述控制指令转发至所述目标被控设备,其中,所述第二声音采集设备与所述智能音箱彼此独立。
[0007] 可选地,所述第二声音采集设备在最优通信路径上与所述智能音箱相邻,所述最优通信路径为从所述智能音箱至目标被控设备之间的信号质量最优的通信路径。
[0008] 可选地,在所述目标被控设备为所述智能音箱时,所述处理器控制所述智能音箱响应所述控制指令。
[0009] 可选地,所述处理器还用于:当所述语音识别模块在预设时间段内识别到至少两个相同的语音识别结果时,根据其中一个语音识别结果生成控制指令。
[0010] 根据本公开的第二方面,提供了一种声音采集设备,所述声音采集设备包括:声音采集模块,用于采集声音信号;第三通信模块,用于将所述声音信号发送至智能音箱,所述声音采集设备与所述智能音箱彼此独立。
[0011] 可选地,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:在接收到第二声音采集设备发送的声音信号后,将接收到的声音信号转发至最优通信路径上与所述第一声音采集设备相邻的第三声音采集设备或所述智能音箱,所述最优通信路径为从所述第一声音采集设备至所述智能音箱之间的信号质量最优的通信路径。
[0012] 可选地,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:将采集到的声音信号发送至最优通信路径上与所述第一声音采集设备相邻的其他声音采集设备或所述智能音箱,所述最优通信路径为所述第一声音采集设备至所述智能音箱之间的信号质量最优的通信路径。
[0013] 可选地,所述声音采集设备作为第一声音采集设备,所述第三通信模块还用于:在所述声音采集模块采集到声音信号后,获取所述第一声音采集设备与所述智能音箱之间的第一通信质量,将所述第一通信质量告知采集到相同声音信号的其他声音采集设备,以及获取所述其他声音采集设备对应的第二通信质量,所述第二通信质量为所述其他声音采集设备与所述智能音箱之间的通信质量;在所述第一通信质量高于所述第二通信质量时,将所述声音信号发送至所述智能音箱。
[0014] 可选地,所述第三通信模块还用于:在将采集到的声音信号发送至所述智能音箱或者其他声音采集设备时,在所述声音信号中携带所述第一声音采集设备的标识。
[0015] 根据本公开的第三方面,还提供了一种智能音箱系统,包括本公开第一方面所述的智能音箱以及本公开第二方面所述的声音采集设备。
[0016] 可选地,所述声音采集设备为至少两个。
[0017] 本公开实施例提供的智能音箱与声音采集设备为彼此独立的两个单体设备,使得声音采集功能不局限于在智能音箱所在区域执行,扩大了智能音箱的拾音范围。
[0018] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明
[0019] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0020] 图1是根据一示例性实施例示出的一种智能音箱的框图
[0021] 图2是根据一示例性实施例示出的一种智能音箱的框图。
[0022] 图3是根据一示例性实施例示出的一种声音采集设备的框图。
[0023] 图4是根据一示例性实施例示出的一种智能音箱系统的框图。

具体实施方式

[0024] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0025] 图1是根据一示例性实施例示出的一种智能音箱的框图,如图1所示,该智能音箱10包括如下组成部分:
[0026] 第一通信模块11,用于接收第一声音采集设备发送的声音信号,其中,第一声音采集设备与智能音箱10为彼此独立的两个单体设备;
[0027] 语音识别模块12,用于对接收到的声音信号进行语音识别,得到语音识别结果。
[0028] 由于本实施例的智能音箱与声音采集设备为彼此独立的两个单体设备,使得声音采集功能不局限于在智能音箱所在区域执行,扩大了智能音箱的拾音范围。
[0029] 其中,上述语音识别模块可以包括DSP(Digital Signal Processing,数字信号处理)芯片以及ARM芯片,DSP芯片用于对接收到的声音信号进行初步处理,例如,对声音信号进行消除噪声、消除回声或去除混响等处理,ARM芯片则作为语音识别引擎来对进行初步处理后的声音信号进行语音识别。或者,DSP芯片设置于声音采集设备中,在该种情况下,智能音箱接收到的声音信号则为经过消除噪声、消除回声或去除混响等初步处理后的声音信号。
[0030] 其中,智能音箱还可以包括声音播放器,用于在语音识别模块识别出语音识别结果后,播放该语音识别结果。
[0031] 图2是根据一示例性实施例示出的智能音箱的框图,如图2所示,智能音箱在包括上述第一通信模块11以及语音识别模块12的基础上,还可包括:处理器13以及第二通信模块14,该处理器用于根据语音识别结果生成控制指令,该控制指令中包括目标被控设备的标识,目标被控设备例如智能家电设备;目标被控设备的标识可以是能够唯一识别目标被控设备的任何类型的标识,例如目标被控设备的编号或名称等。语音识别结果中可包括目标设备的标识,还可以包括目标被控设备需执行的操作或目标被控设备的目标状态等信息,根据这些信息可以生成控制指令,则控制指令中也相应的包括目标被控设备的标识,还可包括目标被控设备需执行的操作或目标被控设备的目标状态等信息。第二通信模块还用于:向目标被控设备发送控制指令,或者向第二声音采集设备或云端发送控制指令,以使第二声音采集设备或云端将控制指令转发至目标被控设备。该第二声音采集设备与智能音箱彼此独立。第二通信模块14,例如是WiFi mesh(无线网格网络)通信模块、蓝牙mesh通信模块或Zigbee通信模块,第二通信模块14与上述第一通信模块可以是同一个通信模块。其中,在智能音箱与目标被控设备之间的通信路径的通信质量良好时,智能音箱可直接向目标被控设备发送控制指令;在智能音箱与目标被控设备之间的通信路径的通信质量较差时,智能音箱可以查找到最优通信路径来发送控制指令,例如,当前智能音箱与第二声音采集设备之间的通信质量最优,则智能音箱将控制指令发送至第二声音采集设备,由第二声音采集设备将该控制指令发送至目标被控设备;在控制指令中指示的目标被控设备需要云端来控制时,处理器将控制指令发送至云端。
[0032] 在一种可实现方式中,第二声音采集设备在最优通信路径上与智能音箱相邻,此处的最优通信路径为从智能音箱至目标被控设备之间的信号质量最优的通信路径。
[0033] 举例来说,智能音箱至目标被控设备之间可能存在多条通信路径,例如智能音箱至目标被控设备的直接通信路径,以及智能音箱经由至少一个声音采集设备至目标被控设备的一条或多条通信路径。智能音箱可选择信号质量最优的通信路径将控制指令发送给目标被控设备。其中,信号质量可以基于信号强度、信噪比等指标来衡量,基于最优通信路径来发送声音信号,实现了优先利用通信质量较佳的通信线路传输信号的目的,提高了系统通信效率。
[0034] 在一种情况下,智能音箱接收到的声音采集设备发送的声音信号中携带采集该声音信号的声音采集设备的标识信息,利用该标识信息可以唯一标识声音采集设备,基于此,在该标识信息与声音采集设备的物理位置之间具有对应关系的前提下,可以基于该标识信息确定声音采集设备的物理位置。例如,在某一声音采集设备在一段时间内均通过其他声音采集设备转发的方式将其采集的声音信号发送至智能音箱的情况下,可初步判断该声音采集设备出现故障,进而基于声音采集设备的标识信息可以较为方便快捷地对故障设备进行定位
[0035] 在一种可实现方式中,在目标被控设备为智能音箱时,处理器控制智能音箱响应控制指令,例如,控制指令中指示控制智能音箱播放本地音乐的情况下,智能音箱中处理器根据控制指令控制智能音箱播放本地音乐。
[0036] 在存在多个声音采集设备将各自采集到的声音信号发送至一个智能音箱进行语音识别的情况下,由于可能存在信号的延迟,所以智能音箱可能会在一个较短的时间段内先后收到不同声音采集设备发送的同一声音信号,在这种情况下,智能音箱在对该声音信号进行语音识别后,处理器可以根据其中一个语音识别结果生成控制指令。可选择最先获得的语音识别结果,或者识别精度最高的语音识别结果。本公开对此不作限制。通过这种方式,可解决多个声音采集设备同时采集声音信号时的冲突问题。
[0037] 图3是根据一示例性实施例示出的声音采集设备的框图,如图3所示,该声音采集设备20包括如下组成部分:
[0038] 声音采集模块21,用于采集声音信号;
[0039] 第三通信模块22,用于将声音信号发送至智能音箱,其中,声音采集设备与智能音箱为彼此独立的两个单体设备。
[0040] 声音采集设备可用于实现语音唤醒功能,即,在存在声音信号被该设备的声音采集模块获取后,唤醒该声音采集设备,以将采集到的声音信号发送至智能音箱。该声音采集设备为一个独立的单体设备,该单体设备可以包括麦克阵列及无线通信模块,该无线通信模块为上述第三通信模块的一个示例,该无线通信模块例如可以采用WiFi mesh通信模块、蓝牙mesh通信模块或Zigbee通信模块,其中,麦克风阵列可以采用两个麦克风器件或者多个麦克风器件。在声音采集设备的实际使用中,可以将多个声音采集设备放置在各个存在语音交互需求的房间内,例如,如客厅、厨房、卧室以及卫生间等,用以实现在不同位置均可以进行语音交互的目的。
[0041] 在存在多个声音采集设备将采集到的声音信号发送给一个智能音箱进行语音识别的情况下,该多个声音采集设备可以加入多语音同时传输的冲突检测机制,使用多个通信路径同时传输声音信号。多个声音采集设备在发送同时采集到的同一声音信号时,也可以选择多个通信路径中通信质量最优的通信路径来发送该声音信号,以避免多个声音采集设备同时采集到同一个声音的情况下,该声音被重复传输的问题。
[0042] 声音采集设备与智能音箱之间的通信路径可包括声音采集设备至智能音箱的直接通信路径,以及声音采集设备经由至少一个其他声音采集设备至智能音箱的一条或多条通信路径。声音采集设备可选择信号质量最优的通信路径将声音信号发送给智能音箱。其中,信号质量可以基于信号强度、信噪比等指标来衡量。
[0043] 以下给出几种通过最优通信路径发送声音信号的示例。
[0044] 在一种可实现方式中,存在至少两个声音采集设备将采集到的声音信号发送给一个上述智能音箱进行语音识别,上述声音采集设备20作为该至少两个声音采集设备中的第一声音采集设备,上述第三通信模块还用于:在接收到该至少两个声音采集设备中的第二声音采集设备发送的声音信号后,将接收到的声音信号转发至最优通信路径上与第一声音采集设备相邻的第三声音采集设备或智能音箱,此处的最优通信路径为从第一声音采集设备至智能音箱之间的信号质量最优的通信路径。该实现方式使得第一声音采集设备在接收到其他声音采集设备(例如第二声音采集设备)发来的声音信号后,可通过最优通信路径发送给智能音箱。
[0045] 在一种可实现方式中,上述第三通信模块还用于:将第一声音采集设备采集到的声音信号发送至最优通信路径上与第一声音采集设备相邻的其他声音采集设备或智能音箱。声音采集设备通过信号传输最优路径将自身采集到的声音信号上传到智能音箱设备,提高了通信效率。
[0046] 在一种可实现方式中,上述第三通信模块还用于:在与智能音箱断开通信连接时,例如,上述第一声音采集设备与上述智能音箱之间失去连接,或者,第三通信模块与上述第一通信模块或上述第二通信模块之间失去连接,将声音信号转发至在最优通信路径上与第一声音采集设备相邻的第二声音采集设备,以使第二声音采集设备将声音信号发送至智能音箱,从而在某一声音采集设备出现故障的情况下,其采集到的声音信号仍然可以上传智能音箱,甚至上传到云端,提高了系统的容错能
[0047] 在一种可实现方式中,第三通信模块还用于:在声音采集模块采集到声音信号后,获取第一声音采集设备与智能音箱之间的第一通信质量,将第一通信质量告知采集到相同声音信号的其他声音采集设备,以及获取其他声音采集设备对应的第二通信质量,第二通信质量为其他声音采集设备与智能音箱之间的通信质量;在第一通信质量高于第二通信质量时,将声音信号发送至智能音箱。在一个示例中,若第一通信质量低于第二通信质量,第一声音采集设备可不发送采集到声音信号,而由其他通信质量更高的声音采集设备发送所采集到的声音信号。基于此,在多个声音采集设备采集到同一声音信号时,能够确保由与智能音箱通信质量最佳的声音采集设备将自身采集到声音信号发送至智能音箱,在确保通信质量的基础上,避免了对同一声音信号的重复传输。其中,可在第一声音采集设备中预先设置与其布置于相同区域(例如同一房间)的其他声音采集设备,将这些声音采集设备视为采集到相同声音信号的其他声音采集设备。第一声音采集设备也可将采集到的声音信号或声音信号的特征发送给其他声音采集设备,由其他声音采集设备来判断是否采集到相同的声音信号。
[0048] 在一种可实现方式中,上述第三通信模块还用于:在将采集到的声音信号发送至智能音箱或者其他声音采集设备时,在声音信号中携带第一声音采集设备的标识信息,基于此,智能音箱则能区分接收到的声音信号是由哪个声音采集设备采集到的,可以实现对接收到的声音信号进行区分,根据该标识信息唯一确定声音采集设备。
[0049] 此外,还可以在声音采集设备中,或智能音箱中内置AI(Artificial Intelligence,人工智能)芯片,利用该AI芯片可以进行语音唤醒、语音识别以及语义解析,在此基础上,可以无需再区分声音采集设备以及智能音箱,二者均能实现语音唤醒、语音识别以及语义解析的功能。且利用不同语音样本进行训练,还可以使得声音采集设备以及智能音箱设备具有区分不同人的语音的功能。
[0050] 在一种情况下,上文中的第一声音采集设备、第二声音采集设备、第三声音采集设备以及其他声音采集设备可为相同的声音采集设备,这些声音采集设备采集到声音信号发送至同一智能音箱进行语音识别。
[0051] 图4是根据一示例性实施例示出的一种智能音箱系统的框图,如图4所示,该系统包括智能音箱40以及声音采集设备41、声音采集设备42、声音采集设备43以及声音采集设备44,其中,声音采集设备的个数可以为一个或多个,图4中示出了该系统包括四个声音采集设备的一种情况。
[0052] 智能音箱系统中的各通信节点设备(即上述智能音箱40、声音采集设备41、声音采集设备42、声音采集设备43以及声音采集设备44)之间均可进行通信,在这些通信节点设备进行通信时,可以基于通信节点之间的通信质量进行通信路径的选择,从而选择最优通信路径进行通信,在进行最优通信路径选择时,获取当前待发送消息的通信节点设备与其他通信节点设备之间的多条通信路径中的各通信路径的通信质量,选择通信质量最优的路径作为最优通信路径。
[0053] 以下结合图4对语音采集设备通过最优通信路径向智能音箱发送声音信号的过程进行简要阐述。
[0054] 当声音采集设备41采集到声音信号后,选择该声音采集设备41至智能音箱40的多条通信路径中通信质量最优的通信路径,例如,该声音采集设备41至声音采集设备42的通信路径的通信质量最优,则声音采集设备41将采集到的声音信号发送至声音采集设备42,声音采集设备42在接收到声音采集设备41发送的声音信号后,还可以如声音采集设备41一样选择最优路径发送声音信号,直至声音信号最终被发送至智能音箱40。
[0055] 本实施例的智能音箱系统,当需要在不同物理位置处采集声音信号时,仅需在这些物理位置处分别放置声音采集设备,使用这些声音采集设备与一个智能音箱通信即可,无需使用多个智能音箱,在扩大了智能音箱识别范围的基础上,还降低了成本。
[0056] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0057] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈