首页 / 专利库 / 医疗设备 / 视觉反馈 / 音频响应回放

音频响应回放

阅读:402发布:2020-05-11

专利汇可以提供音频响应回放专利检索,专利查询,专利分析的服务。并且可以接收包括由与媒体回放系统相关联的麦克 风 设备接收的语音命令的第一消息,其中媒体回放系统包括一个或多个区域,每个区域包括一个或多个回放设备。可以从一个或多个区域中选择音频响应区域来播放对语音命令的音频响应。所选区域的一个或多个回放设备中的至少一个回放设备可以播放音频响应。,下面是音频响应回放专利的具体信息内容。

1.一种用于计算设备的方法,所述方法包括:
接收包括由与媒体回放系统相关联的麦克设备接收的语音命令的第一消息,其中所述媒体回放系统包括多个区域,每个区域包括一个或多个回放设备;
从所述多个区域中选择音频响应区域以播放对所述语音命令的音频响应;
基于能信息确定选择预定区域作为所述音频响应区域还是动态地选择所述多个区域中的区域作为所述音频响应区域,其中能力信息包括以下中的至少一个:
可用传感器
可用设备;
可用网络;以及
可用处理能力,以及
使所选区域的一个或多个回放设备中的至少一个回放设备播放所述音频响应。
2.根据权利要求1所述的方法,其中,选择音频响应区域包括基于上下文信息来选择所述音频响应区域,所述上下文信息包括以下中的至少一个:
位置信息;
定向信息;
用户的定向;
存在信息;
取决于用户位置的配对信息;
取决于麦克风设备的位置的配对信息。
3.根据权利要求2所述的方法,其中,所述上下文信息包括在接收到所述语音命令之后收集的信息。
4.根据权利要求2所述的方法,还包括:基于所述上下文信息来调整所述音频响应的回放的音量等级。
5.根据权利要求3至4中任一项所述的方法,其中,基于上下文信息选择所述音频响应区域包括选择被确定为最靠近用户的回放设备,其中,通过以下之一来确定最靠近用户的回放设备:
通过比较在两个或更多个不同设备处接收的用户语音的量级来确定最近的扬声器;
确定两个或更多个不同设备中的每个设备接收到用户语音的时间之间的延迟或时间差。
6.根据权利要求3至4中任一项所述的方法,其中,基于上下文信息选择所述音频响应区域包括:基于检测到的用户定向来选择回放设备,使得用户面向的回放设备被选择为音频响应设备。
7.根据权利要求1-2中任一项所述的方法,还包括:
确定所述媒体回放系统缺少一个或多个硬件设备;
作为响应,基于所述麦克风设备的配对信息确定选择所述预定区域作为所述音频响应区域。
8.根据权利要求1-2中任一项所述的方法,
还包括确定所述音频响应区域被分组以与第二区域同步回放;并且
其中,使至少一个回放设备播放所述音频响应包括仅使所述音频响应区域播放所述音频响应。
9.根据权利要求1-2中任一项所述的方法,其中:
所述第一消息还包括所述麦克风设备的标识;
所述语音命令包括媒体回放命令;以及
选择所述音频响应区域包括基于以下各项来选择所述音频响应区域:
接收到的第一消息;以及
数据库中的信息,包括指示将麦克风设备的标识分配给媒体回放系统的特定区域的一个或多个数据项,其中,使所选区域的至少一个回放设备播放所述音频响应包括:
向所述音频响应区域发送第二消息,所述第二消息指示所述媒体回放命令并使所述音频响应区域根据所述媒体回放命令来回放媒体。
10.根据权利要求9所述的方法,其中,向所述音频响应区域发送所述第二消息包括以下之一:
向所述音频响应区域包括的至少一个回放设备发送所述第二消息;
向所述音频响应区域包括的多个回放设备中的每个回放设备发送所述第二消息;以及选择所述音频响应区域包括的多个回放设备中的一个回放设备,并向所选回放设备发送所述第二消息。
11.根据权利要求10所述的方法,还包括
从所述音频响应区域中的至少一个回放设备接收第三消息,所述第三消息指示所述回放设备正在执行所述命令;以及
向所述麦克风设备发送第四消息,所述第四消息为所述命令被发送以在所述音频响应区域中执行。
12.根据权利要求9所述的方法,其中:
所述数据库还指示所述麦克风设备与第一区域和第二区域相关联;并且在以下情况中的至少一种情况下,所述第一区域被选择为所述音频响应区域:
所述第一区域与媒体内容相关联;以及
所述第二区域与媒体内容不相关。
13.根据权利要求9所述的方法,其中,当确定在所述语音命令中未指定不同区域时,选择所述数据库中与所述麦克风设备相关联的音频响应区域。
14.根据权利要求1-2中任一项所述的方法,其中,通过网络从所述麦克风设备和远程服务器之一接收所述第一消息。
15.根据权利要求9所述的方法,还包括通过以下步骤来维护所述数据库:
确定联网麦克风设备可用于分配给所述媒体回放系统的一个或多个回放区域;
显示指示所述联网麦克风设备将被分配到的至少一个回放区域的提示;
接收指示本地回放网络中将被分配所述联网麦克风设备的特定回放区域的输入;以及在所述数据库中存储所述联网麦克风设备到所述特定回放区域的分配。
16.根据权利要求15所述的方法,其中,存储所述分配包括向服务器发送消息以使所述服务器在所述数据库中存储所述分配。
17.根据权利要求15所述的方法,还包括:
在界面上显示指示所述特定回放区域的两个或更多个回放设备中的特定回放设备的提示;以及
接收指示所述特定回放区域中的特定回放设备的输入,
其中,所述分配还指示所述联网麦克风设备到所述特定回放区域中的特定回放设备的分配。
18.根据权利要求15所述的方法,其中,所显示的提示包括按下所述特定回放区域中的回放设备上的按钮的提示。
19.根据权利要求15所述的方法,
还包括显示分别与所述媒体回放系统中的每个回放区域相对应的多个表示,其中,所显示的提示包括从多个显示的表示中选择与所述特定回放区域相对应的表示的提示。
20.根据权利要求15所述的方法,其中:
其中,所述媒体回放系统的一个或多个回放区域在本地回放网络内通信;并且确定联网麦克风设备可用于分配给所述一个或多个回放区域包括:
通过第二网络与所述联网麦克风设备建立通信,其中,所述本地回放网络是第一网络;
以及以下之一:
从所述联网麦克风设备接收指示网络麦克风可用于分配给所述本地回放网络内的一个或多个回放设备的消息;以及
通过所述第二网络向所述联网麦克风设备发送指示用于加入所述第一网络的参数的数据,以及通过所述第一网络从回放设备和所述联网麦克风设备之一接收指示所述联网麦克风设备连接到所述第一网络并且可用于分配给所述第一网络内的一个或多个回放区域的消息。
21.根据权利要求1-2中任一项所述的方法,还包括:将回放设备正在回放的音频内容的音量调节到低于所述音频响应的音量的第二音量等级。
22.根据权利要求21所述的方法,其中:
所述第一消息定义所述音频响应的持续时间,并且
在所定义的持续时间内所述音频内容的音量被调整到所述第二音量等级。
23.根据权利要求21所述的方法,其中,调整所述音频内容的音量包括以下之一:
将所述音频响应与所述音频内容混合以在所述回放设备上回放;以及
在输出所述音频响应时使所述音频内容静音或暂停。
24.根据权利要求15所述的方法,其中,选择所述音频响应区域包括:
响应于确定所述音频响应区域的默认回放设备不可用于提供所述音频响应,指示后备设备响应于所述语音命令提供第二响应。
25.根据权利要求24所述的方法,其中,确定所述音频响应区域的回放设备不可用于提供所述音频响应包括确定:
所述回放设备被静音,
所述回放设备处于不中断状态,
所述回放设备处于节能模式,
所述回放设备经由被配置为支持所述媒体回放系统和所述联网麦克风设备之间的通信的网络不可达;以及
已经从所述媒体回放系统接收到指示所述回放设备不可用的消息。
26.根据权利要求24所述的方法,还包括通过以下之一从包括一个或多个后备设备的集合中选择后备设备:
根据预定义的后备设备层次结构选择后备设备;
从被配置为与主媒体回放设备同步地回放媒体内容的一个或多个媒体回放设备中选择后备设备;
从预先被配置为与所述音频响应区域的所述回放设备同步地回放媒体内容的一个或多个媒体回放设备中选择后备设备;以及
选择辅媒体回放设备作为所述后备设备,其中,所述音频响应区域的所述回放设备被配置为回放媒体内容的第一声道,并且其中,所述辅媒体回放设备被配置为回放所述媒体内容的第二声道。
27.根据权利要求24所述的方法,还包括:当指示所述后备设备来提供所述第二响应时,另外指示所述后备设备提供第三响应以指示所述音频响应区域的所述回放设备不可用。
28.根据权利要求27所述的方法,还包括:
确定联网麦克风系统的主联网麦克风设备不可用于接收针对所述媒体回放系统的语音命令;以及
作为响应,指定用于接收针对所述媒体回放系统的语音命令的后备麦克风。
29.根据权利要求28所述的方法,还包括:响应于确定所述主联网麦克风设备不可用,另外指示所述计算设备和一个或多个媒体回放设备中的一个或多个提供第四响应以指示所述主联网麦克风设备不可用,
其中,确定所述主联网麦克风设备不可用包括接收指示所述主联网麦克风设备不可用于接收语音命令的消息。
30.根据权利要求29所述的方法,其中,所述音频响应、所述第二响应、所述第三响应和所述第四响应中的至少一个是以下中的一个或多个:
音频反馈,
视觉反馈,以及
触觉反馈
31.根据权利要求28所述的方法,其中,所述后备麦克风包括以下中的一个或多个:
所述媒体回放系统中的媒体回放设备上的麦克风;
被配置为控制所述媒体回放系统的计算设备上的麦克风;以及
辅联网麦克风设备上的麦克风。
32.根据权利要求15所述的方法,还包括:
建立所述媒体回放系统和所述联网麦克风设备之间的元数据交换通道,其中,所述联网麦克风设备是包括联网麦克风服务器的联网麦克风系统的一部分;
在建立所述元数据交换通道之后,所述媒体回放系统经历元数据交换触发事件;以及响应于经历所述元数据交换触发事件,经由所述元数据交换通道,从所述媒体回放系统向所述联网麦克风系统提供与所述媒体回放系统相关联的元数据。
33.根据权利要求32所述的方法,其中,建立所述元数据交换通道包括:建立所述媒体回放系统的至少一个媒体回放设备和所述媒体回放系统的媒体回放服务器中的一个与所述联网麦克风设备和所述联网麦克风服务器中的至少一个之间的元数据交换通道。
34.根据权利要求32所述的方法,其中,所述元数据交换触发事件包括以下中的一项:
所述媒体回放系统回放新的媒体内容项;
响应于所述联网麦克风系统接收到上下文特定回放命令,从所述联网麦克风系统接收到对元数据的请求
响应于所述联网麦克风系统接收到上下文特定信息请求,从所述联网麦克风系统接收到对元数据请求;以及
经过定义的时间段。
35.根据权利要求32所述的方法,其中,向所述联网麦克风系统提供所述元数据包括以下中的至少一项:
所述媒体回放系统经由所述元数据交换通道向所述联网麦克风系统发送元数据;以及所述媒体回放系统授权所述联网麦克风系统经由所述元数据交换通道访问元数据。
36.根据权利要求32所述的方法,其中,所述元数据包括以下中的至少一项:
所述媒体回放系统的一个或多个配置参数;
关于当前经由所述媒体回放系统播放的音频内容的信息;
关于所述媒体回放系统播放的音频内容的历史信息;
与音频内容有关的用户偏好信息,以及
与媒体回放系统配置有关的用户偏好信息。
37.根据权利要求32所述的方法,其中,所述计算设备是以下中的一种:
联网麦克风设备,
媒体回放设备,
被配置为控制所述媒体回放系统的计算设备,
被配置为与所述媒体回放系统通信的服务器系统,以及
被配置为与所述联网麦克风系统通信的服务器系统。
38.一种存储有指令的有形的非暂时性计算机可读介质,当由处理器执行时,所述指令使计算设备执行根据任何一项前述权利要求所述的方法。
39.一种计算设备,包括:
处理器;以及
存储器,在所述存储器上存储有指令,所述指令在由所述处理器执行时使得所述计算设备执行根据权利要求1至37中任一项所述的方法。

说明书全文

音频响应回放

[0001] 相关申请的相交引用
[0002] 根据PCT第8条,本申请要求以下申请的优先权:(i)于2016年4月14日提交的题为“CONTENT MIXING”的美国非临时申请No.15/098,760;(ii)于2016年4月14日提交的题为
“DEFAULT PLAYBACK DEVICE DESIGNATION”的美国非临时申请No.15/098,867;(iii)于
2016年4月14日提交的题为“DEFAULT PLAYBACK DEVICES”的美国非临时申请No.15/098,
892;(iv)于2016年8月15日提交的题为“AUDIO RESPONSE PLAYBACK”的美国非临时申请
No.15/237,133;(v)于2016年4月18日提交的题为“METADATA EXCHANGE INVOLVING A 
NETWORKED PLAYBACK SYSTEM AND A NETWORKED MICROPHONE SYSTEM”的美国非临时申请
No.15/131,244;(vi)于2016年4月18日提交的题为“HANDLING OF LOSS OF PAIRING 
BETWEEN NETWORKED DEVICES”的美国非临时申请No.15/131,254;(vii)于2016年2月22日
提交的题为“DEFAULT PLAYBACK DEVICE(S)”的美国临时申请No.62/298,410;(viii)于
2016年2月22日提交的题为“AUDIO RESPONSE PLAYBACK”的美国临时申请No.62/298,418;
(ix)于2016年2月22日提交的题为“ROOM-CORRECTED VOICE DETECTION”的美国临时申请
No.62/298,433;(x)于2016年2月22日提交的题为“CONTENT MIXING”的美国临时申请
No.62/298,439;(xi)于2016年2月22日提交的题为“MUSIC SERVICE SELECTION”的美国临时申请No.62/298,425;(xii)于2016年2月22日提交的题为“METADATA EXCHANGE 
INVOLVING A NETWORKED PLAYBACK SYSTEM AND A NETWORKED MICROPHONE SYSTEM”的美
国临时申请No.62/298,350;(xiii)于2016年2月22日提交的题为“HANDLING OF LOSS OF 
PAIRING BETWEEN NETWORKED DEVICES”的美国临时申请No.62/298,388;(xiv)于2016年2
月22日提交的题为“ACTION BASED ON USER ID”的美国临时申请No.62/298,393;以及(xv)于2016年3月23日提交的题为“VOICE CONTROL OF A MEDIA PLAYBACK SYSTEM”的美国临时申请No.62/312,350。这些申请中的每个申请的内容通过引用全部合并于此。

技术领域

[0003] 本公开涉及消费者产品,更具体地,涉及与媒体回放或者其某个方面有关的方法、系统、产品、特征、服务和其他元件。

背景技术

[0004] 在外放的环境中访问和收听数字音频的选项是有限的,直到2003年SONOS公司提交其首批专利申请中题为“Method for Synchronizing Audio Playback between 
Multiple Networked Devices”的专利申请,并在2005年开始出售媒体回放系统为止。
Sonos无线HiFi系统使人们能够通过一个或多个联网回放设备体验来自许多源的音乐。通
过安装在智能电话、平板电脑或计算机上的软件控制应用,可以在任何具有联网回放设备
的房间中播放他或她期望的内容。另外,使用控制器,例如,不同的歌曲可以被流传输到具有回放设备的每个房间,可以将房间分组在一起以进行同步回放,或者可以同步地在所有
房间中听到相同的歌曲。
[0005] 鉴于对数字媒体的兴趣日益增长,仍然需要开发消费者可访问的技术以进一步增强收听体验。
附图说明
[0006] 参考以下说明书、所附权利要求和附图,将更好地理解本公开的技术的特征、方面和优点,在附图中:
[0007] 图1示出了可以实施某些实施例的示例媒体回放系统;
[0008] 图2示出了示例回放设备的功能框图
[0009] 图3示出了示例控制设备的功能框图;
[0010] 图4示出了示例控制器界面;
[0011] 图5示出了示例的多个网络设备;
[0012] 图6示出了示例网络麦克设备的功能框图;
[0013] 图7是关于回放设备在存在内容输出时调整音频内容的音量的示例流程图;以及
[0014] 图8是关于回放设备回放内容输出和/或音频内容的另一示例流程图。
[0015] 图9示出了根据一些实施例的示例方法。
[0016] 图10示出了根据一些实施例的另一示例方法。
[0017] 图11示出了根据一些实施例的又一示例方法。
[0018] 图12示出了用于指定默认回放设备的示例流程图;
[0019] 图13A-D示出了用于分配网络麦克风设备的示例用户界面;以及
[0020] 图14示出了用于应用默认回放设备指定的示例流程图。
[0021] 图15示出了根据本文描述的方面的播放音频响应的示例方法的流程图;以及
[0022] 图16更详细地示出了根据本文描述的方面的图15的框1508和1512的流程图。
[0023] 附图用于示出示例实施例的目的,但可以理解,本发明不限于附图所示的布置和手段。

具体实施方式

[0024] I.概述
[0025] 在一种布置中,所描述的实施例尤其可以涉及当网络麦克风设备或回放系统输出与音频内容不同的内容时调整回放系统回放的音频内容的音量。
[0026] 网络麦克风设备(NMD)可以是通过麦克风阵列接收语音输入并通过扬声器输出内容的设备。语音输入可以是例如人类说话形式的询问,并且内容输出可以是对询问的响应。
语音输入可以是人类说话的形式,并且响应于语音输入的内容输出可以采用各种形式,包
括语音输出、音调、警报或音乐。网络麦克风设备输出的内容在本文中可以称为NMD输出。
[0027] 作为示例,NMD可以接收被表述为“谁是来自‘流媒体服务1’的‘曲目1’的‘艺术家1’”的语音输入。NMD可以确定该语音输入是命令,然后响应于语音输入而提供语音输出。语音输出可以是确认在语音输入中询问的艺术家(例如,Prince)的口头响应。
[0028] 在许多情况下,NMD可以放置在媒体回放系统附近。媒体回放系统可以包括回放音频内容的多个回放设备。这些回放设备可以分布在家庭内的各个位置,并且这些位置可以
被称为诸如卧室或起居室之类的区域。回放设备可以在NMD输出内容的同时回放音频内容。
结果,当也在播放音频内容时,可能听不到从NMD输出的内容。
[0029] 在一个方面,回放设备可以被布置成将其音量减小到低于在NMD输出内容时NMD将使用的音量的音量。这样,收听者可以更好地听到从NMD输出的内容。将回放设备的音量减小到低于另一内容的音量的过程在本文中可称为回避(ducking)。
[0030] 回避的回放设备可以是媒体回放系统中的所有回放设备。在另一示例中,回避的媒体回放设备可以是回放设备的子集。回避的回放设备的子集可以基于NMD是否在相同的
一个或多个区域中。备选地,回避的回放设备的子集可以基于NMD是否与回放设备绑定(分
组或配对)。
[0031] 这些也正在回放音频内容的回放设备会直接影响是否听到NMD输出的内容。例如,如果媒体回放系统在厨房和卧室中具有回放设备并且NMD位于厨房中,则厨房回放设备可
以与NMD绑定。厨房回放设备和卧室回放设备可能都在回放音频。但是当NMD输出内容时,厨房回放设备可以回避,但卧室回放设备可以不回避。但是,如果回放设备在其中操作的环境是具有不同区域的开放区域,则不同区域中的所有回放设备仍然可能回避。否则,在开放区域中仍然难以听到从NMD输出的内容。
[0032] 在另一方面,回放设备本身可以回放NMD内容。假设回放设备可能也正在播放音频内容,例如音乐,则回放设备可以以各种方式输出NMD内容。作为一个示例,回放设备可以被布置为从NMD接收NMD内容的指示,并且将NMD内容与回放设备播放的音频内容混合。作为另一示例,可以使正在回放的音频内容静音,并且可以在回放设备上输出NMD内容。作为又一示例,可以暂停正在回放的音频内容,并且可以在回放设备上输出NMD内容。其他示例也是可能的。
[0033] 在另一种布置中,当媒体回放设备被配置为由NMD接收的语音命令来控制时,为了实现经由联网麦克风系统对媒体回放系统的语音控制,媒体回放系统有时可以有利地与
NMD共享元数据,反之亦然。例如,当联网麦克风系统接收到“现在在我的书房中播放这首歌曲”的语音命令时,联网麦克风系统需要知道“这首歌曲”是什么以及哪个媒体回放设备在用户的书房中。联网麦克风系统弄清楚“这首歌曲”是什么以及哪个或哪些媒体回放设备在用户书房中的一种方式是联网麦克风系统从媒体回放系统获得与以下有关的元数据:(i)
媒体回放系统当前正在播放的歌曲,以及(ii)媒体回放系统中的媒体回放设备的配置。
[0034] 本文描述的一些实施例包括媒体回放系统(或者可能地其一个或多个组件)向联网麦克风系统(或者可能地其一个或多个组件)提供元数据,以促进联网麦克风系统对媒体
回放系统的语音控制。
[0035] 一个方面包括在媒体回放系统和联网麦克风系统之间建立元数据交换通道。在一些实施例中,媒体回放系统单独或者与媒体回放系统服务器组合地包括一个或多个媒体回
放设备,并且联网麦克风系统单独或者与联网麦克风系统服务器组合地包括一个或多个联
网麦克风设备。在一些实施例中,媒体回放系统服务器和/或联网麦克风系统服务器中的一个或两者是基于的服务器系统。
[0036] 在操作中,元数据交换通道可以是媒体回放系统的一个或多个组件与如本文所述的联网麦克风系统的一个或多个组件之间的任何类型的通信信道。在一些实施例中,元数
据交换通道是媒体回放系统的一个或多个组件与联网麦克风系统的一个或多个组件之间
的通信会话。通信会话可以或可以不被特别配置用于元数据的交换实际上,媒体回放系统
和联网麦克风系统可以使用现在已知或以后开发的任何类型的通信机制来在两个系统之
间交换元数据,包括但不限于通信路径、链路、信道和/或会话(例如,一个或多个路径、链接和/或信道可以支持会话)。
[0037] 在建立元数据交换通道之后,或者至少在配置媒体回放系统以共享元数据或以其他方式向联网麦克风系统提供元数据之后,媒体回放系统响应于元数据交换触发事件而向
联网麦克风系统提供与媒体回放系统相关联的元数据。在一些实施例中,元数据交换触发
事件是以下中的任何一个或多个:(i)媒体回放系统回放新的媒体内容项(例如,新的音频
曲目),(ii)媒体回放系统经由联网麦克风系统接收到上下文特定的回放命令,(iii)媒体
回放系统经由联网麦克风系统接收到上下文特定的信息请求,和/或(iv)经过定义的时间
段。
[0038] 一些实施例包括联网媒体回放系统经由元数据交换通道向联网麦克风系统提供元数据。例如,媒体回放系统可以通过以下中的一个或两个经由元数据交换通道向联网麦
克风系统提供与媒体回放系统相关联的元数据:(i)经由元数据交换通道从媒体回放系统
的一个或多个组件向联网麦克风系统的一个或多个组件发送元数据,和/或(ii)授权联网
麦克风系统的一个或多个组件经由元数据交换通道访问存储在媒体回放系统的一个或多
个组件上的元数据。
[0039] 在一些实施例中,媒体回放系统向联网麦克风系统提供的元数据包括以下中的一个或多个:(i)媒体回放系统的一个或多个配置参数,(ii)关于当前经由媒体回放系统播放的音频内容的信息,(iii)关于媒体回放系统播放的音频内容的历史信息,(iv)与音频内容有关的用户偏好信息,(v)与媒体回放系统配置有关的用户偏好信息,和/或(vi)任何其他
元数据,包括但不限于本文公开和/描述的其他元数据。
[0040] 一些实施例可以另外包括联网麦克风系统经由元数据交换通道向媒体回放系统提供元数据。例如,联网麦克风系统可以通过以下中的一个或两个操作,经由元数据交换通道提供与联网麦克风系统相关联的元数据:(i)经由元数据交换通道从联网麦克风系统的
一个或多个组件向媒体回放系统的一个或多个组件发送元数据,和/或(ii)授权媒体回放
系统的一个或多个组件经由元数据交换通道访问存储在联网麦克风系统的一个或多个组
件上的元数据。
[0041] 在一些实施例中,联网麦克风系统向媒体回放系统提供的元数据包括以下中的一个或多个:(i)联网麦克风系统的一个或多个配置参数,(ii)联网麦克风系统的各个联网麦克风设备的配置参数,(iii)关于谁曾经使用(例如,哪个或哪些用户)及何时使用联网麦克风系统来控制媒体回放系统的历史信息,(iv)联网麦克风系统接收到的语音命令,和/或
(v)任何其他元数据,包括但不限于本文公开和/或描述的其他元数据。
[0042] 在又一种布置中,当媒体回放系统被配置为通过经由联网麦克风系统接收到的语音命令来控制时,媒体回放系统执行语音命令并且可能还响应于经由联网麦克风系统接收
到的语音命令而提供反馈,这有时可能是有益的。
[0043] 例如,响应于联网麦克风系统接收到“将这首歌曲添加到我的收藏夹播放列表”的语音命令,有利的是,媒体回放系统(或媒体回放系统的至少一个媒体回放设备)将这首歌曲添加到收藏夹播放列表,并通过一些音频反馈(例如,“已经将[歌曲名称]添加到收藏夹播放列表中”)或一些类似的反馈确认这首歌曲已被添加到用户的收藏夹播放列表中。类似地,响应于联网麦克风系统接收到“这首歌曲的名称是什么?”的语音命令,可能需要媒体回放系统(或媒体回放系统的至少一个媒体回放设备)通过一些音频反馈(例如,“这首歌曲是The Beatles的All You Need is Love”)或者一些类似的反馈向用户通知这首歌曲的名
称。
[0044] 然而,有时一个或多个媒体回放设备可能不可用或者不能响应于联网麦克风系统接收到语音命令而执行语音命令(例如,回放媒体、重新配置媒体回放系统等的命令)或者
提供反馈。在这种情况下,可能希望后备设备响应于经由联网麦克风系统接收到的语音命
令来回放媒体、执行媒体回放系统重配置和/或提供反馈。
[0045] 本文描述的一些实施例包括:(i)经由NMD接收语音命令以执行功能(例如,回放媒体内容、添加歌曲到播放列表或从中移除歌曲、购买歌曲等等),该NMD被配置为接收针对媒体回放系统的语音命令,其中,媒体回放系统包括主媒体回放设备,其被配置为响应于经由NMD接收的语音命令而执行功能,(ii)确定主媒体回放设备不可用于响应于语音命令而执
行功能,以及(iii)响应于确定主媒体回放设备不可用于响应于语音命令而执行功能,指示后备设备响应于语音命令而执行功能。
[0046] 本文描述的一些实施例可以附加地或替代地包括:(i)经由NMD接收语音命令,该NMD被配置为接收针对媒体回放系统的语音命令,其中,媒体回放系统包括主媒体回放设
备,其被配置为响应于经由NMD接收的语音命令而提供第一反馈,(ii)确定主媒体回放设备不可用于响应于语音命令而提供第一反馈,以及(iii)响应于确定主媒体回放设备不可用
于响应于语音命令而提供第一反馈,指示后备设备响应于语音命令而提供第二反馈。
[0047] 另外,有时联网麦克风系统的一个或多个NMD可能不可用或者不能接收语音命令。在这种情况下,可能需要配置后备麦克风(可能暂时地)以接收针对媒体回放系统的语音命
令。
[0048] 本文描述的一些实施例包括:(i)确定联网麦克风系统的主NMD不可用于接收针对媒体回放系统的语音命令,其中,媒体回放系统包括一个或多个媒体回放设备,以及(ii)响应于确定主NMD不可用于接收语音命令,指定用于接收针对媒体回放系统的语音命令的后
备麦克风。
[0049] 在又一种布置中,本文描述的一些实施例可以涉及在媒体回放系统中指定默认回放设备并应用这种对默认回放设备的指定。在一个实施例中,可以将NMD分配给媒体回放系统中的回放区域。在这种情况下,可以将回放区域中的一个或多个回放设备指定为NMD的默认回放设备。本文的一些示例涉及用于指定默认回放设备和/或将NMD分配给回放区域的方
法和过程。其他示例涉及用于使默认回放设备采取某些动作的方法和过程。在实施例中,经由NMD使媒体回放系统执行特定回放命令的命令可以不识别特定回放区域。在这种情况下,可以基于将NMD分配为回放区域的默认回放设备来识别默认回放设备。默认回放设备可以
相应地执行特定回放命令。可以在以下部分中找到涉及指定默认回放设备和应用此指定的
其他场景和示例。
[0050] 在一个方面,提供了一种方法。该方法涉及:由计算设备确定NMD可用于被分配给本地回放网络内的一个或多个回放区域,由计算设备显示指示被分配NMD的至少一个回放
区域的提示,由计算设备接收指示本地回放网络中将被分配NMD的特定回放区域的输入,以及,由计算设备存储指示NMD到特定回放区域的分配的数据。
[0051] 在另一方面,提供了一种计算设备。该计算设备包括处理器和存储器,存储器上存储有可由处理器执行以使设备执行功能的指令。这些功能包括:确定NMD可用于分配给本地回放网络内的一个或多个回放区域,显示指示被分配NMD的至少一个回放区域的提示,接收指示本地回放网络中将被分配NMD的特定回放区域的输入,以及存储指示NMD向特定回放区域的分配的数据。
[0052] 在又一方面,提供了一种非暂时性计算机可读存储器。非暂时性计算机可读存储器上存储有指令,所述指令可由计算设备执行以使计算设备执行功能。这些功能包括:确定NMD可用于分配给本地回放网络内的一个或多个回放区域,显示指示被分配NMD的至少一个
回放区域的提示,接收指示本地回放网络中将被分配NMD的特定回放区域的输入,以及存储指示NMD向特定回放区域的分配的数据。
[0053] 在另一方面,提供了另一种方法。该方法包括:由计算设备维护包括指示NMD的标识向媒体回放系统的回放区域的分配的数据的数据库,由计算设备接收指示(i)NMD的标识
和(ii)媒体回放命令的消息,由计算设备基于数据库中的数据和接收到的消息来识别媒体
回放系统中的回放区域,以及,由计算设备向回放区域发送指示媒体播放命令的消息。
[0054] 在另一方面,计算设备可以包括处理器,以及其上存储有指令的存储器,所述指令可由处理器执行以使设备执行功能。这些功能包括:维护包括指示NMD的标识向媒体回放系统的回放区域的分配的数据的数据库,接收指示(i)NMD的标识和(ii)媒体回放命令的消息,基于数据库中的数据和接收到的消息来识别媒体回放系统中的回放区域,以及向回放
区域发送指示媒体播放命令的消息。
[0055] 又一方面可以包括非暂时性计算机可读存储器,其上存储可由计算设备执行以使计算设备执行功能的指令。这些功能可以包括:维护包括指示NMD的标识向媒体回放系统的回放区域的分配的数据的数据库,接收指示(i)NMD的标识和(ii)媒体回放命令的消息,基
于数据库中的数据和接收到的消息来识别媒体回放系统中的回放区域,以及向回放区域发
送指示媒体播放命令的消息。
[0056] 在另一种布置中,本文描述的一些实施例可以涉及在媒体回放系统中播放对语音命令的音频响应,以及选择响应设备或区域来播放对语音命令的音频响应。在一个实施例
中,响应设备或区域可以是预定的,并且在另一实施例中,可以基于上下文信息动态地选择响应设备或区域。
[0057] 在一个方面,提供了一种方法。该方法可以涉及从与媒体回放系统相关联的麦克风设备接收语音命令。媒体回放系统可以包括一个或多个区域。可以基于区域的配对信息
或能中的至少一项来选择一个或多个回放设备中的至少一个回放设备或至少一个区域
来播放音频响应,并且使得所选择的至少一个回放设备或区域播放音频响应。
[0058] 在另一方面,提供了一种非暂时性计算机可读介质。非暂时性计算机可读介质上存储有指令,所述指令可由计算设备执行以使计算设备执行功能。这些功能包括:从与媒体回放系统相关联的麦克风设备接收语音命令,并且媒体回放系统可以包括一个或多个区
域;基于上下文信息来选择一个或多个回放设备中的至少一个回放设备或者区域来播放音
频响应;以及使所选择的至少一个回放设备或区域播放音频响应。
[0059] 在又一方面,提供了一种装置。该装置包括处理器和存储器。存储器上存储有可由装置执行以使装置执行功能的指令。这些功能包括:经由被分配给包括一个或多个回放设备的区域的麦克风设备接收语音命令;基于区域的配对信息或者能力中的至少一项,选择
一个或多个回放设备中的至少一个回放设备来播放音频响应;以及使所选择的至少一个回
放设备播放音频响应。
[0060] 虽然本文描述的一些示例可以涉及由诸如“用户”和/或其他实体之类的给定行动者执行的功能,但是应该理解,这仅仅出于解释的目的。除非权利要求本身的语言明确要
求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。本领域普通技术人员
将理解,本公开包括许多其他实施例。
[0061] II.示例操作环境
[0062] 图1示出了媒体回放系统100的示例配置,其中可以实施或实现本文公开的一个或多个实施例。如图所示的媒体回放系统100与具有若干房间和空间(例如,主卧室、书房、餐厅和起居室)的示例家庭环境相关联。如图1的示例所示,媒体回放系统100包括回放设备
102-124、控制设备126和128、以及有线或无线网络路由器130。
[0063] 可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件如何交互以向用户提供媒体体验的进一步讨论。虽然本文的讨论总体上可以参考示例媒体回放
系统100,但是本文描述的技术不限于在如图1所示的家庭环境等内的应用。例如,本文描述的技术可以在可能需要多区域音频的环境中有用,例如,诸如餐馆、商场或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或汽车、船舶或船只、飞机等的载运工具。
[0064] a.示例回放设备
[0065] 图2示出了示例回放设备200的功能框图,该示例回放设备200可以被配置为图1的媒体回放系统100的回放设备102-124中的一个或多个。回放设备200可以包括一个或多个
处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、包括无线接口216和有线接口218的网络接口214和麦克风220。在一种情况下,回放设备200可以不包括扬声器212,而是包括用于将回放设备200连接到外部扬声器的扬声器接口。在另一
种情况下,回放设备200既不包括扬声器212也不包括音频放大器210,而是包括用于将回放设备200连接到外部音频放大器或视听接收器的音频接口。
[0066] 在一个示例中,一个或多个处理器202可以是一个或多个时钟驱动的计算组件,其被配置为根据存储在存储器206中的指令来处理输入数据。存储器206可以是有形计算机可
读介质,其被配置为存储可由一个或多个处理器202执行的指令。例如,存储器206可以是数据存储装置,其可以加载有可由一个或多个处理器202执行以实现某些功能的一个或多个
软件组件204。在一个示例中,该功能可以涉及回放设备200从音频源或另一回放设备检索
音频数据。在另一示例中,该功能可以涉及回放设备200在网络上向另一设备或回放设备发送音频数据。在又一示例中,该功能可以涉及将回放设备200与一个或多个回放设备配对以创建多声道音频环境。
[0067] 某些功能可以涉及回放设备200使音频内容的回放与一个或多个其他回放设备同步。在同步回放期间,收听者将优选地不能感知回放设备200和一个或多个其他回放设备回放音频内容之间的时间延迟差异。通过引用合并于此的题为“System and method for 
synchronizing operations among a plurality of independently clocked digital 
data processing devices”的美国专利No.8,234,395,更详细地提供了回放设备之间的音频回放同步的一些示例。
[0068] 存储器206还可以被配置为存储与回放设备200相关联的数据,诸如回放设备200所属的一个或多个区域和/或区域组、回放设备200可访问的音频源、或回放设备200(或某
个其他回放设备)相关联的回放序列。该数据可以存储为一个或多个状态变量,这些状态变量被周期性地更新并用于描述回放设备200的状态。存储器206还可以包括与媒体系统的其
他设备的状态相关联的数据,并且在设备之间不时地共享,使得一个或多个设备具有与系
统相关联的最新数据。其他实施例也是可能的。
[0069] 音频处理组件208可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施例中,音频处理组件208中的一个或多个
可以是一个或多个处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地更改音频内容以产生音频信号。然后可以向音频放大器210提供所产生的音频信号,以通过扬声器212进行放大和回放。具体地,音频放大器210可以包括被配置为将音频信号放
大到用于驱动一个或多个扬声器212的电平的设备。扬声器212可以包括单独的换能器(例
如“驱动器”)或包括具有一个或多个驱动器的壳体的完整扬声器系统。扬声器212的特定驱动器可包括例如低音炮(例如,用于低频)、中音驱动器(例如,用于中间频率)和/或高频扬声器(例如,用于高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的单独对应音频放大器驱动。除了产生用于由回放设备200回放的模拟信号
外,音频处理组件208还可以被配置为处理要向一个或多个其他回放设备发送以进行回放
的音频内容。
[0070] 可以例如通过音频线路输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由回放设备200处理和/或回放的音频内容。
[0071] 网络接口214可以被配置为促进数据网络上回放设备200与一个或多个其他设备之间的数据流。这样,回放设备200可以被配置为通过数据网络从与回放设备200通信的一
个或多个其他回放设备、局域网内的网络设备或通过诸如互联网之类的广域网从音频内容
源接收音频内容。回放设备200可以向网络上的其他设备发送元数据和/或从网络上的其他
设备接收元数据,该其他设备包括但不限于本文公开和描述的联网麦克风系统的组件。在
一个示例中,由回放设备200发射和接收的音频内容和其他信号(例如,元数据和其他信号)可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字分组数据的形式
发射。在这种情况下,网络接口214可以被配置为解析数字分组数据,使得回放设备200正确地接收和处理去往回放设备200的数据。
[0072] 如图所示,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为回放设备200提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE 
802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备200相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)无线通信。有线接口218为回放设备200提供网络接口功能,以根据通信协议(例如,IEEE 802.3)通过有线连接与其他设备进行通信。虽然图2中所示的网络接口214包括无线
接口216和有线接口218,但是在一些实施例中,网络接口214可以仅包括无线接口或仅包括有线接口。
[0073] 麦克风220可以被布置为检测回放设备200的环境中的声音。例如,麦克风可以安装在回放设备的壳体的外壁上。麦克风可以是现在已知或以后开发的任何类型的麦克风,
例如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对扬声器220的频率范围的一部分敏感。一个或多个扬声器220可以与麦克风220相反地操作。在一些方面,回放设备200可能没有麦克风220。
[0074] 在一个示例中,回放设备200和一个其他回放设备可以配对以播放音频内容的两个单独的音频分量。例如,回放设备200可以被配置为播放左声道音频分量,而另一回放设备可以被配置为播放右声道音频分量,从而产生或增强音频内容的立体声效果。配对的回
放设备(也称为“绑定的回放设备”)还可以与其他回放设备同步地播放音频内容。
[0075] 在另一示例中,回放设备200可以与一个或多个其他回放设备声音合并以形成单个合并回放设备。合并回放设备可以被配置为与未合并回放设备或配对的回放设备不同地
处理和再现声音,这是因为合并回放设备可以具有可以通过其呈现音频内容的附加扬声器
驱动器。例如,如果回放设备200是被设计为呈现低频范围音频内容的回放设备(即,低音
炮),则回放设备200可以与被设计为呈现全频率范围音频内容的回放设备合并。在这种情
况下,当与低频回放设备200合并时,全频率范围回放设备可以被配置为仅呈现音频内容的中频和高频分量,而低频范围回放设备200呈现音频内容的低频分量。合并的回放设备还可以与单个回放设备或另一合并的回放设备配对。
[0076] 通过示意性方式,SONOS公司目前提供(或已经提供)某些回放设备以供销售,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”和“SUB”。任意其他过去、现在、和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。此外,应当理解,回放设备不限于图2中示出的示例或SONOS的产品供应。例如,回放设备可以包括有线或无线机。在另一示例中,回放设备可以包括用于个人移动媒体回
放设备的扩展基座,或与其交互。在又一示例中,回放设备可以是诸如电视、照明器材或用于室内或室外用途的一些其他设备之类的另一设备或组件的组成部分。
[0077] b.示例回放区域配置
[0078] 返回参考图1的媒体回放系统100,该环境可以具有一个或多个回放区域,每个回放区域具有一个或多个回放设备。媒体回放系统100可以建立有一个或多个回放区域,之后可以添加或移除一个或多个区域以达到图1所示的示例配置。每个区域可以根据不同的房
间或空间给出名称,例如书房、浴室、主卧室、卧室、厨房、餐厅、起居室和/或阳台。在一种情况下,单个回放区域可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个回放区域。
[0079] 如图1所示,阳台、餐厅、厨房、浴室、书房和卧室区域均具有一个回放设备,而起居室和主卧室区域均具有多个回放设备。在起居室区域中,回放设备104、106、108和110可以被配置为作为单独的回放设备、作为一个或多个绑定的回放设备、作为一个或多个合并的回放设备、或其任何组合而同步播放音频内容。类似地,在主卧室的情况下,回放设备122和
124可以被配置为作为单独的回放设备、作为绑定的回放设备、或作为合并的回放设备而同步地播放音频内容。
[0080] 在一个示例中,在图1的环境中的一个或多个回放区域可以各自播放不同的音频内容。例如,用户可以在阳台区域中进行烧烤并且收听由回放设备102播放的嘻哈音乐,而另一用户可以在厨房区域中准备食物并且收听由回放设备114播放的古典音乐。在另一示
例中,回放区域可以与另一回放区域同步地播放相同的音频内容。例如,用户可以在书房区域中,在该书房区域中回放设备118正在播放与阳台区域中的回放设备102正在播放的摇滚
音乐相同的摇滚音乐。在这种情况下,回放设备102和118可以同步播放摇滚音乐,使得用户在不同回放区域之间移动时可以无缝地(或至少基本上无缝地)享受被大声播放的音频内
容。可以以类似于如先前引用的美国专利No.8,234,395中所述的回放设备之间的同步方式
来实现回放区域之间的同步。
[0081] 如上所述,可以动态地修改媒体回放系统100的区域配置,并且在一些实施例中,媒体回放系统100支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域或从区域移动,则可以重新配置媒体回放系统100以适应这些改变。例如,如果用户将回放设备102从阳台区域物理地移动到书房区域,则书房区域现在会包括回放设备118和回放设
备102。回放设备102可以经由诸如控制设备126和128之类的控制设备与书房区域配对或分
组在一起和/或被重新命名(如果需要)。另一方面,如果一个或多个回放设备被移动到家庭环境中已经不是回放区域的特定区域,则可以针对该特定区域创建新的回放区域。
[0082] 此外,媒体回放系统100的不同回放区域可以动态地组合成区域组或分成单独的回放区域。例如,餐厅区域和厨房区域114可以组合成用于宴会的区域组,使得回放设备112和114可以同步地呈现(例如,回放)音频内容。另一方面,如果该用户希望在起居室空间中听音乐而另一用户希望看电视,则起居室区域可以被分成包括回放设备104的电视区域和
包括回放设备106、108和110的收听区域。
[0083] c.示例控制设备
[0084] 图3示出了示例控制设备300的功能框图,该示例控制设备300可以被配置为媒体回放系统100的控制设备126和128中的一个或两者。如图所示,控制设备300可以包括一个
或多个处理器302、存储器304、网络接口306、用户界面308、麦克风310和软件组件312。在一个示例中,控制设备300可以是用于媒体回放系统100的专用控制器。在另一示例中,控制设备300可以是可以在其上安装媒体回放系统控制器应用软件的网络设备,例如iPhoneTM、
iPadTM或任何其他智能电话、平板电脑或网络设备(例如,联网计算机,如PC或MacTM)。
[0085] 一个或多个处理器302可以被配置为执行与促进媒体回放系统100的用户访问、控制和配置相关的功能。存储器304可以是数据存储装置,其可以加载有可由一个或多个处理器302执行以实现这些功能的一个或多个软件组件。存储器304还可以被配置为存储媒体回
放系统控制器应用软件以及与媒体回放系统100和用户相关联的其他数据。
[0086] 在一个示例中,网络接口306可以基于行业标准(例如,包括IEEE 802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15的无线标准,4G移动通信标准等)。网络接口306可以为控制设备300提供与媒体回放系统100中的其他设备进行通信的手段。在一个示例中,数据和信息(例如,状态变量)可以经由网络接口
306在控制设备300与其他设备之间传送。例如,媒体回放系统100中的回放区域和区域组配置可以由控制设备300从回放设备或另一网络设备接收,或者由控制设备300经由网络接口
306向另一回放设备或网络设备发送。在一些情况下,其他网络设备可以是另一控制设备。
[0087] 诸如音量控制和音频回放控制之类的回放设备控制命令也可以经由网络接口306从控制设备300向回放设备传送。如上所述,还可以由用户使用控制设备300来执行对媒体
回放系统100的配置的改变。配置改变可以包括向/从区域添加/移除一个或多个回放设备、向/从区域组添加/移除一个或多个区域、形成绑定或合并的播放器、将一个或多个回放设
备从绑定或合并的播放器分开等等。因此,控制设备300有时可以被称为控制器,无论控制设备300是专用控制器还是安装有媒体回放系统控制器应用软件的网络设备。
[0088] 控制设备300可以包括麦克风310。麦克风310可以被布置为检测控制设备300的环境中的声音。麦克风310可以是现在已知或以后开发的任何类型的麦克风,例如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可能对频率范围的一部分敏感。两个或更多个麦克风310可以被布置为捕捉音频源(例如,语音、可听声音)的位置信息和/或帮助过滤
背景噪声。
[0089] 控制设备300的用户界面308可以被配置为通过提供诸如图4中所示的控制器界面400之类的控制器界面来便于用户访问和控制媒体回放系统100。控制器界面400包括回放
控制区410、回放区域区420、回放状态区430、回放队列区440和音频内容源区450。所示的用户界面400仅是可以在诸如图3的控制设备300(和/或图1的控制设备126和128)之类的网络
设备上提供并且由用户访问以控制诸如媒体回放系统100之类的媒体回放系统的用户界面
的一个示例。备选地,可以在一个或多个网络设备上实现不同格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的可比的控制访问。
[0090] 回放控制区410可以包括可选择(例如,通过触摸或通过使用光标)图标以使得所选回放区域或区域组中的回放设备播放或暂停、快进、倒回、跳到下一个、跳到上一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式(cross fade 
mode)。回放控制区410还可以包括可选图标,以修改均衡设置和回放音量等。
[0091] 回放区域区420可以包括媒体回放系统100内的回放区域的表示。在一些实施例中,回放区域的图形表示可以是可选择的,以引出在媒体回放系统中管理或配置回放区域
的附加的可选图标,例如创建绑定区域、创建区域组、区域组分离、和区域组的重命名等。
[0092] 例如,如图所示,可以在回放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以引出在媒体回放系统中选择一个或多个其他区域以与特定区域分组在一起的选项。一旦分组,已经与特定区域分组在一起的区域中的回放设备将被配置为与该特定区域中的回放设备同步地播放音频内容。类似地,可
以在区域组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以引出取消选择区域组中的一个或多个区域以从该区域组中移除的选项。经由诸如用户界面
400之类的用户界面对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区
域或区域组配置被修改时,可以动态地更新回放区域在回放区域区420中的表示。
[0093] 回放状态区430可以包括当前正在所选回放区域或区域组中播放、先前播放或安排接下来播放的音频内容的图形表示。可以在用户界面上(例如,在回放区域区420和/或回放状态区430内)可视地区分所选回放区域或区域组。图形表示可以包括曲目标题、艺术家
姓名、专辑名称、专辑年份、曲目长度以及当经由用户界面400控制媒体回放系统时用户知晓可以是有用的其他相关信息。
[0094] 回放队列区440可以包括与所选回放区域或区域组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区域或区域组可以与回放队列相关联,该回放队列包含与回放区域或区域组回放的零个或多个音频项相对应的信息。例如,回放队列中的
每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其
可以由回放区域或区域组中的回放设备用于从本地音频内容源或联网音频内容源查找和/
或检索音频项,可能供回放设备回放。
[0095] 在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项相对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在又一示例中,当回放区域或区域组正在连续播放流式音频内容(例如,可以继续播放直到被停止的网络收音机)而不是具有回放持续时间的分立音频项时,回放队列可以是空的、或者被填充但是“未使用”。在备选实施例中,回放队列可以包括网络收音机和/或其他流式音频内容项,并且当回放区域或区域组正在播放这些项目时“使用中”。
其他示例也是可能的。
[0096] 当回放区域或区域组被“分组”或“取消分组”时,可以清除或重新关联与受影响的回放区域或区域组相关联的回放队列。例如,如果包括第一回放队列的第一回放区域与包括第二回放队列的第二回放区域被分组在一起,则建立的区域组可以具有最初为空的关联
回放队列,其包含来自第一回放队列的音频项(例如,如果第二回放区域被添加到第一回放区域),其包含来自第二播放队列的音频项(例如,如果第一回放区域被添加到第二回放区
域),或者来自第一和第二回放队列两者的音频项的组合。随后,如果建立的区域组被取消分组,则所得的第一回放区域可以与先前的第一回放队列重新关联,或者与新回放队列相
关联,该新回放队列是空的或者包含在建立的区域组被取消分组之前与建立的区域组相关
联的回放队列中的音频项。类似地,所得的第二回放区域可以与先前的第二回放队列重新
关联,或者与新回放队列相关联,该新回放队列是空的或者包含在建立的区域组被取消分
组之前与建立的区域组相关联的回放队列中的音频项。其他示例也是可能的。
[0097] 返回参考图4的用户界面400,音频内容在回放队列区440中的图形表示可以包括曲目标题、艺术家姓名、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以引出附加的可选图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以从回放队列中移除所表示的音频内容,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以
立即播放或在任何当前播放的音频内容之后进行播放等。与回放区域或区域组相关联的回
放队列可以存储在回放区域或区域组中的一个或多个回放设备上、不存在于回放区域或区
域组中的回放设备上、和/或一些其他指定设备上的存储器中。
[0098] 音频内容源区450可以包括可选音频内容源的图形表示,可以从该图像表示中检索音频内容并由所选择的回放区域或区域组播放。有关音频内容源的讨论可在以下部分中
找到。
[0099] d.示例音频内容来源
[0100] 如前所述,区域或区域组中的一个或多个回放设备可以被配置为从各种可用音频内容源检索回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,音频内容可以由回放设备直接从对应的音频内容源(例如,线路输入连接)检索。在另一示例中,音频内容可以经由一个或多个其他回放设备或网络设备经由网络提供给回放设备。
[0101] 示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制设备、支持网络的个人计算机、或者网络附属存储器(NAS))上的本地音乐库、通过互联网(例如云)提供音频内容的流
媒体音频服务、或者通过回放设备或网络设备上的线路输入连接来连接到媒体回放系统的
音频源,等等。
[0102] 在一些实施例中,可以在诸如图1的媒体回放系统100的媒体回放系统中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描媒体回放系统中的回放设备可访问的网络共享的所有文件夹/目录中的可识别音频项,以及生成或更新包含
元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能
的。
[0103] 以上关于回放设备、控制器设备、回放区域配置和媒体内容源的讨论仅提供了操作环境的一些示例,在该操作环境中可以实现下面描述的功能和方法。本文未明确描述的
媒体回放系统、回放设备和网络设备的其他操作环境和配置也可以应用且适合于功能和方
法的实现。
[0104] e.多个联网设备的示例
[0105] 图5示出了示例多个设备500,其可以被配置为基于语音控制提供音频回放体验。本领域普通技术人员将理解,图5中所示的设备仅用于说明目的,并且包括不同和/或附加
(或较少)设备的变型是可能的。如图所示,多个设备500包括计算设备504、506和508;网络麦克风设备(NMD)512、514和516;回放设备(PBD)532、534、536和538;和控制器设备(CR)
522。
[0106] 多个设备500中的每一个可以是具有网络功能的设备,其可以根据一个或多个网络协议(例如,NFC、蓝牙、以太网和IEEE 802.11等),通过一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个人域网(PAN)等),与多个设备中的一个或多个其他设备建立
通信。
[0107] 如图所示,计算设备504、506和508可以是云网络502的一部分。云网络502可以包括附加的计算设备。在一个示例中,计算设备504、506和508可以是不同的服务器。在另一示例中,计算设备504、506和508中的两个或更多个可以是单个服务器的模。类似地,计算设备504、506和508中的每一个可以包括一个或多个模块或服务器。本文中为了便于说明,计算设备504、506和508中的每一个可以被配置为执行云网络502内的特定功能。例如,计算设备508可以是用于流媒体音乐服务的音频内容源。
[0108] 如图所示,计算设备504可以被配置为通过通信路径542与NMD 512、514和516对接。NMD 512、514和516可以是一个或多个“智能家居”系统的组件。在一种情况下,NMD 512、
514和516可以物理地分布在整个家庭中,类似于图1所示的设备的分布。在另一种情况下,NMD 512、514和516中的两个或更多个可以物理地位于彼此相对靠近的范围内。通信路径
542可以包括一种或多种类型的网络,例如,包括互联网的WAN、LAN和/或PAN,等等。
[0109] 在一个示例中,NMD 512、514和516中的一个或多个可以是被配置为主要用于音频检测的设备。在另一示例中,NMD 512、514和516中的一个或多个可以是具有各种主要实用程序的设备的组件。例如,如上面结合图2和3所讨论的,NMD 512、514和516中的一个或多个可以是回放设备200的麦克风220或网络设备300的麦克风310。此外,在一些情况下,NMD 
512、514和516中的一个或多个可以是回放设备200或网络设备300。在示例中,NMD 512、514和/或516中的一个或多个可以包括布置在麦克风阵列中的多个麦克风。在一些实施例中,
NMD 512、514和/或516中的一个或多个可以是移动计算设备(例如,智能电话、平板电脑或其他计算设备)上的麦克风。
[0110] 如图所示,计算设备506可以被配置为通过通信路径544与CR 522和PBD 532、534、536和538对接。在一个示例中,CR 522可以是网络设备,例如,图2的网络设备200。因此,CR 
522可以被配置为提供图4的控制器界面400。类似地,PBD 532、534、536和538可以是回放设备,例如,图3的回放设备300。这样,PBD 532、534、536和538可以物理地分布在整个家庭中,如图1所示。为了说明目的,PBD 536和538可以是绑定区域530的一部分,而PBD 532和534可以是它们各自区域的一部分。如上所述,PBD 532、534、536和538可以被动态地绑定、分组、解除绑定和解除分组。通信路径544可以包括一种或多种类型的网络,例如,包括互联网的WAN、LAN和/或PAN,等等。
[0111] 在一个示例中,与NMD 512、514和516一样,CR 522和PBD 532、534、536和538也可以是一个或多个“智能家居”系统的组件。在一种情况下,PBD 532、534、536和538与NMD 512、514和516分布在相同的家庭中。此外,如上所述,PBD 532、534、536和538中的一个或多个可以是NMD 512、514和516中的一个或多个。
[0112] NMD 512、514和516可以是局域网的一部分,并且通信路径542可以包括通过WAN(通信路径未示出)将NMD 512、514和516的局域网链接到计算设备504的接入点。同样地,
NMD 512、514和516中的每一个可以通过该接入点彼此通信。
[0113] 类似地,CR 522和PBD 532、534、536和538可以是如前面部分中讨论的局域网和/或本地回放网络的一部分,并且通信路径544可以包括通过WAN将CR 522和PBD 532、534、
536和538的局域网和/或本地回放网络链接到计算设备506的接入点。这样,CR 522和PBD 
532、534、536和538中的每一个也可以通过该接入点彼此进行通信。
[0114] 在一个示例中,通信路径542和544可以包括相同的接入点。在示例中,NMD 512、514和516,CR 522和PBD 532、534、536和538中的每一个可以通过家庭的相同接入点来访问云网络502。
[0115] 如图5所示,NMD 512、514和516,CR 522和PBD 532、534、536和538中的每一个还可以通过通信方式546与一个或多个其他设备直接通信。如本文所述的通信方式546可以涉及根据一个或多个网络协议的、通过一种或多种类型的网络的、在设备之间的一种或多种形
式的通信,和/或可以涉及通过一个或多个其他网络设备的通信。例如,通信方式546可以包括,例如,蓝牙TM(IEEE 802.15)、NFC、无线直连和/或专有无线等中的一个或多个。
[0116] 在一个示例中,CR 522可以通过蓝牙TM与NMD 512通信,并且可以通过另一局域网与PBD 534通信。在另一示例中,NMD 514可以通过另一局域网与CR 522通信,并且可以通过蓝牙与PBD 536通信。在又一示例中,PBD 532、534、536和538中的每一个可以根据生成树协议,通过本地回放网络彼此通信,与此同时,分别通过不同于本地回放网络的局域网与CR 
522通信。其他示例也是可能的。
[0117] 在一些情况下,NMD 512、514和516,CR 522和PBD 532、534、536和538之间的通信方式可以根据设备间的通信类型、网络状况和/或延迟要求而改变。例如,当NMD 516首先被引入具有PBD 532、534、536和538的家庭时,可以使用通信方式546。在一种情况下,NMD 516可以通过NFC将对应于NMD 516的标识信息发送到PBD 538,并且作为响应,PBD 538可以通过NFC(或一些其他形式的通信)将局域网信息发送到NMD 516。然而,在家庭内配置了NMD 
516之后,NMD 516和PBD 538之间的通信方式可能会改变。例如,NMD 516可以随后通过通信路径542、云网络502和通信路径544与PBD 538通信。在另一示例中,NMD和PBD可能不通过本地通信方式546进行通信。在另一示例中,NMD和PBD可以主要通过本地通信方式546进行通
信。其他示例也是可能的。
[0118] 在说明性示例中,NMD 512、514和516可以被配置为接收用于控制PBD 532、534、536和538的语音输入。可用的控制命令可以包括先前讨论的任何媒体回放系统控制,例如,回放音量控制、回放传输控制、音乐源选择和分组,等等。在一种情况下,NMD 512可以接收用于控制PBD 532、534、536和538中的一个或多个的语音输入。响应于接收到语音输入,NMD 
512可以通过通信路径542将语音输入发送到计算设备504以进行处理。在一个示例中,计算设备504可以将语音输入转换为等效的文本命令,并解析文本命令以识别命令。然后,计算设备504可以随后向计算设备506发送文本命令,然后计算设备506转而可以控制PBD 532-
538中的一个或多个来执行命令。在另一示例中,计算设备504可以将语音输入转换为等效
的文本命令,然后将文本命令发送到计算设备506。然后,计算设备506可以解析文本命令以识别一个或多个回放命令,然后计算设备506可以另外控制PBD 532-538中的一个或多个以
执行命令。
[0119] 例如,如果文本命令是“在区域1中播放来自流媒体服务1的艺术家1的曲目1”,则计算设备506可以识别(i)流媒体服务1上可用的艺术家1的曲目1的URL,以及(ii)区域1中的至少一个回放设备。在该示例中,来自流媒体服务1的艺术家1的曲目1的URL可以是指向
计算设备508的URL,并且区域1可以是绑定区域530。这样,当识别出URL、以及PBD 536和538中的一个或两个时,计算设备506可以通过通信路径544向PBD 536和538中的一个或两个发
送所识别的URL,用于回放。作为响应,PBD 536和538中的一个或两个可以根据接收到的URL从计算设备508中检索音频内容,并且开始播放来自流媒体服务1的艺术家1的曲目1。
[0120] 本领域普通技术人员将理解,以上仅是一个说明性示例,并且其他实现也是可能的。在一种情况下,如上所述,多个设备500中的一个或多个执行的操作可以由多个设备500中的一个或多个其他设备来执行。例如,语音输入到文本命令的转换可以备选地、部分地或完全由另外一个或多个设备来执行,例如NMD 512、计算设备506、PBD 536和/或PBD 538。类似地,URL的标识可以替代地、部分地或完全地由另一个或多个设备执行,例如NMD 512、计算设备504、PBD 536和/或PBD 538。
[0121] f.示例网络麦克风设备
[0122] 图6示出了示例网络麦克风设备600的功能框图,该示例网络麦克风设备600可以被配置为图5的NMD 512、514和516中的一个或多个。如图所示,网络麦克风设备600包括一个或多个处理器602、存储器604、麦克风阵列606(例如,一个或多个麦克风)、网络接口608、用户界面610、软件组件612和扬声器614。本领域普通技术人员将理解,其他网络麦克风设备配置和布置也是可能的。例如,备选地,网络麦克风设备可以不包括扬声器614,或者具有单个麦克风而不是麦克风阵列606。
[0123] 一个或多个处理器602可以包括一个或多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,一个或多个处理器602可以包括微处理器微控制器、专用集成电路数字信号处理器等。存储器604可以是数据存储装置,其可以加载有可由一个或多个处理器602执行以实现这些功能的一个或多个软件组件。因此,存储器604可以包
括一个或多个非暂时性计算机可读存储介质,其示例可以包括:易失性存储介质(例如,随机存取存储器、寄存器、高速缓存等)、以及非易失性存储介质(例如,只读存储器硬盘驱动器、固态驱动器、闪存和/或光存储设备等)。
[0124] 麦克风阵列606可以是多个麦克风,其被布置为检测网络麦克风设备600的环境中的声音。麦克风阵列606可以包括现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风等。在一个示例中,麦克风阵列可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风阵列606可以对一部分频
段敏感。在一个示例中,麦克风阵列606的第一子集可以对第一频段敏感,而麦克风阵列的第二子集可以对第二频段敏感。麦克风阵列606还可以被布置为捕获音频源(例如,语音、可听到的声音)的位置信息和/或帮助滤除背景噪声。值得注意的是,在一些实施例中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
[0125] 网络接口608可以被配置为促进各种网络设备(例如,参考图5,其中的CR 522、PBD 532-538、云网络502中的计算设备504-508,以及其他网络麦克风设备等)之间的无线和/或有线通信。这样,网络接口608可以采用任何合适的形式来执行这些功能,其示例可以包括:
以太网接口、串行总线接口(例如,FireWire、USB 2.0等)、适于促进无线通信的芯片组和天线、和/或提供有线和/或无线通信的任何其他接口。在一个示例中,网络接口608可以基于行业标准(例如,包括IEEE 802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、
802.11g、802.11n、802.11ac、802.15的无线标准,4G移动通信标准等)。
[0126] 网络麦克风设备600的用户界面610可以被配置为促进用户与网络麦克风设备的交互。在一个示例中,用户界面608可以包括物理按钮、设置在触敏屏幕和/或表面上的图形界面等中的一个或多个,用于用户直接向网络麦克风设备600提供输入。用户界面610还可
以包括灯和扬声器614中的一个或多个,以便向用户提供视觉和/或听觉反馈。在一个示例
中,网络麦克风设备600还可以被配置为通过扬声器614回放音频内容。
[0127] III.用于内容混合的示例系统、装置和方法
[0128] 在一种布置中,实施例尤其可以涉及当NMD或回放系统输出与音频内容不同的内容时调整回放系统回放的音频内容的音量。在许多情况下,NMD可以放置在PBD 532-538附
近。例如,回放设备可能与NMD放置在同一房间中,使得当回放设备正在回放音频内容时难以听到内容输出。
[0129] 图7-图8示出了可以在所公开的操作环境中实现的实施例。图7是所执行的使得当回放设备也正在回放音频内容时能够听到NMD输出的内容的功能的流程图。在一些示例中,所描述的这些功能中的一个或多个可以由回放设备执行。在其他示例中,诸如504-508之类的计算设备还可以结合回放设备或代替回放设备来执行这些功能中的一个或多个。计算设
备可以与回放设备相关联,并执行与回放设备相关联的处理。
[0130] 在702处,可以接收消息。该消息可以与NMD相关联。可以经由通信网络546从NMD接收消息。备选地,可以经由通信链路544、546从与NMD相关联的计算设备(例如,504-508)接收消息。其他示例也是可能的。
[0131] 该消息可以指示由NMD输出的内容,由NMD确定的要输出的内容,和/或由与NMD相关联的计算设备确定的要输出的内容(本文统称为NMD内容)。NMD内容可以采用各种形式,
其示例可以包括语音输出、话音、音乐、音调或警报。该消息可以指定NMD可以在回放设备和NMD共同的时钟参考所定义的特定时间输出内容。该消息还可以指定NMD输出的内容的持续
时间。其他示例也可以用于指示NMD何时可以输出内容。
[0132] 可以向回放系统中的一个或多个回放设备发送该消息。在一些情况下,可以向媒体回放系统中的所有回放设备发送该消息。在另一示例中,可以向回放设备的子集发送该
消息。回放设备的子集可以基于NMD是否与回放设备处于相同的一个或多个区域。
[0133] 另外或备选地,回放设备的子集可以基于NMD是否与回放设备绑定。该绑定可以指示回放设备和NMD彼此非常靠近,例如在同一房间或区域中或者同步地播放音频内容。在这方面,这些回放设备可以直接影响是否可以通过例如由回放设备播放的音乐收听NMD内容。
[0134] 在一些示例中,绑定的回放设备和NMD可以使用各种联网技术来减少它们之间的时延。例如,可以使用本地而非WAN网络连接(LAN或蓝牙)进行通信。作为另一示例,当回放设备被绑定至NMD时,通信可以恢复到本地网络中的不同频率范围,例如从“典型的”2.4Ghz通信切换到5Ghz通信。作为又一示例,通信可以切换到2.4或5Ghz频谱上的保留声道,或者当回放设备和NMD被绑定时,可以减少其他网络流量,例如回放设备可以停止作为其他网络流量的中继节点。其他示例也是可能的。
[0135] 在704处,回放设备可以在消息中指定的时间调整(例如,减小)其音量使其低于NMD在输出内容时将使用的音量等级。可以在回放设备接收的消息中指定音量,或者音量可以已经由回放设备预定义。可以减小音量达NMD内容的持续时间所定义的时间段。降低音量的目的可以是使得收听者能够在音频内容继续在回放设备上播放的同时较好地收听NMD输
出的内容。与NMD内容相比降低音频内容的音量的过程被称为回避。
[0136] 作为示例,考虑在厨房和卧室中具有回放设备的媒体回放系统,并且NMD位于厨房中。厨房回放设备可以与NMD绑定。厨房回放设备和卧室回放设备可以回放音频。该绑定可能会导致当NMD输出内容时厨房回放设备被回避而不是卧室回放设备。
[0137] 作为另一示例,所有回放设备可以位于不同区域中。但是回放设备在其中操作的环境可以是诸如具有起居室区域和餐厅区域的起居室和餐厅组合空间之类的开放区域。在
这种情况下,NMD可以知道该区域的性质(可能在配置NMD时)。在这种情况下,所有回放设备都可能被回避,这是因为否则仍然难以在开放区域中收听NMD输出的内容。
[0138] 在706处,回放设备然后可以恢复正在回放的音频内容的音量。例如,在NMD输出内容之后,可以恢复音量。NMD发送的消息可以指示NMD内容的持续时间。在这方面,回放设备能够确定已经输出了NMD内容,然后恢复正在回放的音频内容的音量。备选地,当回放设备要恢复音频内容的音量时,NMD可以向回放设备发送消息,而不是由回放设备做出该确定。在一些实施例中,回放设备可以存储在704处的调整之前回放的内容的音量,以便可以恢复该音量。
[0139] 作为NMD输出音频内容的替代或补充,媒体回放系统可以输出NMD内容。在这种情况下,NMD可以不输出NMD内容或者可以与回放设备一起输出NMD内容。图8是可以在播放音
频内容以及输出NMD内容时执行的功能的流程图。在一些示例中,所描述的功能中的一个或多个可以由回放设备执行。在其他示例中,诸如504-508之类的计算设备还可以结合回放设备或代替回放设备来执行这些功能中的一个或多个。与回放设备相关联的计算设备可以执
行与回放设备相关联的处理。
[0140] 在802处,可以接收消息。该消息可以与NMD相关联,并且来自NMD或来自与NMD相关联的计算设备。可以经由通信网络546从NMD接收消息。备选地,可以经由通信链路544从与NMD相关联的计算设备(例如,504-508)接收消息。其他示例也是可能的。
[0141] 该消息可以包括对NMD内容的指示。该指示可以是定义内容输出的音频文件。例如,音频文件可以包括代表NMD内容的数字样本。可以向媒体回放系统中绑定至NMD的回放
设备和/或所有回放设备发送该消息。
[0142] 可以以各种方式处理回放设备上输出的NMD内容。作为一个示例,在804处,回放设备可以被布置为将NMD内容与回放设备正在播放的音频内容(例如,歌曲)混合。回放设备可以以固定的采样率回放音频内容。回放设备可以通过降低音频内容的采样率和NMD内容的采样率来将音频内容与NMD内容混合,使得回放设备仍然能够以相同的固定采样率回放混
合的音频内容和NMD输出。在该混合过程期间,可以调整音频内容和/或NMD内容的音量以便于收听回放设备上的NMD内容。
[0143] 作为另一示例,在806处,可以静音在回放设备上回放的音频内容,并且可以在回放设备上输出NMD内容。如果还有其他回放设备502也在同步播放相同的音频内容,则这些
回放设备502可以继续回放该音频内容。当回放设备完成输出NMD内容时,回放设备可以继
续与其他回放设备同步地回放音频内容。例如,扬声器的左声道可以静音并输出NMD内容,右声道可以继续播放音频内容。然后,回放设备可以通过使用音频内容中的呈现时间戳来
继续回放音频内容。呈现时间戳可以指示音频内容的回放定时。基于回放设备输出NMD内容的时间和NMD内容输出的持续时间,回放设备能够使用呈现时间戳确定在输出NMD内容之后
开始播放音频内容。在此过程期间,可以调整音频内容和/或NMD内容输出的音量以便于收
听媒体回放系统上的NMD内容输出。
[0144] 作为又一示例,在808处,可以暂停在回放设备上回放的音频内容,并且可以在回放设备上输出NMD内容。当回放设备从暂停状态恢复时,可以在回放设备中断回放的点处回放音频内容。在这种情况下,可以暂停当回放设备输出NMD内容时也同步播放音频内容的任何其他回放设备502。同样,在此过程期间,可以调整音频内容和/或NMD内容输出的音量以便于收听媒体回放系统上的NMD内容输出。
[0145] 如上所述,回放设备输出的NMD内容可以是基线音量。这可以是先前针对回放设备设置或由NMD在消息中指示的适当音量。在一些实施例中,可以自适应地调整由回放设备输出的NMD内容和/或音频内容的音量。
[0146] 例如,可以关于基线音量相对于回放设备在回避之前和之后回放的音频内容的音量来调整NMD内容输出的音量。当大幅回避音频内容的音量时,NMD内容输出的音量可以从
基线音量大幅下降。另一方面,如果由回放设备回放的音频内容的音量稍微改变,则NMD内容输出的音量可以从基线音量稍微改变。类似地,可以相对于NMD内容的音量来调整音频内容的音量。
[0147] 如果NMD正在输出内容,则回放设备可以向NMD发送所确定的NMD内容音量的指示,使得NMD可以以该音量输出NMD内容。备选地,回放设备可以在输出NMD内容期间发送(在回
避之前或之后)由回放设备播放的音频内容的音量的指示,使得NMD可以确定NMD内容输出
的音量。其他示例也是可能的。
[0148] 因此,如果由回放设备回放的音频内容已经很大声,则NMD内容输出可以不是很大声。类似地,如果正在回放的音频内容已经是柔和的,则NMD内容输出可以不是柔和的。更进一步,在一些实施例中,回放设备或NMD可以根本不调整音频内容的音量或NMD内容的音量。
音量可能是可接受的,因此不需要调整。
[0149] IV.涉及联网回放系统和联网麦克风系统的元数据交换的示例系统、装置和方法
[0150] 在另一种布置中,为了促进媒体回放系统的语音控制,在一些情况下可能希望媒体回放系统共享、交换或以其他方式向联网麦克风系统提供元数据(反之亦然)。在一些实
施例中,媒体回放系统包括PBD 532、534、536和538以及计算设备506(其被配置为媒体回放系统服务器)中的一个或多个,并且联网麦克风系统包括NMD 512、514和516以及计算设备
504(其被配置为联网麦克风系统服务器)中的一个或多个。
[0151] 从媒体回放系统共享到联网麦克风系统的元数据的示例包括以下中的任何一个或多个:(i)媒体回放系统的一个或多个配置参数,(ii)关于当前经由媒体回放系统播放的音频内容的信息,(iii)关于由媒体回放系统播放的音频内容的历史信息,(iv)与音频内容有关的用户偏好信息,(v)与媒体回放系统配置有关的用户偏好信息,以及(vi)其他元数
据,包括但不限于本文公开或描述的任何元数据。从联网麦克风系统共享到媒体回放系统
的元数据的示例可以包括以下中的任何一个或多个:(i)联网麦克风系统的一个或多个配
置参数,(ii)哪些用户已经使用联网麦克风系统,并且可能在何时使用,(iii)由联网麦克风系统接收的命令类型和/或信息请求,(iv)来自其他信息源的信息,例如本地天气、体育比分、新闻、本地音乐会信息、用户是否通过联网麦克风系统购买了先前通过媒体回放系统播放的专辑,和/或(v)其他元数据,包括但不限于本文公开或描述的任何元数据。在联网麦克风系统和媒体回放系统之间共享的元数据可以涉及与媒体回放系统和联网麦克风系统
中的一个或多个有关的任何特征、配置或其他类型的信息,因此可以存在这种元数据的其
他示例。
[0152] 媒体回放系统的配置参数的示例包括各个PBD 532-538所在的区域(例如,厨房、阳台、起居室、卧室等,如图1所示)或给予各个PBD的名称。配置参数还可以包括关于哪些PBD已经被分组在同步组中、被分组到合并的回放设备中、和/或被分组到绑定的回放设备
组中的信息。配置参数还可以包括关于特定PBD被配置用于播放的一个或多个音频声道的
信息(例如,“左声道”或“左后声道”等)。配置参数还可以包括针对各个PBD或PBD组的均衡设置。在一些实施例中,各个PBD或PBD组的均衡设置可以包括针对各个PBD或PBD组的Sonos TrueplayTM设置。配置参数还可以包括各个PBD的定向状态信息,例如特定PBD是正面朝上、倒置还是侧放的。配置参数还可以包括联网信息,例如,特定PBD是操作为回放设备组中的组协调者(例如,“主”)还是操作为回放设备组中的组成员(例如,“从”)。配置参数还可以包括各种其他物理状态信息,例如,PBD的电池电量、PBD是否物理附接到电源插座、PBD是否附接到基座、和/或PBD当前是否在运动中(即被移动)。
[0153] 配置参数还可以包括可以在其中配置各个PBD的可用(例如,先前存储的)区域场景。单个区域场景可以包括配置有特定配置参数集的特定PBD分组。例如,“晚间爵士”区域场景可以(i)将厨房、餐厅、起居室和阳台(参见图1)中的PBD分组成同步组,以便所有PBD 
102-114被配置为同步播放相同的媒体内容,(ii)针对各个PBD 102-114配置音量和/或均
衡设置,以考虑所有PBD 102-114一起播放的事实,(iii)将各个PBD 102-114的均衡器设置配置为“爵士”设置,和/或(iv)从一个或多个播放列表和/或音乐订阅服务将爵士乐曲目加载到同步PBD 102-114组的回放队列中。在标题为“Controlling and manipulating 
groupings in a multi-zone media system”的美国专利No.8,483,853和标题为
“Multiple Groupings in a Playback System”的未决申请14/737,199中描述了区域场
景。专利8,483,853和申请14/737,199的全部内容通过引用并入本文以用于所有目的。
[0154] 关于当前经由媒体回放系统播放的音频内容的信息的示例包括(i)曲目,(ii)标题,(iii)艺术家,(iv)表演者,(v)作者,(vi)专辑,(vii)类型,(viii)年份,(ix)向媒体回放系统提供曲目的音频信息源/媒体服务,(x)曲目已被播放的次数,(xi)曲目是否是用户
“最喜欢的”,(xii)曲目所在的播放列表(如果有的话),(xiii)发起曲目回放的用户,(xiv)曲目的当前回放进程(例如,回放时间戳),(xv)收听者是否“喜欢”该曲目以及收听者“喜欢”该曲目的次数(以及可能何时“喜欢”该曲目),和/或(xvi)关于当前播放曲目的任何其他信息。关于由媒体回放系统播放的音频内容的历史信息的示例包括以下中的任何一项或
全部:关于音频内容的上述元数据、以及当媒体回放系统播放单独音频内容时的日期和时
间、以及可能的播放该内容的特定的一个或多个PBD。关于当前或先前播放的音频的信息还可以包括:关于回放的其他上下文信息,诸如“在Larry的聚会期间播放”、“在圣诞节播放”或“在外面下雨时播放”等。
[0155] 与音频内容有关的用户偏好信息的示例包括(i)从(例如,Spotify、Pandora、本地曲目库等)获得音乐的优选音频信息源或音乐服务,(ii)优选的歌曲版本(例如,现场版本与演播室版本、特定艺术家或团体的歌曲版本),(iii)优选的音乐风格或类型,以及(iv)与音频内容相关的其他用户偏好。
[0156] 与媒体回放系统配置有关的用户偏好信息的示例包括(i)优选回放音量,(ii)优选均衡设置,(iii)优选同步组布置,(iv)优选区域场景,和/或(v)其他媒体回放系统设置。
[0157] 在一些实施例中,在媒体回放系统和联网麦克风系统之间共享任何上述元数据(以及可能的其他元数据)包括:首先在媒体回放系统和联网麦克风系统之间建立元数据交
换通道。在操作中,元数据交换通道可以是媒体回放系统的一个或多个组件与如本文所述
的联网麦克风系统的一个或多个组件之间的任何类型的通信声道。
[0158] 在一些实施例中,元数据交换通道是在媒体回放系统的一个或多个组件与联网麦克风系统的一个或多个组件之间发生的通信会话,并且建立元数据交换通道包括建立通信
会话。通信会话可以或可以不特别配置用于元数据的交换或以其他方式适于元数据的交
换。实际上,媒体回放系统和联网麦克风系统可以使用现在已知或以后开发的任何类型的
通信机制来在两个系统之间交换元数据,包括但不限于通信路径、链路、信道和/或会话(例如,一个或多个路径、链接和/或信道可以支持会话)。
[0159] 在一些实施例中,元数据交换通道可以是以下中的任何一个(i)从媒体回放系统到联网麦克风系统的单向连接,(ii)从联网麦克风系统到媒体回放系统的单向连接,(iii)媒体回放系统和联网麦克风系统之间(即,来回的)双向连接和/或(iv)媒体回放系统的多
个组件与联网麦克风系统的多个组件之间的多向连接。
[0160] 在一些实施例中,PBD 532-538、CR 522和计算设备506中的任何一个或多个可以经由一个或多个单独的或可能共享的元数据多播发送元数据,其中,任何其他PBD 532-
538、CR 522、计算设备506、NMD 512-516和计算设备504可以订阅一个或多个元数据多播通道以接收从媒体回放系统的组件发送的元数据。类似地,NMD 512-513和计算设备504中的
任何一个或多个可以经由一个或多个单独或共享的元数据多播通道发送元数据,其中,任
何其他NMD 512-516、计算设备504、PBD 532-538、CR 522、计算设备506可以订阅一个或多个元数据多播通道以接收从联网麦克风系统的组件发送的元数据。在一些实施例中,元数
据多播通道的集合可以形成元数据网格网络,通过该元数据网格网络,联网麦克风系统的
组件和媒体回放系统的组件彼此共享元数据。
[0161] 在一些实施例中,建立元数据交换通道包括:配置媒体回放系统的一个或多个组件(即,被配置为媒体回放系统服务器的PBD 532、534、536、538、CR 522和/或计算设备506中的任何一个或多个)经由通信路径、链路、通道和/或会话与联网麦克风系统的一个或多
个组件(即,被配置为联网麦克风系统服务器的NMD 512、514、516和/或计算设备504中的任何一个或多个)通信。建立元数据交换通道可以附加地或替代地包括配置联网麦克风系统
的一个或多个组件(即,NMD 512、514、516和/或计算设备504中的任何一个)以经由通信路径、链路、通道和/或会话与媒体回放系统的一个或多个组件(即,PBD 532、534、536、538、CR 
522和/或计算设备506中的任何一个)通信。
[0162] 如前所述,在一些实施例中,元数据交换通道是单独的并且也可能是专用的元数据交换通道。然而,在其他实施例中,元数据交换通道可以包括媒体回放系统和联网麦克风系统之间的一个或多个通信路径、连接、链路或类似通信连接,其可以用于以单向、双向和/或多方向的方式在媒体回放系统的组件和联网麦克风系统的组件之间交换元数据或任何
其他信息、内容、或者其他数据。
[0163] 例如,参考图5,在媒体回放系统和联网麦克风系统之间建立元数据交换通道可以包括在媒体回放系统的一个或多个组件(即,PBD 532-538和/或计算设备506中的任何一
个)之间建立通信会话,以经由以下中的一个或多个与联网麦克风系统的一个或多个组件
(即,NMD 512-513和/或计算设备504中的任何一个)进行通信:(i)本地网络546,(ii)通信路径544,(iii)通信路径542,(iv)云网络502,和/或(v)现在已知或以后开发的任何其他类型的通信路径、链路或其他连接。
[0164] 在操作中,在建立元数据交换通道之后,媒体回放系统响应于经历元数据交换触发事件而经由元数据交换通道向联网麦克风系统提供与媒体回放系统相关联的元数据。
[0165] 在一些实施例中,元数据交换触发事件包括媒体回放系统的一个或多个PBD回放新的媒体内容项。例如,在这样的实施例中,每当媒体回放系统的PBD 532-538中的任何一个开始播放新的媒体曲目时,媒体回放系统(即,PBD 532-538或计算设备506中的任何一
个)向联网麦克风系统(即,NMD 512-516或计算设备504中的任何一个)发送任何上述元数
据。以这种方式,新媒体曲目的回放是使得媒体回放系统向联网麦克风系统发送元数据的
元数据交换触发事件。在这样的实施例中,媒体回放系统在播放每个新曲目时向联网麦克
风系统发送元数据,而不管联网麦克风系统是否具体地请求了任何元数据。在联网麦克风
系统(或者其组件,例如计算设备504)被配置为存储关于媒体回放系统的历史元数据和/或
其他元数据和/或媒体回放系统播放的媒体的情况下,该实现可以是有利的。
[0166] 在一些实施例中,媒体回放系统可以响应于播放经由联网麦克风系统接收的媒体曲目的语音命令而启动对媒体曲目的回放。附加地或备选地,媒体回放系统可以响应于播
放经由被配置为控制媒体回放系统的计算设备(例如,CR 522)接收的媒体曲目的命令而启
动对媒体曲目的回放。在任一情况下,启动对媒体曲目的回放可以使媒体回放系统(即,播放媒体曲目的PBD 532-538、被配置为控制媒体回放系统的计算设备(例如,CR 522)和/或
计算设备506中的任何一个或多个,单独地或组合地)向联网麦克风系统(即,NMD 512-516
或计算设备504中的任何一个或多个,单独地或组合地)发送元数据。
[0167] 在一些实施例中,元数据交换触发事件附加地或备选地包括媒体回放系统响应于联网麦克风系统从用户接收到上下文特定命令(或可能是其他类型的命令)而接收对元数
据的请求。上下文特定命令的示例是“将这首歌曲保存到我的收藏夹播放列表”。该命令是上下文特定的,这是因为联网麦克风系统需要知道“这首歌曲”是什么,以便联网麦克风系统可以指示媒体回放系统将“这首歌曲”添加到用户的收藏夹播放列表。
[0168] 为了确定“这首歌曲”是什么,联网麦克风系统请求关于媒体回放系统当前正在播放的曲目的元数据。如果媒体回放系统具有多个PBD,其中位于不同区域中的不同PBD正在播放不同的音频曲目(参见图1),则可能需要用于确定“这首歌曲”是什么的功能。例如,如果接收到上下文特定命令的联网麦克风系统的NMD与厨房区域配对(或以其他方式连接到
厨房区域或与厨房区域相关联),则联网麦克风系统可以检索当前在厨房区域中由一个或
多个PBD播放的音频曲目的元数据。因此,在该示例中,处理上下文特定命令要求联网麦克风系统获得关于媒体回放系统的配置的元数据(即,哪些PBD在厨房区域中)、关于厨房中的一个或多个PBD正在播放的音频内容的元数据、以及还可能是关于用户的播放列表的元数
据(即,用户偏好元数据)。
[0169] 上下文特定命令的另一示例是“播放上周五晚上在起居室中播放的歌曲”。该命令是上下文特定的,这是因为联网麦克风系统需要知道上周五晚上媒体回放系统在起居室区域中播放的歌曲,以便联网麦克风系统可以指示媒体回放系统现在再次播放这些歌曲。
[0170] 为了确定“上周五晚上在起居室中播放的歌曲”,联网麦克风系统请求与起居室区域中的一个或多个PBD在上个星期五播放的音频曲目的历史有关的元数据。如果媒体回放系统具有多个PBD,其中位于不同区域的不同PBD可以播放不同的音频曲目(参见图1),那么确定哪个或哪些PBD应播放“上周五晚上在起居室播放的歌曲”可能会带来额外的挑战。但是,如果接收到上下文特定回放命令的联网麦克风系统的NMD与书房区域配对(或者以其他
方式连接到书房区域或与书房区域相关联),则联网麦克风系统可以检索关于起居室区域
中的一个或多个PBD在上个星期五播放的音频曲目的元数据,然后指示书房中的一个或多
个PBD现在播放这些音频曲目。因此,在该示例中,处理上下文特定命令需要联网麦克风系统获得关于媒体回放系统的历史配置的元数据(即,哪些PBD在起居室区域中,或者至少上
周五在起居室区域中)、关于起居室中的一个或多个PBD上周五播放的音频内容的元数据、
以及还可能是关于哪个或哪些PBD当前在书房区域中的元数据。
[0171] 上下文特定命令的另一示例是“将这首歌曲添加到我的卧室的队列中”。该命令是上下文特定的,这是因为联网麦克风系统需要知道“这首歌曲”是什么以及哪个卧室是“我的卧室”,以便媒体回放系统可以将正确的歌曲添加到媒体回放系统中正确的PBD上的回放队列中。
[0172] 为了确定“这首歌曲”是什么,联网麦克风系统请求关于媒体回放系统当前正在播放的曲目的元数据。如果媒体回放系统具有多个PBD,其中位于不同区域中的不同PBD正在播放不同的音频曲目(参见图1),则可能需要用于确定“这首歌曲”是什么的功能。例如,如果接收到上下文特定命令的联网麦克风系统的NMD与书房区域配对(或以其他方式连接到
书房区域或与书房区域相关联),则联网麦克风系统可以检索当前在书房区域中由一个或
多个PBD播放的音频曲目的元数据。
[0173] 为了确定哪个卧室是“我的卧室”,联网麦克风系统可以对语音命令执行语音识别以确定谁说出该语音命令、访问由媒体回放系统存储的关于用户的元数据(例如,从用户简档)以确定哪个卧室区域对应于该特定用户、访问关于媒体回放设备的配置的元数据以确定哪个或哪些PBD在与用户相对应的卧室区域中、访问关于卧室区域中的一个或多个PBD的
配置的元数据以确定哪个PBD是存储卧室区域中的一个或多个PBD的回放队列的用于卧室
区域的主区域播放器、以及最后与用于对应于用户的卧室区域中的该PBD的回放队列有关
的元数据。
[0174] 因此,在该示例中,处理上下文特定命令需要联网麦克风系统获得关于媒体回放系统的注册用户的元数据、关于媒体回放系统的配置的元数据(即,哪些PBD在书房和卧室
区域中)、关于书房中的一个或多个PBD当前正在播放的音频内容的元数据、关于卧室区域
中的一个或多个PBD的回放队列的元数据、和/或可能地其他元数据,以便将书房中播放的
歌曲添加到用户卧室的回放队列。
[0175] 上下文特定命令(或信息请求)的又一示例是“这个乐队下一次何时在城里演奏?”该命令是上下文特定的,这是因为联网麦克风系统需要知道“这个乐队”和这个“城镇”是什么,以便联网麦克风系统可以为用户提供答案,或者可能地指示媒体回放设备向用户提供答案。
[0176] 为了确定“这个乐队”是什么,联网麦克风系统请求关于媒体回放系统当前正在播放的曲目的元数据。如果媒体回放系统具有多个PBD,其中位于不同区域中的不同PBD正在播放不同的音频曲目(参见图1),则可能需要用于确定“这个乐队”是什么的功能。例如,如果接收到上下文特定命令的联网麦克风系统的NMD与书房区域配对(或以其他方式连接到
书房区域或与书房区域相关联),则联网麦克风系统可以检索当前在书房区域中由一个或
多个PBD播放的音频曲目的元数据。
[0177] 为了确定这个“城镇”是什么,联网麦克风系统可以请求关于媒体回放系统的位置的元数据,或者联网麦克风系统可以使用其自己的配置信息。无论哪种方式,一旦联网麦克风系统知道“这个乐队”和“城镇”,则联网麦克风系统就可以查询一个或多个第三方信息源以获得“这个乐队”的巡演日程并向用户提供下一日期,或者可能地指示媒体回放系统通知用户。
[0178] 例如,在一些实施例中,联网麦克风系统可以指示媒体回放系统(或媒体回放系统的至少一个特定PBD)提供对“这个乐队下一次何时在城里演奏?”的问题的可听响应。在操作中,媒体回放系统的一个或多个PBD可以提供以下可听答案:“滚石乐队11月15日在芝加哥演奏”。在一些实施例中,在联网麦克风系统的控制下,媒体回放设备可另外询问用户“您想要购买票吗?”,并且如果用户回答“是”,则联网麦克风系统可以通过电子邮件向用户发送购买门票的链接。随后与用户的交互还可能需要联网麦克风系统访问关于媒体回放系
统的注册用户的元数据,以获得用于发送购买音乐会门票的链接的电子邮件地址。
[0179] 上下文特定信息请求的另一示例是“这是什么乐队?”该信息请求是上下文特定的,这是因为联网麦克风系统需要知道当前正在播放的歌曲,使得联网麦克风系统可以(i)向用户通知当前播放的曲目的艺术家或者(ii)指示媒体回放系统向用户通知当前播放的
曲目的艺术家。和前面的示例一样,如果媒体回放系统具有多个PBD,其中位于不同区域的不同PBD可以播放不同的音频曲目(参见图1),那么确定哪个或哪些PBD正在播放感兴趣的
歌曲可能会带来额外的挑战。但是,如果接收到上下文特定信息请求的NMD与起居室区域配对(或以其他方式连接到起居室区域或与起居室区域相关联),则联网麦克风系统可以检索
关于起居室区域中的一个或多个PBD正在播放的音频曲目的元数据。因此,在该示例中,为了处理和响应上下文特定信息请求,联网麦克风系统必须获得关于媒体回放系统的配置的
元数据(即,哪些PBD在起居室区域中)和关于起居室中的一个或多个PBD正在播放的音频内
容的元数据。
[0180] 在一些实施例中,元数据交换触发事件包括经过定义的时间段。例如,在一些实施例中,媒体回放系统可以被配置为每1秒、10秒、1分钟、15分钟、每30分钟、每小时或某个其他时间向联网麦克风系统发送本文所述的任何(或可能所有)类型的元数据。
[0181] 在一些实施例中,媒体回放系统可以被配置为每当媒体回放系统有任何改变时向联网麦克风系统发送元数据。例如,媒体回放系统可以被配置为每当(i)媒体回放系统发生配置改变,例如创建或移除同步组、建立区域场景、将媒体回放设备添加到媒体回放系统或移除媒体回放设备、提高或降低音量、改变均衡设置或任何其他配置改变,(ii)开始或停止回放媒体曲目、前进到下一曲目、跳过曲目、重复播放曲目或其他回放命令,(iii)接收到用户“喜欢”或“不喜欢”(例如,竖起拇指或拇指向下的指示)当前正在播放的曲目、专辑或播放列表的指示,(iv)向播放列表添加曲目或专辑或者从播放列表中移除曲目或专辑,和/或(v)将曲目、专辑或播放列表添加到回放队列或从回放队列移除曲目、专辑或播放列表时,向联网麦克风系统发送元数据。在一些实施例中,媒体回放系统可以以连续、基本连续或半连续的方式向联网麦克风系统发送元数据,这是因为媒体回放系统中的不同PBD在播放曲
目和执行其他媒体管理功能的同时被配置和重新配置。
[0182] 在一些实施例中,媒体回放系统经由元数据交换通道向联网麦克风系统提供与媒体回放系统相关联的元数据(和/或由媒体回放系统播放的媒体)包括:媒体回放系统(或者
可能地媒体回放系统的一个或多个组件)向联网麦克风系统(或者可能地联网麦克风系统
的一个或多个组件)发送元数据。例如,媒体回放系统向联网麦克风系统发送元数据可以包括以下中的任何一个或多个:(i)PBD之一(即,任何PBD 532-538)经由本地网络546向任何
NMD(即,任何NMD 512-516)发送元数据;(ii)计算设备506向计算设备504发送元数据;
(iii)CR 522经由网络546向任何NMD 512-516发送元数据;(iv)CR 522向计算设备504发送
元数据;(v)PBD 532-538中的一个经由通信链路544向计算设备506发送元数据,并且计算
设备506又向计算设备504发送元数据;(vi)PBD 532-538之一经由网络546向NMD 512-516
之一发送元数据,并且NMD 512-516之一经由通信链路546向计算设备504发送元数据。其中媒体回放系统的任何一个或多个组件(PBD 532-538和计算设备506)经由图5中所示的任何
通信路径(544、542、546)(或任何其他通信路径)向联网麦克风系统的任何一个或多个组件(NMD 512-516和计算设备504)发送、共享、传送、传输或以其他方式提供元数据的每个其他场景都是可能的并且在本文中被设想到。
[0183] 在一些实施例中,媒体回放系统经由元数据交换通道向联网麦克风系统提供与媒体回放系统相关联的元数据(和/或由媒体回放系统播放的媒体)包括:媒体回放系统(或者
可能地媒体回放系统的一个或多个组件)授权联网麦克风系统(或者可能地联网麦克风系
统的一个或多个组件)经由元数据交换通道访问元数据。例如,媒体回放系统授权联网麦克风系统访问元数据可以包括以下中的一个或多个:(i)PBD之一(即,任何PBD 532-538)授权任何NMD(即,任何NMD 512-516)经由本地网络546访问元数据;(ii)计算设备506授权计算
设备504访问元数据;(iii)CR 522授权任何NMD 512-516经由网络546访间元数据;(iv)CR 
522授权计算设备504访问元数据;(v)PBD 532-538中的一个授权计算设备506经由通信链
路544访问元数据,并且计算设备506又授权计算设备504访问元数据;(vi)PBD 532-538之
一授权NMD 512-516之一经由网络546访问元数据,并且NMD 512-516之一经由通信链路546
向计算设备504发送元数据。其中媒体回放系统的任何一个或多个组件(PBD 532-538和计
算设备506)授权联网麦克风系统的任何一个或多个组件(NMD 512-516和计算设备504)经
由任何图5中示出的通信路径(544、542、546)(或任何其他通信)访问元数据的每个其他场
景都是可能的并且在本文中被设想到。
[0184] 图9中所示的方法900给出了可以在包括或包含例如图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备300、图4的用户界面、图5中所示的配置、和/或图6中所示的NMD的操作环境内实现的方法的实施例。
[0185] 方法900开始于框902,其包括在媒体回放系统和联网麦克风系统之间建立元数据交换通道,其中,联网麦克风系统包括NMD和联网麦克风服务器。
[0186] 元数据交换通道可以是媒体回放系统的一个或多个组件与如本文所述的联网麦克风系统的一个或多个组件之间的任何类型的通信声道。在一些实施例中,元数据交换通
道是媒体回放系统的一个或多个组件与联网麦克风系统的一个或多个组件之间的通信会
话。在一些实施例中,通信会话可以被特别配置用于元数据的交换。然而,在其他实施例中,媒体回放系统和联网麦克风系统可以使用现在已知或以后开发的任何类型的通信机制来
在两个系统之间交换元数据。
[0187] 在一些实施例中,媒体回放系统包括至少一个媒体回放设备,并且在媒体回放系统和联网麦克风系统之间建立元数据交换通道包括:在至少一个媒体回放设备与(i)NMD和
(ii)联网麦克风服务器中的至少一个之间建立元数据交换通道。
[0188] 在备选实施例中,媒体回放系统还包括连接到至少一个媒体回放设备的媒体回放服务器,并且在媒体回放系统和联网麦克风系统之间建立元数据交换通道包括:在媒体回
放服务器与(i)NMD和(ii)联网麦克风服务器中的至少一个之间建立元数据交换通道。
[0189] 接下来,方法900前进到框904,其包括在建立元数据交换通道之后,媒体回放系统经历元数据交换触发事件。在操作中,元数据交换触发事件可以包括以下中的任何一项(i)媒体回放系统回放新的媒体内容项,(ii)媒体回放系统通过联网麦克风系统接收上下文特定的回放命令,(iii)媒体回放系统通过联网麦克风系统接收上下文特定的信息请求,(iv)经过了定义的时间段,和/或(v)可用于触发元数据交换的其他配置变化、状态变化、动作、输入或请求。在一些实施例中,媒体回放系统可以持续地向联网麦克风系统发送元数据。
[0190] 框904可以另外或备选地包括:在建立元数据交换通道之后,联网麦克风系统经历元数据交换触发事件。在操作中,元数据交换触发事件可以包括以下中的任何一项:(i)联网麦克风系统接收新的语音命令,包括但不限于上下文特定的语音命令,(ii)联网麦克风
系统接收新的信息语音请求,包括但不限于上下文特定的信息语音请求,(iii)联网麦克风系统的配置改变,(iv)经过了定义的时间段,和/或(v)可用于触发元数据交换的其他配置
改变、状态改变、动作、输入或请求。在一些实施例中,联网麦克风系统可以持续地向媒体回放系统发送元数据。
[0191] 最后,方法900前进到框906,其包括响应于经历元数据交换触发事件,媒体回放系统经由元数据交换通道向联网麦克风系统提供与媒体回放系统相关联的元数据。
[0192] 在操作中,元数据包括以下中的至少一个:(i)媒体回放系统的一个或多个配置参数,(ii)关于当前经由媒体回放系统播放的音频内容的信息,(iii)关于由媒体回放系统播放的音频内容的历史信息,(iv)与音频内容有关的用户偏好信息,(v)与媒体回放系统配置有关的用户偏好信息,和/或(vi)本文公开或描述的任何其他元数据。
[0193] 在一些实施例中,媒体回放系统经由元数据交换通道向联网麦克风系统提供与媒体回放系统相关联的元数据包括以下中的至少一个:(i)媒体回放系统经由元数据交换通
道向联网麦克风系统发送元数据或者(ii)媒体回放系统授权联网麦克风系统经由元数据
交换通道访问所选择的元数据。
[0194] 在一些实施例中,框906可以附加地或备选地包括,响应于经历元数据交换触发事件,联网麦克风系统经由元数据交换通道向媒体回放系统提供与联网麦克风系统相关联的
元数据。
[0195] 在操作中,元数据包括以下中的至少一种:(i)联网麦克风系统的一个或多个配置参数,(ii)关于经由联网麦克风系统接收的语音命令和请求的信息,(iii)关于经由联网麦克风系统接收的语音命令和请求的历史信息,(iv)与联网麦克风系统有关的用户偏好信
息,(v)与联网麦克风系统配置有关的用户偏好信息,和/或(vi)本文公开和/或描述的任何其他元数据。
[0196] 在一些实施例中,联网麦克风系统经由元数据交换通道向媒体回放系统提供与联网麦克风系统相关联的元数据包括以下中的至少一项:(i)联网麦克风系统经由元数据交
换通道向媒体回放系统发送元数据或者(ii)联网麦克风系统授权媒体回放系统经由元数
据交换通道访问所选择的元数据。
[0197] V.用于处理联网设备之间配对丢失的示例系统、装置和方法
[0198] 在又一种布置中,在一些情况下,可能希望媒体回放系统的媒体回放设备之一(例如,任何PBD 532-538)响应于通过联网麦克风系统的NMD(例如,任何NMD 512-516)接收的
语音命令而执行功能和/或提供反馈。
[0199] 在本公开的上下文中,执行功能可以包括响应于语音命令由媒体回放系统的任何一个或多个组件采取的任何动作。例如,响应于经由联网麦克风系统接收的“播放Led 
Zeppelin的歌曲”的语音命令,媒体回放系统(或者可能地媒体回放系统的一个或多个PBD)执行播放乐队Led Zeppelin的歌曲的功能。在另一示例中,响应于经由联网麦克风系统接
收的“将厨房和起居室区域组合成同步组”的语音命令,媒体回放系统(或者可能地媒体回放系统的一个或多个PBD单独地或与CR 522和/或计算设备506组合)可以将厨房区域和起
居室区域中的PBD配置成同步组,其中,在将厨房和起居室区域中的PBD配置成同步组之后,厨房区域和起居室区域中的PBD被配置为彼此同步地播放媒体,如本文所述。
[0200] 在本公开的上下文中,反馈是对语音命令的一些可听、可视、有形或其他类型的响应。例如,响应于“外面的当前温度是多少?”的语音命令,联网麦克风系统可以指示媒体回放系统中的一个或多个PBD以当前室外温度进行响应。在一些实施例中,该反馈可以是由媒体回放系统的PBD之一播放的“当前温度是75度”的可听陈述。类似地,响应于“这首歌曲的名称是什么?”的语音命令,联网麦克风系统可以指示媒体回放系统的一个或多个PBD以歌曲的标题进行响应。在一些实施例中,该反馈可以是由媒体回放系统的PBD之一播放的“当前歌曲是The Beatles的All You Need is Love”的可听陈述。在一些实施例中,代替听觉反馈,反馈可以是视觉的或有形的/触觉的,如本文所述。
[0201] 在一些实施例中,媒体回放系统的特定PBD被指定为用于联网麦克风系统的特定NMD的主PBD。在操作中,用于特定NMD的主PBD是被配置为执行功能和/或提供对由该特定
NMD接收的语音命令的反馈的PBD。在一些实施例中,不同的NMD可以具有不同的对应的主
PBD。例如,位于厨房区域中的NMD的主PBD可以是也位于厨房区域中的PBD。同样,位于卧室区域的NMD的主PBD也可能是位于卧室区域的PBD。在其他实施例中,单个PBD可以是联网麦
克风系统的主PBD。在另外的实施例中,被配置为控制媒体回放系统的计算设备可以在执行功能和/或提供对经由联网麦克风系统的一个或多个NMD接收的语音命令的反馈方面充当
主PBD。
[0202] 在操作中,联网麦克风系统的NMD接收语音命令。语音命令可以是任何类型的命令或信息请求。如果期望或甚至需要对语音命令的响应(即,反馈),则联网麦克风系统指示媒体回放系统响应于语音命令而提供反馈(并且可能地还有反馈的内容)。
[0203] 在一些实施例中,为了指示媒体回放系统响应于语音命令而提供反馈,联网麦克风系统首先确定与接收到语音命令的NMD相关联的主PBD是否可用于响应于语音命令而提
供反馈。备选地,一些实施例可以包括联网麦克风系统指示与接收到语音命令的NMD相关联的主PBD响应于语音命令而提供反馈,而无需首先检查主PBD是否可用于响应于语音命令而
提供反馈。
[0204] 在操作中,确定与接收到语音命令的NMD相关联的主PBD是否可用于响应于语音命令而提供反馈可以包括,确定与接收到语音命令的NMD相关联的主PBD是否是以下中的一项
或多项:(i)被静音,(ii)处于不中断状态,(iii)处于省电模式,(iv)经由被配置为支持媒体回放系统和NMD之间通信的网络不可达,(v)未插电,或(vi)断电。如果主PBD已从其典型位置移动,则主PBD可能替代地不可用,使得响应于语音命令而提供反馈可能没有帮助。例如,如果厨房中特定NMD的主PBD从厨房移到卧室,那么主PBD响应于通过厨房中的NMD接收
的语音命令而提供反馈可能没有帮助,这是因为当主PBD在卧室中时,厨房中的用户可能听不到来自主PBD的反馈。在一些实施例中,联网麦克风系统可以在联网麦克风系统指示主
PBD执行功能或提供反馈但是然后联网麦克风系统未能从主PBD接收到主PBD已执行所需功
能或提供所需反馈之后,确定主PBD不可用。
[0205] 在一些实施例中,媒体回放系统可以向联网麦克风系统通知媒体回放系统中的特定PBD的状态(可用和不可用)。例如,如果媒体回放系统知道PBD 534处于“不中断”状态,因为例如PBD 534正在播放与电影相关联的音频内容,则媒体回放系统可以向联网麦克风系
统通知PBD 534不可用,但PBD 532、536和538可用。在一些实施例中,每当PBD的状态从可用状态改变为不可用状态(反之亦然)时,媒体回放系统可以向联网麦克风系统通知PBD的可
用性(或不可用性)。在一些实施例中,媒体回放系统可以周期性地或半周期性地通知联网
麦克风系统关于媒体回放系统中的哪些PBD可用或不可用。例如,媒体回放系统可以每几
秒、每几分钟或者按照某种其他正则或非正则基础向联网麦克风系统通知哪些PBD可用或
不可用。
[0206] 在操作中,媒体回放系统的一个或多个组件(即,PBD 532-538、CR 522和/或计算设备506中的任何一个)可以经由媒体回放系统和联网麦克风系统之间的任何通信路径向
联网麦克风系统的任何一个或多个组件(即,NMD 512-516和/或计算设备504中的任何一
个)发送状态消息。例如,PBD 532可以通过经由网络546和/或542向联网麦克风系统的一个或多个组件发送状态改变消息来向计算设备504通知PBD 532现在可用于响应于语音命令
而执行功能和/或提供反馈。在另一示例中,计算设备506可以向计算设备504通知各个PBD 
532-538的状态(可用与不可用)。在又一示例中,CR 522可以向联网麦克风系统的一个或多个组件通知各个PBD 532-538的状态(可用与不可用)。媒体回放系统也可以以其他方式向
联网麦克风系统通知PBD状态变化。
[0207] 在一些实施例中,媒体回放系统可以以一个PBD接一个PBD或一个NMD接一个NMD的方式向联网麦克风系统通知媒体回放系统中的特定PBD的状态(可用和不可用)。例如,媒体回放系统可以指示厨房中的活动PBD可用于响应于从厨房中的NMD接收的语音命令来提供
反馈,但是其他房间中的活动PBD不可用于响应于从厨房中的NMD接收到的语音命令而提供
反馈。
[0208] 响应于确定与接收到语音命令的NMD相关联的主PBD可用于响应于语音命令而执行功能和/或提供反馈,联网麦克风系统(例如,NMD 512-516或计算设备504中的任何一个,单独地或组合地)指示主PBD响应于语音命令而执行功能和/或提供第一反馈。
[0209] 在操作中,联网麦克风系统可以指示主PBD直接或间接地执行语音命令中所要求的功能。例如,在一些实施例中,NMD 512-516之一可以直接经由网络546指示主PBD来执行期望的功能。在其他实施例中,NMD 512-516之一可以经由网络546指示CR 522执行语音命
令中所要求的功能,然后CR 522可以指示主PBD执行该功能。在另外的实施例中,计算设备
504可以指示计算设备506执行语音命令所要求的功能,并且计算设备506然后可以经由网
络544指示主PBD执行该功能。在另外的实施例中,计算设备504可以指示CR 522执行语音命令所要求的功能,然后计算设备504可以指示主PBD执行该功能。在另外的实施例中,计算设备504可以直接指示主PBD执行语音命令所要求的功能。联网麦克风系统可以指示主PBD以
其他直接或间接方式执行功能。
[0210] 类似地,在操作中,联网麦克风系统可以指示主PBD直接或间接地提供第一反馈。例如,在一些实施例中,NMD 512-516之一可以直接经由网络546指示主PBD提供第一反馈。
在其他实施例中,NMD 512-516之一可以经由网络546指示CR 522提供反馈,然后CR 522可
以指示主PBD提供反馈。在另外的实施例中,计算设备504可以指示计算设备506提供反馈,然后计算设备506可以经由网络544指示主PBD提供反馈。在另外的实施例中,计算设备504
可以指示CR 522提供反馈,然后计算设备504可以指示主PBD提供反馈。在另外的实施例中,计算设备504可以直接指示主PBD提供反馈。联网麦克风系统也可以指示主PBD以其他直接
或间接方式提供第一反馈。
[0211] 在一些实施例中,联网麦克风系统指示主PBD响应于语音命令而提供第一反馈还可以包括联网麦克风系统向主PBD提供第一反馈的内容。例如,响应于“这个乐队的名称是什么?”的语音命令,联网麦克风系统(即,NMD 512-516或计算设备504中的任何一个,单独地或组合地)可以访问来自联网媒体系统(即,来自任何PBD532-538和计算设备506,单独地或组合地)的关于媒体回放系统当前正在播放的音频曲目的元数据,以确定演奏当前播放
的曲目的乐队的名称,然后指示主PBD提供“乐队的名字是The Beatles”的音频反馈。
[0212] 但是响应于确定与接收到语音命令的NMD相关联的主PBD不可用于响应于语音命令而执行功能或提供反馈,联网麦克风设备可以指示后备设备响应于语音命令而执行功能
或提供第二反馈。
[0213] 例如,如果特定NMD的主PBD由于某种原因而不能回放音频,则联网麦克风系统(单独地或与媒体回放系统组合)可以指示后备PBD回放音频。
[0214] 在一些实施例中,当语音命令要求反馈时,第二反馈可以与第一反馈相同。例如,响应于语音命令“这个乐队的名称是什么?”,并非联网麦克风系统指示主PBD提供“乐队的名称是The Beatles”的音频反馈,而是联网麦克风系统可以指示后备设备提供“乐队的名字是TheBeatles”的音频反馈。在操作中,第一反馈可以是以下中的一个或多个:(i)音频反馈,例如语音响应(例如,“乐队的名称是The Beatles”)、哔哔声或其他音频指示,(ii)视觉反馈,例如闪光或其他视觉指示,以及(iii)触觉反馈,例如振动或其他触觉指示。
[0215] 但是在其他实施例中,第二反馈可以与第一反馈不同。在操作中,第二反馈可以是以下中的任何一个或多个:(i)音频反馈,例如语音响应(例如,“乐队的名称是The Beatles”)、哔哔声或其他音频指示,(ii)视觉反馈,例如通过后退设备的闪光或其他视觉指示(例如,文本消息或应用通知),以及(iii)触觉反馈,例如振动或其他触觉或物理指示。
第二反馈与第一反馈相同还是不同可取决于后备设备是否具有与主PBD相同的输出能力。
例如,一些后备设备可能没有扬声器来提供音频反馈。在一些实施例中,第二反馈的内容可以与第一反馈不同,这是因为主PBD不可用。例如,在语音命令是“这是什么乐队?”的在先场景中,第二反馈可以是来自后备设备的陈述道“主回放设备离线;乐队的名称是The 
Beatles”的音频指示。
[0216] 在一些实施例中,(根据语音命令的内容)执行功能和/或提供第二反馈的后备设备是以下中的至少一个:(i)媒体回放系统中的另一PBD,(ii)被配置为控制媒体回放系统
的计算设备,例如CR 522,(iii)接收到语音命令的NMD,和/或(iv)联网麦克风系统的另一NMD。
[0217] 在一些实施例中,联网麦克风系统(即,NMD 512-516和计算设备504中的任何一个,单独地或组合地)可以从一个或多个后备设备集合中选择后备设备。在其他实施例中,媒体回放系统(即,PBD 532-538、CR 522和计算设备506中的任何一个,单独地或组合地)可以从一个或多个后备设备集合中选择后备设备。在任一情况下,从一个或多个后备设备集
合中选择后备设备包括以下之一:(i)根据预定义的后备设备层次结构选择后备设备,(ii)从被配置为与主媒体回放设备同步地回放媒体内容的一个或多个媒体回放设备中选择后
备设备,(iii)从先前被配置为与主媒体回放设备同步地回放媒体内容的一个或多个媒体
回放设备中选择后备设备,或者(iv)选择辅媒体回放设备作为后备设备,其中,主媒体回放设备被配置为回放媒体内容的第一声道,并且其中,辅媒体回放设备被配置为回放媒体内
容的第二声道。
[0218] 例如,一些实施例可以具有预定义的后退设备层次结构以供选择。在一些实施例中,预定义的层次结构可以是用户可配置的。在一些实施例中,预定义的层次结构可以由媒体回放系统的组件的制造商和/或联网麦克风系统的组件的制造商来配置。在一些实施例
中,随着联网麦克风系统的配置和/或媒体回放系统的配置随时间改变,计算设备506(或可能地计算设备504)可以不时地改变后备设备的层次结构。
[0219] 根据一个示例层次结构,联网麦克风系统或媒体回放系统中的一个或两者单独地或组合地可以首先确定主PBD是否是绑定的PBD对的成员,并且如果是,则选择该绑定对中
的另一PBD作为后备设备。
[0220] 但是,如果主PBD不是绑定对的成员,则联网麦克风系统或媒体回放系统中的一个或两者单独地或组合地可以确定主PBD是否是同步组的成员,并且如果是,则从同步组中的其他PBD中选择后备设备。
[0221] 但是,如果主PBD不是绑定对或同步组的成员,则联网麦克风系统或媒体回放系统中的一个或两者单独地或组合地,可以确定媒体回放设备是否包括任何其他PBD,并且如果是,则从媒体回放系统中的其他PBD之一中选择后备设备。
[0222] 然后,如果主PBD不是绑定对或同步组的成员,并且如果主PBD是媒体回放系统中的唯一PBD,则联网麦克风系统或媒体回放系统中的一个或两者单独地或者组合地,可以确定被配置为控制媒体回放系统的计算设备(例如,CR 522)是否是活动的,并且如果是,则选择计算设备作为后备设备。在操作中,CR 522可以提供来自其自身扬声器的音频反馈、在屏幕上提供视觉反馈(例如,通过控制媒体回放系统的用户界面应用、通过应用通知、通过文本消息、或通过一些其他视觉反馈)、或提供触觉反馈(例如,振动)。
[0223] 最后,如果主PBD不是绑定对或同步组的成员,并且主PBD是媒体回放系统中唯一PBD,并且如果被配置为控制媒体回放系统的计算设备不是活动的,则联网麦克风系统或媒体回放系统中的一个或两者单独地或组合地,可以确定媒体回放系统外部的其他网络设备
(例如,接收到语音命令的NMD,联网麦克风系统、联网电视、联网的时钟收音机或其他设备中的其他NMD)是否可用于提供反馈,如果是,则从不属于媒体回放系统的可用网络设备集
合中选择后备设备。任何组合、顺序或布置的其他预定义的设备层次结构也是可能的。
[0224] 备选地,在一些实施例中,联网麦克风系统或媒体回放系统中的一个或两者单独地或组合地可以被配置为从与主PBD相关联的一个或多个其他PBD中选择后备设备,而不是
具有潜在后备设备层次结构,所述与主PBD相关联的一个或多个其他PBD例如是(i)具有主
PBD的合并媒体回放设备中的一个或多个其他PBD,(ii)具有主PBD的绑定对中的一个或多
个其他PBD,(iii)具有主PBD的同步组中的一个或多个其他PBD,(iv)先前在具有主PBD的合并回放设备中的一个或多个其他PBD,(v)先前在具有主PBD的绑定对中的一个或多个其他
PBD,(vi)先前在具有主PBD的同步组中的一个或多个其他PBD,(vii)具有主PBD的媒体回放系统中的一个或多个其他PBD,(viii)先前在具有主PBD的媒体回放系统中的一个或多个其
他PBD。
[0225] 在一些实施例中,后备设备可以附加地或备选地例如经由(i)音频指示、(ii)视觉指示和(iii)触觉指示中的一个或多个指示主PBD不可用。例如,除了(或可能地代替)提供
第二反馈之外,后备设备可以指示(例如,通知用户)通常将响应于语音命令而提供反馈的
主PBD当前不可用于响应于语音命令而提供反馈。在一个示例中,主PBD不可用的指示可以
是例如陈述道“主回放设备当前不可用”的音频指示。该指示可以是由以下中的任何一项大声播放的音频指示:(i)媒体回放系统中的另一PBD,(ii)被配置为控制媒体回放系统的计
算设备(例如,CR 522),(iii)接收到语音命令的NMD,(iv)联网麦克风系统中的另一NMD,或(v)可能地与媒体回放系统和/或联网麦克风系统通信的一些其他设备。备选地,主PBD不可用的指示可以是任何其他类型的听觉、视觉和/或触觉指示。例如,如果后备设备是CR 522,则主PBD不可用的指示可以是在CR 522的屏幕上显示的文本消息或应用通知和/或CR 522
设备的振动。
[0226] 一些实施例可以另外包括控制器设备(例如,CR 522)和PBD,其在主PBD不可用于响应于语音命令而执行功能和/或提供反馈时,执行单独的功能和/或向用户提供单独的反
馈。在一个示例中,联网麦克风系统接收语音命令“播放All You need is Love”,并且在确定与接收到语音命令的NMD相关联的主PBD不可用之后,联网麦克风系统(单独或可能地结
合媒体回放系统)可以(i)指示后备设备播放该歌曲,并且(ii)指示控制器向用户显示主
PBD不可用的消息。因此,以这种方式,后备设备执行功能,而另一设备提供反馈。
[0227] 上述示例描述了联网麦克风系统(或可能地媒体回放系统)选择后备设备。在操作中,联网麦克风系统选择后备设备可以包括NMD 512-516或计算设备504中的任何一个(单
独地或组合地)选择后备设备。类似地,媒体回放系统选择后备设备可以包括PBD 532-538、CR 522或计算设备506中的任何一个(单独地或组合地)选择后备设备。
[0228] 除了PBD可用于或不可用于响应于语音命令而执行功能和/或提供反馈之外,NMD还可用于或不可用于接收语音命令。与上述具有主PBD的个体NMD的概念类似,在一些实施
例中,个体PBD可以具有对应的主NMD。例如,类似于厨房中的特定NMD可以具有也在厨房中的对应的主PBD,厨房中的PDB可以将厨房中的NMD配置为其主NMD。以这种方式,特定NMD可以与特定PBD配对,使得该NMD是PBD的主NMD,并且PBD是NMD的主PBD。并非在所有实施例中需要NMD和PBD之间正式的基于软件的配对,但是在一些实施例中可以存在。
[0229] 一些实施例包括确定联网麦克风系统的主NMD不可用于接收针对具有一个或多个PBD的媒体回放系统的语音命令。在操作中,主NMD可能不可用,因为NMD(i)处于不中断状
态,(ii)处于省电模式,(iii)经由被配置为支持媒体回放系统和NMD之间的通信的网络不
可达,(iv)未插电,或(v)断电。如果主NMD已被移动到与其对应的主PBD不同的房间(或者如果NMD的对应主PBD已被移动到不同的房间),则主NMD可能备选地是不可用的。
[0230] 响应于确定主NMD不可用于接收语音命令,联网麦克风系统和媒体回放系统中的一个或两者单独地或组合地,指定后备麦克风以接收用于整个媒体回放系统的语音命令或
用于媒体回放系统的至少一个PBD的语音命令。
[0231] 在一些实施例中,确定联网麦克风系统的主NMD不可用于接收用于媒体回放系统(或媒体回放系统的至少一个PBD)的语音命令包括:媒体回放系统从联网麦克风系统接收
到指示主NMD不可用于接收语音命令的消息。对于其中媒体回放系统中的各个PBD均在联网
麦克风系统中具有对应的主NMD的一些实施例,联网麦克风系统可以一个PBD接一个PBD地
指示哪些NMD可用而哪些NMD不可用于接收语音命令。
[0232] 在一些实施例中,联网麦克风系统可以周期性地或半周期性地向媒体回放系统提供关于联网麦克风系统的各个NMD的可用性或不可用性的状态信息。
[0233] 在一些实施例中,联网麦克风系统可以向媒体回放系统通知联网麦克风系统中的特定NMD的状态(可用与不可用)。例如,如果联网麦克风系统知道NMD 512处于“不中断”状态,因为例如NMD 512正在执行软件或固件升级,则联网麦克风系统可以向媒体回放系统通知NMD 512不可用但NMD 514和516可用。在一些实施例中,每当NMD的状态从可用状态改变
为不可用状态(反之亦然)时,联网麦克风系统可以向媒体回放系统通知NMD的可用性(或不
可用性)。在一些实施例中,联网麦克风系统可以周期性地或半周期性地向媒体回放系统通知联网麦克风系统中的哪些NMD可用或不可用。例如,联网麦克风系统可以每几秒、每几分钟或者按照某种其他正则或非正则基础向媒体回放系统通知哪些NMD可用或不可用。
[0234] 在操作中,联网麦克风系统的一个或多个组件(即,NMD 512-516和/或计算设备504中的任何一个)可以经由联网麦克风系统和媒体回放系统之间的任何通信路径向媒体
回放系统的任何一个或多个组件(即,PBD 532-538、CR 522和/或计算设备506中的任何一
个)发送状态消息。例如,NMD 512可以通过经由网络546和/或544向媒体回放系统的一个或多个组件发送状态改变消息来向计算设备506通知NMD 512现在可用于接收语音命令。在另
一示例中,计算设备504可以向计算设备506通知各个NMD 512-516的状态(可用与不可用)。
在又一示例中,CR 522可以监测NMD 512-516的可用性,并且向媒体回放系统的一个或多个其他组件通知各个NMD 512-516的状态(可用与不可用)。联网麦克风系统也可以以其他方
式向媒体回放系统告知NMD状态改变。
[0235] 在操作中,联网麦克风系统和媒体回放系统中的一个或两者单独地或组合地可以指定各种可用麦克风中的一个作为后备麦克风以接收语音命令。例如,在一些实施例中,后备麦克风是媒体回放系统中的一个PBD上的麦克风。在其他实施例中,后备麦克风可以是被配置为控制媒体回放系统的计算设备(例如,CR 522)上的麦克风。在其他实施例中,后备麦克风可以是联网麦克风系统的辅NMD上的麦克风。在另外的实施例中,后备麦克风可以是与联网麦克风系统和/或媒体回放系统中的一个或两者通信的某个其他设备上的麦克风。
[0236] 在一些实施例中,联网麦克风系统和媒体回放系统中的一个或两者单独地或组合地可以根据定义的层次结构来选择后备麦克风。例如,在一些实施例中,联网麦克风系统和媒体回放系统中的一个或两者单独地或组合地,可以首先确定联网麦克风系统是否包括一
个或多个附加NMD,并且如果是,则联网麦克风系统和媒体回放系统中的一个或两者单独地或组合地可以选择联网麦克风系统的其他NMD之一作为媒体回放系统的后备麦克风(或选
择其他NMD之一作为媒体回放系统的一个或多个PBD的后备麦克风)。
[0237] 如果联网麦克风系统没有任何其他NMD,则联网麦克风系统和媒体回放系统中的一个或两者可以单独地或组合地选择媒体回放系统的一个PBD以使用其上载有的麦克风
(如果如此配备)作为后备麦克风,用于接收针对媒体回放系统(或媒体回放系统的一个或
多个PBD)的语音命令。接下来,如果联网麦克风系统没有任何附加NMD,并且如果媒体回放系统中没有PBD具有麦克风,则联网麦克风系统和媒体回放系统中的一个或两者可以单独
地或组合地选择被配置为控制媒体回放系统的计算设备(例如,CF 522)以将其麦克风用作
后备麦克风,用于接收针对媒体回放系统(或至少针对媒体回放系统的一个或多个PBD)的
语音命令。
[0238] 如果联网麦克风系统没有任何其他NMD,如果媒体回放系统中的所有PBD都没有麦克风(或者如果麦克风不可用或者如果PBD位于使其麦克风不可用或不想用的位置,因为它
位于房屋的远程位置),并且如果被配置为控制媒体回放系统的计算设备(例如,CR 522)没有麦克风(或者如果麦克风被CR 522上运行的某个其他应用使用,例如如果CR 522正用于
电话呼叫),则联网麦克风系统和媒体回放系统中的一个或两者可以单独地或组合地选择
网络上具有麦克风的某个其他设备,以将该麦克风用作后备麦克风,用于接收针对媒体回
放系统的语音命令。也可以使用其他后备麦克风选择层次结构,包括任何顺序的上述后备
麦克风的任何组合。在一些实施例中,后备麦克风选择层次结构结构可以是用户可配置的。
[0239] 在一些实施例中,响应于确定主NMD不可用于接收语音命令,联网麦克风系统和媒体回放系统中的一个或两者可以单独地或组合地另外指示另一设备指示主NMD不可用。在
操作中,主NMD不可用的指示包括以下中的一个或多个:(i)音频指示,(ii)视觉指示和
(iii)触觉指示。在操作中,指示主NMD不可用的另一设备可以包括以下中的任何一个:(i)媒体回放系统中的任何PBD,(ii)联网麦克风系统中的另一个NMD,(iii)被配置为控制媒体回放系统的任何计算设备(例如,CR 522),或(iv)与联网麦克风系统和/或媒体回放系统通信的并且可配置为提供或以其他方式输出主NMD不可用于接收语音命令的指示的任何其他
设备。
[0240] 图10中所示的方法1000给出了可以在包括或包含例如图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备300、图4的用户界面、图5中所示的配置、和/或图6的NMD的操作环境内实现的方法的实施例。方法1000可以包括一个或多个操作、功能或动作,如框1002-1006中的一个或多个所示。
[0241] 方法1000开始于框1002,其包括经由被配置为接收针对媒体回放系统的语音命令的NMD来接收语音命令,其中,媒体回放系统包括主媒体回放设备,其被配置为响应于经由NMD接收的语音命令而提供第一反馈。在一些实施例中,第一反馈是以下中的一种或多种:
(i)音频反馈,(ii)视觉反馈,以及(iii)触觉反馈,如本文所述。
[0242] 在一些实施例中,方法框1002可以附加地或备选地包括经由被配置为接收针对媒体回放系统的语音命令的NMD来接收语音命令,其中,媒体回放系统包括主媒体回放设备,其被配置为响应于经由NMD接收的语音命令而执行功能。在一些实施例中,该功能是以下中的一个或多个:(i)回放功能,例如开始/停止回放、跳过曲目,(ii)播放列表功能,例如从播放列表添加/移除曲目,(iii)回放设备配置功能,例如升高/降低音量、改变均衡器设置,(iv)媒体回放系统配置功能,例如将回放设备分组成同步组、激活区域场景,和/或(v)可以由回放设备单独地执行或由整个媒体回放系统执行的任何其他功能。
[0243] 接下来,方法1000进行到框1004,其包括确定主媒体回放设备不可用于响应于语音命令而提供第一反馈。在一些实施例中,方法框1004可以附加地或备选地包括确定主媒
体回放设备不可用于执行语音命令中所要求的功能。
[0244] 在一些实施例中,确定主媒体回放设备不可用于响应于语音命令而提供第一反馈和/或执行功能包括确定主媒体回放设备处于以下情形之一:(i)被静音,(ii)处于不中断
状态,(iii)处于省电模式,或(iv)通过被配置为支持媒体回放系统与NMD之间的通信的网
络不可达。在一些实施例中,确定主媒体回放设备不可用于响应于语音命令而提供第一反
馈和/或执行功能包括从媒体回放系统接收指示主媒体回放设备不可用的消息。
[0245] 在一些实施例中,方法1000另外包括从一个或多个后备设备集合中选择后备设备的可选步骤。在一些实施例中,从一个或多个后备设备集合中选择后备设备包括以下之一:
(i)根据预定义的后备设备层次结构选择后备设备,(ii)从被配置为与主媒体回放设备同
步地回放媒体内容的一个或多个媒体回放设备中选择后备设备,(iii)从先前被配置为与
主媒体回放设备同步地回放媒体内容的一个或多个媒体回放设备中选择后备设备,或者
(iv)选择辅媒体回放设备作为后备设备,其中,主媒体回放设备被配置为回放媒体内容的
第一声道,并且其中,辅媒体回放设备被配置为回放媒体内容的第二声道。后备设备可以是以下中的任何一个:(i)媒体回放系统的另一媒体回放设备,(ii)被配置为控制媒体回放系统的计算设备,或(iii)NMD。
[0246] 最后,方法1000进行到框1006,其包括响应于确定主媒体回放设备不可用于响应于语音命令而提供第一反馈,指示后备设备响应于该语音命令而提供第二反馈。在一些实
施例中,第二反馈是以下中的一种或多种:(i)音频反馈,(ii)视觉反馈,以及(iii)触觉反馈,如本文所述。在一些实施例中,第二反馈与第一反馈相同。
[0247] 在一些实施例中,框1006可以附加地或备选地包括,响应于确定主媒体回放设备不可用于响应于语音命令而执行功能,指示后备设备执行语音命令中所要求的一个或多个
功能。
[0248] 方法1000的一些实施例可以另外包括响应于确定主媒体回放设备不可用于响应于语音命令而提供第一反馈和/或执行功能,另外指示后备设备指示主媒体回放设备不可
用,其中,主媒体回放设备不可用的指示包括以下中的一个或多个:(i)音频指示,(ii)视觉指示,以及(iii)触觉指示,如本文所述。
[0249] 图11中所示的方法1100给出了可以在包括或包含例如图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备300、图4的用户界面、图5中所示的配置、和/或图6的NMD的操作环境内实现的方法的实施例。方法1100可以包括一个或多个操作、功能或动作,如框1102-1104中的一个或多个所示。
[0250] 方法1100开始于框1102,其包括确定联网麦克风系统的主NMD不可用于接收针对媒体回放系统的语音命令,其中,媒体回放系统包括一个或多个媒体回放设备。
[0251] 在一些实施例中,主NMD可能不可用于接收语音命令,因为NMD(i)处于不中断状态,(ii)处于省电模式,(iii)经由被配置为支持媒体回放系统和NMD之间的通信的网络不
可达,(iv)未插电,或(v)断电。如果主NMD已被移动到与其对应的主媒体回放设备不同的房间(或者如果NMD的对应主媒体回放设备已被移动到不同的房间),则主NMD可能备选地是不
可用的。在一些实施例中,确定联网麦克风系统的主联网麦克风设备不可用于接收针对媒
体回放系统的语音命令包括:接收指示主NMD不可用于接收语音命令的消息。
[0252] 接下来,方法1100进行到框1104,其包括响应于确定主NMD不可用于接收语音命令,指定后备麦克风来接收针对媒体回放系统的语音命令。在操作中,指定后备麦克风来接收针对媒体回放系统的语音命令的步骤可以由联网麦克风系统的任何组件(例如,参考图
5,NMD 512-516或计算设备504中的任何一个,单独地或组合地)来执行,或者由媒体回放系统的任何组件(例如,参考图5,PBD 532-538、CR 522或计算设备506中的任何一个,单独地或组合地)来执行。
[0253] 在操作中,后备麦克风可以包括以下中的任何一个:(i)媒体回放系统中的媒体回放设备上的麦克风(例如,任何PBD 532-538上的麦克风),(ii)被配置为控制媒体回放系统的计算设备(例如,图5中的CR 522)上的麦克风,(iii)联网麦克风系统的辅NMD上的麦克
风,或(iv)与联网麦克风系统和/或媒体回放系统通信的另一设备上的另一麦克风。
[0254] 在一些实施例中,方法1100可以附加地或备选地包括响应于确定主NMD不可用于接收语音命令,另外指示被配置为控制媒体回放系统的计算设备来指示主NMD不可用的步
骤,其中,主NMD不可用的指示包括以下中的一个或多个:(i)音频指示,(ii)视觉指示,以及(iii)触觉指示,如本文所述。此外,在一些实施例中,方法1100可以附加地或备选地包括响应于确定主NMD不可用于接收语音命令,另外指示媒体回放系统的一个或多个媒体回放设
备来指示主NMD不可用的步骤,其中,主NMD不可用的指示包括以下中的一个或多个:(i)音频指示,(ii)视觉指示,以及(iii)触觉指示,如本文所述。
[0255] VI.用于默认回放设备的示例系统、装置和方法
[0256] 在又一种布置中,本文描述的实施例可以涉及对媒体回放系统中的默认回放设备的指定、以及这种指定的应用。图12示出了用于指定默认回放设备的示例流程图1200,图14示出了用于应用默认回放设备指定的示例流程图1400。方法1200和1400示出的本方法实施
例可以在操作环境内实现,该操作环境包含例如图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备和图5的多个设备中的一个或多个设备。方法1200和1400可以包括分别由框1202-1208和框1402-1408中的一个或多个所示的一个或多个操
作、功能或动作。
[0257] A.默认回放设备指定
[0258] 在一个方面,媒体回放系统中的默认回放设备的指定可以涉及将NMD分配给媒体回放系统中的一个或多个回放设备,使得一个或多个回放设备成为指定的默认回放设备,
用于与该NMD相关联的功能。
[0259] 如图12所示,方法1200包括:在框1202处确定NMD可用于分配,在框1204处显示指示NMD将被分配至的至少一个回放区域的提示,在框1206处接收指示NMD将被分配至的在媒
体回放系统中的特定回放区域的输入,以及在框1208处存储指示NMD被分配至特定回放区
域的数据。
[0260] 出于说明的目的,方法1200可以由图5的CR 522执行,其可以是被配置为控制包括PBD 532、534、536、538或其他回放设备中的一个或多个的媒体回放系统的一个或多个控制器设备之一。然而,本领域普通技术人员将理解,结合方法1200所讨论的功能可以附加地或备选地全部地或部分地,在有或没有适当修改的情况下,通过图5中所示的多个设备500中
的一个或多个其他设备执行。
[0261] 在用户与执行方法1200的计算设备(例如,CR 522)交互的示例场景中,CR 522的用户可以指示将NMD分配给一个或多个回放区域。响应于用户的指示,CR 522可以确定一个或多个NMD是否可用于分配。在一种情况下,用户可以向CR 522输入用户希望分配的NMD的
标识信息。在下面提供另外的讨论的另一种情况下,CR 522可以在CR 522的通信范围内寻
找可用于分配的NMD。在一个实例中,CR 522可以显示找到的NMD的列表,并提示用户选择要分配的NMD。其他示例也是可能的。
[0262] 在框1202处,方法1200涉及确定联网麦克风设备可用于分配给本地回放网络内的一个或多个回放区域。在本文的讨论中,本地回放网络上的回放设备和控制器可以形成如
以上部分中描述的媒体回放系统。出于说明的目的,联网麦克风设备可以是图5的NMD 512。
确定NMD 512可用于分配可以涉及确定NMD 512能够作为局域网的一部分或者通过本地回
放网络中的设备与本地回放网络通信。如前所述,CR 522和PBD 532、534、536和538(本文也称为“家用设备”)可以被配置为通过本地回放网络彼此通信。这样,确定NMD 512能够与本地回放网络通信可以涉及确定NMD 512能够与至少一个家用设备通信。在一种情况下,一个或多个家用设备可以被配置为从其他家用设备发送和/或检测指示在本地网络上存在发送
设备的消息。当发送设备首先上电时,周期性地和/或响应于来自其他设备的请求,可以发送这样的消息。在这种情况下,确定NMD 512能够与至少一个家用设备通信可以涉及由一个或多个家用设备从NMD 512接收指示存在NMD 512的消息。
[0263] 在一个示例中,CR 522可以建立通过不同于本地回放网络的第二网络与NMD 512的通信。例如,NMD 512可以建立到局域网(LAN)(CR 522也被配置为通过该局域网(LAN)进
行通信)的通信,或者建立通过个域网(PAN)与CR 522的通信。在一个示例中,LAN和/或PAN可以便于根据BluetoothTM(IEEE 802.15)无线技术标准。在一种情况下,在建立通过第二网络的连接后,NMD 512可以向CR 522发送指示NMD 512可用于分配给本地回放网络中的一个
或多个回放区域的消息。
[0264] 在另一示例中,确定NMD 512可用于分配还可以涉及NMD 512加入家用设备的本地回放网络。在一种情况下,CR 522(或任何其他家用设备)与NMD 512之间的通信可以在第二网络上建立,如前所述。然而,在这种情况下,CR 522然后可以通过第二网络向NMD 512发送指示用于加入本地回放网络的参数的数据。用于加入本地回放网络的参数的示例可以包括
以下中的一个或多个:服务集标识符(SSID)、网络加密类型、网络密码、网络授权令牌和网络通信信道定义等。在一个实例中,在通过第二网络从NMD 512接收到对网络参数的接收确认和/或指示NMD 512可用于分配的消息之后,CR 522可以确定NMD 512可用于分配。在另一实例中,CR 522可以在通过本地回放网络从NMD 512接收到消息之后确定NMD 512可用于分
配。在此实例中,通过本地回放网络来自NMD 512的消息可以或可以不明确地指示NMD 512
可用于分配,这是因为CR 522和NMD 512之间通过本地回放网络的通信可能足以指示NMD 
512可用于分配。
[0265] 如前所述,NMD 512、514和516中的一个或多个可以是家用设备CR 522和PBD 532、534、536和538中的一个或多个的模块或子组件。在这种情况下,继续上述示例,CR 522可以通过识别NMD 512作为其自身的子组件(在NMD 512是CR 522的模块的情况下)而存在、或者
通过确定NMD 512是另一家用设备的子组件来确定NMD 512可用于分配。在一个实例中,如
果NMD 512是PBD 532的子组件,则CR 522可以识别NMD 512并且当CR 522和PBD 532建立通
信(即,通过本地回放网络)时确定NMD 512可用于分配。其他示例也是可能的。
[0266] 一旦CR 522确定NMD 512可用于分配,CR 522可以在CR 522的用户界面上提供NMD 512可用于分配的指示。出于说明的目的,图13A-D示出了在分配NMD时可能涉及的示例界面
1302-1362。图13A的界面1302示出了本地回放网络中的回放区域的表示。在一个示例中,对应于特定回放区域(在此情况下为书房回放区域)的表示的选择(例如,屏幕点击、力触摸
和/或右击等)可以使界面显示菜单1304(和/或一系列子菜单),其提供可在所选回放区域
上执行的动作的表示。如图所示,可以检测到对“分配麦克风”的选择1306。在一个示例中,可以显示界面1302,并且可以在CR 522确定NMD 512可用于分配之前接收选择1306。在另一示例中,可以显示界面802,并且可以在CR 522已经确定NMD 512可用于分配之后接收选择
1306。在这种情况下,“分配麦克风”的选项可以不显示在菜单1304中,或者可以是灰色的,除非CR 522已经确定NMD 512或至少一个其他NMD可用于分配。其他示例也是可能的。
[0267] 图13B的界面1322示出了消息框1324,其指示已经检测到一个或多个NMD(并且可用于分配)。消息框1324还可以包括可用于分配的NMD的可选表示。例如,表示1326可以是可选择的以进行分配NMD 512。在一个示例中,可以响应于对界面1302的选择1306来提供界面
1322。在另一示例中,可以响应于CR 522确定NMD 512(并且在该示例中,NMD 514)可用于分配来提供界面1322。在一种情况下,如果响应于仅仅经由分配麦克风的界面(界面1302)检
测到一个或多个NMD而非先前输入来提供界面1322和消息框1324,则消息框1324还可以包
括可选择的选项(未示出)以稍后分配检测到的NMD。其他示例也是可能的。
[0268] 在框1204处,方法1200涉及显示指示要向其分配NMD的至少一个回放区域的提示。在一些情况下,至少一个回放区域可以包括两个或更多个回放设备(例如,图5的绑定区域
530,其包括PBD 536和538)。在这种情况下,CR 522还可以显示提示,以指示要向其分配NMD 
512的至少一个回放区域内的至少一个回放设备。在一些其他情况下,CR 522可以不提示对至少一个区域内的回放设备的选择。在这种情况下,NMD 512可以被分配给绑定区域中的每个回放设备,或者默认地被分配给绑定区域的组协调器。其他示例也是可能的。
[0269] 在一个实施例中,指示至少一个回放区域的提示可以涉及与至少一个回放区域物理相关的提示动作。在一个示例中,提示可以是用户按下用户希望将NMD 512分配给其的回放区域中的回放设备上的按钮。图13C的界面1342示出了示例消息框1344,其用于提示用户按下用户希望将NMD 512分配给其的回放区域中的回放设备上的按钮。如上所述,可以响应于对界面1322上的表示1326的选择来提供界面1342。在另一示例中,提示可以是用户轻击
用户希望将NMD 512分配给其的回放区域中的回放设备上的CR 522。在这种情况下,回放设备可以通过近场通信(NFC)协议检测CR 522。
[0270] 在涉及与至少一个回放区域物理相关的动作的这样的示例中,对NMD 512将被分配给其的至少一个回放区域内的至少一个回放设备的指示可以本质上是对至少一个回放
区域的指示。换句话说,在其上发生按钮按下或CR 522轻击的至少一个回放区域中的回放
设备也可以是要分配NMD 512的回放设备。其他示例也是可能的。
[0271] 在另一实施例中,指示至少一个回放区域的提示可涉及在CR 522的用户界面上的提示动作。在一个示例中,CR 522可以在界面上为本地回放网络中的每个回放区域显示对
应的表示(类似于图4的回放区域区420),并且还在界面上显示选择对应于要分配NMD 512
的回放区域的表示的提示。图13D的界面1362示出了示例消息框1364,其包括与本地回放网络中的回放区域相对应的可选表示。如上所述,可以响应于对界面1322上的表示1326的选
择来提供界面1362。在该示例中,如果所选表示对应于绑定回放区域,例如绑定区域530,则CR522还可以在界面上显示指示绑定回放区域中的特定回放设备(即,PBD 536或538)的提
示。例如,CR 522可以在界面上显示选择所选回放区域中的每个回放设备的对应表示的提
示。
[0272] 在另一实施例中,指示至少一个回放区域的提示可以涉及与至少一个回放区域物理相关的动作和CR 522的用户界面上的动作的某种组合。例如,指示要分配NMD 512的回放区域的提示可以仅涉及CR 522的用户界面上的动作,但是指示回放区域内的回放设备的后
续提示可以涉及与要分配NMD 512的回放设备物理相关的动作。其他示例也是可能的。
[0273] 在又一实施例中,指示至少一个回放区域的提示还可包括建议的至少一个回放区域。在一个示例中,CR 522可以识别(i)NMD 512被赋予包括“主卧室”的名称,以及(ii)本地回放网络中的回放区域也赋予“主卧室”的名称,并且因此指示至少一个回放区域的提示包括或向其添加了主卧室回放区域可以是可以分配NMD 512的合适回放区域的建议。其他示
例也是可能的。
[0274] 在框1206处,方法1200涉及接收指示本地回放网络中将分配NMD的特定回放区域的输入。如上所述,如果该特定包括两个或更多个回放设备,则输入还可以指示特定回放区域中的特定回放设备。
[0275] 在一个实施例中,如果在框1204处显示的提示涉及与回放区域物理相关的动作,则可以从特定回放区域中的回放设备接收指示特定回放区域的输入。例如,如果响应于框
1204处所显示的提示而按下PBD 536上的按钮或者执行借助于CR 522轻击PBD 536,则PBD 
536可以向CR 522发送指示PBD 536和/或绑定区域530被选择的消息。
[0276] 在另一实施例中,如果在框1204处显示的提示涉及CR 522的界面上的动作,则可以以用户在界面上进行的选择输入的形式接收指示特定回放区域的输入。其他示例也是可
能的。
[0277] 在框1208处,方法1200涉及存储指示向特定回放区域分配NMD的数据。在一个示例中,继续上述示例,存储指示向绑定区域530分配NMD 512的数据可以涉及在CR 522的本地
存储器存储装置上存储指示分配的数据。在另一示例中,存储指示分配的数据可以涉及向
一个或多个其他家用设备发送指示分配的数据和使一个或多个其他家用设备存储数据的
消息。在又一示例中,存储指示分配的数据可以涉及向服务器(例如,云网络502的计算设备
504、506和508中的一个或多个)发送,指示分配的数据和使云网络502的计算设备504、506和508中的一个或多个存储数据的消息。其他示例也是可能的。
[0278] 如上所述,将NMD分配给特定回放区域还可以涉及将NMD分配给特定回放区域中的至少一个回放设备。这样,如果继续上述示例,则指示将NMD 512分配给绑定区域530的数据可以包括指示将NMD 512分配给PBD 536的数据。在一些情况下,如果未明确指示回放区域
中的回放设备,则可以将NMD分配给特定回放区域中的每个回放设备。在其他情况下,如果未明确指示回放区域中的回放设备,则可以自动地和/或智能地识别特定回放区域中的回
放设备,并且可以将NMD分配给所识别的回放设备。例如,如果回放区域是绑定区域,则可以识别绑定区域的协调回放设备。在另一实例中,如果回放区域是区域组,则可以识别区域组中的组协调器回放设备。其他示例也是可能的。
[0279] 在一个实施例中,已经分配的NMD可以对应于一个或多个唯一标识符。例如,NMD可以具有唯一的序列号或对应的MAC地址等。因此,存储指示将NMD 512分配给绑定区域530(和/或PBD 536)的数据可以涉及存储NMD 512的唯一标识符向绑定区域530(和/或PBD 
536)的分配。
[0280] 在一个示例中,当最初确定NMD 512可用于分配时,CR 522可以接收用于NMD 512的唯一标识符。在一些情况下,如果NMD未提供唯一标识符,则可以生成唯一标识符并将其分配给NMD。其他示例也是可能的。
[0281] 在一些实施例中,可以将NMD分配给两个或更多个回放区域。例如,在具有如图1所示的“开放式平面图”的家庭中,NMD可以位于起居室、餐厅和厨房附近的某处。在这种情况下,将NMD分配给两个或更多个回放区域可能是有益的。
[0282] 在一个示例中,继续上述示例,CR 522可以在界面上显示指示要向其分配NMD 512的第二回放区域的提示,接收指示媒体回放系统中的第二回放区域的输入,并且存储指示
将NMD分配给第二回放区域的数据,使得NMD被分配给第一回放区域和第二回放区域两者,
类似于框1204-1208。
[0283] 在一个示例中,可以串行地执行将NMD 512分配给第二回放区域的交互。例如,在框1206处接收到指示要将NMD 512分配给绑定区域530的输入之后,或者在存储指示将NMD 
512分配给绑定区域530的数据之后,CR 522可以在界面上显示指示要向其分配NMD 512的
第二回放区域的提示。
[0284] 在另一示例中,可以基本上与用于将NMD 512分配给绑定区域530的交互并行地执行将NMD 512分配给第二回放区域的交互。例如,在框1204处指示至少一个回区域的提示可以是指示要向其分配NMD 512的每个回放区域的提示。在这种情况下,如果在框1206处接收的输入仅指示单个回放区域,则在框708处存储的数据可以指示NMD 512仅分配给单个回放
区域。另一方面,如果在框1206处接收的输入指示两个或更多个回放区域,则在框1208处存储的数据可以指示NMD 512分配给两个或更多个回放区域中的每一个。
[0285] 在另一示例中,指示回放区域的提示可以提示用户将要向其分配NMD 512的两个或更多个回放区域分组在一起,使得用户然后可以在界面上从区域的表示中选择对应于该
组的表示(或者备选地,物理地选择区域组中的回放设备)以指示要将NMD 512分配给区域
组和/或区域组中的回放区域。其他示例也是可能的。
[0286]
[0287] 表1
[0288] 出于说明的目的,表1示出了默认回放设备数据库中的一组示例条目。如图所示,表1列出了NMD 512、514和516中的每一个以及它们被分配到的回放区域和回放设备。在该
示例中,NMD 512和NMD 516都被分配给主卧室回放区域(绑定区域530)。然而,在该示例中,NMD 512还专门分配给主卧室回放区域的PBD 536,而NMD 516还专门分配给PBD 536和PBD 
538。此外,在该示例中,NMD 514被分配给起居室回放区域和厨房回放区域。然而,NMD 514还被分配给起居室回放区域中的PBD 534,但未进一步分配给厨房回放区域中的任何回放
设备。
[0289] 本领域普通技术人员将理解,不同的格式、组织和参数集也可以实现与表1类似的功能。在一个示例中,可以将两个或更多个NMD分配给单个回放区域或回放设备。在另一示例中,可以将每个NMD分配给三个或更多个回放区域。在另一示例中,可以将每个NMD分配给一个或多个回放设备,而不是任何回放区域。在又一示例中,表1可以列出本地回放网络中的每个回放区域和/或回放设备,可能并非其中的每个列出的回放区域或回放设备都被分
配了一个或多个NMD。其他示例也是可能的。
[0290] 虽然上述讨论通常可以涉及将一个或多个NMD分配给一个或多个回放区域和/或回放设备,但是本领域普通技术人员将理解,可以根据其他方法和/或协议另外地或备选地建立这样的分配和指定。例如,一个或多个回放区域和/或回放设备可以等效地或备选地被分配一个或多个NMD,并且相应的数据可以本地存储在一个或多个NMD处或远程地存储在诸
如计算设备504之类的服务器处。继续表1的示例,可以备选地(或另外地)基于经由与至少
NMD 512相对应的界面(即,用于管理和控制至少NMD 512的控制器界面)向NMD 512分配PBD 
536和/或主卧室回放区域来提供表1中的条目。类似地,书房回放区域和主卧室回放区域可以经由对应于至少NMD 512和516的界面被分配给NMD 516。
[0291] 另外,两种形式的分配和指定可以共存,使得多个NMD和多个回放设备可以彼此交叉分配。在这种情况下,交叉分配可以完全匹配,也可以不完全匹配。例如,在一些情况下,NMD可以被分配给两个回放设备,但只有一个或两个回放设备都没有被分配给NMD。其他示
例也是可能的。
[0292] 如上所述,将NMD分配给特定回放区域指示特定回放区域被指定为用于NMD的默认回放区域。以下部分提供了这种默认回放区域指定的应用示例。
[0293] b.默认回放设备指定的应用
[0294] 如图14所示,方法1400涉及:在框1402处,维护包括指示将NMD的标识分配给回放区域的数据的数据库;在框1404处,接收指示(i)NMD的标识和(ii)媒体回放命令的消息;在框1406处,基于数据库中的数据和接收到的消息来识别媒体回放系统中的回放区域;以及
在框1408处,向回放区域发送指示回放命令的消息。
[0295] 出于说明的目的,方法1400可由图5的计算设备506执行。然而,本领域普通技术人员将理解,结合方法1400所讨论的功能可以全部地或部分地,在有或没有适当修改的情况下,通过图5中所示的多个设备500中的一个或多个其他设备执行。例如,方法1400可以全部地或部分地由计算设备504和/或508或云网络502执行。
[0296] 在框1402处,方法1400涉及维护包括指示将NMD的标识分配给媒体回放系统的回放区域的数据的数据库。在一个示例中,维护数据库可以涉及与上面结合图12的方法1200
描述的功能类似的功能。另外,维护数据库还可以涉及响应于媒体回放系统和/或本地回放网络的改变而更新数据库。例如,如果已经将NMD重新分配给不同的回放区域和/或回放设
备,则可以更新数据库。同样,如果一个或多个设备(包括NMD,如NMD 512、514和516)、回放设备(例如,PBD 532、534、536和538)或控制设备(例如,CR 552)被添加、移除、暂时断开连接、或者重新连接,则可以相应地更新数据库。维护数据库的其他示例也是可能的。
[0297] 在框1404处,方法1400涉及接收指示(i)NMD的标识和(ii)媒体回放命令的消息。继续上面的示例,计算设备506可以从NMD 514接收消息。
[0298] 在一个示例中,计算设备506可以经由计算设备504从NMD 514接收消息。如结合图5所讨论的,NMD 514可以经由通信路径542向计算设备504发送语音输入,并且计算设备504可以将语音输入转换为等效文本命令,并且随后向计算设备506发送文本命令。在这种情况下,指示(i)NMD的标识和(ii)媒体回放命令的消息可以包括来自计算设备504的文本命令。
[0299] 在另一示例中,计算设备506可以直接从NMD 514接收消息。在这种情况下,消息可以包括指示媒体回放命令的数据,而在消息中(即,在消息的数据分组报头/前缀内)识别的消息源可以指示NMD 514。在这种情况下,计算设备506还可以处理语音输入并将其转换为等效文本命令。
[0300] 在框1406处,方法1400涉及基于数据库中的数据和接收到的消息来识别媒体回放系统中的回放区域。还如结合图5所讨论的,计算设备506然后可以解析文本命令以识别一
个或多个回放命令。在解析文本命令以识别一个或多个回放命令期间,计算设备506可以识别特定命令,但是可以确定回放区域来执行未识别的特定命令。在一个示例中,如果未在回放命令中提供区域指示,则计算设备506可以确定回放区域来执行未识别的特定命令。在另一示例中,如果在媒体回放系统中不存在回放命令中提供的区域指示,则计算设备506可以确定回放区域来执行未识别的特定命令。其他示例也是可能的。
[0301] 无论哪种情况,响应于确定接收到的消息不指示特定回放区域,计算设备1406可以基于接收到的消息中的NMD的标识在数据库中识别媒体回放系统中的回放区域。换句话
说,计算设备506可以识别被指定为在接收到的消息中标识的NMD(和/或媒体回放命令源于
其)的默认回放区域的回放区域。
[0302] 继续上面的示例,包括表1,如果接收到的消息未标识有效的回放区域但指示了NMD 512,则计算设备506可以将回放区域“主卧室”和/或PBD 536识别为要执行接收到的消息中的媒体播放命令的回放区域。
[0303] 如表1所示,在一些情况下,诸如NMD 514或516之类的NMD可以被分配给两个或更多个回放区域(和/或回放设备)。在一个示例中,计算设备506可以将两个或更多个回放区
域中的每一个识别为要执行媒体回放命令的回放区域。例如,如果接收到的消息指示NMD 
514,则计算设备506可以将起居室和厨房都识别为要执行媒体回放命令的回放区域。
[0304] 在另一示例中,计算设备506可以将两个或更多个回放区域的子集识别为要执行媒体回放命令的回放区域。例如,如果接收到的消息指示NMD 516,则计算设备可以将书房或主卧室中的一个识别为要执行媒体回放命令的回放区域。在一些情况下,计算设备506可以基于诸如上下文信息之类的附加信息来识别子集。
[0305] 在一种情况下,计算设备506可以基于与两个或更多个回放区域相关联的媒体内容将两个或更多个回放区域的子集识别为将执行媒体回放命令的回放区域。例如,如果两
个或更多个回放区域的第一子集当在对应NMD处接收到语音输入时正在播放媒体内容和/
或与媒体内容相关联(即,具有相应的回放队列中的媒体内容),而两个或更多个回放区域
的第二子集不在播放媒体内容和/或并非与媒体内容相关联,则计算设备506可以将两个或
更多个回放区域的第一子集识别为要执行媒体回放命令的回放区域。
[0306] 另外,计算设备506可以基于媒体回放命令和两个或更多个回放区域的媒体回放状态来识别两个或更多个回放区域的子集。在这种情况下,计算设备506可以被配置为接收和维护媒体回放系统中的每个回放区域的回放状态。例如,如果媒体回放命令涉及当在相
应的NMD接收到语音输入时两个或更多个回放区域的第一子集正在播放媒体内容而两个或
更多个回放区域的第二子集不在播放媒体内容时暂停对媒体内容的回放,则计算设备506
可以基于用户更可能向正在播放媒体内容的回放区域而不是不在播放媒体内容(即,已经
暂停)的回放区域提供暂停命令的假设来识别两个或更多个回放区域的第一子集。
[0307] 在另一种情况下,数据库(或另一数据库)可以被配置为还存储与媒体回放系统内的媒体回放历史有关的信息,和/或更具体地与每个NMD相关联的媒体回放命令历史。例如,数据库中的数据可以指示两个或更多个回放区域的子集更频繁地用于播放媒体内容和/或
更频繁地用于响应于经由相应NMD的语音命令来播放媒体内容。在这种情况下,计算设备
506可以将两个或更多个回放区域中较为频繁使用的子集识别为要执行媒体回放命令的回
放区域。
[0308] 在另一种情况下,当两个或更多个回放区域的子集更频繁地用于回放媒体内容和/或更频繁地用于响应于语音命令而播放媒体内容时,媒体回放历史和/或媒体回放命令
历史还可以指示一天中的次数或一周中的天数等。在这种情况下,计算设备506还可以基于在对应NMD处接收到语音输入的时间来识别要执行媒体回放命令的两个或更多个回放区域
的子集。
[0309] 在又一种情况下,计算设备506还可以基于计算设备506可用的接近度信息将两个或更多个回放区域的子集识别为执行媒体回放命令的回放区域。换句话说,计算设备506可以基于在向对应NMD提供语音输入时用户的物理位置来识别两个或更多个回放区域的子
集。
[0310] 在一个示例中,由NMD检测和处理的语音输入可以包含与语音输入相对应的方向信息。在一个实施例中,在将NMD设置和分配给两个或更多个回放区域期间,NMD可以确定并在存储器中(本地或远程,即计算设备504)存储与NMD相关的两个或更多个回放区域的位
置。例如,在NMD的设置和分配期间,或者随着时间的推移,NMD可以检测两个或更多个回放区域对媒体内容的回放,并且将检测到媒体内容的回放的方向与对应的回放区域相关联。
这样,可以基于NMD检测到语音输入的方向来确定用户的物理位置。
[0311] 在另一示例中,如前所述,媒体回放系统中的一个或多个其他设备还可以包括NMD和/或其他传感器。因此,可用传感器网络可以被配置为确定当用户向对应NMD提供语音输
入时用户的接近度或对用于进行定位(即,通过三测量等)。在一种情况下,如果用户持有或最近使用诸如CR 522之类的控制设备,则可以基于控制设备和回放设备之间的信号强度
来确定用户的位置或用户与回放设备/回放区域之间的接近度。类似地,由其他NMD检测到
的语音输入的音频量级,或者各种设备之间由用户引起的无线信号干扰也可以由计算设备
506接收和应用,以确定在检测到语音输入时用户的物理位置,并因此将两个或更多个回放区域的子集识别为要执行媒体回放命令的回放区域。其他示例也是可能的。
[0312] 在框1408处,方法1400涉及向回放区域发送指示媒体回放命令的消息。如前所述,媒体回放系统中的每个回放区域包括至少一个回放设备。因此,向回放区域发送指示媒体回放命令的消息可以包括向回放区域的相应的至少一个回放设备发送指示媒体回放命令
的消息。参考表1和图5,书房回放区域仅包括PBD 532。在这种情况下,向书房回放区域发送指示媒体回放命令的消息可以涉及计算设备506向PBD 532发送指示媒体回放命令的消息。
[0313] 再次参考表1和图5,绑定区域530(主卧室)包括PBD 536和538。在一个这样的情况下,计算设备506可以向PBD 536和538发送指示媒体回放命令的消息。在另一这样的情况
下,计算设备506可以仅向回放区域中的一个回放设备发送指示媒体回放命令的消息。
[0314] 在一个实例中,计算设备506可以根据数据库选择PBD 536和538中的一个。例如,如果媒体回放命令源自NMD 512,并且计算设备506正在向主卧室回放区域发送指示媒体回
放命令的消息,则计算设备506可以向PBD 536发送指示媒体回放命令的消息,这是因为NMD 
512还被分配给PBD 536而不是PBD 538。
[0315] 在另一示例中,如果媒体回放命令源自NMD 516,并且计算设备506正在向主卧室回放区域发送指示媒体回放命令的消息,则计算设备506可基于附加信息选择PBD 536或
PBD 538中的一个,这是因为NMD 516已被分配给PBD 536和PBD 538,作为向主卧室回放区
域的分配的一部分。在一种情况下,计算设备506可以基于一个或多个因素(例如,设备处理能力和网络状况等)选择PBD 536或PBD 538中的一个。另外或备选地,计算设备506可以基
于作为绑定区域的协调器的回放设备之一来选择PBD 536或PBD 538中的一个。其他示例也
是可能的。
[0316] 在另一种情况下,如先前所讨论的,计算设备506可以将两个或更多个回放区域识别为要执行媒体回放命令的回放区域。在这种情况下,计算设备506可以向两个或更多个回放区域中的每个中的每个回放设备、两个或更多个回放区域中的每个中的回放设备的子
集、或者其某种组合发送指示媒体回放命令的消息。
[0317] 此外,在被识别为要执行媒体回放命令的回放区域的两个或更多个回放区域的全部或至少一个子集被分组在区域组中的情况下,计算设备506可以识别该区域组中的单个
回放设备,以发送指示媒体播放命令的消息而不是向每个回放区域中的回放设备发送消
息。在这种情况下,计算设备506可以基于一个或多个因素(例如,设备处理能力和网络状况等)从区域组中选择回放设备。另外或备选地,计算设备506可以基于作为区域组的组协调
器的回放设备来从区域组中选择回放设备。其他示例也是可能的。
[0318] 在一个实施例中,在向回放区域发送指示媒体回放命令的消息之后,计算设备506还可以向计算设备504和/或NMD发送指示回放命令被发送以在回放区域中执行的消息。在
一个示例中,计算设备506可以从回放区域中的至少一个回放设备接收指示在向NMD发送指
示回放命令被发送以在回放区域中执行的消息之前回放区域正在执行回放命令的消息。
[0319] 在一种情况下,计算设备506可以直接向NMD发送指示回放命令被发送以在回放区域中执行的消息。在另一种情况下,计算设备506可以经由另一计算设备(例如,云网络502内的计算设备504)向NMD发送指示回放命令被发送以在回放区域中执行的消息。
[0320] 在又一种情况下,计算设备506可以经由媒体回放系统中的回放设备向NMD发送指示回放命令被发送以在回放区域中执行的消息。例如,计算设备506可以经由通信路径544
向PMD 536发送指示回放命令被发送以执行的消息,并且PMD 536可以经由本地通信手段
546向NMD 512中继消息。
[0321] 中继指示回放命令被发送以供执行的消息的回放设备可以是执行媒体回放命令的回放设备。例如,计算设备506在向回放区域发送指示媒体回放命令的消息时,还可以在接收到指示媒体回放命令的消息之后,使所识别的回放区域中的回放设备向相应的NMD发
送指示已发送媒体回放命令以供执行的消息。
[0322] 另外或备选地,计算设备506可以确定媒体回放命令已经被执行或正被执行,并且响应地直接地或经由另一设备向计算设备504和/或NMD发送指示媒体播放命令已被执行或
正在执行的消息。
[0323] 此外,计算设备506在向回放区域发送指示媒体回放命令的消息时,还可以使得所识别的回放区域中的回放设备在完成对媒体回放命令的执行之后或在执行媒体回放命令
期间向相应的NMD发送指示媒体播放命令已被执行或正在执行的消息。其他示例也是可能
的。
[0324] VII.用于音频响应回放的示例系统、装置和方法
[0325] 在另一布置中,本文描述的实施例可以涉及回放对语音命令的音频响应。图15示出了用于播放音频响应的方法的示例流程图1500,图16示出了更详细地呈现图15的框1508
和1512的各方面的示例流程图1600。方法1500和1600的本方法实施例可以在操作环境内实
现,该操作环境包含例如图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备和图5的系统500中的多个设备中的一个或多个设备。
[0326] 在方法1500的框1502处,可以将网络麦克风设备512、514或516分配(例如,配对或绑定)给包括一个或多个回放设备(例如,回放设备532、534、536、538)的区域。可以向区域分配NMD,如被标识为标题为“Default Playback Device(s)”的美国临时申请No.62/298,410的申请中所描述的,该申请的内容通过引用整体并入本文。在框1504处,用户可以向包含麦克风(例如,NMD 512、514、516、PBD 532、534、536、538、CR 522)的多个设备500中的一个或多个设备提供语音命令。一个或多个麦克风设备可以向多个设备系统500中的其他设
备(例如,云网络502中的一个或多个计算设备504、506、508,NMD 512、514、516,PBD 532、
534、536、538)传送语音命令以进行处理。在框1506处,一个或多个处理设备可以处理语音命令并返回要回放的响应。要回放的响应可以以语音响应消息的形式返回,该语音响应消
息包括要播放的音频片段、要转换为话音的文本、和/或要播放的预先记录的响应的标识符(例如,URL或URI),其可以本地存储在系统500的设备上。可以经由一个或多个通信路径
542、544、546返回响应。
[0327] 在框1508处,系统500可以选择一个或多个设备或一个或多个区域来播放语音响应。确定或选择播放语音响应的一个或多个设备或区域可取决于多种因素,包括上下文信
息、配对信息和/或用户设置。将参考图8更详细地讨论框708。
[0328] 在框1510处,系统500可以接收指示要播放响应的语音响应消息。在框1512处,系统500可以使在框1508中选择的一个或多个设备来播放语音响应。可以将默认区域分组以
用于与另一区域进行同步回放,并且可以基于将参考图16更详细地描述的分组来调整对音
频响应的回放。
[0329] 图16示出了根据本文描述的各方面选择一个或多个区域或设备(例如,单独的设备、包括一个或多个设备的区域)以播放对语音命令的语音响应的说明性流程图。在框1602处,计算设备(例如,NMD、回放设备、控制设备、计算设备)可以确定是使用预定响应设备(例如,默认PBD)或区域(例如,默认区域)还是动态地选择响应设备或区域来播放语音响应。在将新设备添加到系统500时,可以在初始系统设置或配置(例如,分配、配对、绑定)期间确定预定的响应设备或区域。例如,初始设置或配置可以是将新的回放设备添加到系统500和/
或将新的NMD添加到或分配给区域(例如,默认区域)。预定响应设备可以由用户选择和/或
由系统500自动选择。可以基于诸如上下文信息(例如,位置信息、定向信息、存在信息)之类的各种信息来动态地选择响应设备或区域,所述各种信息可以包括配对信息(例如,取决于用户的位置的配对、取决于麦克风设备的位置的配对)和/或能力信息(例如,可用传感器、可用设备、可用网络、可用处理能力)。
[0330] 是使用预定设备还是动态地选择音频响应设备的决定可以基于系统500动态地选择响应设备和/或有效确定响应设备的能力。可以使用某些设备和/或硬件以进行动态选
择,并且如果某些设备和/或硬件不可用于参与动态选择,则系统500可以默认使用预定的
响应设备。例如,系统500可能不具有确定与用户的位置和/或麦克风设备(例如,NMD、PBD、CR)的位置相关的位置信息的能力,该麦克风设备接收或负责处理由用户说出的语音命令,和/或系统500可能先前没有确定系统500中的设备的位置信息。在这样的示例中,确定使用预定设备可以是向用户提供对语音命令的立即确认或响应的最有利途径。作为另一示例,
系统500可能缺少诸如传感器、相机或可用于确定上下文信息(例如,位置信息、存在信息
等)的其他输入设备之类的硬件。在这种情况下,系统500可以决定使用预定的响应设备(例如,默认区域、默认回放设备)。作为又一示例,系统500可以仅具有一个区域,在这种情况下,系统可以自动地确定将这一个区域设置为默认区域和/或将这一个区域用于所有音频
响应。类似地,系统500可以仅具有单个PBD。鉴于此,系统可以选择使用单个PBD作为默认设备和/或预定的音频响应设备。
[0331] 在一些情况下,可以通过经由通信路径542、544和/或546向云网络502发送由系统500中的设备检测到的信息以进行处理来确定或处理位置信息。云网络502可以拥有比设备
NMD 512、514、516、CR 522和PBD 532、534、536、538更多的处理能力。在云网络502不可用的情况下,系统500可以使用预定设备之一,并且可以遵从被存储在用户简档中的用户对特定的预定设备(例如,默认响应设备)的偏好以说出或播放音频响应。在一些方面,位置信息可以由NMD、CR、PBD中的一个或多个本地处理。
[0332] 如果系统500已经在框1602处确定选择一个或多个预定响应设备或区域来播放对语音命令的音频响应,则方法1600可以进行到框1604。如果系统500已经在框1602处确定动态地选择一个或多个响应设备来播放音频响应,则方法800可以进行到框806。
[0333] 在框1604处,处理设备(例如,多个设备500中的任何一个)可以确定选择预定区域还是一个或多个预定设备。例如,用户可以在初始设置或配置(例如,分配、配对或绑定)期间指定一个或多个设备或一个或多个区域来播放对任何语音命令的音频响应,并且用户指
定可以作为默认设置被保存在与用户关联的用户简档中。用户简档可以存储在多个设备
500中的任何设备中。响应于接收到语音命令,接收设备或系统500中的任何其他设备可以
检索本地或在另一设备中存储的用户简档,以确定要使用回放设备的哪个或哪些预定扬声
器或区域作为播放对语音命令的音频响应的设备。
[0334] 在一个示例中,NMD可以包括扬声器,并且联网麦克风设备的扬声器可以用于播放语音响应。
[0335] 在另一方面,可以在对NMD的初始设置期间将音频响应设备(例如,NMD、回放设备、控制设备)中的扬声器配置为播放音频响应。例如,用户可以选择默认区域中的特定设备作为默认响应设备。在其他情况下,默认区域可以包括一个回放设备,并且这一个回放设备可以被识别为默认响应设备。在一些其他情况下,默认区域可以包括多于一个回放设备,并且用户可以选择回放设备之一或两个或更多个回放设备作为默认响应设备。
[0336] 在一些方面,回放音频响应的区域可以是包括两个或更多个回放设备(例如,PBD 536、538)的绑定区域(例如,绑定区域530)。在绑定区域中,音频响应可以由结合区域中的一个或多个回放设备播放,并且结合区域的哪个回放设备播放音频可以取决于回放设备的
类型。例如,绑定区域可以包括环绕声系统,其中回放设备可以放置在用户周围的不同位置处并且负责播放一个或多个音频声道。在这种布置中,回放设备可以放置在用户的前面和
后面。基于用户至PBD的定向,可以选择用户前面的PBD来播放音频响应。
[0337] 在一些方面,NMD通常可以是静止的,使得可以在初始设置期间配置相对位置。在一个方面,用户可以识别最靠近NMD的响应设备。响应设备可以是默认区域或另一区域的一部分。在另一方面,最靠近NMD的响应设备可以由附近的响应设备和/或NMD自动识别。例如,可以使用附近的响应设备和/或NMD的麦克风来执行接近度检测。例如,默认区域中的一个
或多个回放设备可以发出或播放预定音调。可以在每个回放设备处以相同的功率电平或音
量播放预定音调。NMD的麦克风可以接收测试音调并且基于最高功率电平来确定哪个回放
设备最靠近NMD。
[0338] 在一些方面,可以基于回放设备相对于NMD的定向来确定默认响应设备。例如,相比于物理上较为靠近NMD的回放设备,面向NMD的回放设备可以具有较高的优先级作为默认
响应设备。类似于使用测试音调来确定最近的回放设备,由NMD的麦克风拾取的测试音调可以用于确定回放设备相对于NMD的定向。NMD可以拾取或检测从回放设备播放的音调,使得
面向NMD的扬声器比远离NMD的扬声器被检测为更大声或处于更高的功率。用于接近度或位
置确定的其他技术是可能的,包括本文描述的那些技术。
[0339] 作为另一示例,可以选择所有回放设备来播放对语音命令的音频响应。例如,默认区域(例如,分配了NMD的区域)中的所有回放设备可以播放响应于音频或语音命令的任何或所有音频响应。
[0340] 在确定一个或多个预定的响应设备之后,该方法可以进行到框1608并确定默认区域是否与另一区域被分组在一起。默认区域可以与另一区域被分组在一起,以进行对媒体
项目(例如,音频内容、视频片段、无线电)的同步回放。
[0341] 返回到框1606,系统500可以动态地选择一个或多个响应设备或一个或多个区域来播放对音频命令的音频响应。可以基于配对信息(例如,基于用户位置和/或设备位置的
NMD动态配对)和/或上下文信息(例如,用户的定向、语音命令时的上下文、位置信息)来选择动态选择的音频响应设备。配对信息可以取决于上下文信息。可以独立于配对信息来选
择动态选择的设备。被选择用于进行响应的区域或设备可以与分配NMD的设备或区域相同
或不同。
[0342] 如上所述,NMD可以配对至或分配给区域或设备。动态选择的音频响应设备可以是NMD与之配对的设备,其中NMD与另一设备之间的配对可以基于响应于特定事件(例如,用户请求特定区域)可在任何时间确定的用户位置(例如,响应于用户位置的改变而改变)和/或
NMD相对于另一设备(例如,NMD、PBD、CR)的位置而动态地改变。例如,在接收到语音命令时或者在向用户播放音频响应时。可以使用多个设备500中的一个或多个以及各种技术来确
定用户的位置。例如,多个设备500中的两个或更多个不同设备中的麦克风可以用于确定用户相对于两个或更多个不同设备的位置。
[0343] 两个或更多个不同的设备可以正在收听用户的语音并通过比较用户语音的量级(例如,音量、功率平)和/或确定两个或更多个不同设备中的每个设备接收用户的语音的时间之间的延迟或时间差来确定最近的扬声器。作为示例,第一设备(例如,PBD 532)和第二设备(例如,PBD 534)可以与用户位于相同的区域中,并且这些回放设备的麦克风能够拾取用户的语音命令。当用户说出语音命令时,设备能够记录和/或分析用户的话音或语音。
记录可以由包括麦克风(例如,NMD、PBD CR)的任何设备500完成,并且分析可以由多个设备
500中的任何设备完成。该分析可以包括从一个或多个其他设备接收所记录的用户话音或
语音,以及基于时间戳和/或根据说出的单词和/或根据用户的语音的音节或记录的其他特
性进行比较。在一些方面,可以在每个单词、音节和/或短语之后执行比较,并且不需要等到用户完成说出语音命令。
[0344] 不同设备接收到用户语音的声音的时间之间的延迟或时间差可以指示用户和接收设备之间的相对距离,这是因为较靠近用户的设备可以在远离用户的设备之前接收到用
户语音的声音。例如,两个或更多个设备均可以具有在语音输入中出现某些声音特性或声
音标记时的时间戳,并且比较时间戳以确定两个或更多个设备中的哪个设备首先接收到语
音的声音。两个或更多个设备可以保持同步时钟并且可以直接比较声音特性的时间戳以确
定哪个设备首先接收到该声音特性。在一些方面,两个或更多个设备可以确定它们各自的
时钟之间的时间差,并且在减去它们各自的时钟之间的时间差的同时比较时间戳的差。
[0345] 用户语音的记录或分析可以由一个或多个设备执行,并且可以由另一设备发起。例如,NMD或包含麦克风的其他设备(例如,CR、PBD)可以总是在收听语音命令,并且当NMD或其他麦克风设备检测到用户已经开始说出命令时,NMD可以通过通过通信连接(例如,542、
544、546)向可能或可能不与NMD位于同一区域的其他麦克风设备发送警报(例如,消息)来
提醒其他麦克风设备(例如,NMD、CR、PBD)开始接收、记录和/或分析用户的语音命令。
[0346] 类似地,用户话音的分析可用于确定用户相对于扬声器的定向。例如,用户可以面向第一扬声器并且具有指向用户背面的第二扬声器。在一些情况下,即使用户更靠近第二扬声器,系统500也可以选择第一扬声器来播放音频响应,这是因为可能希望让用户前面的扬声器而不是用户后面的扬声器来播放音频响应。用户前面的设备(例如,PBD、CR、NMD)中的麦克风可以比用户侧面或后面的设备(例如,PBD、CR、NMD)中的麦克风更大声地或以更高的功率拾取或检测用户的语音。
[0347] 在一些方面,位置信息可包括麦克风设备(例如,NMD、PBD、CR)相对于扬声器的位置。例如,默认区域中的一个或多个回放设备可以发出或播放预定音调。预定音调可以在每个回放设备处以相同的功率水平或音量播放和/或可以在人类听觉范围(例如,大约20Hz至20kHz)之内或之外。NMD的麦克风可以接收测试音调并且基于最高功率电平来确定哪个回
放设备最靠近NMD。
[0348] 在一些方面,NMD 512可以包括麦克风阵列606。使用麦克风阵列606,NMD通常可以通过确定麦克风阵列606中的哪个或哪些麦克风检测到用户语音的最大音量或最高功率来识别用户的方向、距离和/或定向。在一些方面,系统或NMD 500可以先前已经确定回放设备的相对位置和/或已经被编程有回放设备的相对位置,并且NMD能够将回放设备的麦克风与
其自身的麦克风组合使用,以在说出语音命令时使用用户的语音确定用户的大概方向、距
离和/或定向。用户位置的每个确定可以存储在一个或多个设备500中,并且可以响应于之
后的语音命令而对其进行参考,以更快地确定用户的位置和/或定向。
[0349] 用于确定用户位置的另一种技术可以是使用环境(例如,位置、区域)中无线信号的干扰和/或强度。在一些方面,可以基于用户和PBD和/或NMD所位于的环境中的无线信号
来确定用户的位置。无线信号可以包括根据任何无线通信协议的无线通信信号,该无线通
信协议例如是工业标准(例如,IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、
802.15、蓝牙、4G移动通信标准、LTE移动通信标准、 近场通信(NFC)等)。用户可以
具有设备(例如,计算设备、移动设备、可穿戴设备、平板电脑等),其包括根据无线通信协议发送无线通信信号的无线接口。从设备发射的无线信号可能会引起与用户所在的环境中存
在的其他无线信号的干扰。基于与其他无线信号的干扰强度,可以检测无线信号和干扰的
其他设备可以确定用户的位置。
[0350] 为了基于环境中的无线信号的强度来确定用户的位置,用户的设备可以测量由环境中的任何无线设备发射的信号的信号强度(例如,接收信号强度指示符(RSSI))用户并识
别信号强度最强的设备作为离用户最近的设备。类似地,环境中的无线设备(例如,PBD、
NMD、无线路由器、信标,NFC)可以测量由用户设备发射的无线信号的信号强度,并且通过其他设备发送和/或收集用户设备的无线信号的信号强度测量结果。可以通过系统500中的任
何设备来收集和/或比较信号强度测量结果,并且可以将具有最强信号强度测量结果的设
备识别为最靠近用户的设备。
[0351] 在一些方面,NMD可以变为与区域取消配对和与区域重新配对。如果NMD离开与媒体回放系统相关联的环境(例如,离开家庭环境、离开该区域),移动到通信路径(例如,通信路径542、544和/或546)的范围之外(例如,移动到通信路径的无线信号范围之外),和/或断开与通信路径的连接(例如,断开与网络的连接、从系统或服务中退出、禁用通信接口、进入飞行模式),则可能发生这种取消配对。例如,如果NMD返回到与媒体回放系统相关联的环境(例如,重新进入家庭环境),返回到通信路径的范围内(例如,移动进入通信路径的无线信号范围),和/或重新连接到通信路径(例如,建立到网络的连接、启用通信接口、退出飞行模式),则NMD稍后可以与区域重新配对。
[0352] 作为示例,用户可以携带NMD并且可以从用户家的房屋中移除NMD。因此,NMD可能会失去与NMD配对的区域或设备的连接。NMD可以存储该最后已知的连接或配对,并且在返
回到用户的家中时利用此最后已知的连接或配对来自动尝试重新连接或重新配对。在一些
方面,NMD可以基于如本文所述的位置信息动态地配对,并且一旦NMD确定NMD能够与区域或设备配对,则NMD可以自动地进行动态配对。
[0353] 在NMD被取消配对时由用户说出并由NMD接收的任何语音命令可以在重新配对之后立即处理和/或执行或者排队等待处理和/或执行,并且可以在如本文所述的动态选择的
设备上播放对语音命令的任何音频响应。例如,用户可以在家外部播放播放列表并说出在
返回家之后继续播放相同的播放列表的语音命令。NMD可以在用户进入家中之前、在与家中的任何设备或区域重新配对之前、在进入家中之后、或与家中的任何设备或区域重新配对
之后,开始处理语音命令(例如,开始本地处理、向系统500中的另一设备发送以进行处理)。
对语音命令的音频响应可以由与NMD配对的第一区域或设备播放,这可以根据本文描述的
动态配对方面。相同的取消配对和重新配对特征可以适用于在不同区域之间移动的用户或
NMD。在改变不同区域之间的配对或者与特定区域或设备取消配对和重新配对时,当前播放内容或最后播放内容的状态信息可以与配对过程一起或者与配对过程分开地传送。
[0354] 在一些情况下,语音命令可以包括要在其中执行命令的特定区域(例如,在厨房中播放音乐)。响应于语音命令中对特定区域(例如,厨房)的请求,NMD可以自动地将其配对改变为厨房区域。语音命令中对特定区域的请求可以覆盖NMD可能基于检测到的用户或NMD的
位置而另外做出的动态配对选择。
[0355] 在美国专利No.9,084,058、美国专利No.9,225,307、美国专利No.8,930,005、美国专利No.9,195,432、2014年9月2日提交的美国申请No.14/475,191以及2015年4月8日提交的美国专利申请No.14/681,735中描述了用于确定与用户或其他设备相关的位置信息的其
他技术,这些专利或申请的全部内容通过引用并入本文。
[0356] 该方法可以进行到框1608,其用于确定所选区域(例如,默认区域或设备或动态选择的区域或设备)是否如上所述与附加区域分组在一起。如果所选区域未与另一区域分组
在一起,则在框1610处系统500可以使得可以包括一个或多个响应设备的所选区域播放音
频响应。音频响应可以生成或存储在播放音频响应的设备中,和/或可以通过任何通信路径
542、544、546从系统500中的任何其他设备向播放音频响应的设备发送音频响应。可以在来自其他设备的消息中接收音频响应和/或所选响应设备可以从处理语音命令的设备(例如,
系统500中的任何设备)接收包含与要播放的特定音频响应相对应的标识符的消息。
[0357] 在一些方面,系统可以确定所选区域(例如,预定区域、默认区域、动态选择区域)或所选设备(例如,预定设备、默认设备、动态选择设备)处于与另一区域分组在一起的区域中并进行至框1612。例如,所选区域以及与所选区域分组在一起的附加区域可以同步播放音频内容(例如,同时同步播放相同的音频内容)。在接收处理语音命令的语音命令和/或播放对语音命令的音频响应时,当前播放的媒体项或音频内容(例如,歌曲、播放列表、无线电广播节目、视频)的回放可以继续保持不中断,同时从所选区域的设备播放音频响应。同时,除了与所选区域分组在一起的任何其他区域之外,还可以在所选区域中播放将作为音频或
语音命令的结果而播放的任何媒体项或音频内容。例如,语音命令可以是播放特定歌曲的
请求,并且在处理语音命令并且请求歌曲时,任何当前播放的音频内容的音频回放可以继
续,同时由动态选择或预定的响应设备播放音频响应。一旦语音命令被处理并且识别并检
索到所请求的歌曲,则由所选区域和与默认区域分组在一起的任何区域的所有回放设备进
行的回放可以改变至所请求的歌曲。
[0358] 在一些方面,与响应设备在同一区域中的和与响应设备分组在一起的区域中的所有回放设备都可以播放音频响应。是否要在这些区域中播放音频响应的确定可以基于上下
文信息(例如,用户存在)。例如,如果所选响应设备位于被分组用于与第二区域进行同步音频回放的第一区域中,则系统可以确定用户存在于第二区域中并播放音频响应以向其他用
户通知接收到的语音命令引起回放状态改变。
[0359] 在一些方面,可以为单个语音命令提供一个以上的音频响应。例如,响应于接收语音命令的多个设备500中的设备向用户提供已经接收到语音命令的确认或通知,可以播放第一音频响应,并且响应于处理语音命令和/或完成对语音命令的处理可以播放第二音频
响应。可以在一个或多个预定设备或动态选择的设备的任何组合上播放第一音频响应和第
二音频响应。例如,用户可以说出播放“前40的播放列表”的播放语音命令,并且默认音频响应设备可以播放指示NMD(例如,与默认区域相关联的NMD)已接收到语音命令的第一音频响
应(例如,音调、铃声、通知声音、声音片段)。响应于接收到正在处理语音命令或处理完成的指示,可以生成和/或接收诸如“现在正在播放前40的播放列表”之类的第二音频响应。可以在动态选择的设备上播放第二音频响应。根据需要,可以重复图15和图16的各个框,以用于附加音频命令和/或音频响应。
[0360] 在一些方面,所选择的一个或多个响应设备可以基于各种因素来调整音频响应的回放音量。在接收语音命令之前和/或在播放音频响应之前,一些响应设备可以已经被设置在特定音量等级,并且响应设备可以以该特定音量等级播放音频响应。即使响应设备当前
可能不在播放任何媒体内容,也可以将响应设备设置在特定音量等级。可以以大于、小于或等于特定音量等级的音量来播放对语音命令的音频响应。
[0361] 在一些情况下,系统可能确定所选择的一个或多个区域仍然与用户相距一定距离,并且系统可以以较大的音量播放音频响应,使得用户可以听到音频响应。例如,系统可能已经选择了厨房区域中的回放设备,这是因为厨房回放设备最靠近用户,但是用户可能
位于没有回放设备的后院外面。为了使用户能够听到来自回放设备的音频响应,可能需要
以较大的音量来播放音频响应。音频响应的音量可以与可以播放媒体内容的音量或响度无
关。在这种情况下,NMD也可以在厨房区域中,并且系统可以确定使用NMD接收到的用户语音的响度与音频响应回放的音量之间的反比关系。
[0362] 是否调整回放音量的确定可以取决于诸如用户位置和/或用户存在信息之类的上下文信息。例如,系统可能已经确定用户距所选回放设备的距离大于阈值距离,或者用户处于特定区域中,该特定区域可以被预定为处于要调整音频响应回放的音量的距离处。在一
些方面,如果系统确定另一个人或用户在所选区域中,则系统可能不会将音频响应回放的
音量增加到阈值音量等级之上。
[0363] 在一些方面,当确定播放音频响应的音量时,系统可以使用其他上下文信息,例如一天中的时间、星期几和/或当前播放的媒体内容的音量。可以使用其他上下文信息来区分用户是否与NMD相距一定距离,或者用户是否以低音量(例如,耳语)提供语音命令。例如,当相同位置的其他用户可能正在睡觉时,一天中的时间可能是晚上或深夜。用户可能不希望打扰正在睡觉的其他用户,因此可以以低音量提供语音命令。基于在特定时间(例如,晚上9点)之后的一天中的时间,系统可以确定切换到诸如夜间模式之类的特殊模式并且以与NMD
接收语音命令的音量相同或大约相同的音量来播放音频响应。在一些方面,可以向用户提
供通过控制设备使用夜间模式的选项。在又一示例中,在周末睡眠时间可能更灵活,因此系统可以确定即使一天中的时间在特定时间之后,系统也可以不使用夜间模式,因为这一天
是周末。
[0364] 另一示例可以是部分地基于可以播放当前播放的音乐的音量来确定音频响应的音量。例如,当音乐音量被设置为低于或等于阈值音量等级时,系统可以决定自动使用夜间模式音频响应音量。用户可能正在以较低的音量播放音乐,以便不会打扰在较高音量下则
可能在收听范围内的其他人。在该示例中,音乐回放的音量和/或用户语音的响度与音频响应的音量之间可以存在直接相关性。
[0365] 系统可以使用本文描述的各种技术从环境中的其他设备接收上下文信息,例如环境中的人的存在信息和/或位置信息。系统可以基于上下文信息和/或位置信息来确定可以
从当前音量设置改变要播放音频响应的音量。
[0366] 在音频响应回放时间段期间,音频响应回放音量可以独立于媒体内容的回放音量的调整或与其结合来调整,或者可以如在2016年4月14日提交的题为“Content Mixing”的美国申请No.15/098,760中描述的在音频响应回放时间段期间调整媒体内容的回放音量,
该申请的内容通过引用合并于此。
[0367] 在使所选择的一个或多个回放设备以调整后的音量播放音频响应时,云网络502中的一个或多个回放设备中的回放设备和/或一个或多个计算设备可以确定调整后的音
量。例如,云网络502中的一个或多个计算设备可以确定调整后的音量(例如,音量等级、增益等级、增益调整量)并向所选择的一个或多个回放设备发送调整音量信息。在另一示例
中,所选择的一个或多个设备可以确定调整后的音量。
[0368] 虽然本文描述的特征解决了选择一个或多个设备来播放对语音命令的音频响应,但是代替或者除了播放音频响应之外,所选择的一个或多个设备还可以提供视觉指示作为
对语音命令的响应。
[0369] VIII.其他示例特征
[0370] (特征1)一种用于回放设备的方法,该方法包括:以第一音量等级输出音频内容;接收与网络麦克风设备相关联的消息;以及基于该消息,将音频内容的音量调整到第二音
量等级,该第二音量等级低于与网络麦克风设备相关联的内容的音量。
[0371] (特征2)根据特征1所述的方法,其中:消息定义与网络麦克风相关联的内容的持续时间,并且音频内容的音量在所定义的持续时间内被调整到第二音量等级。
[0372] (特征3)根据特征2所述的方法,还包括在定义的持续时间之后将音频内容的音量恢复至第一音量等级。
[0373] (特征4)根据特征1至3中任一项所述的方法,还包括将与网络麦克风设备相关联的内容与音频内容混合以在回放设备上回放。
[0374] (特征5)根据特征1至3中任一项所述的方法,其中:调整音频内容的音量包括使音频内容静音或暂停音频内容;并且该方法还包括在音频内容被静音的同时在回放设备上输
出与网络麦克风设备相关联的内容。
[0375] (特征6)一种计算机可读存储介质,包括用于由处理器执行的指令,所述指令在被执行时使得处理器实现根据任何前述特征的方法。
[0376] (特征7)一种回放设备,包括:网络接口,被配置为经由通信网络与网络麦克风设备通信;处理器,被配置为执行根据任何前述特征的方法。
[0377] (特征8)一种方法,包括:在媒体回放系统和包括联网麦克风设备和联网麦克风服务器的联网麦克风系统之间建立元数据交换通道;在建立元数据交换通道之后,媒体回放
系统经历元数据交换触发事件;以及响应于经历元数据交换触发事件,经由元数据交换通
道,从媒体回放系统向联网麦克风系统提供与媒体回放系统相关联的元数据。
[0378] (特征9)根据特征8所述的方法,其中,建立元数据交换通道包括在媒体回放系统的至少一个媒体回放设备和媒体回放系统的媒体播放服务器之一与联网麦克风设备和联
网麦克风服务器中的至少一个之间建立元数据交换通道。
[0379] (特征10)根据前述特征8至9中任一项所述的方法,其中,元数据交换触发事件包括以下之一:媒体回放系统回放新的媒体内容项;响应于联网麦克风系统接收到上下文特
定回放命令,从联网麦克风系统接收元数据请求;响应于联网麦克风系统接收到上下文特
定信息请求,从联网麦克风系统接收元数据请求;以及经过定义的时间段。
[0380] (特征11)根据前述特征8至10中任一项所述的方法,其中,向联网麦克风系统提供元数据包括以下中的至少一项:媒体回放系统经由元数据交换通道向联网麦克风系统发送
元数据;媒体回放系统授权联网麦克风系统经由元数据交换通道访问元数据。
[0381] (特征12)根据前述特征8至11中任一项所述的方法,其中,所述元数据包括以下中的至少一种:媒体回放系统的一个或多个配置参数;关于当前通过媒体回放系统播放的音
频内容的信息;关于媒体回放系统播放的音频内容的历史信息;与音频内容有关的用户偏
好信息;以及与媒体回放系统配置有关的用户偏好信息。
[0382] (特征13)根据前述特征8至12中任一项所述的方法,其中,所述联网麦克风设备是移动计算设备。
[0383] (特征14)一种编码有指令的有形的非暂时性计算机可读介质,其中当一个或多个处理器执行时,所述指令使计算设备执行根据前述特征8至13中任一项所述的方法。
[0384] (特征15)一种媒体回放设备,包括:一个或多个处理器;根据特征14的有形的非暂时性计算机可读介质。
[0385] (特征16)一种用于联网麦克风设备的方法,所述联网麦克风设备被配置为接收针对媒体回放系统的语音命令,所述媒体回放系统包括被配置为响应于经由联网麦克风设备
接收的语音命令而提供第一反馈的主媒体回放设备,所述方法包括:通过联网麦克风设备
接收语音命令;确定主媒体回放设备不可用于响应于语音命令而提供第一反馈;作为响应,指示后备设备响应于语音命令而提供第二反馈。
[0386] (特征17)根据特征16所述的方法,其中,确定主媒体回放设备不可用于提供第一反馈包括确定主媒体回放设备是以下之一:被静音,处于不中断状态,处于省电模式,或者经由被配置为支持媒体回放系统和联网麦克风设备之间的通信的网络不可达。
[0387] (特征18)根据特征16所述的方法,其中,确定主媒体回放设备不可用于提供第一反馈包括从媒体回放系统接收到指示主媒体回放设备不可用的消息。
[0388] (特征19)根据前述特征16至18中任一项所述的方法,还包括从一个或多个后备设备集合中选择后备设备,其中,从一个或多个后备设备中选择后备设备包括以下之一:根据预定义的后备设备层次结构选择后备设备;被配置为与主媒体回放设备同步地回放媒体内
容的一个或多个媒体回放设备中选择后备设备;从先前被配置为与主媒体回放设备同步地
回放媒体内容的一个或多个媒体回放设备中选择后备设备;以及选择辅媒体回放设备作为
后备设备,其中,主媒体回放设备被配置为回放媒体内容的第一声道,并且其中,辅媒体回放设备被配置为回放媒体内容的第二声道。
[0389] (特征20)根据特征16或19所述的方法,其中,所述后备设备是以下之一:被配置为控制媒体回放系统的计算设备;和联网麦克风设备。
[0390] (特征21)根据前述特征16至20中任一项所述的方法,其中,第一反馈和/或第二反馈是以下中的一种或多种:音频反馈,视觉反馈和触觉反馈。
[0391] (特征22)根据前述特征16至21任一项所述的方法,其中,第一反馈与第二反馈相同。
[0392] (特征23)根据前述特征16至22任一项所述的方法,还包括:当指示后备设备提供第二反馈时,另外指示后备设备使用以下中的一个或多个来指示主媒体回放设备不可用:
音频指示,视觉指示和触觉指示。
[0393] (特征24)一种联网麦克风设备,包括被配置为执行根据前述特征16至23中任一项所述的方法的一个或多个处理器。
[0394] (特征25)一种用于与包括一个或多个回放设备的媒体回放系统相关联的计算设备的方法,所述方法包括:确定联网麦克风系统的主联网麦克风设备不可用于接收针对媒
体回放系统的语音命令;作为响应,指定后备麦克风来接收针对媒体回放系统的语音命令。
[0395] (特征26)根据特征25所述的方法,其中,确定主联网麦克风设备不可用包括接收指示主麦克风设备不可用于接收语音命令的消息。
[0396] (特征27)根据特征25或26所述的方法,还包括:响应于确定主联网麦克风设备不可用,另外指示计算设备和一个或多个媒体回放设备中的一个或多个使用以下中的一个或
多个来指示主联网麦克风设备不可用:音频指示,视觉指示和触觉指示。
[0397] (特征28)根据特征25至27中的任一项所述的方法,其中,后备麦克风包括以下中的一个或多个:媒体回放系统中的媒体回放设备上的麦克风;被配置为控制媒体回放系统
的计算设备上的麦克风;以及辅联网麦克风设备上的麦克风。
[0398] (特征29)根据特征25至28中任一项所述的方法,其中,计算设备是以下中的一种:联网麦克风设备,媒体回放设备,被配置为控制媒体回放系统的计算设备,被配置为与媒体回放系统通信的服务器系统,以及被配置为与联网麦克风系统通信的服务器系统。
[0399] (特征30)一种计算设备,包括被配置为执行根据特征25至29中任一项所述的方法的一个或多个处理器。
[0400] (特征31)一种编码有指令的有形的非暂时性计算机可读介质,其中,当被一个或多个处理器执行时,所述指令使得联网麦克风设备执行根据特征16至23和25至29中任一项
所述的方法。
[0401] (特征32)一种方法,包括:确定联网麦克风设备可用于分配给本地回放网络内的一个或多个回放区域,每个回放区域包括至少一个回放设备;显示指示要被分配网络麦克
风设备的至少一个回放区域的提示;接收指示本地回放网络中要被分配网络麦克风设备的
特定回放区域的输入;以及存储网络麦克风设备向特定回放区域的分配。
[0402] (特征33)根据特征32所述的方法,还包括:在界面上显示指示特定回放区域的两个或更多个回放设备中的特定回放设备的提示;接收指示特定回放区域中的特定回放设备
的输入,其中,该分配还指示网络麦克风设备向特定回放区域中的所选择的特定回放设备
的分配。
[0403] (特征34)根据前述特征32至33中任一项所述的方法,其中,所显示的提示包括按下特定回放区域中的回放设备上的按钮的提示。
[0404] (特征35)根据前述特征32至34中任一项所述的方法,还包括显示分别与媒体回放系统中的每个回放区域相对应的多个显示的表示,其中,显示的提示包括从多个显示的表
示中选择与所述特定回放区域相对应的表示的提示。
[0405] (特征36)根据前述特征32至35中任一项所述的方法,其中确定联网麦克风设备可用于分配给一个或多个回放区域包括:通过第二网络与网络麦克风设备建立通信,其中本
地回放网络是第一网络;从网络麦克风设备接收指示网络麦克风可用于分配给本地回放网
络内的一个或多个回放设备的消息。
[0406] (特征37)根据前述特征32-36中任一项所述的方法,其中确定联网麦克风设备可用于分配给本地回放网络内的一个或多个回放区域包括:通过第二网络与网络麦克风设备
建立通信,其中,本地回放网络是第一网络;通过第二网络向网络麦克风设备发送指示用于加入第一网络的参数的数据;以及在向网络麦克风设备发送指示用于加入第一网络的参数
的数据之后,接收指示网络麦克风设备可用于分配给第一网络内的一个或多个回放区域的
消息。
[0407] (特征38)根据特征36或37所述的方法,其中,通过第一网络从回放设备和网络麦克风设备之一接收消息。
[0408] (特征39)根据特征37或38所述的方法,其中,该消息指示网络麦克风设备连接到第一网络。
[0409] (特征40)根据特征36至39中任一项所述的方法,其中,第二网络是局域网(LAN)和个域网(PAN)之一,优选地根据蓝牙无线技术标准。
[0410] (特征41)根据前述特征32至40中任一项所述的方法,其中,存储所述分配包括向服务器发送消息,以使所述服务器存储所述分配。
[0411] (特征42)根据前述特征32至41中任一项所述的方法,其中,网络麦克风设备对应于唯一标识符,并且其中,存储分配包括存储指示唯一标识符向特定回放区域的分配的数
据。
[0412] (特征43)根据前述特征32至42中任一项所述的方法,还包括:接收指示本地回放网络中的第二回放区域的输入;以及存储网络麦克风设备向第二回放区域的分配,使得网
络麦克风设备被分配给第一特定回放区域和第二回放区域两者。
[0413] (特征44)根据前述特征32至43中任一项所述的方法,其中,网络麦克风设备是本地回放网络中的回放设备的组件。
[0414] (特征45)一种计算机可读存储介质,包括用于由处理器执行的指令,所述指令在被执行时使得处理器实现根据前述特征32至44中任一项所述的方法。
[0415] (特征46)一种计算设备,被配置为用于本地回放网络的控制器设备,该计算设备包括:处理器,被配置为执行前述特征32至44中任一项所述的方法;以及网络麦克风。
[0416] (特征47)一种方法,包括:维护包括指示网络麦克风设备的标识向包括多个回放区域的媒体回放系统的第一回放区域的分配的数据的数据库,每个回放区域包括至少一个
回放设备;接收指示网络麦克风设备的标识和媒体回放命令的第一消息;基于数据库中的
数据和接收到的第一消息来识别第一回放区域;以及向第一回放区域发送指示媒体回放命
令的第二消息。
[0417] (特征48)根据特征47所述的方法,其中,向第一回放区域发送第二消息包括向第一回放区域包括的至少一个回放设备发送第二消息。
[0418] (特征49)根据权利要求48所述的方法,还包括:向第一回放区域包括的多个回放设备中的每个回放设备发送第二消息。
[0419] (特征50)根据特征48所述的方法,其中,发送第二消息包括:选择第一回放区域包括的多个回放设备中的一个回放设备;以及向所选回放设备发送第二消息。
[0420] (特征51)根据前述特征47至50中任一项所述的方法,其中,接收第一消息包括从网络麦克风设备接收指示媒体回放命令的消息。
[0421] (特征52)根据前述特征47至51中任一项所述的方法,其中,从远程服务器接收第一消息。
[0422] (特征53)根据前述特征47至52中任一项所述的方法,其中,识别第一回放区域包括:确定接收到的第一消息未指示第二回放区域;以及响应于确定接收到的消息未指示第
二回放区域,基于网络麦克风设备的标识在数据库中识别第一回放区域。
[0423] (特征54)根据前述特征47至53中任一项所述的方法,其中,数据库中的数据还指示网络麦克风设备的标识向第二回放区域的分配。
[0424] (特征55)根据特征54所述的方法,其中,基于以下中的至少一项来识别第一回放区域:确定第一回放区域与媒体内容相关联;以及确定第二回放区域与媒体内容不相关。
[0425] (特征56)根据特征54所述的方法,其中:识别第一回放区域包括识别第一回放区域和第二回放区域;以及向与所识别的第一回放区域或第二回放区域相关联的至少一个回
放设备发送第二消息。
[0426] (特征57)根据特征54所述的方法,其中:第一消息还指示接近度信息;并且还基于接近度信息来识别第一回放区域。
[0427] (特征58)根据前述特征47至57中任一项所述的方法,还包括:向网络麦克风设备发送第三消息,第三消息指示回放命令被发送以在回放区域中执行。
[0428] (特征59)根据特征58所述的方法,还包括:在发送第三消息之前,从回放区域中的至少一个回放设备接收第四消息,第四消息指示回放区域正在执行回放命令。
[0429] (特征60)根据特征58或59所述的方法,其中,经由第二服务器发送第三消息,其中,计算设备是第一服务器。
[0430] (特征61)根据特征58所述的方法,其中,发送第三消息包括使回放区域中的至少一个回放设备向网络麦克风设备发送第三消息。
[0431] (特征62)一种计算机可读存储介质,包括用于由处理器执行的指令,所述指令在被执行时使得处理器实现根据前述特征47至61中任一项所述的方法。
[0432] (特征63)一种计算设备,包括:处理器;存储有指令的存储器,所述指令可由计算设备执行以执行根据特征47至61中任一项所述的方法。
[0433] (特征64)一种用于计算设备的方法,所述方法包括:从与媒体回放系统相关联的麦克风设备接收包括语音命令的第一消息,其中,所述媒体回放系统包括一个或多个区域;
从一个或多个区域中选择音频响应区域以播放对语音命令的音频响应,其中,所选择的区
域包括一个或多个回放设备;以及使所选择的区域的一个或多个回放设备中的至少一个回
放设备播放音频响应。
[0434] (特征65)根据特征64所述的方法,其中,选择音频响应区域包括基于上下文信息来选择音频响应区域,该上下文信息包括以下中的至少一项:位置信息:定向信息;用户的定向;存在信息;取决于用户位置的配对信息;取决于麦克风设备位置的配对信息。
[0435] (特征66)根据特征65所述的方法,其中,选择音频响应区域包括基于上下文信息动态地选择一个或多个区域中的第一区域作为音频响应区域。
[0436] (特征67)根据特征65或66所述的方法,其中,在接收到语音命令之后收集上下文信息。
[0437] (特征68)根据前述特征64至67中任一项所述的方法,还包括:基于能力信息,来确定是选择预定区域作为第一区域还是动态地选择一个或多个区域中的区域作为第一区域,其中,能力信息包括以下中的至少一项:可用传感器、可用设备、可用网络和可用处理能力。
[0438] (特征69)根据特征68所述的方法,还包括:确定媒体回放系统缺少一个或多个硬件设备;作为响应,基于麦克风设备的配对信息来确定选择预定区域作为音频响应区域。
[0439] (特征70)根据前述特征64至69中任一项所述的方法,还包括:确定音频响应区域被分组以与第二区域进行同步回放;并且其中,使至少一个回放设备播放音频响应包括仅
使音频响应区域播放音频响应。
[0440] (特征71)根据特征65至70中任一项所述的方法,还包括基于上下文信息调整音频响应的回放的音量等级。
[0441] (特征72)根据前述特征64至71中任一项所述的方法,其中,选择音频响应设备包括选择被确定为最靠近用户的设备,其中,最靠近用户的回放设备由以下之一确定:通过比较在两个或更多个不同设备处接收的用户语音的量级来确定最靠近的扬声器;确定两个或
更多个不同设备中的每个设备接收用户语音的时间之间的延迟或时间差。
[0442] (特征73)根据前述特征64至72中任一项所述的方法,其中,选择音频响应设备包括基于检测到的用户定向来选择设备,使得用户面向的设备被选择为音频响应设备。
[0443] (特征74)一种存储有指令的有形的非暂时性计算机可读介质,当由处理器执行时,所述指令使计算设备执行根据前述特征64至73中任一项所述的方法。
[0444] 一种装置,包括处理器,所述处理器被配置为执行根据特征64至73中任一项所述的方法。
[0445] IX.结论
[0446] 以上描述公开了各种示例系统、方法、装置和包括在硬件上执行的固件和/或软件等组件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。
因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
[0447] 本文公开的方法和其他过程可以包括一个或多个操作、功能或动作。尽管以连续顺序示出了框,但是这些框也可以并行执行,和/或以与本文描述的顺序不同的顺序执行。
而且,可以将各种框组合成更少的框,划分成附加框,和/或基于期望的实现来移除。
[0448] 另外,针对本文公开的方法和其他过程和方法,流程图示出了本实施例的一种可能实现的功能和操作。在这方面,每个框可以表示模块、段或程序代码的一部分,该程序代码包括可由处理器执行的一个或多个指令,用于实现过程中的特定逻辑功能或步骤。程序
代码可以存储在任何类型的计算机可读介质上,例如包括磁盘或硬盘驱动器的存储设备。
计算机可读介质可以包括非暂时性计算机可读介质,例如,诸如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)之类的短时间存储数据的计算机可读介质。计算机可读介质
还可以包括非暂时性介质,例如辅助或持久型长期存储装置,如只读存储器(ROM)、光盘或磁盘、光盘只读存储器(CD-ROM)。计算机可读介质还可以是任何其他易失性或非易失性存
储系统。计算机可读介质可以被认为是计算机可读存储介质,例如有形存储设备。另外,附图中的每个框可以表示被连接以执行该过程中的特定逻辑功能的电路。
[0449] 此外,本文对“实施例”的提及意味着结合实施例描述的特定特征、结构或特性可以包括在本发明的至少一个示例性实施例中。在说明书中各处出现该短语不一定都指代相同的实施例,也不是与其他实施例互斥的分离的或备选的实施例。因此,本领域技术人员应当显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例组合。
[0450] 主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦合到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工
作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
[0451] 当随附的任一项权利要求被理解成涵盖纯软件和/或固件的实现时,在此明确限定至少一个示例中的至少一个单元以包括存储软件和/或固件的有形非暂时性介质,如存
储器、DVD、CD、蓝光等。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈