首页 / 专利库 / 人工智能 / 计算幽默 / 生成和分发具有相关情绪的音乐和故事的播放列表

生成和分发具有相关情绪的音乐和故事的播放列表

阅读:27发布:2020-05-12

专利汇可以提供生成和分发具有相关情绪的音乐和故事的播放列表专利检索,专利查询,专利分析的服务。并且实施例 可以涉及获取包含故事的音频文件的 服务器 设备。服务器设备可以确定故事的情绪。服务器设备可以选择包含音乐的音频文件,其中包含音乐的音频文件与指示情绪的音乐属性相关联。服务器设备可以为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。服务器设备可以通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放其中的每个音频文件。,下面是生成和分发具有相关情绪的音乐和故事的播放列表专利的具体信息内容。

1.一种方法,包括:
服务器设备获取包含故事的音频文件,其中客户端设备和所述服务器设备通过广域网相互通信,并且其中所述客户端设备包括音频播放器应用;
基于与包含所述故事的所述音频文件相关联的故事属性,由所述服务器设备确定所述故事的情绪;
基于所述故事的所述情绪,由所述服务器设备选择包含音乐的音频文件,其中包含所述音乐的所述音频文件与指示所述情绪的音乐属性相关联;
由所述服务器设备为所述客户端设备生成播放列表,其中所述播放列表包括(i)对包含所述音乐的所述音频文件的引用,以及(ii)对包含所述故事的所述音频文件的引用;以及
由所述服务器设备通过广域网将所述播放列表传输给所述客户端设备,其中所述客户端设备接收到所述播放列表使得所述音频播放器应用检索并播放包含所述音乐的所述音频文件和包含所述故事的所述音频文件中的每个。
2.根据权利要求1所述的方法,其中,生成包括(i)对包含所述音乐的所述音频文件的引用以及(ii)对包含所述故事的所述音频文件的引用的所述播放列表是基于所述情绪或一天中的时间的。
3.根据权利要求1所述的方法,其中,所述音频播放器应用从所述服务器设备检索包含所述音乐的所述音频文件和包含所述故事的所述音频文件中的每个。
4.根据权利要求1所述的方法,其中,对包含所述音乐的所述音频文件的引用在所述播放列表中排在对包含所述故事的所述音频文件的引用之前,并且其中所述音频播放器应用在检索并播放包含所述故事的所述音频文件之前检索并播放包含所述音乐的所述音频文件的至少一些。
5.根据权利要求1所述的方法,其中,对包含所述音乐的所述音频文件的引用在所述播放列表中排在对包含所述故事的所述音频文件的引用之后,并且其中所述音频播放器应用在检索并播放包含所述故事的所述音频文件之后检索并播放包含所述音乐的所述音频文件的至少一些。
6.根据权利要求1所述的方法,其中所述情绪是快乐、悲伤、幽默、悲惨、愤怒、沮丧、焦虑、孤独、困惑、兴奋、希望或放松中的一种。
7.根据权利要求1所述的方法,其中,选择包含所述音乐的所述音频文件是基于以下中是否存在一个或更多个关键词:(i)与所述音乐相关联的艺术家名字,(ii)与所述音乐相关联的标题,或者(iii)与所述音乐相关联的歌词。
8.根据权利要求1所述的方法,其中,指示所述情绪的所述音乐属性包括表示所述情绪的音乐属性。
9.根据权利要求1所述的方法,其中,所述情绪是第一情绪,并且其中指示所述第一情绪的音乐属性包括:表示不与所述第一情绪相对立的第二情绪的音乐属性。
10.根据权利要求1所述的方法,其中,指示所述情绪的所述音乐属性包括指示以下的音乐属性:(i)特定节奏、特定节拍模式或特定和弦进行与所述情绪相关联,以及(ii)所述音乐中存在特定节奏、特定节拍模式或特定和弦进行。
11.根据权利要求1所述的方法,其中,从附属于所述服务器设备的第三方媒体服务器中检索包含所述音乐的所述音频文件或包含所述故事的所述音频文件中的至少一个。
12.一种方法,包括:
由服务器设备获取包含音乐的音频文件,其中客户端设备和所述服务器设备通过广域网相互通信,并且其中所述客户端设备包括音频播放器应用;
基于与包含所述音乐的所述音频文件相关联的音乐属性,由所述服务器设备确定所述音乐的情绪;
基于所述音乐的所述情绪,由所述服务器设备选择包含故事的音频文件,其中包含所述故事的所述音频文件与指示所述情绪的故事属性相关联;
由所述服务器设备为所述客户端设备生成播放列表,其中所述播放列表包括(i)对包含所述音乐的所述音频文件的引用,以及(ii)对包含所述故事的所述音频文件的引用;以及
由所述服务器设备通过广域网将所述播放列表传输给所述客户端设备,其中所述客户端设备接收到所述播放列表使得所述音频播放器应用检索并播放包含所述音乐的所述音频文件和包含所述故事的所述音频文件中的每个。
13.根据权利要求12所述的方法,其中,所述音乐属性指示所述情绪。
14.根据权利要求13所述的方法,其中,指示所述情绪的所述音乐属性包括指示以下的音乐属性:(i)特定节奏、特定节拍模式或特定和弦进行与所述情绪相关联,以及(ii)所述音乐中存在特定节奏、特定节拍模式或特定和弦进行。
15.一种包括非暂时性计算机可读介质的制品,所述非暂时性计算机可读介质上存储有程序指令,所述程序指令在由服务器设备的处理器执行时使所述服务器设备执行操作,所述操作包括:
获取包含故事的音频文件,其中客户端设备和所述服务器设备通过广域网相互通信,并且其中所述客户端设备包括音频播放器应用;
基于与包含所述故事的所述音频文件相关联的故事属性来确定所述故事的情绪;
基于所述故事的所述情绪来选择包含音乐的音频文件,其中包含所述音乐的所述音频文件与指示所述情绪的音乐属性相关联;
为所述客户端设备生成播放列表,其中所述播放列表包括(i)对包含所述音乐的所述音频文件的引用,以及(ii)对包含所述故事的所述音频文件的引用;以及通过广域网将所述播放列表传输给所述客户端设备,其中所述客户端设备接收到所述播放列表使得所述音频播放器应用检索并播放包含所述音乐的所述音频文件和包含所述故事的所述音频文件中的每个。
16.根据权利要求15所述的制品,其中,生成包括(i)对包含所述音乐的所述音频文件的引用以及(ii)对包含所述故事的所述音频文件的引用的所述播放列表,是基于所述情绪或一天中的时间的。
17.根据权利要求15所述的制品,其中,选择包含所述音乐的所述音频文件是基于以下中是否存在一个或更多个关键词:(i)与所述音乐相关联的艺术家名字,(ii)与所述音乐相关联的标题,或者(iii)与所述音乐相关联的歌词。
18.根据权利要求15所述的制品,其中,指示所述情绪的所述音乐属性包括表示所述情绪的音乐属性。
19.根据权利要求15所述的制品,其中,所述情绪是第一情绪,并且其中指示所述第一情绪的音乐属性包括:表示不与所述第一情绪相对立的第二情绪的音乐属性。
20.根据权利要求15所述的制品,其中,指示所述情绪的所述音乐属性包括指示以下的音乐属性:(i)特定节奏、特定节拍模式或特定和弦进行与所述情绪相关联,以及(ii)所述音乐中存在特定节奏、特定节拍模式或特定和弦进行。

说明书全文

生成和分发具有相关情绪的音乐和故事的播放列表

[0001] 相关申请的交叉引用
[0002] 本申请要求2016年2月12日提交的美国专利申请15/043,073的优先权,后者要求了2016年1月4日提交的美国临时申请62/274,591的优先权,它们的全部内容通过引用并入本文。

背景技术

[0003] 为了收听无线电广播,听众通常将接收机调谐到特定频率(例如,AM或FM频率或卫星频率),收听无线电台在该频率上广播的音乐、新闻或其他可听内容。无线电台生成可听内容的节目,这些节目被同时发送给所有听众。这些节目可以预先生成,也可以实时或以特定方式生成。在某些情况下,这可能会导致组成播放列表的可听内容的各个单元之间出现主题或情感不匹配的情况。或者,播放列表可能会无意中包含可能会冒犯特定听众或者可能会根据当前事件被视为不敏感的素材。发明内容
[0004] 本申请实施例公开了用于生成播放列表的各种机制,使得其中引用的可听内容具有某种形式的主题关联或被布置为具有大致的长度。例如,可以基于特定用户的喜好或已知的关于该用户的信息来选择音乐、新闻和/或广告内容。这些可听内容单元中的至少一些单元可以基于先前或后续单元的属性来选择,使得播放列表的各单元之间存在主题连续性。
[0005] 在某些情况下,这可能意味着可以利用包含音乐(例如,艺术家名称、歌曲标题或歌词内容)的音频文件的属性来选择包含故事(例如新闻故事)的音频文件。反过来,包含故事的音频文件的内容也可以用于选择包含音乐的音频文件。在播放列表中,对包含故事的音频文件的引用可以排在对包含音乐的音频文件的引用之前或之后。
[0006] 因此,第一示例实施例可以涉及:可能基于与客户端设备相关联的简档,服务器设备选择包含音乐的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。可能基于与包含音乐的音频文件相关联的属性,服务器设备可以选择包含故事的音频文件。服务器设备可以为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。服务器设备可以通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每个。
[0007] 第二示例实施例可以涉及:可能基于与客户端设备相关联的简档,服务器设备选择包含故事的文本文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。可能基于包含故事的文本文件内的文本,服务器设备可以选择包含音乐的音频文件。自动文本转语音系统可以将包含故事的文本文件转换为包含故事的音频文件。服务器设备可以为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。服务器设备可以通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每个。
[0008] 在其他情况下,可以对音频文件中的故事进行关键词解析或扫描(例如,在由自动语音转文本系统处理之后)。可以基于是否存在特定关键词来确定故事的情绪(例如,快乐、悲伤、幽默、悲惨)。在一些实施例中,可以对故事的部分或整体进行语义分析,并且可以基于该分析确定故事的情绪。
[0009] 包含音乐的音频文件可以被选择为使得该音频文件具有与故事情绪相同或相似的情绪,或至少具有基于故事情绪的情绪。相反地,与包含音乐的音频文件相关联的情绪可以用来选择包含故事的音频文件。在播放列表中,对包含故事的音频文件的引用可以排在对包含音乐的音频文件的引用之前或之后。
[0010] 因此,第三示例实施例可以涉及服务器设备获取包含故事的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。可能基于与包含故事的音频文件相关联的属性和/或对故事的语义分析,服务器设备可以确定故事的情绪。可能基于故事的情绪,服务器设备可以选择包含音乐的音频文件,其中包含音乐的音频文件与指示情绪的属性相关联。服务器设备可以为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。服务器设备可以通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每个。
[0011] 第四示例实施例可以涉及服务器设备获取包含音乐的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。可能基于与包含音乐的音频文件相关联的属性,服务器设备可以确定音乐的情绪。可能基于音乐的情绪,服务器设备可以选择包含故事的音频文件。与包含故事的音频文件相关联的属性和/或对故事的语义分析可以指示故事的情绪。服务器设备可以为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。服务器设备可以通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每个。
[0012] 在进一步的实施例中,客户端设备可以从服务器设备生成的播放列表中检索并播放音频文件。响应于客户端设备接收到的输入,客户端设备可以确定播放应该在一定时间量内结束。例如,用户可能激活了客户端设备的定时器功能,使得客户端设备在特定数量的分钟内终止播放。响应于该输入,客户端设备可以指示服务器设备生成在大约该特定数量的分钟之后结束的新播放列表。服务器设备可以生成新播放列表并将其提供给客户端设备,并且客户端设备可以开始从该新播放列表中检索并播放音频文件。在一些实施例中,计时器可以是睡眠定时器,并且由新播放列表引用的音频文件可以被选择和/或布置为使得它们有利于睡眠。在其他实施例中,定时器可以测量直到到达目的地或者事件发生(例如公共汽车或火车到达,或约会开始)时剩余的时间量。
[0013] 因此,第五示例实施例可以涉及服务器设备为客户端设备生成第一播放列表。第一播放列表可以包括以第一指定顺序对第一多个音频文件的引用。第一多个音频文件可以播放第一持续时间。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。服务器设备可以通过广域网将第一播放列表传输给客户端设备。客户端设备接收到第一播放列表可以使音频播放器应用以第一指定顺序检索并播放第一多个音频文件中的至少一些。可能在客户端设备播放第一多个音频文件中的当前音频文件时,服务器设备可以从客户端设备接收指令。可能响应于接收到该指令,服务器设备可以生成第二播放列表。第二播放列表可以包括以第二指定顺序对第二多个音频文件的引用,其中第二多个音频文件可以播放小于第一持续时间的第二持续时间。服务器设备可以通过广域网将第二播放列表传输给客户端设备。客户端设备接收到第二播放列表可以使音频播放器应用以第二指定顺序检索并播放第二多个音频文件。
[0014] 在第六示例实施例中,一种制品可以包括非暂时性计算机可读介质,其上存储有程序指令,所述程序指令在由计算设备执行时使得计算设备执行根据第一、第二、第三、第四和/或第五示例实施例的操作。
[0015] 在第七示例实施例中,一种计算设备可以包括至少一个处理器以及存储器和程序指令。程序指令可以存储在存储器中,并且在由至少一个处理器执行时,使计算设备执行根据第一、第二、第三、第四和/或第五示例实施例的操作。
[0016] 在第八示例实施例中,一种系统可以包括用于执行第一、第二、第三、第四和/或第五示例实施例的每个操作的各种装置。
[0017] 尽管本文描述的示例将某些动作由某些设备执行,但任何设备都可以执行这些动作。例如,由上述“服务器设备”执行的动作的部分或全部可以由不同的服务器设备和/或客户端设备执行。
[0018] 通过阅读以下详细描述并适当参考附图,这些以及其他实施例、方面、优点和替代方案对于本领域普通技术人员而言将变得显而易见。此外,应该理解的是,本文提供的该发明内容以及其他描述和附图旨在仅通过示例来说明实施例,并且因此可以有多种变型。例如,在所要求保护的实施例的范围内,能够重新排列、组合、分配、省略或以其他方式改变结构元素和处理步骤。

附图说明

[0019] 图1是根据示例实施例的客户端-服务器计算系统的高级描述。
[0020] 图2示出根据示例实施例的计算设备的示意图。
[0021] 图3示出根据示例实施例的联网服务器集群的示意图。
[0022] 图4描绘了根据示例实施例的播放列表。
[0023] 图5A是根据示例实施例的描绘生成播放列表的消息流图。
[0024] 图5B是根据示例实施例的描绘播放由播放列表引用的音频文件的消息流图。
[0025] 图6是根据示例实施例的生成和分发播放列表的流程图
[0026] 图7是根据示例实施例的生成和分发播放列表的流程图。
[0027] 图8是根据示例实施例的情绪之间的关系的表格。
[0028] 图9是根据示例实施例的生成和分发播放列表的流程图。
[0029] 图10是根据示例实施例的生成和分发播放列表的流程图。
[0030] 图11是根据示例实施例的时序图。
[0031] 图12是根据示例实施例的生成和分发播放列表的流程图。

具体实施方式

[0032] 本文描述了示例性方法、设备和系统。应该理解的是,本文使用词语“示例”和“示例性”来表示“用作示例、实例或说明”。本文描述为“示例”或“示例性”的任何实施例或特征不一定被解释为比其他实施例或特征优选或有利。在不脱离本文提出的主题范围的情况下可以使用其它实施例,也可以做出其他改变。
[0033] 因此,本文描述的示例实施例并不是限制性的。容易理解,能够对本文大体描述的以及在附图中示出的本公开的各方面以各种不同配置进行布置、替换、组合、分离和设计。例如,在替代实施例中,分配给特定设备(例如,服务器设备)的步骤、或动作可以由另一设备(例如,客户端设备)的组件来执行。
[0034] 此外,除非上下文另有说明,否则每个附图中示出的特征可以彼此组合使用。因此,附图一般应该被视为一个或更多个总体实施例的组成部分,理解为并非所有示出的特征对于每个实施例都是必需的。
[0035] 1.概述
[0036] 与传统的广播无线电不同,在线(例如,基于互联网的)无线电可以将音频内容传输给单独的客户端设备或客户端设备组。因此,这种音频内容能够针对不同的用户或用户组进行个性化。例如,服务器设备可以基于已知的、一个或更多个用户的喜好或属性来生成播放列表。该播放列表可以包含对一个或更多个远程音频文件的一系列引用(例如统一资源定位符或URL)。这样的播放列表可以传输给用户的客户端设备。客户端设备可以遍历播放列表,检索和播放音频文件。这样做时,客户端设备可以在播放音频文件之前(从服务器设备或不同的设备)下载一个或更多个音频文件,或者可以将音频文件作为流接收。
[0037] 在本文中,下载音频文件可以指客户端设备在开始播放音频文件的任何部分之前从服务器设备获取整个音频文件。另一方面,音频文件的流式传输可以涉及客户端设备接收音频文件的一部分,并且同时播放音频文件的另一、先前接收的部分。
[0038] 作为示例,在服务器设备生成播放列表之后或者当服务器设备生成播放列表时,服务器设备可以将播放列表传输给客户端设备,客户端设备可以遍历播放列表的条目。这样做时,客户端设备可以检索表示每个引用音频文件的数据,并根据播放列表定义的序列播放音频文件。因此,对于播放列表所定义的序列中的每个引用,(i)客户端设备可以向服务器设备(或不同的设备)传输对引用音频文件的请求,(ii)服务器设备可以接收传输来的请求,(iii)响应于服务器设备接收到传输来的请求,服务器设备可以向客户端传输所请求的音频文件的流,(iv)客户端设备可以开始接收和缓冲音频文件的流,以及(v)当正在接收音频文件流时,客户端设备可以播放音频文件的接收到的部分。以这种方式,可以为用户基本连续地播放该播放列表所引用的音频文件。
[0039] 尽管个性化音频节目具有优势,但由计算机生成的播放列表可能会带来一些挑战。例如,计算机生成的播放列表可能不会展示音频文件之间的主题连续性。因此,音频文件的选择和排序可能看起来也是随机的,即使这些音频文件可能是(以某种方式)基于用户的简档选出的。
[0040] 本申请实施例有助于基于专题关联选择要包括在播放列表中的音频文件及其排序。因此,新闻故事的主题可能会影响对序列中新闻故事之后的音乐的选择。类似地,音乐的特征(例如,基于节奏、音量、艺术家名字、歌曲标题和/或歌词内容确定的特征)可以影响对序列中音乐之后的新闻故事的选择。在一些情况下,可以组合一个以上这样的特征来确定两个或更多个音频文件的内容之间的总体相似性。可替选地或另外地,在播放列表的各个部分中所使用的特征可以不同。例如,可以使用艺术家名字作为前三个条目之间的相似性特征,歌曲标题可以作为接下来的四个条目之间的相似性特征,等等。
[0041] 此外,新闻故事的情绪(例如,快乐、悲伤、不幸、幽默)可能影响序列中新闻故事之后的音乐的选择。同样,音乐的情绪可能会影响序列中音乐之后的新闻故事的选择。在某些情况下,服务器设备可以尝试匹配新闻故事和音乐的情绪,或者服务器设备可以选择新闻故事和音乐的情绪使得这些情绪不会相互对立。在其他情况下,服务器设备可以选择这些情绪以使它们相互对立。一般而言,服务器设备可以选择新闻故事和音乐中的一个,使得其情绪以某种方式基于另一个的情绪。
[0042] 在各实施例中,新闻故事最初可以以文本格式存在(例如,纯文本文件或标记语言文件)。当新闻故事被选择包括在播放列表中时,服务器设备可以判断是否存在该新闻故事的音频版本,如果不存在,则服务器设备可以使用文本转语音(例如,语音生成)技术来自动地生成新闻故事的音频文件。反过来,为了确定音频文件格式的新闻故事的情绪,服务器设备可以使用语音转文本(例如,语音识别)技术来自动生成新闻故事的文本文件。然后,可以基于文本文件的内容来确定新闻故事的情绪。
[0043] 在一些实施例中,服务器设备可能已经生成了播放列表,并且客户端设备可能正在播放播放列表中所引用的音频文件。服务器设备可以从客户端设备接收客户端设备已被指示在未来某个时刻终止音频播放的指示。例如,客户端设备的用户可能激活了客户端设备的睡眠定时器功能。作为响应,服务器设备可以生成新的播放列表,该新播放列表大致匹配客户端设备被安排终止播放之前剩余的时间长度。可以对该新播放列表引用的媒体进行选择和排序,以便在播放即将结束时让听众放松而入眠。例如,媒体的动态范围可以逐渐变窄,和/或音频的节奏可以逐渐变慢。在其他实施例中,定时器可以测量直到到达目的地或者事件发生(例如公共汽车或火车到达,或约会开始)时剩余的时间量。
[0044] 以上或本文其他地方描述的任何实施例可以以各种方式进行组合。因此,在一些实现方式中,可以用主题相关的媒体填充响应于前述定时器功能的激活而生成的新播放列表。
[0045] 尽管本文描述的实施例关注于生成用于音频播放的音频文件的播放列表,但是也能够使用相同或类似的实施例来生成用于音频/视频播放的音频/视频文件(例如,电视新闻节目、娱乐节目、广告片、电影等)的播放列表。因此,所描述的实施例不限于音频文件,而是可以应用于其他类型的媒体。
[0046] 不管实现方式如何,本文中的实施例都可以利用一个或更多个计算设备。这些计算设备可以包括,例如在用户控制下的客户端设备以及与客户端设备直接或间接交互的服务器设备。这些设备在下一节中介绍。
[0047] 2.示例计算设备和基于的计算环境
[0048] 图1示出了用于执行本文描述的一个或更多个实施例的示例通信系统100。通信系统100可以包括计算设备。这里,“计算设备”可以指客户端设备、服务器设备(例如,独立服务器计算机或服务器设备的联网集群)或某种其他类型的计算平台。
[0049] 客户端设备102可以是包括个人计算机、便携式计算机、可穿戴计算设备、无线计算设备、头戴式计算设备、移动电话或平板计算设备等的任何类型的设备,其被配置为根据本文描述的实施例将数据106传输给服务器设备104和/或从服务器设备104接收数据108。例如,在图1中,客户端设备102可以经由一个或更多个有线或无线接口与服务器设备104进行通信。在一些情况下,客户端设备102和服务器设备104可以经由局域网相互通信。或者,客户端设备102和服务器设备104可以各自位于不同的网络内,并且可以经由诸如因特网的广域网进行通信。
[0050] 客户端设备102可以包括用户界面通信接口、主处理器和数据存储器(例如存储器)。数据存储器可以包含可由主处理器执行的指令,用于执行一个或更多个操作,诸如与将数据发送给服务器设备104或从服务器设备104接收数据有关的操作,和/或本文公开的其他操作。客户端设备102的用户界面可以包括按钮、触摸屏、麦克和/或任何其他用于接收输入的元件,以及扬声器、一个或更多个显示设备和/或任何其他用于传送输出的元件。
[0051] 服务器设备104可以是布置成执行本文描述的服务器操作的任何实体或计算设备。此外,服务器设备104可以配置成向客户端设备102发送数据108和/或从客户端设备102接收数据106。
[0052] 数据106和数据108可以采取各种形式。例如,数据106和108可以分别表示由客户端设备102或服务器设备104传输的作为一个或更多个通信会话的一部分的数据包。这样的通信会话可以包括在信令级传输的数据包(例如,会话建立、管理和消息拆除),和/或在媒体级传输的数据包(例如,文本、图形、音频和/或视频数据)。例如,数据106可以包括对播放列表和音频文件流的请求的传输,而数据108可以包括响应于这些请求包括播放列表和音频文件流的传输。
[0053] 不管确切的架构如何,客户端设备102、服务器设备104的操作以及与图1的架构相关联的任何其他操作都能够由一个或更多个计算设备来执行。这些计算设备可以以独立方式、基于云(联网)的计算环境或其他布置来组织。
[0054] 图2是例示计算设备200的简化框图,示出了能够包括在布置成根据本文的实施例进行操作的计算设备中的一些功能组件。示例计算设备200可以是客户端设备、服务器设备或一些其他类型的计算平台。简单起见,本说明书可以将计算设备200不时地等同于服务器。尽管如此,对计算设备200的描述可以应用于为了本文描述的目的所使用的任何组件。
[0055] 在该示例中,计算设备200包括处理器202、数据存储器204、网络接口206以及输入/输出功能208,它们都可以通过系统总线210或类似的机制耦合。处理器202能够包括一个或更多个CPU,诸如一个或更多个通用处理器和/或一个或更多个专用处理器(例如,专用集成电路(ASIC)、数字信号处理器(DSP)、网络处理器等)。
[0056] 数据存储器204又可以包括易失性和/或非易失性数据存储器,并且能够整体地或部分地与处理器202集成。数据存储器204能够保存可由处理器202执行的程序指令以及可由这些指令操纵的数据,以执行本文所述的各种方法、过程或操作。或者,这些方法、过程或操作能够由硬件固件和/或硬件、固件和软件的任何组合来定义。
[0057] 作为示例,数据存储器204中的数据可以包含程序指令,该程序指令可能存储在非暂时性计算机可读介质上,其可由处理器202执行以实现本说明书或附图中公开的任何方法、过程或操作。数据存储器204还可以包含一个或更多个播放列表和/或可能由播放列表引用的音频文件。
[0058] 网络接口206可以采用有线连接的形式,诸如以太网、令牌环或T载波连接。网络接口206也可以采用无线连接的形式,诸如IEEE 802.11(WiFi)、蓝牙或广域无线连接。然而,可以在网络接口206上使用其他形式的物理层连接和其他类型的标准或专有通信协议。此外,网络接口206可以包括多个物理接口。
[0059] 输入/输出功能208可以帮助用户与示例计算设备200交互。输入/输出功能208可以包括多种类型的输入设备,诸如键盘鼠标、触摸屏等等。类似地,输入/输出功能208可以包括多种类型的输出设备,诸如屏幕、显示器、打印机或一个或更多个发光二极管(LED)。另外地或可选地,示例计算设备200可以支持另一设备经由网络接口206或者经由诸如通用串行总线(USB)或高清多媒体接口(HDMI)端口的另一接口(未示出)的远程访问
[0060] 在一些实施例中,一个或更多个计算设备可以部署在联网架构中。计算设备的确切物理位置、连接性和配置对于客户端设备可能是未知的和/或不重要的。因此,计算设备可以指的是可以安置在各个远程位置处的“基于云的”设备。
[0061] 图3描绘了根据示例实施例的基于云的服务器集群304。在图3中,服务器设备(诸如服务器设备104(如由计算设备200例示))的功能可以分布在服务器设备306、集群数据存储器308和集群路由器310之间,它们可以通过本地集群网络312连接。服务器集群304中的服务器设备、集群数据存储器和集群路由器的数量可以取决于分配给服务器集群304的计算任务和/或应用。
[0062] 例如,服务器设备306能够配置成执行计算设备200的各种计算任务。因此,计算任务能够分布在一个或更多个服务器设备306之间。只要能够并行执行这些计算任务,这样的任务分配就可以减少完成这些任务并返回结果的总时间。简单起见,服务器集群304和单个服务器设备306可以被称为“服务器设备”。该术语应该被理解为意指在服务器设备操作中可能涉及一个或更多个不同的服务器设备、数据存储设备和集群路由器。
[0063] 集群数据存储器308可以是包括磁盘阵列控制器的数据存储阵列,该磁盘阵列控制器配置成管理对磁盘驱动器组(例如,具有旋转盘片的硬盘驱动器或固态驱动器)的读取和写入访问。磁盘阵列控制器也可以配置成单独或与服务器设备306一起管理存储在集群数据存储器308中的数据的备份或冗余副本,以防止磁盘驱动器故障或其他类型的阻止一个或更多个服务器设备306访问集群数据存储器308的单元的故障。作为示例,集群数据存储器308可以包含一个或更多个播放列表和/或可能由播放列表引用的音频文件。
[0064] 集群路由器310可以包括配置成为服务器集群提供内部和外部通信的网络设备。例如,集群路由器310可以包括一个或更多个包交换和/或路由设备,其被配置为提供(i)服务器设备306与集群数据存储器308之间经由集群网络312的网络通信,和/或(ii)服务器集群304和其他设备之间经由通信链路302到网络300的网络通信。
[0065] 另外,集群路由器310的配置能够至少部分地基于:服务器设备306和集群数据存储器308的数据通信需求,本地集群网络312的延迟和吞吐量,通信链路302的延迟、吞吐量和成本,和/或可能有助于系统架构的成本、速度、容错、弹性、效率和/或其他设计目标的其他因素。
[0066] 作为可能的示例,集群数据存储器308可以包括任何形式的数据库,诸如结构化查询语言(SQL)数据库。各种类型的数据结构可以将信息存储在这样的数据库中,包括但不限于表、数组、列表、树和元组。此外,集群数据存储器308中的任何数据库可以是整体的或分布在多个物理设备上。
[0067] 服务器设备306可以配置成向集群数据存储器308传输数据,以及从集群数据存储器308接收数据。这种传输和取回可以分别采用SQL查询或其他类型的数据库查询以及这些查询的输出的形式。其他文本、图像、视频和/或音频也可以包含在内。此外,服务器设备306可以将接收到的数据组织成网页表示。这样的表示可以采用标记语言的形式,例如超文本标记语言(HTML)、可扩展标记语言(XML)或某种其他标准化或专有格式。此外,服务器设备306可以具有执行各种类型的计算机化脚本语言的能,诸如但不限于Perl、Python、PHP超文本预处理器(PHP)、动态服务器页面(ASP)、JavaScript等等。用这些语言编写的计算机程序代码可以有助于向客户端设备提供网页,以及客户端设备与网页的交互。
[0068] 3.示例播放列表和流式传输环境
[0069] 图4描绘了示例播放列表400,其包含对音频文件的两个或更多个引用的序列。播放列表400可以采用计算机文件的形式,诸如纯文本文件、可扩展标记语言(XML)文件、超文本标记语言(HTML)文件、二进制文件或某种其他文件格式。播放列表也可以采用其他形式,并且可以包含其他类型的内容。
[0070] 在一些情况下,播放列表400可以由服务器设备(诸如服务器设备104)为特定客户端设备(诸如客户端设备102)生成。这样做时,服务器设备104可以考虑存储在服务器设备104处或服务器设备104可访问的客户端设备102的简档中的信息。例如,该简档可以包括对客户端设备102的用户的喜好的表示,诸如喜欢的新闻类型、喜欢的音乐风格、喜欢的流式传输音频文件的比特率和/或音频质量等等。在其他情况下,可以基于这些设备中的至少一些设备的简档中的信息为一组一个或更多个客户端设备生成播放列表400。
[0071] 此外,如下更详细描述的,服务器设备104可以生成播放列表400,使得其中引用的音频文件在内容和/或情绪方面主题上一致。可替换地,服务器设备104可以生成播放列表400,使得其中引用的音频文件至少主题上一致。
[0072] 播放列表400中的每个条目可以包括音频文件的标识符和/或对音频文件的引用。播放列表400中引用的音频文件可以存储在数据库402中。因此,例如,播放列表400中引用的新闻故事1包含指向新闻故事1的音频文件的位置的URL,而播放列表400中引用的歌曲1包含指向歌曲1的音频文件的位置的URL,等等。尽管如此,播放列表可以采用其他形式,包括对文件的引用或文件的通用序列。
[0073] 通常,数据库402可以包含数百、数千、数万或甚至更多的音频文件。因此,数据库402可以表示存储这些文件的一个或更多个物理设备。这样的物理设备可以位于相同的物理位置,也可以分布在通信网络(例如,因特网)上。在某些情况下,音频文件可以通过第三方文件下载或流媒体服务获取。
[0074] 播放列表400包含对四个新闻故事的引用,这四个新闻故事的引用与五段音乐的引用大致交错。然而,播放列表可以包含更多或更少的条目。此外,新闻故事和音乐的模式可能会不同。在某些情况下,播放列表可能主要包含对新闻故事的引用,而对音乐的引用很少,而在其他情况下,播放列表可能主要包含对音乐的引用,而对新闻故事的引用很少。
[0075] 播放列表400中引用的新闻故事和音乐的混合可以表示“上午驾驶时段”的内容风格,其中口语节目中穿插着音乐。因此,播放列表400中引用的“新闻故事”可以包括关于当前事件、天气、交通、幽默片段、玩笑、广告等的信息。播放列表内容的其他排列也是可能的。
[0076] 在一些实施例中,音乐和/或故事可以在一定程度上重复。然而,重复故事通常不如重复音乐更可取。另一方面,重复包含广告的故事可能是可取的。
[0077] 图5A是描述示例性的生成和分发播放列表的消息流图500。流程图500包括客户端设备102、服务器设备104、简档数据库502、文本故事数据库504和音频数据库506。在一些实施例中,服务器设备104、简档数据库502、文本故事数据库504和音频数据库506中的一个或更多个可被组合成更少的组件或被分成更多的组件。作为两个可能的示例,服务器设备104可以包含简档数据库502、文本故事数据库504和音频数据库506的功能,或者简档数据库502、文本故事数据库504和音频数据库506中的每一个可以分布在多个物理计算设备上。也可以由其它布置。
[0078] 客户端设备102可以包括音频播放器应用,该音频播放器应用可以请求播放列表、加载播放列表、解析播放列表和/或请求播放列表中引用的音频文件的流。在一些实施例中,可以触发音频播放器应用以通过接收播放列表来开始请求并流式传输音频文件。
[0079] 在步骤510,客户端设备102可以向服务器设备104传输播放列表请求。该请求可能没有明确地寻找特定的播放列表,而是可以请求为客户端设备104的用户流式传输个性化无线电台。在步骤512,服务器设备104可以向简档数据库502传输针对客户端设备104的简档的简档请求。在步骤514,简档数据库502可以将该简档的表示传输给服务器设备104。
[0080] 简档可以包括关于客户端设备104的用户的信息及其在无线电节目方面的喜好。例如,简档可以包括用户的个人背景信息、关于用户新闻兴趣、电子商务交易、用户最喜爱的音乐风格、最喜爱的体育团队的信息,等等。至少部分地基于简档中的信息,服务器设备
104可以为播放列表选择故事和音乐。
[0081] 因此,在步骤516,服务器设备104可以评估和选择文本故事数据库504中的文本故事。类似地,在步骤518,服务器设备104可以评估和选择音频数据库506中的音频文件。例如,文本故事数据库504可以包括包含新闻故事的文本文件。音频数据库506可以包括新闻故事和/或音乐的音频文件。在未示出的一些实施例中,包含新闻故事的音频文件可以存储在一个物理数据库或逻辑数据库中,而包含音乐的音频文件可以存储在不同的物理数据库或逻辑数据库中。
[0082] 在包含新闻故事的一个或更多个文本文件被选择包括在播放列表中的情况下,在步骤520,服务器设备104(或另一设备)可以通过文本转语音(TTS)技术将这些文本文件转换为音频文件。这种TTS技术可以自动将文本文件中的词和/或音节转换成合成言语。在步骤522,将任何经转换的新闻故事的音频文件存储在音频数据库506中。
[0083] 在步骤524,服务器设备104可以生成播放列表。如在播放列表400的描述中所讨论的,所生成的播放列表可以包括对存储在音频数据库506中的音频文件的引用的序列。然后,在步骤526,可以将播放列表传输给客户端设备102。
[0084] 图5B是描绘播放列表中引用的音频文件的示例播放的消息流图528。从图5A停止的地方继续,在步骤530,客户端设备102可以向音频数据库506传输对播放列表的第一条目的请求。例如,客户端设备102可以解析播放列表,确定第一条目的URL,并且向音频数据库506请求该URL处的内容。作为响应,在步骤532,音频数据库506可以向客户端设备102传输与该条目相关联的音频文件的流。然后,在步骤534,客户端设备102可以播放该流。
[0085] 值得注意的是,在开始播放该流之前,客户端设备102可以接收并缓冲该流的一部分(例如,5-10秒)。以这种方式,如果在向客户端设备102传送流的后续部分的过程中存在抖动,则通过缓冲该流可以对用户隐藏该抖动。客户端设备102可以试图通过播放所有音频文件来保持该缓冲。
[0086] 在步骤536,客户端设备102可以向音频数据库506传输对播放列表的第二条目的请求。客户端设备102可以在仍然播放与第一条目相关联的音频文件的一部分的同时传输该请求。以这种方式,客户端设备102能够从播放与第一条目相关联的音频文件平滑地过渡到播放与第二条目相关联的音频文件。例如,音频播放器应用可以淡出与第一条目相关联的音频文件的结尾,同时淡入与第二条目相关联的音频文件的开头。
[0087] 无论如何,在步骤538,音频数据库506可以向客户端设备102传输与第二条目相关联的音频文件的流。然后,在步骤540,客户端设备102可以播放该流。
[0088] 图5A和5B仅是生成播放列表和流式传输音频文件的示例实施例。可以使用其他实施例来获得相同或相似的结果。
[0089] 4.生成具有相关音乐和故事的播放列表
[0090] 计算机生成的播放列表的一个可能的缺点是选择包含在给定播放列表中的故事和音乐可能是不相关的。然而,这些播放列表的生成提供了将其中的条目在主题上相关联的机会。例如,播放列表中的每个条目的属性或特性可以用作选择播放列表中的其他条目的基础,或者用于对先前选择的条目进行排序。
[0091] 例如,包含故事的文本文件中的文本可用于选择播放列表中的其他条目(故事或音乐)。此外,包含音乐的音频文件可以包括一个或更多个属性或与一个或更多个属性相关联。这些属性可以作为能够包含在音频文件或与音频文件配对的另一个文件中的元数据存在。这样的属性可以包括音频文件和/或其中包含的音乐的各种描述符,例如创作和/或演奏音乐的艺术家的名字、音乐的标题(例如歌曲标题)、音乐的歌词、音乐的长度、音乐的发行人(例如,唱片公司)、音乐的录制地点等等。这些属性的任何一个都可以用于选择播放列表中的其他条目(故事或音乐)。
[0092] 在一些实施例中,播放列表可以具有预定义的主题(例如,关注于音乐的播放列表的“经典摇滚”主题、涉及音乐和/或与特定艺术家的访谈的播放列表的“艺术家”主题、或与特定足球事件或团队有关的故事和/或音乐的“足球”主题)。当播放列表与这样的主题相关联时,可以基于主题以及播放列表中的其他条目来选择播放列表中的条目。
[0093] 当出于特定原因(例如,确定与先前音频文件的内容有关)而选择音频文件时,可以将该原因显示给播放音频文件的客户端设备的用户。此外,可以赋予用户(例如,通过用户界面)表达对音频文件之间的某些类型的关系的喜好的能力。例如,用户可以指示所用的关系(i)是可接受的,(ii)不应该再次使用,或者(iii)应该用不同的关系代替。
[0094] A.基于音乐选择故事
[0095] 基于用户简档中的信息,可以选择包含音乐的音频文件以包括在播放列表中。例如,用户简档可以指示先前为其生成播放列表的用户表示对音乐风格或演奏音乐的艺术家感兴趣。
[0096] 音频文件的任何属性都可用于选择播放列表中音频文件之前或之后的故事。作为示例,艺术家名字可以用于查找关于该艺术家的新闻故事,并且将对该新闻故事的引用放在播放列表中对包含该音乐的音频文件的引用之前或之后的位置。如果用户对艺术家感兴趣,则选择的故事也可能是用户感兴趣的。例如,所选故事可以包括艺术家的巡回演出日期,或者该艺术家即将发行专辑的新闻。
[0097] 在某些情况下,也可以根据用户简档中的信息(用户的位置和/或购买历史)来选择故事。例如,可以选择包括巡回演出日期的故事,因为这些巡回演出日期中的一个或更多个在地理位置上靠近用户的位置(例如,距离用户家50英里的阈值距离内)。可替代地或另外地,可以选择即将发行专辑的新闻,因为用户的购买历史中包括购买了艺术家的另一张专辑或歌曲。
[0098] 基于与包含音乐的音频文件相关联的属性来选择故事的其他示例是可能的。例如,标题或歌词可以用作选择故事的基础。特别地,服务器设备可以识别出现在标题或歌词中的关键字或关键词,然后可以用这些关键字或关键词作为搜索引擎的输入。搜索引擎可以返回一个或更多个与关键字或关键词相关的故事。例如,如果标题或歌词包含“车”、“卡车”、“驾驶”或“正在驾驶”等词,搜索引擎可能会返回对有关汽车、驾驶、道路或交通状况的一个或更多个故事的引用。此外,搜索引擎还可以返回对包含汽车销售的广告的一个或更多个故事的引用。
[0099] 在所选故事存在于文本文件中的情况下,服务器设备可以使用TTS技术将文本文件转换为包含故事的音频文件,将该音频文件存储在数据库中,并且将对存储的音频文件的引用包括在播放列表中。
[0100] 图6是示出示例实施例的流程图。图6所示的过程可以由服务器设备(诸如计算设备200)和/或计算设备集群(诸如服务器集群304)来执行。但是,该过程也能够由其他类型的设备或设备子系统来执行。
[0101] 框600可以涉及:可能基于与客户端设备相关联的简档来选择包含音乐的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。
[0102] 框602可以涉及:可能基于包含音乐的音频文件的属性来选择包含故事的文本文件。框604可以涉及:通过自动文本转语音系统将包含故事的文本文件转换为包含故事的音频文件。在一些情况下,框602和604可以通过直接选择包含故事的音频文件来替换。如果音频文件与描述其内容的一个或更多个属性相关联,则可能会发生这种情况。
[0103] 框606可以涉及:为客户端设备生成播放列表,其中播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。框608可以涉及:通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每一个。音频播放器应用可以从服务器设备检索包含音乐的音频文件和包含故事的音频文件中的每一个。
[0104] 在某些情况下,包含故事的文本或音频文件也可以基于该包含故事的文本或音频文件可从附属于服务器设备的第三方媒体服务器获取来选择。换句话说,包含故事的文本或音频文件可以从媒体服务器选择,该媒体服务器不是由运行或拥有生成播放列表的服务器设备的实体运行或拥有的。
[0105] 属性可以是与音乐相关联的艺术家名字、与音乐相关联的歌曲标题和/或与音乐相关联的歌曲歌词中的一个。但是,也可以是其他属性。包含故事的文本或音频文件可以基于该属性在该包含故事的文本或音频文件中或与该包含故事的文本或音频文件相关联来选择。可替选地或另外地,该属性可以与特定地理区域相关联,并且包含故事的文本或音频文件可以基于该包含故事的文本或音频文件包括与特定地理区域相关的文本或与特定地理区域相关联来选择。
[0106] 在其他实施例中,与客户端设备相关联的简档可以包含客户端设备的位置的指示,并且可以选择包含音乐的音频文件,使得属性与客户端设备的位置相关。或者,可以基于与在即将到来的时间段内(例如,在接下来的几天或几周内)在客户端设备的位置的预定距离内演奏的音乐相关联的艺术家来选择包含音乐的音频文件。
[0107] 在一些实施例中,对包含音乐的音频文件的引用可以在播放列表中排在对包含故事的音频文件的引用之前。因此,音频播放器应用可以在检索并播放包含故事的音频文件之前检索并播放包含音乐的音频文件的至少一些。可替选地,对包含音乐的音频文件的引用可以在播放列表中排在对包含故事的音频文件的引用之后。在这种情况下,音频播放器应用可以在检索并播放包含故事的音频文件之后检索并播放包含音乐的音频文件的至少一些。
[0108] 在一些实施例中,与客户端设备相关联的简档可以包含优选语言,并且可以选择包含音乐的音频文件,使得其中的至少一些歌唱采用优选语言。属性可以指示音乐的歌唱部分中的至少一些采用优选语言,并且包含故事的文本或音频文件可以基于该故事的至少部分采用优选语言来选择。
[0109] B.基于故事选择音乐
[0110] 代替或者除了基于与音频文件相关联的属性来选择故事之外,还可以基于故事的内容来选择音频文件。这可能涉及:基于用户的简档选择包含故事的文本文件,然后基于文本文件的内容选择包含音乐的音频文件。例如,可以基于用户的个人背景、兴趣、位置、购买历史和/或其他因素来选择文本文件。
[0111] 服务器设备可以识别出现在文本文件中的关键字或关键词,然后可以用这些关键字或关键词作为搜索引擎的输入。搜索引擎可以返回对包含与关键字或关键词相关的音乐的一个或更多个音频文件的引用。例如,搜索引擎可以搜索与音频文件相关联的属性中的关键字或关键词。例如,如果文本文件包含“汽车”、“卡车”或“驾驶”或“正在驾驶”等字样,则搜索引擎可以返回对具有关于汽车和驾驶的艺术家名字、歌曲标题或歌词的一个或更多个音频文件的引用。在一些实施例中,可以对文本文件进行语义分析以确定其中的词的意思或主题。语义分析可以涉及将句法结构(例如短语、从句、句子、段落等)与其语言无关的含义相关联。这样,文本或音频文件中的词可以在其中其他词的上下文中考虑。这种分析的结果可以用来选择文本的一种或更多种情绪。
[0112] 此外,服务器设备可以使用TTS技术将文本文件转换为包含故事的音频文件,将该音频文件存储在数据库中,并且将对存储的音频文件的引用包括在播放列表中。
[0113] 图7是示出示例实施例的流程图。与图6类似,图7所示的过程可以由服务器设备(诸如计算设备200)和/或计算设备集群(诸如服务器集群304)来执行。但是,该过程也能够由其他类型的设备或设备子系统来执行。
[0114] 框700可以涉及:可能基于与客户端设备相关联的简档来选择包含故事的文本文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。
[0115] 框702可以涉及:可能基于包含故事的文本文件中的文本来选择包含音乐的音频文件。可以基于与和音乐相关联的艺术家名字、歌曲标题或歌词之一匹配的文本来选择包含音乐的音频文件。框704可以涉及:通过自动文本转语音系统将包含故事的文本文件转换为包含故事的音频文件。
[0116] 在一些情况下,框700、702和704中的至少部分可以通过直接选择包含故事的音频文件来替换。如果音频文件与描述其内容的一个或更多个属性相关联,则可能会发生这种情况。在这些情况下,可能不需要单独的转换块。
[0117] 框706可以涉及:为客户端设备生成播放列表。播放列表可以包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。框708可以涉及:通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每一个。
[0118] 可以通过去除图6和图7所示的任何一个或更多个特征来简化其中的实施例。此外,这些实施例可以彼此组合,以及与任何前述附图的特征、方面和/或实施方式或本文中另外描述的特征、方面和/或实施方式组合。
[0119] 5.生成具有相关音乐和故事情绪的播放列表
[0120] 计算机生成的播放列表的另一个可能的缺点是:选择以包含在给定播放列表中的故事和音乐可能具有不同的情绪。一些情绪之间的过渡可能会让听众感到不和谐。例如,如果播放列表中的新闻故事是关于安静冥想的好处,但播放列表中引用的前一个或下一个音频文件包含一段大声的驾车音乐,则这些条目的排序可能看起来不合适。
[0121] 更糟糕的是,计算机生成的播放列表可能会将有关悲剧的新闻故事放在歌词在悲剧背景下不敏感的一段音乐的前面或后面。举例而言,如果新闻故事是关于枪击事件或者枪击行凶者的审判的报道,而这个新闻故事之后的歌曲的歌词是对枪支、死亡或违法的美化或关于这些的笑话,则看起来该歌曲是在嘲笑这场悲剧。播放列表中条目的这种排列可能会让听众感到不快。
[0122] 然而,用计算机生成播放列表提供了如下机会:选择播放列表中的条目,使得顺序排列的音乐和故事的情绪是相关的。在某些情况下,这意味着播放列表中条目的情绪基于播放列表中的一个或更多个先前条目的情绪。例如,播放列表中的条目i的情绪可以与播放列表中的条目i-1的情绪相似或相同,或者条目i的情绪可以与条目i-1的情绪相反。这样做可以把新闻故事的文本内容以及音乐内容考虑在内。
[0123] 故事的情绪可以由某些关键字和/或关键词的存在或缺失决定。如上所述,可以对文本文件进行语义分析以确定其中的词的意思或主题。这种分析的结果可以用来选出文本的一种或更多种情绪。对于音频故事,可以替代地或者也可以使用说话者的声音特征,诸如韵律信息(例如,声音的语调、对某些音节或词的强调)。
[0124] 在某些情况下,可以使用语音转文本(语音识别)技术将包含故事的音频文件转换为包含故事的文本文件。然后,可以分析这些文本文件中与一种或更多种情绪相关联的关键字和关键词和/或语义信息。在某些情况下,人们可以手动确定故事的一种或更多种情绪。然后可以将包含故事的音频文件与识别的情绪相关联。例如,可以将情绪作为元数据包含在音频文件中,或者包含在与相应音频文件相关的单独文件中。
[0125] 一段音乐的情绪可以通过艺术家名字、歌曲标题和/或音乐的歌词中是否存在某些关键字和/或关键词,以及节奏、动态范围和/或音乐的音量来确定。如上所述,包含音乐的音频文件可以与包含这些特征的文本表示的元数据相关联。
[0126] 与故事的文本表示无异,可以分析该元数据的与一种或更多种情绪关联的关键字和关键词。在某些情况下,人们可以手动确定一段音乐的一种或更多种情绪。然后可以将包含音乐的音频文件与识别的情绪相关联。例如,可以将情绪作为元数据包含在音频文件中,或者包含在与相应音频文件相关的单独文件中。
[0127] 基于所识别的故事情绪,可以选出包含音乐的适当音频文件。可替选地或另外地,基于识别出的一段音乐的情绪,可以选择包含故事的适当的音频文件。图8说明了可能促进这些过程的各种情绪之间的关系。
[0128] 表格800列出了多种情绪:快乐、悲伤、幽默、悲惨、愤怒、沮丧、焦虑、孤独、困惑、兴奋、希望和放松。对于这些情绪中的每一种,条目提供了特定情绪与其他情绪的关系的指示。如果一个条目包含对钩标记,那么两种情绪相互匹配。如果一个条目包含x,则两种情绪相互对立。如果条目是空的,那么两种情绪既不匹配也不相互对立。
[0129] 例如,快乐与其本身相匹配,也与幽默匹配。快乐与悲伤、悲惨、愤怒、沮丧和孤独相对立。因此,如果目标是使故事的情绪和一段与快乐相关的音乐的情绪相匹配,则只有与快乐或幽默情绪相关的故事才是备选。另一方面,如果目标是选择一种情绪不与和快乐有关的音乐的情绪相对立的故事,那么只要与悲伤、悲惨、愤怒、沮丧和孤独情绪相关的故事都会被排除在选择之外。此外,如果目标是选择一种情绪与和快乐有关的音乐的情绪相对立的故事,那么仅与悲伤、悲惨、愤怒、沮丧和孤独情绪相关的故事可以被选择。
[0130] 表格800指示的关系仅作为示例目的呈现。情绪之间可以有不同的关系,因此可以以不同的方式填写表格800。此外,在这种表格中可以使用更多或更少的情绪。
[0131] 在某些情况下,播放列表中可能会故意省略某些情绪或内容的音乐。因此,包含与体现特定情绪的特征相关联的音乐的音频文件可能被排除在播放列表之外。例如,这可以根据当前事件或当前日期来操作。例如,与悲伤或愤怒相关的音乐可能不会放在对节假日期间生成的播放列表中。
[0132] 此外,基于客户端设备的简档,与某些情绪相关联的或与某些关键字、关键词或语义相关联的音乐可能不包括在为该客户端设备生成的播放列表中。这可以避免冒犯具有已知敏感性的用户。
[0133] 如上所述,播放列表可以具有预定义的主题(例如,关注于音乐的播放列表的“古典摇滚”主题,涉及音乐和/或与特定艺术家的访谈的播放列表的“艺术家”主题,或与特定足球事件或团队有关的故事和/或音乐的“足球”主题)。当播放列表与这样的主题相关联时,可以基于主题以及播放列表中的其他条目的情绪来选择条目。
[0134] 当出于特定原因(例如,确定与先前音频文件的内容有关)而选择音频文件时,可以将该原因显示给播放音频文件的客户端设备的用户。此外,可以赋予(例如,通过用户界面)用户表达对音频文件之间的某些类型的关系的喜好的能力。例如,用户可以表示所用的关系(i)是可接受的,(ii)不应该再次使用,或者(iii)应该用不同的关系代替。
[0135] A.基于故事的情绪选择音乐
[0136] 图9是示出基于故事情绪选择包含音乐的音频文件的实施例的流程图。与图6和7类似,图9所示的过程可以由服务器设备(诸如计算设备200)和/或计算设备集群(诸如服务器集群304)来执行。但是,该过程也能够由其他类型的设备或设备子系统来执行。
[0137] 框900可以涉及:获取包含故事的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。框902可以涉及:通过自动语音转文本系统将包含故事的音频文件转换为包含故事的文本文件。
[0138] 框904可以涉及:可能基于包含故事的文本文件中是否存在一个或更多个关键字,确定故事的情绪。该框可以涉及语义分析和/或韵律分析。情绪可以是快乐、悲伤、幽默、悲惨、愤怒、沮丧、焦虑、孤独、困惑、兴奋、希望、放松或其他情绪中的一种。
[0139] 在某些情况下,包含故事的音频文件可能已经关联了情绪。在这种情况下,可以省略框902和904的部分或全部。例如,可以基于与包含故事的音频文件相关联的一个或更多个故事属性来确定故事的情绪。
[0140] 框906可以涉及:可能基于故事的情绪,选择包含音乐的音频文件。包含音乐的音频文件可以与指示情绪的一个或更多个音乐属性相关联。在某些情况下,故事属性可以与音乐属性相匹配。可替选地或另外地,可以基于以下中是否存在一个或更多个关键字来选择包含音乐的音频文件:(i)与音乐相关的艺术家名字,(ii)与音乐相关的标题,或者(iii)与音乐相关的歌词。
[0141] 框908可以涉及:为客户端设备生成播放列表。播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。生成包括(i)对包含音乐的音频文件的引用以及(ii)对包含故事的音频文件的引用的播放列表可以基于情绪、日期和/或一天中的时间。
[0142] 框910可以涉及:通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每一个。音频播放器应用可以从服务器设备检索包含音乐的音频文件和包含故事的音频文件中的每个。或者,可以从附属于服务器设备的第三方媒体服务器中检索包含音乐的音频文件或包含故事的音频文件中的至少一个。
[0143] 在一些实施例中,对包含音乐的音频文件的引用在播放列表中可以排在对包含故事的音频文件的引用之前,并且音频播放器应用可以在检索并播放包含故事的音频文件之前检索并播放包含音乐的音频文件的至少一些。或者,对包含音乐的音频文件的引用在播放列表中可以排在对包含故事的音频文件的引用之后,并且音频播放器应用可以在检索并播放包含故事的音频文件之后检索并播放包含音乐的音频文件的至少一些。
[0144] 指示情绪的一个或更多个音乐属性可以涉及表示情绪的音乐属性。在一些实施例中,情绪可以是第一情绪,指示第一情绪的音乐属性可以涉及表示基于第一情绪的第二情绪的音乐属性。指示情绪的音乐属性还可以涉及指示以下的音乐属性:(i)特定节奏、特定节拍模式或特定和弦进行与情绪相关联,以及(ii)音乐中存在特定节奏、特定节拍模式或特定和弦进行。
[0145] B.基于一段音乐的情绪选择故事
[0146] 图10是示出用于基于一段音乐的情绪选择包含故事的音频文件的实施例的流程图。与图6、7和9类似,图10所示的过程可以由服务器设备(诸如计算设备200)和/或计算设备集群(诸如服务器集群304)来执行。但是,该过程也可以由其他类型的设备或设备子系统来执行。
[0147] 框1000可以涉及:获取包含音乐的音频文件。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。
[0148] 框1002可以涉及:可能基于与包含音乐的音频文件相关联的一个或更多个音乐属性,确定音乐的情绪。音乐属性可以指示情绪。例如,音乐属性可以指示:(i)特定节奏、特定节拍模式或特定和弦进行与情绪相关,以及(ii)在音乐中存在特定节奏、特定节拍模式或特定和弦进行。
[0149] 框1004可以涉及:可能基于音乐的情绪,选择包含故事的文本文件。包含故事的文本文件中的一个或更多个关键字或其语义可以指示情绪。框1006可以涉及:通过自动文本转语音系统将包含故事的文本文件转换为包含故事的音频文件。在一些情况下,框1004和1006中的至少部分可以由直接选择包含故事的音频文件替换。这可能在包含故事的音频文件与描述其内容的一个或更多个故事属性相关联的情况下发生。
[0150] 框1008可以涉及:为客户端设备生成播放列表。播放列表包括(i)对包含音乐的音频文件的引用,以及(ii)对包含故事的音频文件的引用。
[0151] 框1010可以涉及:通过广域网将播放列表传输给客户端设备。客户端设备接收到播放列表可以使音频播放器应用检索并播放包含音乐的音频文件和包含故事的音频文件中的每一个。
[0152] 可以通过去除其中所示的任何一个或更多个特征来简化图9和10的实施例。此外,这些实施例可以彼此组合,以及与任何前述附图的特征、方面和/或实施方式或本文中另外描述的特征、方面和/或实施方式组合。
[0153] 6.基于时间约束生成播放列表
[0154] 媒体播放设备(例如收音机和电视机)以及各种类型的计算设备上的媒体播放器应用可以支持睡眠定时器。如果在音频(或视频)播放过程中激活睡眠定时器功能,则播放会持续指定的一段时间,然后在睡眠定时器定义的持续时间结束时突然终止。这种功能的目标是允许用户在播放期间慢慢睡着,并在用户睡着时关闭播放,由此节省能量并提供更安静、更有利于睡眠的环境。
[0155] 但是,从激活睡眠定时器功能到播放终止之间播放的媒体并没有由于激活了睡眠定时器功能而改变——播放的媒体与未激活睡眠定时器功能时的媒体相同。因此,可能在用户试图入睡时播放任何不利于睡眠的媒体(例如,响亮的音乐和/或具有高动态范围的音乐)。此外,突然终止播放可能会影响用户,甚至可能吵醒睡着的用户。利用计算机生成播放列表,可以克服现有技术的这两个缺点。
[0156] 尽管如此,除了支持改进的睡眠定时器功能之外,此处描述的实施例可以用于其他目的。例如,每当用户希望改变现有播放列表或者生成特定持续时间和/或特定情绪的播放列表时,可以使用这些实施例。例如,可以至少部分地使用汽车中或无线通信设备中的定位单元(例如,全球定位系统(GPS))来确定到达目的地的时间。本文的定时器可以基于这一时间来设置,并且也可以随着时间的变化而更新。或者,本文的定时器可以基于预定的时间表,诸如在个人或团体的日历应用中出现的事件,或基于火车或公交时刻表。也存在其它可能性。
[0157] 图11描述了响应于定时器功能的激活而生成新的播放列表的时序图。在时刻T0,客户端设备开始播放播放列表1的条目n-1。播放列表1可以是为客户端设备生成的播放列表,并且可以根据本文的任何实施例生成。类似于图5B的实施例,客户端设备可以针对播放列表1中的每个条目,(i)顺序地请求和接收条目的流,并且(ii)播放流。
[0158] 在时刻T1,客户端设备开始播放播放列表1的条目n。此条目约四分钟长。在时刻T2,播放列表1的条目n约播放了三分钟,客户端设备接收到定时器功能激活,指示请求的定时器持续时间为30分钟。定时器可能由客户端设备的用户激活并且用户可能选择了持续时间,或者持续时间可能是基于预定的时间表或基于另一个软件单元的触发器而自动选择的。
[0159] 响应于接收到定时器功能激活,并且在知道播放列表1的条目n的播放剩余大约一分钟的情况下,在时刻T3,客户端设备可以请求29分钟的播放列表。该请求可以被传输给服务器设备,例如向客户端设备提供播放列表1的服务器设备。
[0160] 响应于接收到这一请求,服务器设备可以生成播放列表2。可以选择该播放列表的条目,使得播放列表的总持续时间大约为29分钟。此外,如果定时器是睡眠定时器,则可以选择这些条目以使它们有利于睡眠。例如,可以选择节奏缓慢、动态范围窄和/或音量较小的音乐。另外,可以将播放列表中的条目布置成使得其中的任何音乐或故事在播放列表的持续时间内逐渐变得更加平静。因此,可以组织播放列表2以让听众入睡。
[0161] 在时刻T4,客户端设备可以接收播放列表2。在时刻T5,随着播放列表1的条目n的播放结束,客户端设备可以开始播放播放列表2中的条目一。因此,客户端设备可以从播放播放列表1的条目切换到播放播放列表2的条目。在时刻T6,客户端设备可以通过开始播放播放列表2的条目2来继续播放播放列表2的条目。
[0162] 图12是示出从播放一个播放列表切换到播放另一个播放列表的实施例的流程图。与图6、7、9和10类似,图12所示的过程可以由服务器设备(诸如计算设备200)和/或计算设备集群(诸如服务器集群304)来执行。但是,该过程也能够由其他类型的设备或设备子系统来执行。
[0163] 框1200可以涉及:为客户端设备生成第一播放列表。第一播放列表可以包括以第一指定顺序对第一多个音频文件的引用。第一多个音频文件的播放可以具有第一持续时间。客户端设备和服务器设备可以通过广域网相互通信,并且客户端设备可以包括音频播放器应用。
[0164] 框1202可以涉及:通过广域网将第一播放列表传输给客户端设备。客户端设备接收到第一播放列表可以使音频播放器应用以第一指定顺序检索并播放第一多个音频文件中的至少一些。
[0165] 框1204可以涉及:在客户端设备正播放第一多个音频文件的当前音频文件时,从客户端设备接收指令。框1206可以涉及:可能响应于接收到该指令而生成第二播放列表。第二播放列表可以包括以第二指定顺序对第二多个音频文件的引用。第二多个音频文件的播放可具有小于第一持续时间的第二持续时间。
[0166] 此外,第二多个音频文件可能不包括第一多个音频文件中按第一指定顺序在当前音频文件之前的任何音频文件。因此,可以选择第二多个文件以避免重复客户端设备已经播放过的媒体。可替选地或另外地,第二多个音频文件可以包括第一多个音频文件中按第一指定顺序在当前音频文件之后的至少一些音频文件。在一些情况下,生成第二播放列表可以涉及:从第一多个音频文件中按第一指定顺序在当前音频文件之后的音频文件中,选择第二多个音频文件。因此,可以选择第二多个文件以包括由于遍历第一播放列表而本来会被播放的至少一些媒体。尽管如此,第二多个文件可能不具有与第一多个文件相同的文件。
[0167] 在一些实施例中,第一多个音频文件中的音频文件与相应的优先级相关联。生成第二播放列表可以涉及从第一多个音频文件的音频文件中选择第二多个音频文件,同时与具有较低优先级的音频文件相比,优先选择具有较高优先级的音频文件。包含广告的音频文件可以比包含音乐的音频文件具有更高的优先级,或者相反。
[0168] 框1208可以涉及:通过广域网将第二播放列表传输给客户端设备。客户端设备接收到第二播放列表可以使音频播放器应用以第二指定顺序检索并播放第二多个音频文件。客户端设备接收到第二播放列表还可以使音频播放器应用在音频播放器播放完当前音频文件之后播放第二多个音频文件。
[0169] 在一些实施例中,指示指定目标持续时间,并且生成第二播放列表可以涉及:选择第二多个音频文件,使得第二持续时间在目标持续时间的阈值内。该阈值可以是例如三分钟或更短。因此,阈值可以是15秒或更短、30秒或更短、1分钟或更短、2分钟或更短等等。另外,如果指示指定客户端设备已经激活具有目标持续时间的睡眠定时器,并且可以基于以下中的一个或更多个喜好来选择第二多个音频文件:(i)慢节奏,(ii)窄动态范围,或(iii)较低音量。
[0170] 可以通过去除图12所示的任何一个或更多个特征来简化图12的实施例。此外,该实施例可以与任何前述附图的特征、方面和/或实施方式或本文中另外描述的特征、方面和/或实施方式组合。
[0171] 7.结论
[0172] 本公开不限于在本申请中描述的特定实施例,这些实施例旨在作为各个方面的说明。对于本领域技术人员来说显而易见的是,可以在不脱离其范围的情况下做出许多修改和变化。根据前面的描述,除本文列举的那些之外,在本公开的范围内的功能上等同的方法和设备对于本领域技术人员将是显而易见的。这些修改和变化旨在落入所附权利要求的范围内。上述具体实施方式参照附图描述了所公开的系统、设备和方法的各种特征和功能。本文和附图中描述的示例实施例并非限制性的。在不脱离本文提出的主题范围的情况下可以使用其它实施例并且可以做出其他改变。容易理解的是,如本文大致描述的和附图中示出的本公开的方面能够以各种不同配置进行组织、替换、组合、分离和设计,所有这些都在本文中被明确地考虑。
[0173] 对于附图中的和本文讨论的任何或全部消息流图、场景和流程图,每个步骤、框和/或通信都能够表示根据示例实施例的信息处理和/或信息传输。替代实施例被包括在这些示例实施例的范围内。在这些替代实施例中,例如,描述为步骤、框、传输、通信、请求、响应和/或消息的功能能够根据所涉及的功能以与所示出或讨论的顺序不同的顺序执行,包括基本上同时执行或以相反的顺序执行。此外,更多或更少的框和/或功能能够与本文讨论的梯形图、场景和流程图中的任何一个一起使用,并且这些梯形图、场景和流程图可以部分或全部地相互组合。
[0174] 表示信息处理的步骤或框能够对应于可被配置成执行本文描述的方法或技术的特定逻辑功能的电路。可替选地或另外地,表示信息处理的步骤或框能够对应于程序代码(包括相关数据)的模块、段或一部分。程序代码能够包括可由处理器执行的一个或更多个指令,用于实现该方法或技术中的特定逻辑功能或动作。程序代码和/或相关数据能够存储在任何类型的计算机可读介质上,例如包括磁盘、硬盘驱动器或其他存储介质的存储设备。
[0175] 计算机可读介质还能够包括非暂时性计算机可读介质,诸如像寄存器存储器、处理器高速缓存和随机存取存储器(RAM)那样的短时间存储数据的计算机可读介质。计算机可读介质还能够包括长时间存储程序代码和/或数据的非暂时性计算机可读介质。因此,计算机可读介质可以包括辅助或持久长期存储器,例如只读存储器(ROM)、光盘或磁盘、光盘只读存储器(CD-ROM)等。计算机可读介质也能够是任何其他易失性或非易失性存储系统。计算机可读介质能够被认为是例如计算机可读存储介质或者有形存储设备。
[0176] 此外,表示一个或更多个信息传输的步骤或框能够对应于同一物理设备中的软件和/或硬件模块之间的信息传输。但是,其他信息传输能够在不同物理设备中的软件模块和/或硬件模块之间。
[0177] 图中所示的特定布置不应视为限制性的。应该理解,其他实施例能够包括或多或少的给定图中所示的每个元件。此外,所示元件中的一些能够被组合或省略。另外,示例性实施例能够包括图中未示出的元件。
[0178] 虽然本文已经公开了各个方面和实施例,但是其他方面和实施例对于本领域技术人员而言将是显而易见的。本文公开的各个方面和实施例仅用于说明的目的,而非限制性的,真正的范围由所附权利要求书指出。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈