首页 / 国际专利分类库 / 物理 / 乐器;声学 / 利用歌词与旋律之间的相关性的音乐作曲系统

利用歌词与旋律之间的相关性的音乐作曲系统

申请号 CN201310712131.8 申请日 2013-12-20 公开(公告)号 CN103902642B 公开(公告)日 2017-11-10
申请人 香港科技大学; 发明人 黄智荣; 施家威; 龙程;
摘要 本 发明 提供了一种用于生成旋律的方式。目前还没有基于音乐歌词来自动生成旋律的 算法 。然而,根据最近的一些研究,在一首歌曲中,歌曲的音符(音高)和歌词的 音调 通常存在一定的相关性。利用该相关性,可以生成基于给定歌词的旋律。本文公开的系统、方法和算法考虑了歌曲中旋律的音符和歌词的音调之间的相关性来自动生成旋律。
权利要求

1.一种用于生成歌曲旋律的方法,包括:
至少基于用于关联音符组和字组的第一关联数据从数据存储库中选择音调数据,其中,所述音符组用于表示一组歌曲,所述字组用于表示一组歌词,其中所述字组中的每个字包括一个或多个音节;
至少基于用于将所述音调数据与所述音节的音节标识符相关联的第二关联数据,为所述字组中的各音节分配相应的音调数据值;
至少基于歌曲子集和歌词子集之间的相关性确定歌曲模式,其中所述歌曲子集由所述音符组的音符子集来表示,所述歌词子集由所述字组中的字子集来表示;
至少基于所确定的歌曲模式创建作曲模型;
至少基于所述作曲模型生成旋律;以及
至少将所生成的旋律与所述歌词子集相配对
2.根据权利要求1所述的方法,其中,所述配对的步骤包括:
将所述旋律配对到所述一组歌词。
3.根据权利要求1所述的方法,进一步包括:
分析所述一组歌曲中的各个歌曲中的相应大调音阶或相应小调音阶,所述大调音阶或小调音阶至少基于歌曲组中的相应歌曲相对于音符组的频度分布来确定。
4.根据权利要求1所述的方法,进一步包括:
对相应的所述音节标识符与表示所述音符组中的对应音符的字母进行配对。
5.根据权利要求4所述的方法,其中,所述相应的音节标识符包括Do,Re,Mi,Fa,So,La,或Ti。
6.根据权利要求1所述的方法,其中,所述歌曲模式是二元组的序列,所述二元组的序列包括:
第一元组元素,包含音高和音长的音符;以及
第二元组元素,其为音符标识符,
其中,所述二元组的序列表示为所述音符和所述音符标识符的关联。
7.根据权利要求6所述的方法,其中,所述音高表示声音的频率,所述音长表示声音的持续时间。
8.根据权利要求1所述的方法,进一步包括:
通过执行模式挖掘以确定出所述歌曲模式。
9.根据权利要求1所述的方法,其中,所述歌曲模式包括基于大调音阶作曲的第一模式与基于小调音阶作曲的第二模式。
10.根据权利要求9所述的方法,其中,所述作曲模型是基于所述第一模式和所述第二模式中至少之一的概率模型。
11.根据权利要求9所述的方法,还包括:
接收所述字子集和所述音符子集,其中所述音符子集代表大调音阶或小调音阶;
提取与所述字子集和所述音符子集关联的音调数据;以及
基于所述第一模式或所述第二模式将所提取的音调数据映射到所述旋律上。
12.根据权利要求11所述的方法,进一步包括:
从所述音调数据的值中选择出最常出现在与所述字子集中相应字相关的相应音节段上的一个值。
13.根据权利要求1所述的方法,其中所述作曲模型包括表示以下信息中的至少一个:
谐波变量、节奏变量、音域变量、第一子集词和第二子集词之间的数据关联。
14.一种用于生成歌曲旋律的系统,包括:
音调提取组件,至少基于用于关联音符组和字组的第一关联数据从数据存储库中选择音调数据,其中,所述音符组用于表示一组歌曲,所述字组用于表示一组歌词,其中所述字组中的每个字包括一个或多个音节;
分配组件,至少基于数据存储库中音调数据与所述音节的音节标识符关联的第二关联数据,为所述字组中的各音节段分配相应的音调数据值;
模式挖掘组件,至少基于由歌曲子集和由歌词子集之间的相关性确定歌曲模式,其中所述歌曲子集由所述音符组的音符子集来表示,所述歌词子集由所述字组中的字子集来表示;
自动建模组件,至少基于所确定的歌曲模式来创建自动作曲模型;以及
旋律生成组件,至少基于所述自动作曲模型来生成旋律。
15.根据权利要求14所述的系统,进一步包括:
分析组件,用于分析所述一组歌曲组中的各个歌曲中的相应大调音阶或相应小调音阶,所述大调音阶或小调音阶是至少基于歌曲组中的相应歌曲相对于音符组的频度分布来确定。
16.根据权利要求14所述的系统,进一步包括:
匹配组件,用于对相应的所述音节标识符与表示所述音符组中的对应音符的字母进行配对。
17.根据权利要求14所述的系统,其中,所述歌曲模式是二元组的序列,所述二元组的序列包括:
第一元组元素,包含音高和音长的音符;以及
第二元组元素,其为音符标识符,
其中,所述二元组的序列表示为所述音符和所述音符标识符的关联。
18.根据权利要求17所述的系统,其中,所述音高表示声音的频率,所述音长表示声音的持续时间。

说明书全文

利用歌词与旋律之间的相关性的音乐作曲系统

技术领域

[0001] 本发明涉及自动生成歌曲旋律的系统、方法和算法

背景技术

[0002] 有许多研究提出了自动生成歌曲旋律的算法,这被称为算法作曲。以算法(至少是正式的规则集)来创作音乐已被采用了多个世纪。
[0003] 算法作曲的意思是使用正规程序、通过采用几率程序或使用计算机做音乐,但完全无需人工干预。现存的各种算法作曲技术都有其各自的局限性,因此需要改进算法作曲系统。

发明内容

[0004] 给出以下发明内容的目的在于提供对本发明的基本理解,而不是对本发明的详尽概述。它既不是用来确定本公开的关键或重要元素,也不是用来描绘本发明的具体实施例的任何范围或权利要求书中的任何范围。其唯一的目的是以简化形式来介绍本公开的一些概念,以便了解稍后提出的详细描述。
[0005] 本文中的一个或多个实施例和相应公开内容描述了各种自动算法作曲的非限制性问题。本发明的实施方式提供了这样一种方法,其包括以下步骤:
[0006] 包括处理器的系统从数据存储库中接收音调数据,其中,所接收的音调数据从音符组表示的一组歌曲和字组表示的一组歌词来确定,以及其中至少基于用于关联所述音符组和所述字组的第一关联数据从所述数据存储库中选择所述音调数据;
[0007] 所述系统至少基于由音符子集表示的歌曲子集和由字子集表示的歌词子集之间的相关性确定模式;
[0008] 所述系统至少基于所确定的模式创建作曲模型;
[0009] 所述系统至少基于所述作曲模型生成旋律;以及
[0010] 所述系统将所述旋律至少与所述歌词子集相配对
[0011] 该方法进一步包括由系统分析相应的调号。调号包括在歌曲组的相应歌曲中的相应大调音阶或相应小调音阶,该相应大调音阶或相应小调音阶是至少基于所述歌曲组中的相应歌曲相关于音符组的各个频度分布来确定。
[0012] 此外,该方法进一步包括由系统对相应的音乐音节标识符与代表所述音符组中的对应音符的字母进行配对的步骤。
[0013] 此外,上述方法进一步包括由系统分配相应音调数据值到与该词组中相应词关联的相应音节段的步骤。该分配的步骤至少基于数据存储库中音调数据与音节标识符关联的第二相关数据来执行。
[0014] 下面的描述和相应的附图阐述了本发明的各个方面。所述的示例是示意性的,本领域技术人员基于本申请公开的原理可采用其它各种方法。当结合以下详细描述和附图一起考虑时,本发明的其它方面将变得显而易见。
[0015] 附图简要说明
[0016] 图1示出了与词相关的音节以及与各个音节相关的强调音调的一个非限制性例子;
[0017] 图2示出了歌词和歌曲旋律的一个非限制性例子;
[0018] 图3示出了一个可基于一首歌中音符和歌词之间的相关性从而生成旋律的系统的非限制性例子;
[0019] 图4A示出了用于生成歌曲旋律的机率自动机的非限制性例子;
[0020] 图4B示出了用于生成歌曲旋律的音调输入数据序列的非限制性例子;
[0021] 图5示出了用于根据歌词组和音符组生成旋律的方法的非限制性例子;
[0022] 图6示出了用于根据歌词组和音符组生成旋律的方法与的一个例子;
[0023] 图7为示出的在其中可以实施本申请的各种实施例的非限制性网络化环境的方框图;以及
[0024] 图8中的方框图表示在其中可以实施本申请的各种实施例的非限制性计算系统或操作环境。

具体实施方式

[0025] 概述
[0026] 为了使本发明的内容更加清楚和易于理解,下面结合附图对本发明的具体实施例进行详细描述。在本发明中,以示例方式,对本发明提出的方法进行说明,但是本发明不限于所公开的优选实施例的具体形式。所属领域的技术人员可以根据本发明公开的内容对本发明进行修改和变型,这些修改和变型也应当属于由权利要求限定的本发明的保护范围。
[0027] 如上所述的背景,现存有各种对算法作曲的研究。然而,没有任何方法把歌词考虑到旋律生成中。在一首歌曲中,它的旋律和歌词之间通常存在一定程度的相关性。因此,本发明所描述的各种实施例利用这种类型的关联信息进行自动旋律生成。当歌曲中具有一段歌词时,不仅可以考虑在歌曲旋律中全部音符之间的时间相关性,而且还考虑了歌曲音符和歌词的关联。可使用一个模型是来表示歌曲中旋律的音高和歌词的音调之间的关联性,并利用这个关联性来生成新的旋律。通过进一步的介绍,本发明涉及一种用于通过考虑歌曲旋律和歌词之间的关系自动生成音乐旋律的方法。
[0028] 当一段歌词存于歌曲,本发明的方法可以不仅考虑在歌曲旋律中的全部音符之间的时间相关性,而且还能考虑到歌曲音符和歌词的关联。在这点上,由于现有的研究没有把歌词考虑到算法作曲中,因此现有算法作曲并未考虑歌词与音符的关联。
[0029] 使用旋律和歌词之间的相关性的算法作曲
[0030] 歌词音符的相关度对应于连续的音符序列的变化趋势(也被称为一组音符)与连续相应歌词的音调序列的变化趋势(也被称为一组歌词)之间的关系。该相应歌词通过连续的相应字序列来表示。音符序列的变化趋势对应于每两个相邻音符之间的一系列音高差异,这是因为各个音符都有它的音高(或者其频率)。字序列的变化趋势(其中每个字都可以分割成一个或多个音节)对应于每两个相邻音节之间一系列的音调差异,每个音节都有它的音调。例如图1示意了英文“international”一字有五个音节,即,附图标号102所示的“In”、附图标号104所示的“ter”、附图标号106所示的“na”、附图标号108所示的“tion”,以及附图标号110所示的“al”。每一个音节可以主重音、次重音和非重音这三种重音或音调中的之一来进行发音。主重音是对具有较高频率的音节进行发声的声音,次重音是对具有较低频率的音节进行发声的声音和非重音是对具有最低频率的音节进行发声的声音。在图1中,第三个音节(“na”106)是主重音,第一个音节是次重音(例如,“in”102),其他音节是非重音(“ter”104,“tion”108,或“al”110)。音调在音乐上是稳定的声音周期,其特征在于持续时间、音高、度和音色,并且在除了英语之外的其它许多语言上均会出现。普通话有四个或五个音调,而每个字只有一个音节。广东话中有六个音调,每个字也只有一个音节。其他有音调的语言包括泰语,越南语等。
[0031] 在一个方面中,歌词音符的相关性可涉及:根据任何语言表达的歌词实现旋律的算法作曲。给定用具有不同音调的语言制作的歌词,旋律作曲器T-Music(也被称为“系统”)可以利用歌词音符的相关性生成旋律。该系统拥有两个阶段。第一个阶段是预处理阶段,首先在数据库或数据存储中寻找歌词音符的相关性,所述数据库或数据存储中存储了大量的现有歌曲,而每一歌曲同时包括这首歌的旋律和歌词,该系统会对数据存储中的歌曲数据进行频繁模式挖掘任务(frequent pattern mining task)。另一方面,通过频繁模式挖掘任务来标识的歌曲是基于歌词音符的相关性来确定,并且可被用来建立一个概率自动机(Probabilistic Automaton)(以下称为“PA”)。第二阶段是旋律生成阶段,通过执行在第一阶段中生成的PA给一个歌词生成一个旋律。在各种实施例中,该系统可以存取强大的知识源来生成旋律。该系统不仅利用现有的歌曲数据库(存储在数据存储),而且还利用指定歌词的音调信息。其次,该系统是高度人性化的,用户不必对音乐具有很多知识,亦不必知道如何选择一个合适的旋律作曲算法,也可以使用该系统生成旋律。此外,由于旋律可以自动根据用户写入的歌词生成,因此用户可以通过该系统获得个人和便捷的经验。
[0032] 在一方面,一首歌可以配上歌词,其中歌词是一组字。一组歌曲的歌词可以由众多歌词片段组成,歌词片段被称为字子集(例如,字序列中的一个或多个字)。如该图1所示,每个字可以包含各种音调,因此字的每个音节都与相应音调相关(如主重音、次重音和非重音)。例如,设T为音调的总数。在这个系统中,每个音调都与一个音调识别符相关联,音调识别符亦被称为音调ID∈[1,T]。例如英语有三种可能的音调,其中,1,2和3分别代表音调ID的主重音,次重音和非重音。普通话有4或5个音调,而粤语有6个音调。
[0033] 图2说明的是音乐理论的基本概念。202示出了旋律的片段,其中旋律由音符序列来表示。204示出了由音调序列表示的歌词段。整首歌曲可以包括歌词组和音符组,其中所述旋律是由序列中的音符组来表示。每一个音符都与音高(pitch)和声音的持续时间(例如,声音的时间区间)有关,其中音高表示对应于音符的声音的频率。另外,音符的特征在于音调和持续时间。
[0034] 在一方面,如204所出的歌词被定义为字序列,每个字由一个或多个音节组成。此外,每一个音节都与一个音调ID相关联。因此,每个歌词可以通过音调ID的序列来表示。通过结合旋律表示和歌词表示,一首歌曲可以用二元组序列的形式来表示,每个二元组的形式是(音符,音调ID)。歌曲的表示被称为S-序列(S-sequence)。一个特定的(音符,音调ID)二元组包含p.note(音符元素)和p.tone(音调ID元素)。
[0035] 图3说明的是T-Music系统的架构。在一个实施方式中,图3所示的系统300包括其上存储有计算机可执行组件的存储器324、和被配置为执行存储在存储器中的计算机可执行组件的处理器326。在另一个实施方式中,系统300包括的各个元件、组件或构件可以是由硬件电路或软硬件电路的组合构成。
[0036] 数据库302存储了歌曲和与这些歌曲相关的数据。系统300包含第一阶段的子系统,该子系统包括音调提取元件308,频繁模式挖掘组件310频繁模式312和概率自动机构件314。数据存储区304存储音调数据、数据值、音调查表,其中音调查表含有每个字的音节和音调ID之间的映射。
[0037] 音调提取部件308为在歌曲数据库中存储的每首歌以及相应的歌词提取乐音数据。此外,音调提取元件308可用于识别各个相应歌曲的音调序列(S-序列)。
[0038] 频繁模式挖掘部件310基于所识别的S-序列来确定与歌曲组相关联的频繁模式312。频繁模式312代表歌词音符的相关性。
[0039] 概率自动机构件314基于频繁模式312来构建一个概率自动机(PA)。
[0040] 系统300还包括了第二阶段子系统。第二阶段子系统采用了数据存储304、歌词输入组件306、音调提取元件308、音调序列构件318和旋律生成组件320。其中,第一和第二阶段的子系统均采用了存储器324,数据存储器304和处理器32。歌词输入组件306可以存储表示不同语言的歌词组。在系统300中,通过音调提取部件308提取从歌词输入部件306接收到的一个或多个歌词的音调序列。旋律生成组件320基于PA和所提取的音调序列生成旋律322。
[0041] 频繁模式挖掘组件310基于所识别的S-序列来确定歌曲组相关的频繁模式312。频繁模式挖掘的行动可以通过陈述来说明。设D是一组对应于存储在歌曲数据库组件302中的歌曲S-序列。设S是S-序列。S的长度由|S|表示,表示S中(音符,音调ID)-二元组的数量。S[i,j]表示S-序列中第i个位置和第j个位置之间的(音符,音调ID)-二元组。例如,S[1,m]对应S本身,其中m是S的长度。给出两个S-序列S=((n1,t1),...,(nm,tm))和S’=((n’1,t’1),...,(n’m’,t’m’)),S和S’之间的串联被记为 它被定义为在((n1,t1),...,(nm,tm),(n’1,t’1),...,(n’m’,t’m’))的S-序列。S’是指S中的一个子串是否存在整数i,使得S[i,i+m’-1]与S’完全相同,其中m’是S’的长度。我们定义S-序列基于D的支持,表示为S.T,为D中包含S作为子字符串的S-序列的数量。给定一个阈值δ,频繁模式挖掘组件310识别所有基于D的支持至少为δ的所有S-序列S。一个算法会被采用于寻找频繁子序列/子串挖掘。对于每一个频繁的S-序列S,我们维护其基于D的支持,即S.T.。
[0042] 图4示出了概率自动机的构建组件314和基于频繁模式312建立概率自动机(PA:Probabilistic Automaton)的示例。概率自动机(PA)是不确定性有限自动机(NFA:Non-deterministic Finite Automaton)的泛化。NFA是专为在自动机理论上的词法分析。NFA可以由五元组来表示(Q,∑,Δ,q0,F),其中,(1)Q是有限状态集,(2)∑是一组输入符号,(3)Δ是过渡关系Q×∑→P(Q),其中P(Q)代表Q的幂集,(4)q0为初始状态和(5) 是一套最终的(接受)的状态。PA概括了NFA以使得在PA中发生的转换具有概率性。此外,在NFA中具有确定性的初始状态q0在PA中被概率向量v代替,在概率向量v中,每一项对应于初始状态等于Q中的一个状态的概率。因此,五元组(Q,∑,Δ,v,F)代表PA,其中Q,∑和F与它们在NFA中的含义相同,Δ的每个转变与概率相关联。
[0043] 设T为从接收到的歌词中提取到的音调ID序列。一个音调ID序列(称为音序列)的例子为(2,1,3,5)(在图4(B)中的第一行420)。下文中描述了通过概率自动机构建组件314所执行的概率自动机的构建过程,其中PA的构成由(Q,∑,Δ,v,F)表示。在一个方面中,Q被构造为含S-序列S并需要满足以下两个条件的集合:
[0044] (1)S的长度等于l,其中l是用户给定的参数;以及
[0045] (2) 使得S是子字符串S’。
[0046] 另一方面,∑被构造成含有音调ID的集合。Δ的构造如下:Δ的最初值为 然后,对于每对状态q∈Q和符号t∈∑则执行以下两个步骤。
[0047] 首先,发现一组状态,使得在Qq,t的每个状态q’都满足以下几点:(1)q’[1:l-1]与q[2:l]是完全一样,(2)q’[l]音调与t完全一样。
[0048] 其次,对于每个状态q’∈Qq,t,在Δ创建的是q到q’的转变,其输入为t,概率为q’.T/∑q”∈Qq,tq”.T。
[0049] 在一方面,对于每一个状态q∈Q,即初始状态为q的概率设置为q.T/∑q∈Qq.T。另外,F构成为 这是因为在旋律生成中终状态不会表明对PA的终止执行。相反,它会在T中的音调ID输入后被终止,其中T为从歌词输入中提取的音调序列。
[0050] 图4(A)示出了PA的一个实例。为简单起见,在该图中省略了持续时间。这里有5个状态q1,q2,q3,q4,q5,每一个状态以方框来代表。每个状态旁边的数目是其相应S-序列的支持,例如q1.T=5。箭头表示从一个状态到另一个状态的转变。沿着箭头的数目是对应于转变时Σ中的输入符号。此外,括号内的数字是与对应转变相关联的概率。系统300通过旋律生成组件320上生成音乐。由概率自动机建筑构件314从输入歌词中提取输入的音调序列而构建PA(即T),旋律生成组件320通过执行PA生成旋律。具体地,设(q1,q2,...,qn)为当执行PA与T为输入时生成的状态序列。然后,由系统300所生成的旋律是音符序列,是以代表。由于在Δ中由qi到qi+1为1≤i≤n-1存在转变,qi[2:l]是与qi+1[1:l-1]完全一样。
[0051] 在对PA的执行过程中,可能会出现以下情况。当前状态可能存在没有转换。如当前状态q到具有当前输入音调ID的其他状态(t)的转换,即,Δ(q,t)是一个 因此,在这种情况下,执行过程无法进行。要解决此问题,在系统300中,选择Q中的状态q’时要附满足:(1)q’[1:l-1]最类似于q[2:l],(2)q’[l].tone与t完全一样,(3)Δ(q’,t)是一个非空的集。
[0052] 系统300所采用的相似性度量是两个字符串之间的共同编辑距离测量。旋律生成组件320利用如图4(B)输入的音频序列来执行PA,如图所示4(A)所示。假如它选择状态q1作为初始状态。在这之后,当前状态为q1和当前的输入符号是3(音调识别码2和1都参与状态q1)。这时,下一状态可以是q2(发生概率等于0.3)或q3(发生概率等于0.7)。假设它进入状态q3,当前的输入符号为5。进一步假设,它选择q5作为下一个状态。由于在音频序列的音调ID已被输入,执行过程停止。结果得到的状态的顺序是(q1,q3,q5),由此生成的旋律是(q1[1].note,q1[2].note,q3[2].note,q5[2].note),即(do,mi,re,fa)还有与之对应的每个音高的时长信息。
[0053] 系统300会考虑一些先进的音乐理论来生成旋律,例如和谐规律、节奏、连贯性和音域概念。和谐规律的两个例子是和弦和韵律。每首歌曲可以被分解为多个阶段。我们可以把一个阶段作为一种语言的句子。在音乐理论中,每个阶段结束时含有韵律。韵律是一种用于描述一个阶段结束的模式,它就像一个句号或英文逗号。根据韵律的概念,最后几个音符在每个阶段结束时必须来自某些特定的音符。系统300可以根据这个韵律原理在每个阶段结束时生成的音符。特别是,当在一个阶段结束时所生成音符,涉及到韵律的音符被视为代替所有可能的音符。
[0054] 节奏可用于生成旋律。例如,一个阶段的最后一个音符要长一些。一个阶段的节奏是类似于其他阶段的节奏。在一首歌曲中,一部分旋律通常是与其它部分类似,以使歌曲具有连贯的效果。系统300还可以结合使用这一概念。具体而言,每当为旋律生成一个阶段,系统会调查先前生成的某些部分旋律是否可以用于生成新旋律的其中一部分。如果可以的话,现有的一些旋律部分会被用于新的部分。该标准要求调查每个现有旋律部分加上歌词部分是否可以在第一阶段的频繁模式挖掘中被发现。关于音域,一些声乐范围(如人声)是有限的(如最多两个八度)。音域是衡量一个人可以唱的音调/强度的范围。在音域的基础上,系统300执行PA时,可以限制生成音符的可能选项。
[0055] 图5和图6示出了按照本发明特定方案的方法或流程图。为了使说明更简单,所公开的方法显示和描述为一系列的动作,所揭示的主题不受动作顺序的限制,因为一些动作可以按不同顺序发生和/或同时与其他动作中示出和描述。例如,本领域的技术人员将理解和领会所公开的方法可以替代状态图中表示的一系列相互关联状态或事件。在一些实施方式中,并不需要所有示出的动作来实现本发明的一些目的。此外,应当理解的是,在本公开中公开的方法能够存储在制造品上,以便将这些方法传递到计算机或其他计算设备。
[0056] 图5提出的是在本说明书中根据一个实施例所公开的系统的示例应用程序流程图。示例性公开的方法500可例如存储在存储器中,并利用处理器执行的计算机可执行指令来执行各种功能。在步骤502中,包括处理器的系统从数据存储库中接收音调数据,其中,所接收的音调数据从音符组表示的一组歌曲和字组表示的一组歌词来确定,以及其中至少基于用于关联所述音符组和所述字组的第一关联数据从所述数据存储库中选择所述音调数据。在步骤504,至少基于与各自歌曲相关联的音符组的频度分布,系统分析相应的关键特征,包括歌曲组中歌曲相应的大调音阶或相应的小调音阶。在步骤506,该系统将各个音节标识符与表示音符组中的相应音符的字母(letter)相配对。在步骤508,系统为词组中相应词的相应音节分配相应的音调数据值。该分配步骤至少基于用于将来自数据存储中音节标识与音调数据值关联的第二相关数据来执行。在步骤510,系统至少基于由音符子集表示的歌曲子集和由字子集表示的歌词子集之间的相关性确定模式。在步骤512中,系统至少基于该模式来创建作曲模型。所述模式是二元组的序列,第一元组元素包含音高和音长的音符,第二个元组元素是一个音符标识符。两个二元组的序列表示为音符和音符标识符的关联。在步骤514中,系统至少基于所述作曲模型来生成旋律。在步骤516中,系统配对旋律至少到歌词组。而这配对包括配对旋律到歌词组。
[0057] 图6提出的是本说明书中根据一个实施例所公开的系统的应用程序的流程图示例。示例公开方法600可例如被存储在存储器中,并利用处理器执行计算机可执行指令来执行各种功能。在步骤602,系统通过处理器从接收数据存储中的词子集和音符子集,其中音符子集表示大调音阶或小调音阶。在步骤604,该系统提取与词子集和音符子集相关联的音调数据。在步骤606,系统基于所述第一模式或所述第二模式映射音调数据到旋律上,其中第一模式包括基于大调音阶作曲的模式,第二模式包括基于在小调音阶作曲的模式。在步骤608,该系统从所述音调数据的值中选择出最常出现在与所述词子集中相应词相关的相应音节段上的一个值。在步骤610,该系统至少基于所述自动作曲模型来生成旋律。其中所述作曲模型是一个概率模型。该概率模型至少基于第一模式或第二模式。在步骤612中,该系统基于歌词子集统配对旋律,其配对包括配对旋律到歌词组。
[0058] 实例操作环境
[0059] 下面描述的系统和方法可在硬件中实施,例如在单个集成电路(IC)芯片、多个集成电路、和专用集成电路(ASIC)等。另外,每个过程出现的部分或全部过程次序是不被限制的。某些过程块可以以各种顺序执行,本公开中并未明确地示出所有顺序。图7示出为实现所要求的各方面题材包括计算机702的一个合适环境700。计算机702包括处理单元704,系统存储器706,编解码器705,以及系统总线708。系统总线708耦合的系统部件,包括但不限于系统存储器706至处理单元704。所述处理单元704可以是各种可用的处理器。双微处理器和其他多处理器架构也可以用作处理单元704。系统总线708可以是多类型的总线结构包括:存储器总线或存储器控制器、外围总线或外部总线、和/或使用任何各种可用总线体系结构的局部总线。可用总线体系结构可以是但不限于工业标准架构(ISA)、微通道架构(MSA)、扩展ISA(EISA)、智能驱动器电子(IDE)、VESA局部总线(VLB)、外围组件互连(PCI)、卡总线、通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)、火线(IEEE1394)和小型计算机系统接口(SCSI)。
[0060] 系统存储器706包括易失性存储器713和非易失性存储器712。基本输入/输出系统(BIOS),包含基本例程以在计算机702内的元件之间传输信息,如启动例程存储在非易失性存储器712。此外,根据不同实施例,解码器705可以包括至少一个编码器或解码器,其中,所述至少一个的编码器或解码器可以包括硬件,硬件和软件的组合,或者软件。虽然编解码器705被描述为单独的组件,编解码器705可以包含在非易失性存储器712。通过举例说明的方式,非易失性存储器712可以包括但不限制于只读存储器(ROM),可编程ROM(PROM),电可编程ROM(EPROM),电可擦除可编程ROM(EEPROM)或快闪存储器。易失性存储器713包括随机存取存储器(RAM),并充当外部高速缓冲存储器。根据本发明,易失性存储器可存储该写入操作的重试逻辑(图7中未示出)等。通过举例说明,RAM是可用于许多形式,例如但不局限于静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDR SDRAM)和增强型SDRAM(ESDRAM)。
[0061] 计算机702还可以包括可移动/不可移动,易失性/非易失性计算机存储媒体。图7示出磁盘存储710。磁盘存储710包括,但不限于,磁盘驱动器、固态盘(SSD)的软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS-70驱动器、闪存卡、或记忆棒。另外,磁盘存储器710可以包括单独存储媒体或与其他存储媒体相结合,其他存储媒体包括但不限于光盘驱动器,例如光盘ROM设备(CD-ROM)、可记录CD驱动器(CD-R驱动器)、可擦写光盘驱动器(CD-RW驱动器)或数字通用光盘ROM驱动器(DVD-ROM)。一般使用可移动或不可移动接口,如接口716,以便于连接磁盘存储设备710到系统总线708。图7介绍了充当用户和基本的计算机资源之间媒介的软件。该软件已在合适的操作环境700中描述,并包括操作系统718。操作系统
718控制并分配计算机系统702的资源,并可以存储在磁盘存储器710。应用程序720通过程序模块724和程序数据726,以充分利用操作系统管理的资源,如存储在系统存储器706或盘存储710中的开机/关机事务表等。所要求保护主题可以以各种操作系统或操作系统组合来实现。
[0062] 通过输入装置728以输入用户输入命令或信息到计算机702。输入设备728包括但不限于各样指示设备,例如鼠标跟踪球、指示笔、触摸板键盘、麦克、操纵杆、游戏垫、圆盘式卫星天线、扫描仪、TV调谐卡、数码相机、数字视频相机、网络摄像头等。经介面端口730,通过系统总线708连接这些和其它输入设备到处理单元704。介面端口730包括串行端口、并行端口、游戏端口、以及通用串行总线(USB)。输出设备736使用一些相同类型的端口作为输入设备728。例如,一个USB端口可以用于提供输入到计算机702,并且从计算机702输出信息至输出设备736。这里提供了输出转接器734以连接一些输出设备736如监视器、扬声器和打印机、以及其他这需要专用转接器的输出设备736。输出转接器734包括并不限制于视频卡和声卡,它提供了输出设备736和系统总线708之间的连接。但应注意的是,其他设备的和/或系统设备都可提供输入和输出能力,诸如远程计算机738。计算机702可以在使用逻辑连接到一个或多个远程计算机738在联网环境中操作。远程计算机738可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电器、对等设备、智能电话、平板电脑、或其他网络节点、并且包括许多相对于计算机702描述的元素。为简明起见,只有一个记忆存储装置740示出了远程计算机738。远程计算机738通过网络介面742逻辑连接至计算机
702,然后经由通信连接744相连。网络介面742包括有线和/或无线通信网络,例如局域网(LAN)、广域网(WAN)和蜂窝网络。LAN技术包括光纤分布式数据接口(FDDI)、分布式数据接口(CDDI)、以太网和令牌环等。WAN技术包括但不限于点对点链路、电路交换网如综合业务数字网(ISDN)及其变异、分组交换网络、以及数字用户线(DSL)。
[0063] 通信连接744是指使用硬件/软件将网络接口742连接到总线708。同时通信连接744清楚说明了计算机702的内部,它也可以是计算机702的外部。用于连接到网络介面742所需的硬件/软件包括内部和外部的技术、例如调制解调器、ISDN适配器、有线和无线以太网卡、集线器和路由器。其中调制解调器可以是一般电话调制解调器,电缆调制解调器和DSL调制解调器。
[0064] 图8是根据本发明公开示出在计算环境800中示意方框图。该系统800包括一个或多个客户端802(例如笔记本电脑、智能电话、PDA、媒体播放器、计算机、便携式电子设备、平板电脑等)。客户端802可以是硬件和/或软件(例如线程,进程,计算设备)。该系统800还包括一个或多个服务器804。服务器804也可以是硬件或硬件与软件的组合(例如,线程,进程,计算设备)。服务器804可以容纳各线程以通过采用本发明的各方法执行变换。客户端802和服务器804之间的可行通信可以是在一个数据包的两个或更多计算机进程之间传输的形式,其中,该数据包可以包括视频数据。该数据分组可以包括元数据,如相关的情境信息。系统800包括通信框架806(例如,全球通信网络,如因特网或移动网络),它可以用来促进客户机802和服务器804之间的通信。
[0065] 通信可经由有线(包括光纤)和/或无线技术来促进。客户端802包括或可操作地连接到一个或多个客户机数据存储808。数据存储808可以采用于本地存储信息而给客户端802使用(例如,相关联的情境信息)。类似地,服务器804包括或可操作地连接到一个或多个服务器数据存储810。数据存储810可以采用于本地存储信息而给服务器804使用。
[0066] 在一个实施例中,客户端802可以根据所公开的主题将已编码的文件传送到服务器804。服务器804可以存储该文件,解码的文件,或将文件传送到另一台客户端802。客户端802也可以压缩的文件传输到服务器804,而服务器804可以根据所公开的主题压缩该文件。
同样地,服务器804能编码影像信息,并通过通信架构806将信息传送到一个或多个客户机
802。
[0067] 本发明的所说明的也可以在分布式计算环境中实施,其中某些任务由通过通信网络链接的远程处理装置执行。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备中。
[0068] 此外,在本说明书中描述的各种部件可以包括电路,其可以包括为了实现各种实施例的组件和适当值的电路元件。许多不同的组件都可以在一个或多个集成电路(IC)芯片上实现。在一个实施例中,一组元件可以在单一的集成电路芯片上实现。在其它实施例中,一个或多个相应的组件可以在不同的集成电路芯片上实现或制造。
QQ群二维码
意见反馈