首页 / 专利库 / 版权及相关权 / 表演者 / 识别多首乐曲的方法

识别多首乐曲的方法

阅读:1051发布:2020-06-23

专利汇可以提供识别多首乐曲的方法专利检索,专利查询,专利分析的服务。并且一种识别多首乐曲的方法。按照本 发明 ,至少将待识别的一首乐曲的旋律和/或歌词 片段 (MA)提供给分析装置(1),由它确定旋律和/或歌词片段(MA)与分析装置(1)已知的多首乐曲(MT)之间的一致性。该分析装置(1)再参照确定的一致性选择已知的多首乐曲(MT)中的至少一首并提供识别数据(ID),例如,选择的一首乐曲(MT)的曲名或 表演者 和/或选择的一首乐曲(MT)本身的至少一部分。,下面是识别多首乐曲的方法专利的具体信息内容。

1.一种识别多首乐曲的方法,该方法包括如下步骤:
向分析装置(1)提供待识别的一首乐曲的旋律和/或歌词的至少一个 片段(MA);
提供的旋律和/或歌词片段或从中提取出的歌词被提供给语音识别系 统,并且将语音识别系统识别出的词和/或句子与不同的多首乐曲的歌词比 较;
确定该旋律和/或歌词片段(MA)与分析装置(1)已知的多首乐曲(MT) 或乐曲的一部分之间的一致性;
在定义的最小程度的一致性的范围内,参照此确定的一致性,至少从 已知的多首乐曲(MT)中选出一首乐曲;
提供选定的这首乐曲(MT)的识别数据(ID)和/或提供选定的这首 乐曲(MT)本身的至少一部分,或在没有选出一首乐曲(MT)的情况下 提供相应的信息。
2.如权利要求1所述的方法,其特征在于提供和/或建议提供具有确 定的最大一致性的多首乐曲和/或它们的识别数据。
3.如权利要求1或2所述的方法,其特征在于为了确定一致性,提取 旋律和/或歌词片段(MA)的给定典型特征,再从确定的典型特征中确定 代表旋律和/或歌词片段(MA)特征的一组典型特征,并将该组典型特征 与表示已知的多首乐曲(MT)特征的多组典型特征(MS)相比较。
4.如权利要求3所述的方法,其特征在于为了将旋律和/或歌词片段 (MA)的一组典型特征与保存在数据库中的多组典型特征(MS)相比较, 确定待比较的多组典型特征之间的相关性系数,所述的相关性系数的值表 示相应的多组典型特征之间的一致性。
5.如权利要求1所述的方法,其特征在于为了语音识别的目的,指定 提供的歌词片段使用的语言。
6.如权利要求1所述的方法,其特征在于用户向通信终端装置(2) 提供旋律和/或歌词片段(MA),旋律和/或歌词片段(MA)经通信网络 发送到分析装置(1),所选择的一首乐曲(MT)和/或它的识别数据(ID) 被发送,用来提供给用户指定的通信终端装置(2,3)。
7.如权利要求6所述的方法,其特征在于将旋律和/或歌词片段(MA) 提供给是一种移动通信终端装置(2)的终端装置(2)。
8.如权利要求6或7所述的方法,其特征在于所选择的一首乐曲(MT) 和/或它的识别数据(ID)被回送以便提供给通信终端装置(2),所述通 信终端装置(2)被加入了接收旋律和/或歌词片段(MA)。
9.如权利要求1所述的方法,其特征在于除所选择的一首或多首乐曲 和/或相关联的识别数据之外,至少提供和/或建议提供近似于所选择乐曲的 另外一首乐曲和/或它的识别数据。
10.如权利要求9所述的方法,其特征在于在心理声学领域的基础上 确定两首乐曲之间的相似性。
11.如权利要求9或10所述的方法,其特征在于在音域矩阵(AM) 的基础上确定两首乐曲之间的相似性,该矩阵是借助于收听试验或顾客行 为分析而建立的。
12.一种用于执行权利要求1到11中任何一种方法的分析装置(1), 包括:
用于提供待识别的一首乐曲的旋律和/或歌词的至少一个片段(MA) 的装置;
包括不同的多首乐曲或乐曲的一部分的数据库的存储器(4),或接入 至少一个这样的存储器的装置;
用于确定旋律和/或歌词的片段(MA)和不同的多首乐曲(MT)或乐 曲的一部分之间的一致性的装置;
用于在定义的最小程度的一致性的范围内,参照确定的一致性选择多 首乐曲(MT)中的至少一首的选择装置;
用于提供所选择的一首乐曲(MT)的识别数据(ID)和/或所选择的 一首乐曲(MT)本身的装置;以及
比较装置,用于将提供的旋律和/或歌词片段或从中提取出的歌词提供 给语音识别系统,并且将语音识别系统识别出的词和/或句子与不同的多首 乐曲的歌词比较。
13.如权利要求12所述的分析装置,其特征在于该分析装置包括用于 提取旋律和/或歌词片段(MA)的给定典型特征的装置和用于从确定的典 型特征中确定一组代表旋律和/或歌词片段(MA)特点的典型特征的装置, 并且其中存储器(4)的数据库包括代表每首乐曲(MT)特点的对应的多 组典型特征。
14.如权利要求12或13所述的分析装置,其特征在于用于提供旋律 和/或歌词片段的装置包括一个话筒,用于提供识别数据和/或所选择的一首 乐曲的装置包括声音输出单元和/或光学输出单元。
15.如权利要求12或13所述的分析装置,其特征在于用于提供旋律 和/或歌词片段(MA)的装置包括从终端装置(2)接收相应数据的接口, 用于提供识别数据(ID)和/或所选择的一首乐曲(MT)的装置包括向终 端装置(2,3)发送相应数据的接口。
16.如权利要求12或13所述的分析装置,其特征在于还包括用于选 择与选定的一首乐曲类似的另外多首乐曲的装置。

说明书全文

技术领域

发明涉及一种识别多首乐曲的方法,以及执行该方法的分析装置。

背景技术

很多人经常在迪斯科舞厅、美食城、百货公司等这类公共场所或通过广播 听到乐曲,并想知道表演者和/或作曲者以及曲名,以便获得这首乐曲的CD或 通过互联网获得乐曲文件。听到乐曲的人经常只记得想要的该首乐曲后面的段 落给定片段,例如,他记得歌词和/或旋律的给定片段。如果他足够幸运在专业 商店里与非常内行的店员接触,他就可以给店中的店员唱或哼出这首歌的片段 或说出一部分歌词,于是这个内行的店员就能够确定这首歌并指出它的名字和 演唱者。但是,很多情况下这是不可能的,因为商店的店员自己也不知道或不 记得曲名,或者因为当通过互联网定这首歌时没有直接可以找到的地址。

发明内容

本发明的目的是提供一种自动识别多首乐曲的方法和执行该方法的适当的 装置。该目的是通过本发明提供的识别多首乐曲的方法和执行该方法的分析装 置实现的。
按照本发明的第一方面,提供了一种识别多首乐曲的方法,该方法包括如 下步骤:向分析装置提供待识别的一首乐曲的旋律和/或歌词的至少一个片段; 提供的旋律和/或歌词片段或从中提取出的歌词被提供给语音识别系统,并且将 语音识别系统识别出的词和/或句子与不同的多首乐曲的歌词比较;确定该旋律 和/或歌词片段与分析装置已知的多首乐曲或乐曲的一部分之间的一致性:在定 义的最小程度的一致性的范围内,参照此确定的一致性,至少从已知的多首乐 曲中选出一首乐曲;提供选定的这首乐曲的识别数据和/或提供选定的这首乐曲 本身的至少一部分,或在没有选出一首乐曲的情况下提供相应的信息。
按照本发明的第二方面,提供了一种用于执行上述识别多首乐曲的方法的 分析装置,包括:用于提供待识别的一首乐曲的旋律和/或歌词的至少一个片段 的装置;包括不同的多首乐曲或乐曲的一部分的数据库存储器,或接入 至少一个这样的存储器的装置;用于确定旋律和/或歌词的片段和不同的多 首乐曲或乐曲的一部分之间的一致性的装置;用于在定义的最小程度的一 致性的范围内,参照确定的一致性选择多首乐曲中的至少一首的选择装置; 用于提供所选择的一首乐曲的识别数据和/或所选择的一首乐曲本身的装 置;以及比较装置,用于将提供的旋律和/或歌词片段或从中提取出的歌词 提供给语音识别系统,并且将语音识别系统识别出的词和/或句子与不同的 多首乐曲的歌词比较。
按照本发明,至少把要识别的一首乐曲的旋律和/或歌词的片段,例如第一 小节或副歌输入到分析装置。在该分析装置中,根据是分析装置所知晓的乐曲 确定旋律和/或歌词片段与其它多首乐曲或乐曲的一部分之间的不同的一致性。 在这种意义上说,分析装置知晓所有的歌曲,该装置具有到多首歌曲的链接并 且能够获得歌曲的相关数据比如曲名、演唱者、创作者等。这些歌曲可以存储 在一个或多个数据库中。例如,可能涉及各个唱片公司的不同数据库,这些数 据库可以由分析装置经网络,例如互联网获得。
通过将旋律和/或歌词片段与已知的多首歌曲(或它的一部分)相比较确定 与哪首歌一致,例如,使用一种或多种不同的样本分类运算法则。在最简单的 情况下,这是旋律和/或歌词片段与已知的多首歌曲之间简单的相互关系。至少 当提供待识别的一首乐曲原始的片段时,能够从与分析装置知晓的“正确的” 那首歌的速度相一致的固定速度开始。
基于确定的一致性,无论如何只要找到一首歌就至少选定多首歌曲中的一 首,这首歌与输入的旋律和/或歌词片段之间具有规定的最低限度的符合程度。
随后,提供确认的例如曲名、演唱者、作者或其他信息这些数据。同时提 供选择的这首乐曲本身。例如,这样的音响输出会起到核实这首歌曲的作用。 当用户听到播出的这首歌时,他可以再次验证是否是他寻找的那首并只在确定 是他要找的那首乐曲后提供识别数据。当因为没有确定输入的数据与任何一首 乐曲之间有最低限度的一致性而没有选择歌曲时,则依据该信息提供文字“没 有识别存在”。
最好,不仅提供一首乐曲而且提供多首歌曲和/或它们的识别数据以确定最 符合的那首或要求提供这些首歌曲和/或它们的识别数据。这意味着不仅提供最 一致的曲名而且提供第n(n=1,2,3,…)类似的曲名,为了证实的目的用 户能够连续地收听这些曲目或者向用户提供所有n首歌曲的识别数据。
在典型的最佳实施例中,为了确认一致性,提取给定的旋律和/或歌词片段 的典型特征。然后一组以旋律和/或歌词片段为特征的典型特征从这些指定的典 型特征中确定。这样的一组典型特征基本对应于每首乐曲的“指纹”。该组典 型特征再与分析装置已知的表征多首乐曲作品的多组典型特征相比较。这带来 待处理的数据量大大减小的优势,这也提高了整个方法的速度。而且,既然这 样数据库就不再需要保存多首完整的乐曲或具有所有信息的多首乐曲的一部 分,而只保存特定的多组典型特征,从而要求的存储区域将大大减小。
有利的是,旋律和歌词片段输入被提供给语音识别系统。相应的歌词也可 以被提取并单独提供给语音识别系统。在该语音识别系统中,识别的字和域句 子与多首不同的乐曲的歌词相比较。最终,歌词当然也应当作为典型特征保存 在数据库中。为了加快语音识别的速度,歌词片段的语言被预先指定从而语音 识别系统只需要接入相关语言要求的库而不需要搜索其它语言库。
旋律和歌词片段也可以提供给乐曲识别系统,在该系统中将识别的节拍和/ 或音程与典型的保存的多首乐曲的节拍和/或音程相比较,以这种方式找到该旋 律对应的那首乐曲。
例如,通过两种方式单独分析旋律和歌词以及单独搜索给定的一首乐曲也 是可能的。随后,比较用旋律找到的多首乐曲与用歌词找到的多首乐曲是否对 应。另外,从用不同的方式找到的多首乐曲中选定最一致的一首或多首乐曲。 在这种情况下,可以执行加权,在此加权中,用此概率检测经给定方式找到的 一首乐曲是正确地选定的一首乐曲。
也可以只提供没有歌词的一段旋律或旋律片断或者没有相应的旋律的一首 乐曲的歌词或歌词片段。
按照本发明,用于执行种的方法的分析装置应当包括用于提供待识别的一 首乐曲作品的旋律和/或歌词的片段的装置。而且,还应当包括带有包含若干首 乐曲或它们的一部分的数据库的存储器,或至少用于接入这样的存储器的装 置,比如用于接入其他互联网存储器的互联网连接。而且,该分析装置需要一 个装置,用于确定旋律和/或歌词片段与多首不同的乐曲或它们的一部分之间的 一致性,还需要一个选择装置,用于参照确定的一致性从多首乐曲中至少选出 一首,和用于提供选定的那首乐曲和/或选定的那首乐曲本身的识别数据的装 置,最后,分析装置还包括用于将提供的旋律和/或歌词片段或从中提取出的 歌词提供给语音识别系统,并且将语音识别系统识别出的词和/或句子与不同 的多首乐曲的歌词比较的比较装置。
这样的用于执行该方法的装置可以被形成为一个自支持系统,该系统包括 例如作为提供旋律和/或歌词片段装置的话筒,用户能够向该话筒说或唱他所知 道的歌词片段,也可以吹口哨或哼出相应的旋律。当然一首乐曲也可以在话筒 前被弹奏出。这种情况下,输出装置最好包括声音输出装置,例如扬声器,为 了验证的目的使用该扬声器可以将选出的一首乐曲或多首乐曲完整地或部分地 再现出来。识别数据也可以通过该声音输出装置提供。另外,分析装置也还可 以包括光学输出装置,例如在该装置上可以显示出识别数据。分析装置最好也 包括相应的操作装置,以验证多首乐曲的输出用于选择输出提供的多首乐曲或 提供对识别有帮助的附加信息,例如歌词的语言等。这样的自支持系统可以出 现在例如能够用它来向顾客做广告的媒体商店中。
在典型的最佳实施例中,用于提供旋律和/或歌词片段的分析装置包括从终 端设备接收相应数据的接口。同样,提供识别数据和/或选择的一首乐曲的装置 借助于向终端设备发送相应数据的接口来实现。在这种情况下,分析装置可以 在任意位置。用户能够向通信终端设备提供旋律或歌词片段并由此经通信网络 将它发送到分析装置。
最好,被提供旋律和/或歌词片段的通信终端装置是移动的通信终端装置例 如移动电话。这样的移动电话有话筒和用于经通信网络向任意个其它装置发送 记录的声音信号的必要的装置,在这里通信网络是移动无线网络。该方法的优 点是当用户在迪斯科舞厅或在百货公司的背景乐曲听到一首乐曲时,他能够通 过他的移动电话立即与分析装置建立连接,并能够经移动电话向分析装置“播 放”当前这首乐曲。用这样的原始乐曲的片段,与由用户自己唱或说出的被相 当程度地变形的乐曲和/或歌词片段相比能很大程度地提早识别出这首歌。
选择的该首乐曲或该首乐曲的一部分的识别数据和声音输出的提供也可以 通过相应的接口来实现,经过该接口相关的数据被发送到用户终端。该终端可 以是相同的终端装置,例如,用户的移动电话,旋律和/或歌词片段被提供给该 移动电话。这可以在线或离线完成。用于确认的选择的一首乐曲或选择的多首 乐曲或乐曲的一部分经终端装置的扬声器被提供。也可以发送曲名或表演者这 些识别数据以及可能选择输出的其他项目,例如,借助于终端装置的显示上的 SMS。
提供的一首乐曲的选择,以及对分析装置的其他控制命令或附加信息能够 由传统的操作控制,例如,由终端装置的键盘控制。
然而,数据也可以由自然的语音对话提供,这要求相应的语音接口,即分 析装置中的语音识别和语音输出系统。
另外,也可以离线作出搜索,即输入旋律和/或歌词片段后和输入其它命令 或信息后,用户或分析装置中断与分析装置的连接。分析装置已经找到结果后 发送该结果,例如,由SMS或由通过语音信道回叫用户的通信终端装置。
在这样的离线方法中,为用户指明另一个通信终端装置也是有可能的,例 如,将结果发送到他家中的计算机或e-mail地址。该结果也能够以HTML文 件的形式或类似的形式发送。发送地址的指示,即结果被发送到的通信终端装 置可以在输入乐曲和/或歌词片段之前或之后由相应的命令提供和指明。然而, 也有可能为相应用户预先在操作存储所需数据的分析装置的服务提供者那里明 确地登记。
在典型的优选实施例中,有可能除了选择的一首乐曲或相关的识别数据之 外还提供与与选择的一首乐曲相关的多首乐曲或它们的识别数据。这意味着, 例如,指明乐曲的曲目作为与记得的乐曲曲目相似格的附加的信息,从而使 用户能够知道符合他自己的口味的其他曲目,这些曲目他可能会想购买。
在心理声学范畴的基础上可以确定两首不同的乐曲之间的相似性,例如, 非常强或弱的低音、旋律中给出的频率变化等。确定两首乐曲之间的相似性的 另一种可能是使用通过收听试验和/或市场分析建立的音域矩阵,例如用户行为 分析。
参照下文中描述的实施例,本发明的这些和其他方面变得明显并将被说 明。
附图说明
在附图中:
图1用图示出了按照本发明使用移动电话输入和输出请求的数据进行在线 搜索的方法;
图2用图示出了按照本发明使用移动电话输入请求的数据并使用PC输出 结果数据进行离线搜索的方法;
图3示出了用于确定不同的多首乐曲之间的相似性的音域矩阵。

具体实施方式

在图1所示的方法中,用户使用移动电话2与分析装置1通信。于是,当 前在用户附近由任意的乐曲源5播放的一首乐曲的旋律和/或歌词MA被移动 电话2的话筒探测到。旋律和/或歌词MA经移动电话网络发送到分析装置1, 该分析装置与移动电话网络或固定电话网络一定有相应的连接,因而能够通过 此电话网络由用户与某地通话。
原则上,可以使用商业上可获得的移动电话2,它可以被修改以获得更好 的传输质量。通过移动电话2对分析装置1的控制可以由移动电话2上的按键 (未示出)通过相应的菜单控制实现。或者也可使用语音控制的菜单。
给定的典型特征由分析装置1从得到的旋律和/或歌词片段MA中提取。一 组代表旋律和/或歌词片段MA的特点的典型特征再从这些确定的典型特征中 指定。分析装置1与包含数据库的存储器4通信联络,该数据库包括每一个都 表示不同的乐曲特点的相应的多组典型特征MS。该数据库也包括请求的识别 数据,例如,对应的相关联的多首乐曲的曲名和表演者。为了把表示旋律和/或 歌词片段的特点的一组典型特征与保存在存储器4的数据库中的多组典型特征 MS相比较,待比较的多组典型特征之间的相关性系数由分析装置1确定。这 些相关性系数的值表示相应的多组典型特征之间的一致性。这意味着,保存在 存储器4中的一组典型特征MS的最大的相关性系数与提供给移动电话2的旋 律和/或歌词片段有最大的一致性的一首乐曲相关联。该首乐曲则被选为相关联 的识别出的一首乐曲,相关联的识别数据ID由分析装置1在线传送到移动电 话2,并在移动电话的显示屏上示出。
在所述的方法中,旋律和/或歌词片段MA直接由乐曲源5提供,识别过程 被简化到以下这个程度,与普通的语音或取样识别相反,假定多首乐曲总是以 几乎相同的速度播放从而能够假定用于识别的乐曲和/或歌词片段和待选择的相 应正确的一首乐曲之间至少固定的共同时间段。
图2表示与上述方法稍有不同的离线状态进行识别的方法。
待识别的一首乐曲或该首乐曲的一段旋律和/或歌词片段MA也通过外部的 乐曲源5提供到用户的移动电话2,信息也随后发送到分析装置1。而且通过 以旋律和/或歌词片段为特点的一组典型特征的确定来进行分析的种类和第一实 施例一样。
然而,与图1的第一实施例相反,识别的结果不回送到用户的移动电话2。 代替这种方式,该结果用e-mail经互联网或作为HTML页向用户的PC3或由 用户指定的PC或e-mail地址。
除了识别数据,相应的这首乐曲MT本身或者至少这首乐曲的一个片断也 发送到PC,从而用户能够为了识别的目的收听这首乐曲。这些乐曲MT(或这 些乐曲的片段)与代表多首乐曲的特点的多组典型特征一起也保存在存储器4 中。
也可发送索取带有搜索到的这首乐曲的CD、商业资料或附加的信息的命 令。附加信息可以被发送给用户,例如,与识别的乐曲曲目类似的其他乐曲曲 目。
通过图3所示的音域矩阵AM可确定相似性。该音域矩阵AM的元素M 是相似性系数,即表示两首乐曲之间的相似性的测量值。多首乐曲当然总是百 分之百与自己本身相似因此在对应的区域中填入1.0这个值。在相应的例子中, 带有曲名1的乐曲与曲目3和曲目5基本上相似。相反,具有曲名4或6的乐 曲与具有曲名1的乐曲完全不相似。因此,向被识别的乐曲曲名为1的用户另 外提供曲名3和5。
这样的音域矩阵AM也可以保存在存储器4中。这样的矩阵可通过,例如 在相当多的测试听众主观收听试验或顾客行为分析的基础上来确定。
分析装置1可以被放置在任意位置。分析装置应当只有与传统的移动电话 连接的接口或只有互联网连接。分析装置1在图中以相关的装置示出。分析装 置1的不同功能当然也可以分布在与互联网连接在一起的不同的装置中。分析 装置的功能可以很大部分或全部以软件的形式在有足够的计算和存储能的适 当的计算机或服务器上实现。使用包括相关数据库的单个中央存储器是不必要 的,而可以使用放在不同位置并能由分析装置1经互联网或其他的网络存取的 多个存储器。在这种情况下,有可能不同的乐曲生产和/或销售公司把他的多 首乐曲保存在他们自己的数据库中并允许分析装置接入到这些不同的数据库。 当减少不同的多首乐曲的特征信息为多组典型特征时,应当有效地确保从多首 乐曲中通过相同的方法提取典型特征,并且多组典型特征用相同的方式构成从 而以这种方式获得兼容性。
按照本发明的方法能够使用户容易地获得所需的数据以购买想要的乐曲, 并快速地识别当前播放的乐曲。而且,该方法使用户能够被告知也与他的个人 口味相应的其它多首乐曲的信息。该方法对乐曲销售公司是有利的,因为潜在 的用户能够被确切地提供他们感兴趣的乐曲从而吸引想得到的目标组。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈