首页 / 专利库 / 人工智能 / 音乐信息检索 / 基于示例语义的音乐检索装置

基于示例语义的音乐检索装置

阅读:116发布:2020-05-15

专利汇可以提供基于示例语义的音乐检索装置专利检索,专利查询,专利分析的服务。并且基于示例语义的音乐检索装置,属于语义分析和音乐检索领域,用于解决发展中文音乐的 信息检索 的问题,要点是包括标注模 块 、网络参数获取模块、网络输出获取模块、语义向量获取模块、示例音乐语义向量获取模块、距离计算模块、名称集合获取模块、列表获取模块;效果是可以得到与所记得的歌曲名称最为相似的音乐列表。,下面是基于示例语义的音乐检索装置专利的具体信息内容。

1.一种基于语义的音乐检索装置,其特征在于,包括:
标注模:标注音乐数据集 该数据集中每首音乐被表示成一个d维
特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
网络参数获取模块:按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数Wk,bk;Wk是权值网络参数,bk是偏置网络参数;
网络输出获取模块:使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出 所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
语义向量获取模块:根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义
向量的项数, 是网络输出值;
示例音乐语义向量获取模块:将示例音乐作为卷积神经网络输入,得到网络输出值计算示例音乐q的语义向量
距离计算模块:计算 和 之间余弦距离Rs;
名称集合获取模块:令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
列表获取模块:输出在语义空间中与示例音乐最相似的音乐列表Xlist。

说明书全文

基于示例语义的音乐检索装置

技术领域

[0001] 本发明属于语义分析和音乐检索领域,涉及一种基于示例语义的音乐检索装置。

背景技术

[0002] 音乐信息检索(MIR)是一个跨学科领域,专注于从音频信号中自动提取信息,并能够搜索出音乐相关信息。基于语义描述的音乐检索是一种从音乐语义描述文件和人对音乐的主观感受出发,检索音乐信息的一种方式,通常处理步骤为:在有监督的多类别标记模型基础上,对音乐实现语义标签的自动化标记,进一步将音乐内容映射到语义空间向量。在语义空间中,比较音乐语义向量之间的相似度,从而得出检索结果。
[0003] 但语义的体会往往因人而异,有很强的主观性和个性化特点。此外,类似的音乐数据库多集中在西方音乐中,对中文歌曲鲜有完成自动化语义标注的音乐数据库。开发一个基于语义的音乐检索交互系统,是在完成自动化语义标签标注基础上,设计用户交互界面,以完成用户语义检索需求,同时广泛收集用户对歌曲新的标注信息,特别是中文歌曲的标注,有助于中文音乐信息检索的进一步发展。因此,提出基于语义的音乐检索方法十分必要。

发明内容

[0004] 为了解决进一步发展中文音乐的信息检索的问题,本发明提供一种基于示例语义的音乐检索方法,方案如下:一种基于语义的音乐检索装置,包括
[0005] 1.一种基于语义的音乐检索装置,其特征在于,包括:
[0006] 标注模:标注音乐数据集 该数据集中每首音乐被表示成一个d维的特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0007] 网络参数获取模块:按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数Wk,bk;Wk是权值网络参数,bk是偏置网络参数;
[0008] 网络输出获取模块:使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出 所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0009] 语义向量获取模块:根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0010] 示例音乐语义向量获取模块:将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0011] 距离计算模块:计算 和 之间余弦距离Rs;
[0012] 名称集合获取模块:令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0013] 列表获取模块:输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0014] 有益效果:由上述方案,可以得到与所记得的歌曲名称q最为相似的音乐列表。也就是说,即使输入不完整的歌曲名称,本发明提供的方法也可找到与之匹配的歌曲,基于示例语义的音乐检索方法可有效提高查找音乐的效率。附图说明
[0015] 图1是基于语义的音乐检索交互模型框架
[0016] 图2是计算语义向量集流程执行图。
[0017] 图3是音乐检索算法流程执行图。
[0018] 图4是卷积神经网络结构示意图。

具体实施方式

[0019] 实施例1:音乐充斥在生活的每一个落,随着科技的飞速发展,人们对查找音乐的要求也在不断地提高。当对某首歌的歌名不太记得却想要找到这首音乐时,本发明提供的方法可以有效的解决此时的音乐需求。为了实现上述目的,本实施例采用的技术方案执行步骤如下:
[0020] S1.输入你所记得的歌曲名称,记为q,标注音乐数据集 该数据集中每首音乐被表示成一个d维的特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0021] S2.按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数Wk,bk;Wk是权值网络参数,bk是偏置网络参数;
[0022] S3.使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0023] S4.根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0024] S5.将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0025] S6.计算 和 之间余弦距离Rs;
[0026] S7.令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0027] S8.输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0028] 基于上述方法,得到一种与上述方法一一对应的装置,包括:
[0029] 标注模块:标注音乐数据集 该数据集中每首音乐被表示成一个d维的特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0030] 网络参数获取模块:按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关k k系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数W ,bk;W 是权值网络参数,bk是偏置网络参数;
[0031] 网络输出获取模块:使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出 所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0032] 语义向量获取模块:根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0033] 示例音乐语义向量获取模块:将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0034] 距离计算模块:计算 和 之间余弦距离Rs;
[0035] 名称集合获取模块:令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0036] 列表获取模块:输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0037] 由上述方案,可以得到与所记得的歌曲名称q最为相似的音乐列表。也就是说,即使输入不完整的歌曲名称,本发明提供的方法也可找到与之匹配的歌曲,基于示例语义的音乐检索方法可有效提高查找音乐的效率。
[0038] 基于语义描述的音乐检索是从音乐语义描述文件和人对音乐的主观感受出发,检索音乐信息的一种方式。与传统的基于内容音乐检索和基于文本元数据的音乐检索方式不同,基于语义的检索系统是在有监督的多类别标记模型基础上,对音乐实现语义标签的自动化标记,进一步将音乐内容映射到语义空间向量。在语义空间中,比较音乐语义向量之间的相似度,从而得出检索结果,提高了中文音乐的检索速度,满足现代人对音乐检索的要求。
[0039] 以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈