技术领域
[0001] 本
发明属于语义分析和音乐检索领域,涉及一种基于示例语义的音乐检索装置。
背景技术
[0002] 音乐
信息检索(MIR)是一个跨学科领域,专注于从音频
信号中自动提取信息,并能够搜索出音乐相关信息。基于语义描述的音乐检索是一种从音乐语义描述文件和人对音乐的主观感受出发,检索音乐信息的一种方式,通常处理步骤为:在有监督的多类别标记模型
基础上,对音乐实现语义标签的自动化标记,进一步将音乐内容映射到语义空间向量。在语义空间中,比较音乐语义向量之间的相似度,从而得出检索结果。
[0003] 但语义的体会往往因人而异,有很强的主观性和个性化特点。此外,类似的音乐
数据库多集中在西方音乐中,对中文歌曲鲜有完成自动化语义标注的音乐数据库。开发一个基于语义的音乐检索交互系统,是在完成自动化语义标签标注基础上,设计用户交互界面,以完成用户语义检索需求,同时广泛收集用户对歌曲新的标注信息,特别是中文歌曲的标注,有助于中文
音乐信息检索的进一步发展。因此,提出基于语义的音乐检索方法十分必要。
发明内容
[0004] 为了解决进一步发展中文音乐的信息检索的问题,本发明提供一种基于示例语义的音乐检索方法,方案如下:一种基于语义的音乐检索装置,包括
[0005] 1.一种基于语义的音乐检索装置,其特征在于,包括:
[0006] 标注模
块:标注音乐数据集 该数据集中每首音乐被表示成一个d维的
特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0007] 网络参数获取模块:按照
卷积神经网络结构,使用已知标记数据集中xi和yj间的关系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数Wk,bk;Wk是权值网络参数,bk是偏置网络参数;
[0008] 网络输出获取模块:使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出 所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索
算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0009] 语义向量获取模块:根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0010] 示例音乐语义向量获取模块:将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0011] 距离计算模块:计算 和 之间余弦距离Rs;
[0012] 名称集合获取模块:令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0013] 列表获取模块:输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0014] 有益效果:由上述方案,可以得到与所记得的歌曲名称q最为相似的音乐列表。也就是说,即使输入不完整的歌曲名称,本发明提供的方法也可找到与之匹配的歌曲,基于示例语义的音乐检索方法可有效提高查找音乐的效率。
附图说明
[0015] 图1是基于语义的音乐检索交互模型
框架。
[0016] 图2是计算语义向量集流程执行图。
[0017] 图3是音乐检索算法流程执行图。
[0018] 图4是卷积神经网络结构示意图。
具体实施方式
[0019]
实施例1:音乐充斥在生活的每一个
角落,随着科技的飞速发展,人们对查找音乐的要求也在不断地提高。当对某首歌的歌名不太记得却想要找到这首音乐时,本发明提供的方法可以有效的解决此时的音乐需求。为了实现上述目的,本实施例采用的技术方案执行步骤如下:
[0020] S1.输入你所记得的歌曲名称,记为q,标注音乐数据集 该数据集中每首音乐被表示成一个d维的特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0021] S2.按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数Wk,bk;Wk是权值网络参数,bk是偏置网络参数;
[0022] S3.使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0023] S4.根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0024] S5.将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0025] S6.计算 和 之间余弦距离Rs;
[0026] S7.令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0027] S8.输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0028] 基于上述方法,得到一种与上述方法一一对应的装置,包括:
[0029] 标注模块:标注音乐数据集 该数据集中每首音乐被表示成一个d维的特征向量xi,xi∈X,X是数据集,X∈D,i是数据集中音乐的序号,j是语义空间中语义标签的序号;q是待检索的示例音乐,yj是在训练好的网络模型中的xi对应的网络输出;
[0030] 网络参数获取模块:按照卷积神经网络结构,使用已知标记数据集中xi和yj间的关k k系,按照设计好的卷积神经网络结构训练网络模型,得到网络参数W ,bk;W 是权值网络参数,bk是偏置网络参数;
[0031] 网络输出获取模块:使用训练好的网络模型,将待检索数据集中每首音乐作为输入,得到网络输出 所述训练好的网络模型结构,是根据用户所出示的示例歌曲信号,从中获取底层物理特征并映射到卷积神经网络,把从卷积神经网络得到的语义特征向量导入语义检索算法,在标注数据集的加持下得出检索结果,把用户的交互信息导入交互检索及推荐算法,在标注数据集的加持下得出交互结果,将检索结果和交互结果反馈给用户而形成的网络模型结构;
[0032] 语义向量获取模块:根据网络模型输出,计算待检索数据集中每首音乐的语义向量,得到语义向量集: sementic表示为语义的,p表示语义向量集中语义向量的项数, 是网络输出值;
[0033] 示例音乐语义向量获取模块:将示例音乐作为卷积神经网络输入,得到网络输出值 计算示例音乐q的语义向量
[0034] 距离计算模块:计算 和 之间余弦距离Rs;
[0035] 名称集合获取模块:令音乐列表Xlist是Rs值最小的前n个音乐的名称集合;
[0036] 列表获取模块:输出在语义空间中与示例音乐最相似的音乐列表Xlist。
[0037] 由上述方案,可以得到与所记得的歌曲名称q最为相似的音乐列表。也就是说,即使输入不完整的歌曲名称,本发明提供的方法也可找到与之匹配的歌曲,基于示例语义的音乐检索方法可有效提高查找音乐的效率。
[0038] 基于语义描述的音乐检索是从音乐语义描述文件和人对音乐的主观感受出发,检索音乐信息的一种方式。与传统的基于内容音乐检索和基于文本元数据的音乐检索方式不同,基于语义的检索系统是在有监督的多类别标记模型基础上,对音乐实现语义标签的自动化标记,进一步将音乐内容映射到语义空间向量。在语义空间中,比较音乐语义向量之间的相似度,从而得出检索结果,提高了中文音乐的检索速度,满足现代人对音乐检索的要求。
[0039] 以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉
本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。