专利汇可以提供一种基于声乐特征的个性化歌曲推荐方法专利检索,专利查询,专利分析的服务。并且本 发明 实施例 公开了一种基于声乐特征的个性化歌曲推荐系统。该方法包括如下步骤:特征提取步骤:提取歌唱数据的音域特征、速度特征和音色特征,其中音域特征包括绝对音域和相对音域,速度特征是每分钟 节拍 数,音色特征是梅尔 频率 倒谱 系数训练的高斯混合模型。系统推荐步骤:将用户演唱 片段 用关键音匹配 算法 找到音乐库中的对应歌曲,进行音域适合度检测、歌曲适合度检测、歌手适合度检测。用提取的用户特征进行歌手推荐和歌曲推荐。利用本发明实施例,可以实现评价当前演唱歌曲是否适合用户演唱,并进一步推荐与用户声乐能 力 相匹配的歌手和适合用户演唱的歌曲。从用户演唱的 角 度出发,将传统的音乐推荐范围进行了推广,具有很高的实用价值。,下面是一种基于声乐特征的个性化歌曲推荐方法专利的具体信息内容。
1.一种基于声乐特征的个性化歌曲推荐方法,其特征在于,包括以下步骤:
一.特征提取步骤:
A、音域特征提取:读入歌唱片段并通过快速傅里叶变换得到频谱,将每帧信号频谱值最大处对应的频率作为备选音高,并将其作为二到五次谐波时对应的基频加入到备选音高集合中;从歌唱片段中提取出每帧的备选音高集合;计算备选音高的选中概率,取概率最大者为输出音高,得到初始音高序列;对初始音高序列去孤立点,得到最终预测音高序列;找出最终预测音高序列的最高音和最低音,计算绝对音域和相对音域;
备选音高集合表达式为:
其中,fi表示当前帧的第i个备选音高,fmax表示当前帧的频谱峰值对应的频率;
每个备选音高的选中概率为:
其中,hm=0.55m-1为压缩因子,A(nf)是f的n次谐波对应的频谱幅度;
音域特征提取的步骤,具体包括:在得到初始音高序列后进行去孤立点,判断初始音高序列中的各点是正常点的规则是该点音高与前一点和后一点的音高一致,频率差不超过
60Hz;得到最终预测音高序列后,绝对音域为最低音到最高音的区间,相对音域是该区间对应的八度个数;
B、速度特征提取:利用小波变换得到原始歌唱信号的一系列子频带;对每一个子频带分别做低通滤波、下采样,得到时域上的振幅包络;对其求和并做自相关函数分析,将得到的前5个峰值的每分钟节拍数BPM值相加得到速度特征;
C、音色特征提取:提取歌唱片段的39阶梅尔频率倒谱系数,用其训练该歌唱片段的含
64个成分的高斯混合模型;
二.推荐步骤:将用户演唱片段用关键音匹配算法找到音乐库中的对应歌曲;进行音域适合度检测、歌曲适合度检测和歌手适合度检测后;用提取的音域特征和音色特征进行歌手推荐和歌曲推荐;
关键音匹配算法步骤如下:
1)用户歌唱片段记为User(n),音乐库中的片段记为Music(N);用户歌唱片段序列和音乐库片段序列为二维向量序列
①对Music(N)和User(n)进行关键音提取,得到各自的关键音序列Musicp(M)和Userp(m),M和m为关键音序列的长度;关键音序列为三维向量序列
②比较关键音序列Musicp(M)和Userp(m),确定Music(N)中可能与User(n)相似的片段,进行关键音匹配;
2)根据步骤1)中找到的相似片段,将User(n)的整体音高调整到与Music(N)一致,歌唱速度调整到与原唱速度一致;
3)计算User(n)和Music(N)的相似度;
①对User(n)和Music(N)进行时间的交叉划分,得到User(m)和Music(M);
②对User(m)和Music(M)进行音长的交叉划分,得到User(t)和Music(t),序列长度为T;这两个序列的音高分量序列和音长分量序列分别记为Userp(t)、Userd(t)、Musicp(t)、Musicd(t);
③按下式计算用户歌唱片段和音乐库片段的相似度:
Similarity值越小,相似度越高;Similarity=0时,代表两段旋律完全相同。
2.根据权利要求1所述的方法,其特征在于,音域适合度检测的步骤,包括:
返回用户歌唱的绝对音域和相对音域、用户歌唱音域中的较窄、正常和/或较宽的属性;
其中,绝对音域的表示形式为音符加八度标号,设置的音符加八度标号的歌唱音域范围为[C2,C6],相对音域以绝对音域对应了几个八度计;用户歌唱音域判定规则:若相对音域<1,则用户歌唱音域较窄;若1≤相对音域≤1.75,则用户歌唱音域正常;若相对音域>
1.75,则用户歌唱音域较宽。
3.根据权利要求1所述的方法,其特征在于,歌曲适合度检测的步骤,包括:返回当前演唱歌曲是否适合用户演唱;歌曲适合度检测使用的特征是音域特征和速度特征:
音域特征的比较步骤:
①比较绝对音域,若用户绝对音域在歌曲绝对音域范围内,则该歌曲可以演唱,否则不可以直接演唱;若不可以直接演唱,则进行步骤②;
②比较相对音域,若用户相对音域不小于歌曲相对音域,则该歌曲可以选择转调演唱,否则该歌曲无法演唱;
速度特征的比较规则:若0.8倍的歌曲速度≤用户演唱速度≤1.2倍的歌曲速度,则该曲适合演唱;否则该曲不适合演唱。
4.根据权利要求1所述的方法,其特征在于,歌手适合度检测,包括:返回当前演唱歌曲的原唱歌手是否有歌曲适合用户演唱;歌手适合度检测使用的特征是音域特征和音色特征:
音域特征的比较:
①比较绝对音域,若用户绝对音域在歌手绝对音域的±14个半音范围内,则用户可以演唱该歌手的歌曲,否则不可以直接演唱;若不可以直接演唱,则进行步骤②;
②比较相对音域,若用户相对音域大于歌手相对音域的 则用户可以选择转调演唱该歌手的歌曲,否则无法演唱;
音色特征的比较,通过计算用户歌唱片段观察矢量序列的后验概率P(X|λk),来得到音色相近的歌手;将后验概率最大的三位歌手作为最合适该用户演唱的三位歌手,若其中含有当前演唱歌曲的原唱歌手,则判定音色相似,可以演唱,否则判定用户不适合演唱该歌手的歌曲。
5.根据权利要求1所述的方法,其特征在于,还包括根据用户演唱特征进行推荐工作的步骤,包括:首先进行音色匹配得到推荐歌手,然后需要用户选择演唱方式,演唱方式包括直接演唱、转调演唱或跨性别演唱,在推荐歌手的范围内进行音域匹配得到推荐歌曲;若用户选择直接演唱,则在音域匹配中进行绝对音域匹配,若选择转调演唱,则在音域匹配中选择相对音域匹配;音域匹配为音域特征的比较,包括:
①比较绝对音域,若用户绝对音域在歌曲绝对音域范围内,则该歌曲可以演唱,否则不可以直接演唱;若不可以直接演唱,则进行步骤②;
②比较相对音域,若用户相对音域不小于歌曲相对音域,则该歌曲可以选择转调演唱,否则该歌曲无法演唱;
音色匹配的方法包括:音色特征的比较,通过计算用户歌唱片段观察矢量序列的后验概率P(X|λk),来得到音色相近的歌手;将后验概率最大的三位歌手作为最合适该用户演唱的三位歌手,若其中含有当前演唱歌曲的原唱歌手,则判定音色相似,可以演唱,否则判定用户不适合演唱该歌手的歌曲;得到了三位推荐歌手后,在每位歌手的歌曲库中进行音域匹配:首先进行歌手适合度检测中的音域特征的比较,得到音色和音域均可演唱的歌手,然后进行歌曲适合度检测中的音域特征的比较,得到可演唱歌曲;最终得到推荐给该用户的歌手和歌曲。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
语音唇形拟合方法、系统及存储介质 | 2020-05-12 | 578 |
声纹识别方法、装置、移动终端及计算机可读存储介质 | 2020-05-14 | 126 |
一种基于特征融合的语音声效模式检测方法 | 2020-05-14 | 729 |
基于多种特征融合的语音篡改检测方法 | 2020-05-14 | 200 |
到站提醒方法、装置、终端及存储介质 | 2020-05-08 | 218 |
一种基于余弦相似度的语音识别方法和装置 | 2020-05-13 | 253 |
身份识别方法、装置及计算机可读存储介质 | 2020-05-15 | 675 |
一种登陆方法和装置 | 2020-05-14 | 534 |
一种基于LSTM循环神经网络的天然气管道泄漏检测方法 | 2020-05-08 | 79 |
一种用于增强现实的处理方法及增强现实终端 | 2020-05-13 | 546 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。