首页 / 专利库 / 人工智能 / 词性标注 / 背景音乐的确定方法及相关设备

背景音乐的确定方法及相关设备

阅读:173发布:2020-05-13

专利汇可以提供背景音乐的确定方法及相关设备专利检索,专利查询,专利分析的服务。并且本 申请 公开了一种背景音乐的确定方法及相关设备,方法包括:获取目标文本;对所述目标文本进行分词处理,得到关键词信息;根据预先构建的问题集树和所述关键词信息确定文本特征信息;根据所述文本特征信息确定目标背景音乐;将所述目标背景音乐作为所述目标文本的背景音乐。采用本申请 实施例 可提升背景音乐选择的准确性。,下面是背景音乐的确定方法及相关设备专利的具体信息内容。

1.一种背景音乐的确定方法,其特征在于,所述方法包括:
获取目标文本;
对所述目标文本进行分词处理,得到关键词信息;
根据预先构建的问题集树和所述关键词信息确定文本特征信息;
根据所述文本特征信息确定目标背景音乐;
将所述目标背景音乐作为所述目标文本的背景音乐。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标文本进行分词处理,得到关键词信息,包括:
对所述目标文本进行分词处理,得到分词信息;
筛选所述分词信息,得到所述关键词信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标文本进行分词处理,得到分词信息,包括:
对所述目标文本进行分词处理,得到分词结果;
对所述分词结果包括的词进行修正,得到修正结果;
对所述修正结果包括的词进行词性标注,得到所述分词信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述问题集树包括多颗二叉树,每颗所述二叉树对应一个或多个问题,所述根据预先构建的问题集树和所述关键词信息确定文本特征信息,包括:
将所述关键词信息输入所述问题集树,输出每颗所述二叉树对应的文本特征值;
根据每颗所述二叉树对应的文本特征值生成所述文本特征信息。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述文本特征信息确定目标背景音乐,包括:
将所述文本特征信息输入音乐特征预测模型,输出第一音乐特征信息;
根据所述第一音乐特征信息确定目标背景音乐。
6.根据权利要求5所述的方法,其特征在于,应用于电子设备,所述电子设备存储有背景音乐库,所述背景音乐库包括多个背景音乐,每个背景音乐对应一个第二音乐特征信息,所述根据所述第一音乐特征信息确定目标背景音乐,包括:
确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度;
根据确定的多个相似度确定所述目标背景音乐。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述将所述目标背景音乐作为所述目标文本的背景音乐之后,所述方法还包括:
对所述目标文本进行语音转换,得到目标语音;
将所述目标语音与所述目标背景音乐进行混音处理,得到所述目标文本对应的目标音频。
8.一种背景音乐的确定装置,其特征在于,所述装置包括:
获取单元,用于获取目标文本;
分词单元,用于对所述目标文本进行分词处理,得到关键词信息;
特征确定单元,用于根据预先构建的问题集树和所述关键词信息确定文本特征信息;
背景音乐确定单元,用于根据所述文本特征信息确定目标背景音乐;
所述背景音乐确定单元,还用于将所述目标背景音乐作为所述目标文本的背景音乐。
9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理执行如权利要求1-7任一项所述的方法。

说明书全文

背景音乐的确定方法及相关设备

技术领域

[0001] 本申请涉及电子技术领域,尤其涉及一种背景音乐的确定方法及相关设备。

背景技术

[0002] 随着智能语音相关技术的日益成熟,越来越多的人习惯于用朵来感受这个世界,如听广播、新闻、听有声读物等。在“听”的同时,播放背景音乐的能够让人有身临其境的感觉,使文章表达更为生动,一个好的背景音乐可以更充分的表现出文章所要表达的信息,引发共鸣。因此,为了让用户获得更大的体验感及舒适度,背景音乐变得尤为重要。目前,在涉及背景音乐选择的应用场景中,绝大多数背景音乐的选择都依靠人工,人工选择可能会选择到一个不适合当前场景的背景音乐。发明内容
[0003] 本申请实施例提供一种背景音乐的确定方法及相关设备,用于提升背景音乐选择的准确性。
[0004] 第一方面,本申请实施例提供一种背景音乐的确定方法,所述方法包括:
[0005] 获取目标文本;
[0006] 对所述目标文本进行分词处理,得到关键词信息;
[0007] 根据预先构建的问题集树和所述关键词信息确定文本特征信息;
[0008] 根据所述文本特征信息确定目标背景音乐;
[0009] 将所述目标背景音乐作为所述目标文本的背景音乐。
[0010] 第二方面,本申请实施例提供一种背景音乐的确定装置,所述装置包括:
[0011] 获取单元,用于获取目标文本;
[0012] 分词单元,用于对所述目标文本进行分词处理,得到关键词信息;
[0013] 特征确定单元,用于根据预先构建的问题集树和所述关键词信息确定文本特征信息;
[0014] 背景音乐确定单元,用于根据所述文本特征信息确定目标背景音乐;将所述目标背景音乐作为所述目标文本的背景音乐。
[0015] 第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面所述的方法中的步骤的指令。
[0016] 第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。
[0017] 第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0018] 可以看出,在本申请实施例中,先对目标文本进行分词处理,得到关键词信息,然后根据预先构建的问题集树和关键词信息确定文本特征信息,再然后根据文本特征信息确定目标背景音乐,最后将目标背景音乐作为目标文本的背景音乐,实现了基于文本的文本特征信息来选择符合文本的背景音乐,进而提升背景音乐选择的准确性。
[0019] 本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明
[0020] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021] 图1是本申请实施例提供的一种电子设备的结构示意图;
[0022] 图2A是本申请实施例提供的一种背景音乐的确定方法的流程示意图;
[0023] 图2B是本申请实施例提供的一种二叉树的示意图;
[0024] 图3是本申请实施例提供的另一种背景音乐的确定方法的流程示意图;
[0025] 图4本申请实施例提供的一种电子设备的结构示意图;
[0026] 图5本申请实施例提供的一种背景音乐的确定装置的结构示意图。

具体实施方式

[0027] 为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0028] 以下分别进行详细说明。
[0029] 本申请的说明书权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0030] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0031] 电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminal device)等等。
[0032] 如图1所示,图1是本申请实施例提供的一种电子设备的结构示意图。该电子设备包括处理器、存储器、显示屏、随机存取存储器(Random Access Memory,RAM)和摄像头。其中,存储器、显示屏、RAM和摄像头均与处理器连接。
[0033] 进一步地,电子设备还包括信号通信接口信号处理器、扬声器、麦克传感器,信号处理器、扬声器、麦克风和传感器均与处理器连接,通信接口与信号处理器连接。
[0034] 其中,显示屏可以是液晶显示器(Liquid Crystal Display,LCD)、有机或无机发光二极管(Organic Light-Emitting Diode,OLED)、有源矩阵有机发光二极体面板(Active Matrix/Organic Light Emitting Diode,AMOLED)等。
[0035] 其中,该摄像头可以是普通摄像头、也可以是红外摄像,在此不作限定。该摄像头可以是前置摄像头或后置摄像头,在此不作限定。
[0036] 其中,传感器包括以下至少一种:光感传感器、陀螺仪、红外接近传感器、指纹传感器、传感器等等。其中,光感传感器,也称为环境光传感器,用于检测环境光亮度。光线传感器可以包括光敏元件和模数转换器。其中,光敏元件用于将采集的光信号转换为电信号,模数转换器用于将上述电信号转换为数字信号。可选的,光线传感器还可以包括信号放大器,信号放大器可以将光敏元件转换的电信号进行放大后输出至模数转换器。上述光敏元件可以包括光电二极管、光电三极管、光敏电阻电池中的至少一种。
[0037] 其中,处理器是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器内的软体程序和/或模,以及调用存储在存储器内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
[0038] 其中,处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
[0039] 其中,存储器用于存储软体程序和/或模块,处理器通过运行存储在存储器的软件程序和/或模块,从而执行电子设备的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的软体程序等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0040] 下面对本申请实施例进行详细介绍。
[0041] 请参见图2A,图2A是本申请实施例提供一种背景音乐的确定方法,应用于上述电子设备,具体包括以下步骤:
[0042] 步骤201:电子设备获取目标文本。
[0043] 可选地,电子设备获取目标文本,包括:
[0044] 电子设备获取用户当前阅读的目标文本;或者电子设备获取用户当前收听的目标文本。
[0045] 其中,所述目标文本的获取单位为文本篇章。比如,用户当前阅读小说1的第一篇章,那么电子设备获取的目标文本为小说1的第一篇章。又比如,用户当前收听小说1的第一篇章,那么电子设备获取的目标文本为小说1的第一篇章。
[0046] 可以看出,以文本篇章为单位获取文本,即可以防止因文本信息过少,不足以描述文本所表达主题内容的情况,又可以防止文本信息太多,造成的系统响应速度变慢的问题。
[0047] 可选地,在步骤201之前,所述方法还包括:
[0048] 电子设备显示所述目标文本的阅读界面;
[0049] 在检测到针对所述目标文本的阅读界面的第一设定触控操作时,电子设备显示音乐图标;
[0050] 电子设备确定检测到针对所述音乐图标的点击操作。
[0051] 其中,所述第一设定触控操作包括以下其中一种:针对特定位置(如所述目标文本的阅读界面的左上、左下角、右下角、右上角等等)的长按操作、针对所述目标文本的阅读界面的特定滑动操作(如从上往下的滑动操作、从下往上的滑动操作、从左往右的滑动操作、从右往左的滑动操作等等)等等。
[0052] 可以看出,通过界面上显示的图标来触发确定文本的背景音乐,操作简单便捷,提升用户体验。
[0053] 可选地,在步骤201之前,所述方法还包括:
[0054] 电子设备进行音频采集,得到第一音频;
[0055] 电子设备解析所述第一音频,得到至少一个第一关键词;
[0056] 电子设备确定所述至少一个第一关键词包括至少一个第一设定关键词。
[0057] 其中,第一设定关键词包括以下至少一个:播放、背景、音乐等等。
[0058] 可以看出,通过语音触发确定文本的背景音乐,操作简单便捷,提升用户体验。
[0059] 可选地,所述电子设备包括第一音量调节物理按键,在步骤201之前,所述方法还包括:
[0060] 电子设备确定检测到针对所述第一音量调节物理按键的按压操作,所述电子设备当前显示目标文本的阅读界面。
[0061] 可以看出,通过音量调节物理按键触发确定文本的背景音乐,操作简单便捷,提升用户体验。
[0062] 步骤202:电子设备对所述目标文本进行分词处理,得到关键词信息。
[0063] 在本申请的一实现方式中,电子设备对所述目标文本进行分词处理,得到关键词信息,包括:
[0064] 电子设备对所述目标文本进行分词处理,得到分词信息;
[0065] 电子设备筛选所述分词信息,得到所述关键词信息。
[0066] 可选地,电子设备对所述目标文本进行分词处理,得到分词信息,包括:
[0067] 电子设备对所述目标文本进行分词处理,得到分词结果;
[0068] 电子设备对所述分词结果包括的词进行修正,得到修正结果;
[0069] 电子设备对所述修正结果包括的词进行词性标注,得到所述分词信息。
[0070] 其中,电子设备使用分词模型对目标文本进行分词处理,该分词模型采用常用模型构建,如基于神经网络的方法构建得到。
[0071] 其中,电子设备使用“查词典”方法对分词结果进行修正,“查词典”方法由通用词典,以及与书籍或阅读方向相关的专业词典构成,具体修正时,将出现在词典中的阅读词汇作为一个词。
[0072] 其中,电子设备使用词性标注(part-of-speech,POS)方法对修正结果包括的词进行词性标注,POS会根据上下文对词打上词性标签,方便对词进行词性辨别,以删减与文本相关度不大的词。
[0073] 可选地,电子设备筛选所述分词信息,得到所述关键词信息,包括:
[0074] 电子设备从所述分词信息中筛选出词性标签为预设标签的词,得到所述关键词信息。
[0075] 其中,所述关键词信息包括至少一个关键词。
[0076] 其中,所述预设标签包括以下至少一种:状态词、形容词、名称等。
[0077] 举例来说,假设目标文本为“今晚的月色是非常的迷人啊”,使用分词模型对目标文本进行分词处理后,假如得到的分词结果为“今晚/的/月色/是/非常/的/迷人/啊”,使用“查词典”方法对分词结果进行修正,假如得到的修正结果为“今晚/的/月色/是/非常/的/迷人/啊”,使用POS对修正结果进行词性,假如标注后得到的分词信息“今晚(z)/的(u)/月色(n)/是(u)/非常(d)/的(u)/迷人(a)/啊(u)”,其中,z表示状态词,u表示助词,a表示形容词,d表示副词,n表示名词,假如预设标签包括状态词、形容词和名称,那么筛选后的关键词信息为“今晚(z)/月色(n)/迷人(a)”。
[0078] 步骤203:电子设备根据预先构建的问题集树和所述关键词信息确定文本特征信息。
[0079] 在步骤203之前,电子设备先构建问题集树,该问题集树构建主要是围绕文本主题场景设计的。围绕文本主题场景提出的所有问题组成该问题集树。组成的问题集树包括多颗二叉树,每颗所述二叉树对应一个或多个问题。
[0080] 在本申请的一实现方式中,电子设备根据预先构建的问题集树和所述关键词信息确定文本特征信息,包括:
[0081] 电子设备将所述关键词信息输入所述问题集树,输出每颗所述二叉树对应的文本特征值;
[0082] 电子设备根据每颗所述二叉树对应的文本特征值生成所述文本特征信息。
[0083] 可选地,电子设备根据每颗所述二叉树对应的文本特征值生成所述文本特征信息,包括:
[0084] 电子设备按照文本特征值的输出顺序对输出的多个文本特征值进行排列,得到所述文本特征信息。
[0085] 具体地,每经过问题集树中的一颗二叉树均会得到一个文本特征信息,二叉树的每个节点为一个问题,节点的每一条边表示回答“是”或“否”。举例来说,针对文本“泰山自古长存,雄浑壮阔”,问题有“文章中有无地名?”,假如针对该问题的回答为1,即该问题对应的特征值为1,特征值为1表示有地名,该问题对应的二叉树如图2B所示。
[0086] 其中,文本特征信息的表示方式有:V={v1,v2,…,vi,…,vn},其中,V为文本特征信息,vi表示第i个问题的文本特征值,n为问题个数。
[0087] 举例来说,假设问题集树包括3颗二叉树,这3颗二叉树包括二叉树1、二叉树2和二叉树3,每颗二叉树对应一个问题,这3颗二叉树在问题集树的排列顺序有:二叉树1-二叉树2-二叉树3,将关键词输入问题集树,由于依次经过二叉树1、二叉树2和二叉树3,那么会依次输出二叉树1对应的文本特征值1、二叉树2对应的文本特征值2和二叉树3对应的文本特征值3,假如文本特征值1为0,文本特征值2为1,文本特征值3为1,那么得到的文本特征信息为V={0,1,1}。
[0088] 又举例来说,假设问题集树包括3颗二叉树,这3颗二叉树包括二叉树1、二叉树2和二叉树3,二叉树1对应问题1和问题2,问题1的排列顺序先于问题2,二叉树2对应问题3,二叉树3对应问题4和问题5,问题4的排列顺序先于问题5,这3颗二叉树在问题集树的排列顺序有:二叉树1-二叉树2-二叉树3,将关键词输入问题集树,由于依次经过二叉树1、二叉树2和二叉树3,那么会依次输出二叉树1对应的文本特征值1和文本特征值2、二叉树2对应的文本特征值3和二叉树3对应的文本特征值4和文本特征值5,假如文本特征值1为0,文本特征值2为1,文本特征值3为1,文本特征值4为0,文本特征值5为0,那么得到的文本特征信息为V={0,1,1,0,0}。
[0089] 步骤204:电子设备根据所述文本特征信息确定目标背景音乐。
[0090] 其中,在步骤204之前,先构建音乐特征预测模型,该音乐特征预测模型是基于第一模型训练得到的,第一模型可用现有的分类模型实现,如基于深度神经网络支持向量机等模型。
[0091] 首先收集大量篇章文本与对应的背景音乐,在文本篇章到背景音乐的对应关系中,一篇文本会对应一个主题场景,但是一个主题场景可能有多个不同的背景音乐可以用来匹配。每一个背景音乐对应一个背景音乐特征信息,在模型训练前,要先提取出背景音库中的每一个背景音乐对应的背景音乐特征信息,然后基于每个背景音乐对应的背景音乐特征信息训练第一模型,以得到音乐特征预测模型。其中,背景音乐特征信息包括多个音乐特征对应的音乐特征值,该音乐特征值是标注人员或用户对每一个背景音乐的特征值进行打分得到的,如对《梁山伯与祝英台》进行打分如下:
[0092] 柔和值情感值节奏值流行值…
[0093] 0.9 0.1 0.3 0.1…
[0094] 具体的评分中,每个特征的分值从0到1,如“柔和值”为0.9,表示音乐很委婉;“情感值”为0.1,表示音乐较为哀伤,分值越接近1,表示音乐偏向高兴场景;“节奏值”为0.3,表示节奏偏缓慢;“流行值”为0.1,表示音乐偏向于古典音乐。
[0095] 在本申请的一实现方式中,电子设备根据所述文本特征信息确定目标背景音乐,包括:
[0096] 电子设备将所述文本特征信息输入音乐特征预测模型,输出第一音乐特征信息;
[0097] 电子设备根据所述第一音乐特征信息确定目标背景音乐。
[0098] 可选地,电子设备存储有背景音乐库,所述背景音乐库包括多个背景音乐,每个背景音乐对应一个第二音乐特征信息,电子设备根据所述第一音乐特征信息确定目标背景音乐,包括:
[0099] 电子设备确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度;
[0100] 电子设备根据确定的多个相似度确定所述目标背景音乐。
[0101] 其中,第一音乐特征信息和第二音乐特征信息的表示方式有:W={w1,w2,…,wk,…,wm},其中,W为音乐特征信息,wk表示第k音乐特征的音乐特征值,m为音乐特征个数。
[0102] 其中,音乐特征例如有:柔和、情感、节奏、流行、复古、摇滚、民谣等等。
[0103] 可选地,所述相似度为欧式距离,电子设备确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度,包括:
[0104] 电子设备根据欧拉距离公式,确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的欧式距离。
[0105] 其中,欧式距离公式为:
[0106]
[0107] 其中,errj为欧式距离, 和 均表示音乐特征信息中的第k个音乐特征值,m为音乐特征个数,errj越小,表示第j个背景音乐越接近所预测的背景音乐。
[0108] 进一步地,电子设备根据确定的多个相似度确定所述目标背景音乐,包括:
[0109] 电子设备将确定的多个欧式距离中最小的欧式距离对应的背景音乐确定为所述目标背景音乐;或者,电子设备将确定的多个欧式距离中小于第一阈值的欧式距离对应的背景音乐作为所述目标背景音乐。
[0110] 举例来说,假设背景音乐库包括3个背景音乐,这3个背景音乐为背景音乐1、背景音乐2和背景音乐3,背景音乐1对应第二音乐特征信息1、背景音乐2对应第二音乐特征信息2、背景音乐3对应第二音乐特征信息3,假如第一音乐特征信息为W1={0.9,0.1,0.3,0.1},第二音乐特征信息1为W2={0.1,0.2,0.8,0.1},第二音乐特征信息2为W3={0.1,0.7,0.2,
0.1},第二音乐特征信息3为W4={0.1,0.3,0.2,0.7},基于欧式距离公式可计算得到第一音乐特征信息与第二音乐特征信息1的欧式距离为0.3,第一音乐特征信息与第二音乐特征信息2的欧式距离为1.004,第一音乐特征信息与第二音乐特征信息3的欧式距离为1.024,那么电子设备选择背景音乐1作为目标文本的背景音乐。
[0111] 可选地,所述相似度为余弦相似度,电子设备确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度,包括:
[0112] 电子设备根据余弦相似度公式,确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的余弦相似度。
[0113] 其中,余弦相似度公式为:
[0114]
[0115] 其中,errj为余弦相似度, 和 均表示音乐特征信息中的第k个音乐特征值,m为音乐特征个数,errj越大,表示第j个背景音乐越接近所预测的背景音乐。
[0116] 进一步地,电子设备根据确定的多个相似度确定所述目标背景音乐,包括:
[0117] 电子设备将确定的多个余弦相似度中最大的余弦相似度对应的背景音乐确定为所述目标背景音乐;或者,电子设备将确定的多个余弦相似度中大于或等于第二阈值的余弦相似度对应的背景音乐作为所述目标背景音乐。
[0118] 举例来说,假设背景音乐库包括3个背景音乐,这3个背景音乐为背景音乐1、背景音乐2和背景音乐3,背景音乐1对应第二音乐特征信息1、背景音乐2对应第二音乐特征信息2、背景音乐3对应第二音乐特征信息3,假如第一音乐特征信息为W1={0.9,0.1,0.3,0.1},第二音乐特征信息1为W2={0.1,0.2,0.8,0.1},第二音乐特征信息2为W3={0.1,0.7,0.2,
0.1},第二音乐特征信息3为W4={0.1,0.3,0.2,0.7},基于余弦相似度公式可计算得到第一音乐特征信息与第二音乐特征信息1的余弦相似度为0.802,第一音乐特征信息与第二音乐特征信息2的余弦相似度为0.711,第一音乐特征信息与第二音乐特征信息3的余弦相似度为0.755,那么电子设备选择背景音乐1作为目标文本的背景音乐。
[0119] 可选地,所述相似度为曼哈顿距离,电子设备确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度,包括:
[0120] 电子设备根据曼哈顿距离公式,确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的曼哈顿距离。
[0121] 其中,曼哈顿距离公式为:
[0122]
[0123] 其中,errj为余弦相似度, 和 均表示音乐特征信息中的第k个音乐特征值,m为音乐特征个数,errj越小,表示第j个背景音乐越接近所预测的背景音乐。
[0124] 进一步地,电子设备根据确定的多个相似度确定所述目标背景音乐,包括:
[0125] 电子设备将确定的多个曼哈顿距离中最小的曼哈顿距离对应的背景音乐确定为所述目标背景音乐;或者,电子设备将确定的多个曼哈顿距离中小于第三阈值的曼哈顿距离对应的背景音乐作为所述目标背景音乐。
[0126] 举例来说,假设背景音乐库包括3个背景音乐,这3个背景音乐为背景音乐1、背景音乐2和背景音乐3,背景音乐1对应第二音乐特征信息1、背景音乐2对应第二音乐特征信息2、背景音乐3对应第二音乐特征信息3,假如第一音乐特征信息为W1={0.9,0.1,0.3,0.1},第二音乐特征信息1为W2={0.1,0.2,0.8,0.1},第二音乐特征信息2为W3={0.1,0.7,0.2,
0.1},第二音乐特征信息3为W4={0.1,0.3,0.2,0.7},基于曼哈顿距离公式可计算得到第一音乐特征信息与第二音乐特征信息1的曼哈顿距离为1.4,第一音乐特征信息与第二音乐特征信息2的曼哈顿距离为1.5,第一音乐特征信息与第二音乐特征信息3的曼哈顿距离为
1.7,那么电子设备选择背景音乐1作为目标文本的背景音乐。
[0127] 步骤205:电子设备将所述目标背景音乐作为所述目标文本的背景音乐。
[0128] 在本申请的一实现方式中,在步骤205之后,所述方法还包括:在阅读或收听所述目标文本时,电子设备播放所述目标背景音乐。
[0129] 在本申请的一实现方式中,电子设备将所述目标背景音乐作为所述目标文本的背景音乐之后,所述方法还包括:
[0130] 电子设备对所述目标文本进行语音转换,得到目标语音;
[0131] 电子设备将所述目标语音与所述目标背景音乐进行混音处理,得到所述目标文本对应的目标音频。
[0132] 可选地,所述得到所述目标文本对应的目标音频之后,所述方法还包括:电子设备播放所述目标音频。
[0133] 可选地,所述电子设备当前显示所述目标文本的阅读界面,所述电子设备对所述目标文本进行语音转换,得到目标语音之前,所述方法还包括:
[0134] 在检测到针对所述目标文本的阅读界面的第二设定触控操作时,电子设备显示音频输出图标;
[0135] 电子设备确定检测到针对所述音频输出图标的点击操作。
[0136] 其中,第一设定触控操作不同于第二设定触控操作,第二设定触控操作包括以下其中一种:针对特定位置(如所述目标文本的阅读界面的左上角、左下角、右下角、右上角等等)的长按操作、针对所述目标文本的阅读界面的特定滑动操作(如从上往下的滑动操作、从下往上的滑动操作、从左往右的滑动操作、从右往左的滑动操作等等)等等。
[0137] 可以看出,通过界面上显示的图标来触发将文本转换成语音,操作简单便捷,提升用户体验。
[0138] 可选地,所述电子设备当前显示所述目标文本的阅读界面,所述电子设备对所述目标文本进行语音转换,得到目标语音之前,所述方法还包括:
[0139] 电子设备进行音频采集,得到第二音频;
[0140] 电子设备解析所述第二音频,得到至少一个第二关键词;
[0141] 电子设备确定所述至少一个第二关键词包括至少一个第二设定关键词。
[0142] 其中,第二设定关键词包括以下至少一个:转换、合成、背景、音乐、音频等等。
[0143] 可以看出,通过语音触发将文本转换成语音,操作简单便捷,提升用户体验。
[0144] 可选地,所述电子设备包括第二音量调节物理按键,所述电子设备当前显示所述目标文本的阅读界面,所述电子设备对所述目标文本进行语音转换,得到目标语音之前,所述方法还包括:
[0145] 电子设备确定检测到针对所述第二音量调节物理按键的按压操作。
[0146] 其中,第一音量调节物理按键不同于第二音量调节物理按键。
[0147] 可以看出,通过音量调节物理按键触发将文本转换成语音,操作简单便捷,提升用户体验。
[0148] 可以看出,在本申请实施例中,先对目标文本进行分词处理,得到关键词信息,然后根据预先构建的问题集树和关键词信息确定文本特征信息,再然后根据文本特征信息确定目标背景音乐,最后将目标背景音乐作为目标文本的背景音乐,实现了基于文本的文本特征信息来选择符合文本的背景音乐,进而提升背景音乐选择的准确性。
[0149] 与所述图2A所示的实施例一致的,请参见图3,图3是本申请实施例提供的另一种背景音乐的确定方法的流程示意图,应用于上述电子设备,电子设备存储有背景音乐库,所述背景音乐库包括多个背景音乐,每个背景音乐对应一个第二音乐特征信息,具体包括以下步骤:
[0150] 步骤301:电子设备获取目标文本。
[0151] 步骤302:电子设备对所述目标文本进行分词处理,得到分词结果。
[0152] 步骤303:电子设备对所述分词结果包括的词进行修正,得到修正结果。
[0153] 步骤304:电子设备对所述修正结果包括的词进行词性标注,得到所述分词信息。
[0154] 步骤305:电子设备筛选所述分词信息,得到所述关键词信息。
[0155] 步骤306:电子设备将所述关键词信息输入预先构架的问题集树,输出所述问题集树包括的每颗二叉树对应的文本特征值,所述问题集树包括多颗二叉树,每颗所述二叉树对应一个或多个问题。
[0156] 步骤307:电子设备根据每颗所述二叉树对应的文本特征值生成所述文本特征信息。
[0157] 步骤308:电子设备将所述文本特征信息输入音乐特征预测模型,输出第一音乐特征信息。
[0158] 步骤309:电子设备确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度。
[0159] 步骤310:电子设备根据确定的多个相似度确定所述目标背景音乐。
[0160] 步骤311:电子设备将所述目标背景音乐作为所述目标文本的背景音乐。
[0161] 步骤312:电子设备对所述目标文本进行语音转换,得到目标语音。
[0162] 步骤313:电子设备将所述目标语音与所述目标背景音乐进行混音处理,得到所述目标文本对应的目标音频。
[0163] 步骤314:电子设备播放所述目标音频。
[0164] 需要说明的是,本实施例的具体实现过程可参见上述方法实施例所述的具体实现过程,在此不再叙述。
[0165] 与上述图2A和图3所示的实施例一致的,请参阅图4,图4是本申请实施例提供的一种电子设备的结构示意图,如图所示,该电子设备包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:
[0166] 获取目标文本;
[0167] 对所述目标文本进行分词处理,得到关键词信息;
[0168] 根据预先构建的问题集树和所述关键词信息确定文本特征信息;
[0169] 根据所述文本特征信息确定目标背景音乐;
[0170] 将所述目标背景音乐作为所述目标文本的背景音乐。
[0171] 可以看出,在本申请实施例中,先对目标文本进行分词处理,得到关键词信息,然后根据预先构建的问题集树和关键词信息确定文本特征信息,再然后根据文本特征信息确定目标背景音乐,最后将目标背景音乐作为目标文本的背景音乐,实现了基于文本的文本特征信息来选择符合文本的背景音乐,进而提升背景音乐选择的准确性。
[0172] 在本申请的一实现方式中,在对所述目标文本进行分词处理,得到关键词信息方面,上述程序包括具体用于执行以下步骤的指令:
[0173] 对所述目标文本进行分词处理,得到分词信息;
[0174] 筛选所述分词信息,得到所述关键词信息。
[0175] 在本申请的一实现方式中,在对所述目标文本进行分词处理,得到分词信息方面,上述程序包括具体用于执行以下步骤的指令:
[0176] 对所述目标文本进行分词处理,得到分词结果;
[0177] 对所述分词结果包括的词进行修正,得到修正结果;
[0178] 对所述修正结果包括的词进行词性标注,得到所述分词信息。
[0179] 在本申请的一实现方式中,所述问题集树包括多颗二叉树,每颗所述二叉树对应一个或多个问题,在根据预先构建的问题集树和所述关键词信息确定文本特征信息方面,上述程序包括具体用于执行以下步骤的指令:
[0180] 将所述关键词信息输入所述问题集树,输出每颗所述二叉树对应的文本特征值;
[0181] 根据每颗所述二叉树对应的文本特征值生成所述文本特征信息。
[0182] 在本申请的一实现方式中,在根据所述文本特征信息确定目标背景音乐方面,上述程序包括具体用于执行以下步骤的指令:
[0183] 将所述文本特征信息输入音乐特征预测模型,输出第一音乐特征信息;
[0184] 根据所述第一音乐特征信息确定目标背景音乐。
[0185] 在本申请的一实现方式中,应用于电子设备,所述电子设备存储有背景音乐库,所述背景音乐库包括多个背景音乐,每个背景音乐对应一个第二音乐特征信息,在根据所述第一音乐特征信息确定目标背景音乐方面,上述程序包括具体用于执行以下步骤的指令:
[0186] 确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度;
[0187] 根据确定的多个相似度确定所述目标背景音乐。
[0188] 在本申请的一实现方式中,在将所述目标背景音乐作为所述目标文本的背景音乐之后,上述程序包括还用于执行以下步骤的指令:
[0189] 对所述目标文本进行语音转换,得到目标语音;
[0190] 将所述目标语音与所述目标背景音乐进行混音处理,得到所述目标文本对应的目标音频。
[0191] 需要说明的是,本实施例的具体实现过程可参见上述方法实施例所述的具体实现过程,在此不再叙述。
[0192] 请参阅图5,图5是本申请实施例提供的一种背景音乐的确定装置,应用于电子设备,该装置包括:
[0193] 获取单元501,用于获取目标文本;
[0194] 分词单元502,用于对所述目标文本进行分词处理,得到关键词信息;
[0195] 特征确定单元503,用于根据预先构建的问题集树和所述关键词信息确定文本特征信息;
[0196] 背景音乐确定单元504,用于根据所述文本特征信息确定目标背景音乐;将所述目标背景音乐作为所述目标文本的背景音乐。
[0197] 可以看出,在本申请实施例中,先对目标文本进行分词处理,得到关键词信息,然后根据预先构建的问题集树和关键词信息确定文本特征信息,再然后根据文本特征信息确定目标背景音乐,最后将目标背景音乐作为目标文本的背景音乐,实现了基于文本的文本特征信息来选择符合文本的背景音乐,进而提升背景音乐选择的准确性。
[0198] 在本申请的一实现方式中,在本申请的一实现方式中,在对所述目标文本进行分词处理,得到关键词信息方面,分词单元502具体用于:
[0199] 对所述目标文本进行分词处理,得到分词信息;
[0200] 筛选所述分词信息,得到所述关键词信息。
[0201] 在本申请的一实现方式中,在对所述目标文本进行分词处理,得到分词信息方面,分词单元502具体用于:
[0202] 对所述目标文本进行分词处理,得到分词结果;
[0203] 对所述分词结果包括的词进行修正,得到修正结果;
[0204] 对所述修正结果包括的词进行词性标注,得到所述分词信息。
[0205] 在本申请的一实现方式中,所述问题集树包括多颗二叉树,每颗所述二叉树对应一个或多个问题,在根据预先构建的问题集树和所述关键词信息确定文本特征信息方面,特征确定单元503具体用于:
[0206] 将所述关键词信息输入所述问题集树,输出每颗所述二叉树对应的文本特征值;
[0207] 根据每颗所述二叉树对应的文本特征值生成所述文本特征信息。
[0208] 在本申请的一实现方式中,在根据所述文本特征信息确定目标背景音乐方面,背景音乐确定单元504具体用于:
[0209] 将所述文本特征信息输入音乐特征预测模型,输出第一音乐特征信息;
[0210] 根据所述第一音乐特征信息确定目标背景音乐。
[0211] 在本申请的一实现方式中,应用于电子设备,所述电子设备存储有背景音乐库,所述背景音乐库包括多个背景音乐,每个背景音乐对应一个第二音乐特征信息,在根据所述第一音乐特征信息确定目标背景音乐方面,背景音乐确定单元504具体用于:
[0212] 确定每个所述第二音乐特征信息分别与所述第一音乐特征信息的相似度;
[0213] 根据确定的多个相似度确定所述目标背景音乐。
[0214] 在本申请的一实现方式中,所述装置还包括:
[0215] 语音处理单元505,用于在将所述目标背景音乐作为所述目标文本的背景音乐之后,对所述目标文本进行语音转换,得到目标语音;将所述目标语音与所述目标背景音乐进行混音处理,得到所述目标文本对应的目标音频。
[0216] 需要说明的是,获取单元501、分词单元502、特征确定单元503、背景音乐确定单元504及语音处理单元505可通过处理器实现。
[0217] 本申请实施例还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如上述方法实施例中电子设备所描述的部分或全部步骤。
[0218] 本申请实施例还提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法中电子设备所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0219] 本申请实施例所描述的方法或者算法的步骤可以以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(Random Access Memory,RAM)、闪存、只读存储器(Read Only Memory,ROM)、可擦除可编程只读存储器(Erasable Programmable ROM,EPROM)、电可擦可编程只读存储器(Electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于接入网设备、目标网络设备或核心网设备中。当然,处理器和存储介质也可以作为分立组件存在于接入网设备、目标网络设备或核心网设备中。
[0220] 本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(Digital Video Disc,DVD))、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
[0221] 以上所述的具体实施方式,对本申请实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请实施例的具体实施方式而已,并不用于限定本申请实施例的保护范围,凡在本申请实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本申请实施例的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈