序号 | 专利名 | 申请号 | 申请日 | 公开(公告)号 | 公开(公告)日 | 发明人 |
---|---|---|---|---|---|---|
1 | 音频分割方法和系统 | CN201710512310.5 | 2017-06-28 | CN109147771A | 2019-01-04 | 雷延强 |
本发明涉及一种音频分割方法和系统,方法包括以下步骤:读取待分割的音频数据的各个音频帧,分别对各个音频帧进行特征提取,得到各个音频帧对应的音频信号特征;将所述音频信号特征输入到预先训练的音频类别分类器,分别计算所述音频信号特征对应的音频帧属于各个音频类别的概率值,根据所述概率值获取所述音频信号特征对应的音频帧所属的目标音频类别;根据各个音频帧所属的目标音频类别对所述音频数据进行音频分割。上述音频分割方法和系统可以将音频数据分割为细小的片段,音频分割精确度高。 | ||||||
2 | 音频分割方法和系统 | CN201710512310.5 | 2017-06-28 | CN109147771B | 2021-07-06 | 雷延强 |
本发明涉及一种音频分割方法和系统,方法包括以下步骤:读取待分割的音频数据的各个音频帧,分别对各个音频帧进行特征提取,得到各个音频帧对应的音频信号特征;将所述音频信号特征输入到预先训练的音频类别分类器,分别计算所述音频信号特征对应的音频帧属于各个音频类别的概率值,根据所述概率值获取所述音频信号特征对应的音频帧所属的目标音频类别;根据各个音频帧所属的目标音频类别对所述音频数据进行音频分割。上述音频分割方法和系统可以将音频数据分割为细小的片段,音频分割精确度高。 | ||||||
3 | 一种分割音频内容的方法及装置 | PCT/CN2015/070798 | 2015-01-15 | WO2016112519A1 | 2016-07-21 | 周文宇; 李自军; 杨芬 |
本发明提供一种分割音频内容的方法及装置,涉及音频领域,通过用户设备与服务器的交互,实现对音频内容的截取。该方法包括:接收用户设备发送的分割位置消息(101);根据音频内容的音频标识查找与音频内容的音频标识匹配的至少一个第二分割位置信息(102);根据至少一个第一分割位置信息与至少一个第二分割位置信息,从至少一个第一分割位置信息中确定出至少一个目标分割位置信息,从至少一个第二分割位置信息中确定出至少一个参考分割位置信息(103);在至少一个目标分割位置与每个目标分割位置对应的参考分割位置小于第一预设值时,根据至少一个目标分割位置信息及与每个目标分割位置信息对应的参考分割位置信息确定至少一个第三分割位置信息(104);向用户设备发送分割位置推荐消息(105)。 |
||||||
4 | 音频数据分割方法及装置 | CN202310015019.2 | 2023-01-04 | CN116110388A | 2023-05-12 | 白高峰; 李志飞 |
本发明实施例公开了一种音频数据分割方法及装置,通过将获取的音频数据进行分段,以在各分段处以预定长度的搜寻窗口搜索最大静音片段,根据搜索到的最大静音片段起始位置和终止位置确定音频分割点并进行分割。由此,减少了音频分割时的计算量,缩短了音频分割时间,同时使分割后得到的音频段长度比较均匀,便于后续处理。 | ||||||
5 | 一种音频分割方法及装置 | CN201610202144.4 | 2016-03-31 | CN105931635B | 2019-09-17 | 谭应伟; 王涛 |
本发明实施例公开了一种音频分割方法及装置,方法包括:根据预设的特征提取算法提取目标音频的目标特征值;根据所述目标特征值,将所述目标音频划分为目标语音部分和目标静音部分;将所述目标特征值作为预设高斯模型的输入参数,获得针对所述目标音频的后验概率;根据所述后验概率和预设的分类模型对所述目标语音部分进行分割,得到目标音乐部分和非目标音乐部分,其中,所述预设的分类模型为:基于多特征融合和上下文关联的分类模型;根据所述目标静音部分、所述目标音乐部分和所述非目标音乐部分生成针对所述目标音频的分割结果。应用本发明实施例提供的方案分割音频,可以把音频分割为静音部分、音乐部分和非音乐部分。 | ||||||
6 | 一种分割音频内容的方法及装置 | CN201580003468.9 | 2015-01-15 | CN106104690A | 2016-11-09 | 周文宇; 李自军; 杨芬 |
本发明提供一种分割音频内容的方法及装置,涉及音频领域,通过用户设备与服务器的交互,实现对音频内容的截取。该方法包括:接收用户设备发送的分割位置消息(101);根据音频内容的音频标识查找与音频内容的音频标识匹配的至少一个第二分割位置信息(102);根据至少一个第一分割位置信息与至少一个第二分割位置信息,从至少一个第一分割位置信息中确定出至少一个目标分割位置信息,从至少一个第二分割位置信息中确定出至少一个参考分割位置信息(103);在至少一个目标分割位置与每个目标分割位置对应的参考分割位置小于第一预设值时,根据至少一个目标分割位置信息及与每个目标分割位置信息对应的参考分割位置信息确定至少一个第三分割位置信息(104);向用户设备发送分割位置推荐消息(105)。 | ||||||
7 | 一种音频分割方法及装置 | CN201610202144.4 | 2016-03-31 | CN105931635A | 2016-09-07 | 谭应伟; 王涛 |
本发明实施例公开了一种音频分割方法及装置,方法包括:根据预设的特征提取算法提取目标音频的目标特征值;根据所述目标特征值,将所述目标音频划分为目标语音部分和目标静音部分;将所述目标特征值作为预设高斯模型的输入参数,获得针对所述目标音频的后验概率;根据所述后验概率和预设的分类模型对所述目标语音部分进行分割,得到目标音乐部分和非目标音乐部分,其中,所述预设的分类模型为:基于多特征融合和上下文关联的分类模型;根据所述目标静音部分、所述目标音乐部分和所述非目标音乐部分生成针对所述目标音频的分割结果。应用本发明实施例提供的方案分割音频,可以把音频分割为静音部分、音乐部分和非音乐部分。 | ||||||
8 | 一种分割音频内容的方法及装置 | CN201580003468.9 | 2015-01-15 | CN106104690B | 2019-04-19 | 周文宇; 李自军; 杨芬 |
本发明提供一种分割音频内容的方法及装置,涉及音频领域,通过用户设备与服务器的交互,实现对音频内容的截取。该方法包括:接收用户设备发送的分割位置消息(101);根据音频内容的音频标识查找与音频内容的音频标识匹配的至少一个第二分割位置信息(102);根据至少一个第一分割位置信息与至少一个第二分割位置信息,从至少一个第一分割位置信息中确定出至少一个目标分割位置信息,从至少一个第二分割位置信息中确定出至少一个参考分割位置信息(103);在至少一个目标分割位置与每个目标分割位置对应的参考分割位置小于第一预设值时,根据至少一个目标分割位置信息及与每个目标分割位置信息对应的参考分割位置信息确定至少一个第三分割位置信息(104);向用户设备发送分割位置推荐消息(105)。 | ||||||
9 | 基于空间元数据的音频分割 | CN201580022101.1 | 2015-04-23 | CN106463125A | 2017-02-22 | V·麦尔考特; M·J·洛; R·M·费杰吉恩 |
编码自适应音频的方法包括:接收N个对象以及相关联的描述这些对象的持续运动的空间元数据,并且基于所述空间元数据将音频划分成段。该方法通过如下操作对具有对象和通道床的自适应音频进行编码:捕获在包含矩阵的序列的时间变化的矩阵轨迹中的N个对象的持续运动,将时变矩阵轨迹的系数编码为将经由高清晰度音频格式被发送以用于通过M个输出通道渲染自适应音频的空间元数据,以及基于所述空间元数据将矩阵的序列分割成多个子段,其中所述多个子段被配置为有助于自适应音频的一个或更多个特性的编码。 | ||||||
10 | 基于基音频率的快速音频分割方法 | CN200510061358.6 | 2005-10-31 | CN100485780C | 2009-05-06 | 杨莹春; 吴朝晖; 杨旻 |
本发明涉及一种基于基音频率的快速音频分割方法,首先用基音频率从音频中检测语音,然后用能量将非语音部分分成静音和非静音,最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。本发明有益的效果是:利用韵律特征基音频率实现静音、语音和非语音的分割,消除非语音对说话人分割的不利影响;而基音频率较倒谱特征更节省计算时间。 | ||||||
11 | 一种MP3压缩域音频分割方法 | CN200710171802.9 | 2007-12-06 | CN101221762A | 2008-07-16 | 余小清; 万旺根; 常辽豫; 谭海英 |
本发明涉及一种MP3压缩域音频分割方法。本方法先从MP3压缩音频数据中提取特征参数,再将音频信息进行静音分割,对非静音语音分割,在语音段中用统计判决模型进行说话人改变检测,最后由说话人改变点的得到分割结果。实验结果,采用本发明得分割方法比传统分割方法,在其准确率、召回率和综合性能均有显著提高。 | ||||||
12 | 基于空间元数据的音频分割 | CN201580022101.1 | 2015-04-23 | CN106463125B | 2020-09-15 | V·麦尔考特; M·J·洛; R·M·费杰吉恩 |
编码自适应音频的方法包括:接收N个对象以及相关联的描述这些对象的持续运动的空间元数据,并且基于所述空间元数据将音频划分成段。该方法通过如下操作对具有对象和通道床的自适应音频进行编码:捕获在包含矩阵的序列的时间变化的矩阵轨迹中的N个对象的持续运动,将时变矩阵轨迹的系数编码为将经由高清晰度音频格式被发送以用于通过M个输出通道渲染自适应音频的空间元数据,以及基于所述空间元数据将矩阵的序列分割成多个子段,其中所述多个子段被配置为有助于自适应音频的一个或更多个特性的编码。 | ||||||
13 | 一种将录音音频分割成段的方法 | CN201611037945.6 | 2016-11-23 | CN106782506A | 2017-05-31 | 张悦 |
本发明公开了一种将录音音频分割成段的方法,其特征是包括以下步骤:获取并遍历录音音频数据,获取语音部分和静音部分;设定停顿处;根据时间分割形成若干个节点,设置节点编号;相邻的两个节点之间形成段;对节点进行修正;所述对节点进行修正的方法是判断节点是否属于停顿处,如果节点不属于停顿处,那么把节点调整至上一个停顿处;如果节点属于停顿处,继续修正下一个节点直至结束;所述静音部分的时间为相邻的两个语音部分之间的时间差。优点是:1.大容量的音频分割成若干段,方便存储取用;2. 在分割的过程中分割形成的节点属于停顿处(一般是句尾或段尾),避免了音频损失,增强了用户体验。 | ||||||
14 | 一种音频批量分割方法及装置 | CN201611100678.2 | 2016-12-02 | CN106653029A | 2017-05-10 | 王金龙; 丁小响; 吴小龙 |
本发明适用计算机技术领域,提供了一种音频批量分割方法及装置,所述方法包括:获取录音文本以及录音后的音频,将所述音频进行语音识别,得到对应的待匹配文本;将所述待匹配文本与所述录音文本进行匹配;根据预设匹配度,从所述音频中分割出对应的小音频段。本发明将录音后的音频通过语音识别得到待匹配文本,将待匹配文本与录音文本进行匹配后,从音频中分割出对应的小音频段,通过语音识别与文本匹配,实现将录音的音频,按录音文本的要求,直接批量分割成多个小音频段,无需逐个一一加标识再导出分割小音频段,从而提高拆分效率,节约人力成本以及降低出错率。 | ||||||
15 | 把音频信号分割成听觉事件 | CN02810671.7 | 2002-02-26 | CN1524258B | 2012-03-21 | 布莱特·G.·克罗克特 |
一方面,通过计算音频信号的连续时间组的频谱内容(5-1),计算音频信号的连续时间组之间频谱内容的差别(5-2),并且当这样的连续时间组之间频谱内容的差别超过阈值时,把听觉事件边界看作连续时间组之间的边界(5-3),本发明把音频信号分成被感知为独立的并且不同的听觉事件。另一方面,通过把音频信号分成被感知为独立的并且不同的听觉事件,格式化并保存和听觉事件相关的信息(5-4),本发明产生音频信号的简化信息表现。可选的是,本发明还可向一个或多个听觉事件指定特征(5-5)。 | ||||||
16 | 基于基音频率的快速音频分割方法 | CN200510061358.6 | 2005-10-31 | CN1758331A | 2006-04-12 | 杨莹春; 吴朝晖; 杨旻 |
本发明涉及一种基于基音频率的快速音频分割方法,首先用基音频率从音频中检测语音,然后用能量将非语音部分分成静音和非静音,最后在语音片段之间检测说话人改变,由说话人改变点得到最终分割结果。本发明有益的效果是:利用韵律特征基音频率实现静音、语音和非语音的分割,消除非语音对说话人分割的不利影响;而基音频率较倒谱特征更节省计算时间。 | ||||||
17 | 把音频信号分割成听觉事件 | CN02810671.7 | 2002-02-26 | CN1524258A | 2004-08-25 | 布莱特·G·克罗克特 |
一方面,通过计算音频信号的连续时间组的频谱内容(5-1),计算音频信号的连续时间组之间频谱内容的差别(5-2),并且当这样的连续时间组之间频谱内容的差别超过阈值时,把听觉事件边界看作连续时间组之间的边界(5-3),本发明把音频信号分成被感知为独立的并且不同的听觉事件。另一方面,通过把音频信号分成被感知为独立的并且不同的听觉事件,格式化并保存和听觉事件相关的信息(5-4),本发明产生音频信号的简化信息表现。可选的是,本发明还可向一个或多个听觉事件指定特征(5-5)。 | ||||||
18 | 基于信号能量尖峰识别的音频分割方法 | CN201911121998.X | 2019-11-15 | CN110838302B | 2022-02-11 | 王旻轩; 鲍亭文; 金超 |
本申请涉及一种基于信号能量尖峰识别的音频分割方法,包括:将输入的音频信号进行短时傅里叶变换,转换为功率谱矩阵;提取基于功率谱的中频能量特征;对提取的中频能量特征进行尖峰识别;对进行尖峰识别后的信号进行错分修正;输出音频信号的分割点时间坐标。本申请的音频分割方法无需设置门限阈值,无需提前训练,能够实时、快速、准确地基于音频信号做出分析,可以部署在边缘端,无需接入其他运行参数,基本实现无参数动态分割。 | ||||||
19 | 一种基于分层可靠度变化趋势的音频分割方法 | CN201610872916.5 | 2016-09-30 | CN106297824B | 2017-08-01 | 杨新宇; 王银瑞; 丁建行; 董怡卓; 罗晶; 杨泽正; 王艺蒙; 李雨墨 |
本发明公开了一种基于分层可靠度变化趋势的音频分割方法,具体步骤包括:1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;2)基于定长分析窗内跳变点检测的音频分割。本发明采用定长分析窗来避免分窗检测导致的累积误差,在定长分析窗内根据可靠度变化趋势来检测声学跳变点以解决冗余点过多与硬判决的局限性问题,同时在定长分析窗内采用自顶向下的分层检测方式来避免跳变点漏检的情况,能够有效减少冗余分割点,提高综合性能。 | ||||||
20 | 用编解码器强制的帧大小进行音频分割 | CN201080061488.9 | 2010-12-21 | CN102713883B | 2016-09-28 | 卡尔文·瑞安·欧文 |
本发明描述一种用于在不引入边界假象的情况下将媒体内容的音频分割成单独内容文件的方法及设备。 |