专利汇可以提供一种广告检测识别方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种广告检测识别方法,包括:对待检测的广播电视节目数据进行预处理,得到所述数据 音频流 的短时 能量 包络;根据音频的短时能量特征,将所得到的短时能量包络切分为能量包络单元,得到待检测的广播电视节目数据的能量包络单元图;利用跳单元的策略和基于能量包络单元的相似性度量方法,对所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现对广告的检测识别。本发明以音频特征取代视频特征、音视频特征结合等进行广告检测,具有计算复杂度低,检测效率高的优点;通过将待测数据与已知广告的音频特征进行比较,可以实现对特定广告的识别;本发明还具有应用范围广的优点。,下面是一种广告检测识别方法及系统专利的具体信息内容。
1、一种广告检测识别方法,包括以下步骤: 步骤1)、对待检测的广播电视节目数据进行预处理,得到所述数据音频流的短时能量包络; 步骤2)、根据音频的短时能量特征,将步骤1)所得到的短时能量包络切分为能量包络单元,得到所述待检测的广播电视节目数据的能量包络单元图; 步骤3)、利用跳单元的策略和基于能量包络单元的相似性度量方法,对步骤2)得到的所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现对广告的检测识别。
2、 根据权利要求1所述的广告检测识别方法,其特征在于,还包括: 步骤4 )、采用基于KL2距离的方法对步骤3 )所得到的广告检测识别结果进行验证。
3、 根据权利要求1或2所述的广告检测识别方法,其特征在于,所 述预处理包括:步骤1-1 )、从所述待检测的广播电视节目数据中分离出音频流; 步骤1-2)、对所述的音频流中的音频信号按照一定的时间间隔分为多 个帧;步骤1-3)、对所得到的音频流进行短时能量特征提取;步骤i_4)、将帧按照每一帧的短时平均能量形成短时能量包络。
4、 根据权利要求1或2所述的广告检测识别方法,其特征在于,所 述的将短时能量包络切分为能量包络单元包括以下步骤:步骤2-l)、对短时能量包络中的能量均值进行平滑,得到各个帧的短 时能量值;步骤2-2)、采用检测函数对各个帧的短时能量值进行检测,得到一个 检测结果,所述的检测函数将一个帧与其后续的N个帧分别进行比较,取 最大的比较结果作为该检测函数的值;步骤2-3)、将步骤2-2)所得到的各个帧的检测函数结果与两个预先 设定的阈值进行比较,根据比较结果,计算帧被检测为切分点的概率;步骤2-4)、根据步骤2-3)所得到的切分点概率,确定短时能量包络中的切分点,根捧所述的切分点将所述的短时能量包络切分为能量包络单 元。
5、根据权利要求4所述的广告检测识别方法,其特征在于,在所述 的步骤2-3)中,所述的帧被检测为切分点的概率的计算公式为:
6、 根据权利要求5所述的广告检测识别方法,其特征在于,在所述 的步骤2-4)中,所述的切分点为所述的切分点概率为非0的帧。
7、 根据权利要求1或2所述的广告检测识别方法,其特征在于,所 述的步骤3)包括:步骤3-l)、在待检测广播电视节目数据的能量包络单元图上,依次选 择每个能量包络单元的起始点作为匹配操作的起始点;步骤3-2 )、将已知广告以及待检测广播电视节目数据分别用由切分点 位置和切分点概率组成的数对的形式表示;步骤3-3 )、将待检测广播电视节目数据的数对依次与每个已知广告的 数对进行比较,得到匹配点以及对应的匹配概率;步骤3-4)、采用相似性度量函数对步骤3-3)所得到的匹配点以及对 应的广告进行计算,得到两者的相似值;步骤3-5)、将步骤3-4)所得到的相似值与一个预先设定的第四阔值 进行比较,若所述的相似值大于该阈值,则认为与步骤3-3)所得到的匹 配点相对应的音频片l爻和与匹配点相对应的广告匹配。
8、 根据权利要求7所述的广告检测识别方法,其特征在于,在所述 的步骤3-3)中,所述的将待检测广播电视节目数据的数对依次与每个已 知广告的数对进行比较包括:在已知广告的能量包络单元中存在一个切分点Uj,而在待检测广播电 视节目数据中存在一个切分点Vj,当满足条件IUi-Vjh:T,认为Ui为匹配点; 其中,所述T是一个预先定义的第三阈值。
9、 根据权利要求8所述的广告检测识别方法,其特征在于,所述匹配点对应的匹配扭克率为切分点Uj的切分点概率和切分点Vj的切分点概率中 的较小值。
10、 根据权利要求7所述的广告检测识别方法,其特征在于,所述的 步骤3-4)包括:步骤3-4-1)、对所述的匹配点以及对应广告中的相应切分点,计算召 回率R与精确率S;步骤3-4-2 )、根据所得到的召回率R与精确率S计算相似性度量函数 的值。
11、 根据权利要求10所述的广告检测识别方法,其特征在于,所述 的召回率的计算公式为:其中,U表示已知广告;V表示待检测广播电视节目数据中的一个片 段;p表示所述已知广告的能量包络单元中的切分点概率,p'表示匹配点 的匹配概率。
12、根据权利要求10所述的广告检测识别方法,其特征在于,所述 的精确率的计算公式为:其中,U表示已知广告;V表示待检测广播电视节目数据中的一个片 段;q表示所述待检测广播电视节目数据中的一个片段的切分点概率,p'表 示匹配点的匹配相克率。
13、根据权利要求10所述的广告检测识别方法,其特征在于,所述 相似性度量函数的计算公式为:
14、根据权利要求2所述的广告检测识别方法,其特征在于,所述的 步骤4)包括:步骤4-l)、对步骤3)所得到的广告检测识别结果以及对应的已知广 告的能量包络单元分别提取梅尔频率倒谱系数特征;步骤4-2)、为所述广告检测识别结果的梅尔频率倒谱系数特征与对应 已知广告的梅尔频率倒谱系数特征分别建立高斯模型,在所建立的高斯模i?(c/,r)+,,r)型中分别计算均值和方差;步骤4-3)、根据步骤4-2)计算所得的均值和方差,计算初检测结果 与对应广告间的KL2距离;步骤4-4)、将步骤4-3)计算得到的KL2距离值与一个预先设定的第 五阈值进行比较,若所述的KL2距离值小于或等于该阈值,则认为步骤3) 所得到的4企测识别结果与对应已知广告是同 一个广告,即初检测结果正 确,否则,认为步骤3)所得到的检测识别结果为误报。
15、 一种广告检测识别系统,包括:预处理模块、能量包络单元切分 模块、音频检索模块以及广告音频特征库;其中,所述的预处理模块用于对待检测的广播电视节目数据进行预处理,得 到所述数据音频流的短时能量包络;所述的能量包络单元切分模块用于根据音频的短时能量特征,将短时 能量包络切分为能量包络单元;所述的音频检索模块用于对所得S 'J的所述待检测的广播电视节目数 据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结 果实现对广告的4企测识别;所述的广告音频特征库用于存储已知广告的包含能量包络单元图以 及梅尔频率倒谱系数特征在内的特征信息。
16、 根据权利要求15所述的广告检测识别系统,其特征在于,还包 括一个后处理模块,所述的后处理模块的作用是对所述音频检索模块的结 果提取梅尔频率倒谱系数后,结合对应广告的梅尔频率倒谱系数进行KL2 距离计算,以验证初步检测的结果是否正确。
17、 根据权利要求15或16所述的广告检测识别系统,其特征在于, 还包括一个结果评测模块,所述的結果评测模块的作用是对检测结果的准 确性以及4企测时间进4亍评测。
18、 根据权利要求15所述的广告检测识别系统,其特征在于,所述 的广告音频特征库由广告库中的已知广告经过预处理、特征提取和能量包 络单元切分得到。
其中,T,为所述的两个预先设定的阈值中的第一阈值,丁2为所述的两个预先设定的阈值中的第二阈值,&为所述检测函数的值。上述技术方案中,在所述的步骤2-4)中,所述的切分点为所述的切 分点概率为非0的帧。上述技术方案中,所述的步骤3)包括:步骤3-l)、在待检测广播电视节目数据的能量包络单元图上,选择每 个能量包络单元的起始点作为匹配操作的起始点;步骤3-2 )、将已知广告以及待检测广播电视节目数据分别用由切分点 位置和切分点概率组成的数对的形式表示;步骤3-3 )、将待检测广播电视节目数据的数对依次与每个已知广告的 数对进行比较,得到匹配点以及对应的匹配概率;步骤3-4)、采用相似性度量函数对步骤3-3)所得到的匹配点以及对 应的广告进行计算,得到两者的相似值;步骤3-5)、将步骤3-4)所得到的相似值与一个预先设定的第四阈值 进行比较,若所述的相似值大于该阈值,则认为与步骤3-3)所得到的匹 配点相对应的音频片l爻和与匹配点相对应的广告匹配。上述技术方案中,在所述的步骤3-3)中,所述的将待检测广播电视 节目数据的数对依次与每个已知广告的数对进行比较包括:在已知广告的能量包络单元中存在一个切分点Uj,而在待检测广播电 视节目数据中存在一个切分点Vj,当满足条件IUj-Vj| 专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。 我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。 专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。table see original document page 17
才艮据本发明的广告4企测识别方法,可以生成相应的广告检测识别系统。如图7所示,在该系统中包括预处理模块、能量包络单元切分模块、 音频检索模块以及广告音频特征库。其中,预处理模块还包括音频流分离单元、特征提取单元。所述的音频流分 离单元用于对待检测数据进行音频流的分离。特征提取单元对分离得到的 音频流进行短时能量的特征提取,生成相应的短时能量包络。能量包络单元切分模块用于根据音频的短时能量特征,将短时能量包 络切分为能量包络单元;音频检索模块用于对所得到的所述待检测的广播电视节目数据的能 量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现 对广告的检测识别;广告音频特征库用于存储已知广告的能量包络单元图和MFCC特征。 广告音频特征库由广告库中的已知广告经过预处理、能量包络单元切分、 特征提取得到。本发明的广告检测识别系统还包括一个后处理^t块,所述的后处理模 块的作用是对所述音频检索模块的结果以及对应的广告提取MFCC系数 后,进行KL2距离计算,以再次检测初步检测的结果是否正确。本发明的广告检测识别系统还包括一个结果评测模块,所述的结果评 测模块的作用是对检测结果的准确性以及检测时间进行评测。最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。 尽管参照实施例对本发明进行了详细说明,本领域的普通才支术人员应当理 解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
标题
发布/更新时间
阅读量
基于室内声学信道扰动分析的物体识别方法
2020-05-12
835
基于谱峭度和神经网络的滚动轴承故障分类方法及系统
2020-05-12
610
基于长短时记忆神经网络的说话人分段标注方法及装置
2020-05-13
551
基于双声道的脚步检测方法
2020-05-13
552
基于多种特征融合的语音篡改检测方法
2020-05-14
200
一种基于后端模型的声纹识别优化方法和相关装置
2020-05-08
156
音频处理方法、装置和存储介质
2020-05-12
359
一种基于声信号特征库的风机桨叶故障识别方法
2020-05-14
334
一种音频关键词模板的筛选和优化方法
2020-05-12
781
一种登陆方法和装置
2020-05-14
534