首页 / 专利库 / 电信 / 数据速率 / 一种非法调频广播电台的检测和识别方法

一种非法调频广播电台的检测和识别方法

阅读:1037发布:2020-06-18

专利汇可以提供一种非法调频广播电台的检测和识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种非法调频广播电台的检测和识别方法,本发明利用数字 信号 处理和信息处理技术,开发设计一个稳健的、便于 软件 或 硬件 设计实现的检测和识别方法。利用非法调频广播电台的周期重复特性,基于相关累积 算法 ,检测非法调频广播电台的重复次数和时间点,从而完成非法调频广播电台的检测和识别,检测和识别的准确性高,并且处理快速,具有突出的实质性特点和显著的进步。,下面是一种非法调频广播电台的检测和识别方法专利的具体信息内容。

1.一种非法调频广播电台的检测和识别方法,其特征在于,包括如下步骤:
(1)样本数据采集,对目标广播电台进行连续语音录制,并存储为样本数据文件;
(2)样本数据预处理,将样本数据文件分割成多个数据子,并对每个数据子块进行编号、存储;
(3)确定参考数据片段,依次获取每个数据子块的起始时间X的语音片段数据,作为参考语音片段;
(4)相关波形求取计算,将每个参考语音片段逐点与所有数据子块的数据进行相关计算,得到每个参考语音片段的相关波形信号
(5)相关峰值的检测,针对每个参考语音片段的相关波形信号,寻找并求取最大值,并寻找相关波形信号中幅度值超过最大值*预先设定相关峰限数值的局部最大值峰值点,并记录其位置
(6)将所有参考语音片段的重复记录信息结果中的次数进行累加求和,得到重复次数数值,然后将该重复次数数值与预先设定的重复次数门限数值进行比较,判断该目标广播电台是否为非法广播电台;
(7)对其他目标广播电台,重复步骤(1)-(6)。
2.根据权利要求1所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(1)中,连续语音录制的时间为3-5天,样本数据的采样率为22050Hz,数据样点位宽为
16bit。
3.根据权利要求2所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(1)中,目标广播电台的样本数据采集过程具体为:首先,接收目标广播电台的调频广播信号,然后对该调频广播信号进行数字下变频、抽取滤波,数据速率降为200KHz,然后进行调频解调处理,得到原始的广播语音信号,再进行低通滤波和变速率处理,数据速率降为
22050Hz,数据样点位宽为16bit。
4.根据权利要求3所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(2)中,将样本数据文件分割成多个数据子块是以小时为单位分割。
5.根据权利要求4所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(2)分割后的每个数据子块还对其进行数据样点抽取,将该抽取的数据样点根据数据子块的编号进行索引号编号命名、存储为新的数据子块。
6.根据权利要求5所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(3)中,首先,根据采样率、数据样点位宽、抽取率计算时间X的语音片段的数据长度,然后根据该数据长度获取每个数据子块的起始时间X的语音片段数据作为参考语音片段。
7.根据权利要求6所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(4)中,相关计算采用快速傅里叶变换计算,具体的计算过程为:
(401)首先选取需要进行相关计算的参考语音片段ref,共有N个数据子块,也就有N个参考语音片段,n≤N,令n初值为1;
(402)获取数据子块n的全部数据,获取数据子块n+1的起始时间X的语音片段数据,将两者进行拼接,得到需要与参考语音片段进行相关比对的样本数据b_n;
(403)对参考语音片段ref和b_n进行相关计算,得到相关计算结果corr_bn;
(404)将n累加1,并判断n是否等于数据子块总数量N,若小于N,则返回步骤(402);若等于N,则结束,并把所有的相关计算结果corr_bn,n为1至N之间的整数,拼接为一个完整的数据,这个数据就是参考语音片段ref相对于整个样本数据的相关计算结果-相关波形信号corr。
8.根据权利要求7所述的一种非法调频广播电台的检测和识别方法,其特征在于,所述步骤(403)中,相关计算基于快速傅里叶变换计算,快速傅里叶变换的处理对象,均为抽取后的数据,相关计算的具体过程为:
(411)获取处理对象,即抽取后的数据子块n的数据的起始时间X的语音片段数据、抽取后的数据子块n的数据、抽取后的数据子块n+1的起始时间X的语音片段数据;
(412)对抽取后的数据子块n的数据、抽取后的数据子块n+1的起始时间X的语音片段数据进行拼接,然后进行傅里叶变换;
(413)同时,对数据子块n的参考语音片段信号进行反转和补零处理,然后进行傅里叶变换;
(414)对步骤(412)和(413)输出的结果,即两个矢量,进行矢量点乘操作,然后对输出结果依次进行逆傅里叶变换、数据裁剪,得到参考语音片段相对于数据子块n的相关计算结果。

说明书全文

一种非法调频广播电台的检测和识别方法

技术领域

[0001] 本发明涉及无线通信系统中的无线电监测技术领域,是涉及一种非法调频广播电台的检测和识别方法,实现非法调频广播电台(俗称黑广播)的自动甄别,为无线电监测管理、频谱资源的合理有效利用提供技术支撑

背景技术

[0002] 非法调频广播电台俗称“黑广播”,多为谋取非法经济利益而设置,播出内容绝大多数为虚假医药广告。从社会影响上看,黑广播内容会误导广大受众(消费者),部分黑广播内容低俗,严重污染社会气。从空中电磁波的秩序监管度看,由于非法调频广播电台设备均为“三无”产品,且发射功率超大(黑广播电台发射功率大多在一千瓦功率以上),很容易对民航、广播等正常的无线电通信业务造成干扰。一个突出的典型案例为:民航频段(108MHz—117.975MHz航空无线电导航业务117.975MHz—137MHz航空移动业务)与调频广播频段(87MHz—108MHz)毗邻,非法调频广播信号可能会干扰民航频段,影响民航客机的导航和指挥调度,进而危及飞机的起飞降落安全。因此非法广播电台的社会危害性和安全隐患极大。
[0003] 目前的非法调频广播电台的检测和识别均采用人工鉴别途径,通过人工监听一定时间段的电台播放内容,来判断该广播电台是否为非法电台。这种方式耗时耗,且效率很低。由于当前电子信息设备和技术的飞速发展,搭建一个非法调频广播电台的成本愈来愈低,难度也愈来愈小,基于巨大的经济利益诱惑,非法调频广播电台的数量在全国的各个大中城市,近年来均呈现出迅速增长趋势。这给非法调频广播电台的监测和识别带来了更多的困难和压力。

发明内容

[0004] 本发明的目的在于提供一种非法调频广播电台的检测和识别方法,解决人工检测和识别非法广播电台的低效与不足的问题。本发明利用数字信号处理和信息处理技术,开发设计的一个稳健的、便于软件硬件设计实现的检测和识别方法。
[0005] 为了实现上述目的,本发明采用的技术方案如下:
[0006] 一种非法调频广播电台的检测和识别方法,包括如下步骤:
[0007] (1)样本数据采集,对目标广播电台进行连续语音录制,并存储为样本数据文件;
[0008] (2)样本数据预处理,将样本数据文件分割成多个数据子,并对每个数据子块进行编号、存储;
[0009] (3)确定参考数据片段,依次获取每个数据子块的起始时间X的语音片段数据,作为参考语音片段;
[0010] (4)相关波形求取计算,将每个参考语音片段逐点与所有数据子块的数据进行相关计算,得到每个参考语音片段的相关波形信号;
[0011] (5)相关峰值的检测,针对每个参考语音片段的相关波形信号,寻找并求取最大值,并寻找相关波形信号中幅度值超过最大值*预先设定相关峰限数值的局部最大值峰值点,并记录其位置,局部最大值峰值点的个数即为参考语音片段在整个样本数据中的重复次数。局部最大值峰值点的位置就是整个录音时段中与参考语音片段基本完全相同的重复语音片段位置,将这些位置信息存储记录为相关检测记录;
[0012] (6)将所有参考语音片段的重复记录信息结果中的次数进行累加求和,得到重复次数数值,然后将该重复次数数值与预先设定的重复次数门限数值进行比较,判断该目标广播电台是否为非法广播电台;
[0013] (7)对其他目标广播电台,重复步骤(1)-(6),得到所有目标广播电台的判决结果。从而自动筛选出嫌疑极大的非法广播电台。通过各个广播电台的相关检测记录信息,可有针对性的针对重复位置进行有选择性的语音片段播放和回放,以进一步进行核实。
[0014] 本发明利用非法调频广播电台的周期重复特性,基于相关累积算法,检测非法调频广播电台的重复次数和时间点,从而完成非法调频广播电台的检测和识别。
[0015] 具体地,所述步骤(1)中,连续语音录制的时间为3-5天,样本数据的采样率为22050Hz,数据样点位宽为16bit。
[0016] 进一步地,所述步骤(1)中,目标广播电台的样本数据采集过程具体为:首先,接收目标广播电台的调频广播信号,然后对该调频广播信号进行数字下变频、抽取滤波,数据速率降为200KHz,然后进行调频解调处理,得到原始的广播语音信号,再进行低通滤波和变速率处理,数据速率降为22050Hz,数据样点位宽为16bit。
[0017] 再进一步地,所述步骤(2)中,将样本数据文件分割成多个数据子块是以小时为单位分割。所述步骤(2)分割后的每个数据子块还对其进行数据样点抽取,将该抽取的数据样点根据数据子块的编号进行索引号编号命名、存储为新的数据子块。后续进行相关计算的数据子块和参考语音数据均为抽取后的数据子块。在不影响相关检测结果的情况下,针对原始样本数据进行一定程度的抽取,可有效减少计算量,节省计算时间,从而实现更快的检测和识别。
[0018] 再进一步地,所述步骤(3)中,首先,根据采样率、数据样点位宽、抽取率计算时间X的语音片段的数据长度,然后根据该数据长度获取每个数据子块的起始时间X的语音片段数据。值得注意的是,由于数据子块为经过抽取后的数据,因此参考语音片段也是经过抽取后的数据。
[0019] 再进一步地,相关运算的处理对象,不论是所有的数据子块数据,还是基于数据子块数据开始时间长度X的参考语音片段数据,均为抽取后的数据。所述步骤(4)中,相关计算采用快速傅里叶变换计算,可使得乘法操作数量降低为原始的百分之一甚至千分之一,从而大大降低相关运算的计算量。具体的计算过程为:
[0020] (401)首先选取需要进行相关计算的参考语音片段ref,共有N个数据子块,也就有N个参考语音片段,n≤N,令n为初值1;
[0021] (402)获取数据子块n的全部数据,获取数据子块n+1的起始时间X的语音片段数据,将两者进行拼接,得到需要与参考语音片段进行相关比对的样本数据b_n;
[0022] (403)对参考语音片段ref和b_n进行相关计算,得到相关计算结果corr_bn;
[0023] (404)将n累加1,并判断n是否等于数据子块总数量N,若小于N,则返回步骤(402);若等于N,则结束,并把所有的相关计算结果corr_bn,n=1,2,3,….N,拼接为一个完整的数据,这个数据就是参考语音片段ref相对于整个样本数据的相关计算结果-相关波形信号corr。
[0024] 另外,所述步骤(403)中,相关计算基于快速傅里叶变换计算,快速傅里叶变换的处理对象,均为抽取后的数据,相关计算的具体过程为:
[0025] (411)获取处理对象,即抽取后的数据子块n的数据的起始时间X的语音片段数据、抽取后的数据子块n的数据、抽取后的数据子块n+1的起始时间X的语音片段数据;
[0026] (412)对抽取后的数据子块n的数据、抽取后的数据子块n+1的起始时间X的语音片段数据进行拼接,然后进行傅里叶变换;
[0027] (413)同时,对数据子块n的参考语音片段信号进行反转和补零处理,然后进行傅里叶变换;
[0028] (414)对步骤(412)和(413)输出的结果,即两个矢量,进行矢量点乘操作,然后对输出结果依次进行逆傅里叶变换、数据裁剪,得到参考语音片段相对于数据子块n的相关计算结果。
[0029] 本发明的有益效果为:
[0030] 本发明利用数字信号处理和信息处理技术,开发设计的一个稳健的、便于软件或硬件设计实现的检测和识别方法。利用非法调频广播电台的周期重复特性,基于相关累积算法,检测非法调频广播电台的重复次数和时间点,从而完成非法调频广播电台的检测和识别,检测和识别的准确性高,并且处理快速,具有突出的实质性特点和显著的进步。附图说明
[0031] 图1是本发明-实施例的整体实现流程图
[0032] 图2是本发明-实施例的数据预处理单元的实现流程图。
[0033] 图3是本发明-实施例的相关累积计算单元的实现流程图。
[0034] 图4是本发明-实施例的相关计算快速算法的实现流程图。
[0035] 图5是本发明-实施例的相关峰检测和记录单元的实现流程图。
[0036] 图6是本发明-实施例的判断决策处理单元的实现流程图。

具体实施方式

[0037] 下面结合附图和实施例对本发明作进一步说明。本发明的实施方式包括但不限于下列实施例。
[0038] 非法调频广播电台的检测和识别方法,要便于利用通用的商用硬件平台或通用计算机软件平台实现。通用的硬件平台,比如DSP(Digital Signal Processor数字信号处理器),或者FPGA(Field Programmable Gate Array,现场可编程门阵列)等大规模数字集成电路。通用的软件平台,比如PowerPC嵌入式系统平台,基于x86的Windows操作系统平台。基于通用硬件平台实现,具有实时性强,计算速度快,及时给出结果的优点。基于通用软件平台实现,运算速度相对降低,但具有灵活性和适用性更强的特点。
[0039] 实施例
[0040] 如图1所示,一种非法调频广播电台的检测和识别方法,包括如下步骤:
[0041] S101、样本数据采集,对目标广播电台(可为正常广播电台,或者非法广播电台)进行3-5天的连续语音录制,采样率为22050Hz,数据样点位宽为16bit,并存储为样本数据文件。
[0042] 在上述过程中,接收到的目标广播电台信号为调频广播信号,然后对该调频广播信号进行数字下变频、抽取滤波,数据速率降为200KHz,然后进行调频解调处理,得到原始的广播语音信号,再进行低通滤波和变速率处理,数据速率降为22050Hz,数据样点位宽为16bit。
[0043] S102、样本数据预处理,将样本数据文件,以小时为单位,分割成多个短时数据文件,每个文件大小为158.76MB,以抽取率5进行抽取,即每间隔5个数据样点取一个数据样点,这样数据量降低为原来的五分之一,数据量大小为31.752MB,将抽取后的数据进行存储,抽取后的每个数据为一个数据子块,并对这些数据子块进行索引号编号命名。
[0044] 例如,索引号为1的数据子块表示整个样本数据的第一个小时时段的抽取后的语音数据,依次类推。
[0045] S103、确定参考数据片段,根据采样率和数据样点位宽,计算5分钟的语音片段的数据长度,针对第一个小时对应的数据子块,从起始位置开始进行截取,从而获得第一个小时时段的起始5分钟的参考语音片段,命名为参考信号ref1。
[0046] 由于数据子块为经过抽取后的语音数据,因此参考语音片段也是经过抽取后的语音数据。
[0047] S104、相关波形求取计算,将参考信号ref1逐点与所有短时数据文件的数据进行相关计算,相关计算采用基于FFT(Fast Fourier Transformation)的快速算法计算完成。
[0048] 最终得到参考信号ref1的相关波形信号,命名为corr1,其长度为全时段的抽取后的语音数据样点个数。
[0049] S105、相关峰值的检测,针对参考信号ref1的相关波形信号corr1,寻找并求取其最大值corr1_max,基于设定的相关峰门限数值0.25,寻找相关波形信号中幅度值超过corr1_max*0.25的局部最大值峰值点,并记录其位置。局部最大值峰值点的个数即为参考信号ref1的重复次数。局部最大值峰值点的位置就是整个样本数据中与参考信号ref1基本完全相同的重复语音片段位置,将这些峰值数量和位置信息存储记录,记为相关检测记录mem1。
[0050] S106、针对第2个小时的短时数据段,截取起始5分钟的语音数据段,按照步骤S103、S104、S105的方法,得到相关波形信号corr2,mem2。针对第3个小时,第4个小时,直到全时段语音数据的最后一个小时,依次进行步骤S103、S104、S105的操作。最终得到每个小时的起始5分钟的重复次数与位置的记录信息结果。
[0051] S107:将所有参考语音片段的重复记录信息结果中的重复次数进行累加求和,得到一个重复次数数值REPEAT。将REPEAT与预先设定的重复次数门限数值Gate_rp进行比较。Gate_rp的数值为8。若大于该门限数值,则判定为该全时段语音数据重复率很高,该目标广播电台为嫌疑性极大的非法广播电台。
[0052] S108:针对所有监测的目标广播电台,重复步骤S101-S107的操作,得到所有监测目标广播电台的判决结果,从而自动筛选出嫌疑极大的非法广播电台。通过各个广播电台的相关检测记录mem中的位置信息,可有针对性的针对重复位置进行有选择性的语音片段播放和回放,以进一步进行核实。
[0053] 图2为样本数据预处理单元的实现流程图,结合图2,具体实现细节描述如下:
[0054] S201:针对某个目标广播电台,利用接收机接收并采集中频信号,然后进行DDC下变频和调频解调处理,最终得到采样率为22050Hz,16bit位宽的一个长时段的语音信号样本数据;通常时间长度为3-5天。
[0055] S202:计算样本数据长度,截取整数个小时的样本数据,最后的非整数小时数据可抛弃不用。以小时为单位,将整个样本数据分割为若干数据子块,每个数据子块的语音长度均为1小时。比如3天的样本数据,则最终得到72个数据子块。
[0056] S203:针对每个数据子块,进行5倍的数据抽取操作。在不影响最终判决结果的情况下,这对于降低运算时间是非常有必要的。因此每个数据子块的数据量将为原来的五分之一。一个小时的数据子块数据量,也由158.76MB降低为31.752MB。
[0057] S204:将抽取后的各个数据子块存储为文件,并按照时间顺序进行编号;这些抽取后的数据子块就作为后续处理流程的处理对象。
[0058] 图3为相关累积计算单元的实现流程图,结合图3的具体实现细节描述如下:
[0059] S301:设定N为数据子块数量。设定n的初始值为1,获取数据子块n的数据,截取初始5分钟的语音数据,作为参考语音片段ref_n。
[0060] S302:获取数据子块n的全部数据,获取数据子块n+1的起始5分钟的语音数据,将两者进行拼接,就得到需要与参考语音片段进行相关比对的样本数据。需要进行拼接的原因是:保证参考语音片段与数据子块n语音数据进行相关运算的结果的完整性。参考语音片段样点个数为L1,数据子块n数据样点个数为L2,L2远大于L1,两者进行相关运算的结果长度确定为L2,则当参考语音片段需要与数据子块n的结尾数据进行相关计算时,就需要数据子块n+1的初始的一部分数据,这部分数据的长度正好等于参考语音片段的长度,因此需要子块n+1的起始的5分钟数据。
[0061] S303:针对参考语音片段ref_n和数据子块样本数据b_n,基于快速相关算法,进行相关计算,得到相关计算结果corr_bn_rn。快速相关计算算法,可参考图4及其描述。
[0062] S304:将n累加1,并判断n是否等于数据子块总数量N,若小于N,则返回步骤S302。若等于N,则结束,并把所有的相关计算结果拼接为一个完整的数据,这个数据就是参考语音片段ref_n相对于整个样本数据的相关计算结果-相关波形信号corr_n。
[0063] 图4为相关计算快速算法的实现框图,结合图4的具体实现细节描述如下:
[0064] 首先得到相关计算的处理对象,即模块401的参考语音片段信号(长度为L1),模块402的数据子块n数据(长度为L2),模块403的数据子块n+1的数据。模块405完成数据子块数据的拼接,拼接方法在图3的实现流程描述中已进行详细说明,不再重复描述。拼接后的子块数据长度为L3=L1+L2;针对参考语音片段信号,模块404完成该信号的反转和补零处理。
反转和补零处理处理后,参考语音片段信号ref_n的最后一个数据样点,成为第一个数据样点,然后补L2个零,最后是参考语音片段信号的第1个至第L1-1的样点。针对拼接后的数据子块数据和反转后的参考语音片段,均进行快速傅里叶变换(FFT:Fast Fourier Translation),即模块407和模块408所完成的处理操作。模块407和模块408的输出结果,即进行快速傅里叶变换的结果,对应两个矢量,进行矢量的点乘操作。两个矢量维度相同,均为L3。所谓点乘,即矢量的对应元素进行相乘操作,结果仍是一个维度为L3的矢量。这两个矢量的点乘操作由模块409完成。模块410完成逆傅里叶变换,同样采用快速傅里叶变换算法实现。模块411完成数据的裁剪,逆傅里叶变换的输出矢量长度为L3,截取前L2个数据,就得到参考语音片段相对于数据子块n的相关计算结果。
[0065] 图5为相关峰检测和记录单元的实现流程图,结合图5的具体实现细节描述如下:
[0066] S501、获取参考语音片段n相对于整个样本数据的相关计算结果corr_n。
[0067] S502、从相关波形信号corr_n中寻找全局最大峰值点,其峰值数值设为corr_n_max。
[0068] S503、确定局部相关峰值门限数值为gate_corr=corr_n_max*0.25。
[0069] S504、在整个相关波形信号corr_n中,查找所有超过gate_corr的局部最大值峰值点,确定这些局部峰值的数量和位置,并存出记录为数据mem_n。
[0070] 图6为判断决策处理单元的实现流程图,结合图6的具体实现细节描述如下:
[0071] S601、设定N为参考语音片段的个数,也即数据子块总的个数值减去1。
[0072] S602、设定REPEAT数值初始值为0。
[0073] S603、设定n=1,获取参考语音片段n相对于整个样本数据的相关计算结果corr_n的相关峰值检测结果mem_n。
[0074] S604、从mem_n中得到相关峰值个数repeat_n,做为参考语音片段n在整个样本数据的重复次数记录;并令REPEAT=REPEAT+repeat_n。
[0075] S605、n累加1,若小于N,则返回上一步,得到新的参考语音片段在整个样本数据中的重复次数,并对REPEAT进行累加,直到n等于N。
[0076] S606、最终得到所有参考语音片段相对于整个样本数据的重复次数记录之和,记录为REPEAT。
[0077] S607、将REPEAT与预设定的检测门限数值进行比较,若大于门限数值,则判定目标广播电台为非法电台;否则为常规电台。
[0078] 本发明实施例提供的模块或装置划分仅为功能上的划分,物理上可以合并或分割。模块或装置的名称可以随技术演进或应用场景的不同而改变,但仍应考虑在本发明的保护范围内。本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括若干指令用以执行本发明各个实施例所述的方法。这里所述的存储介质,如:ROM/RAM、磁碟、光盘等。
[0079] 按照上述实施例,便可很好地实现本发明。值得说明的是,基于上述设计原理的前提下,为解决同样的技术问题,即使在本发明所公开的结构基础上做出的一些无实质性的改动或润色,所采用的技术方案的实质仍然与本发明一样,故其也应当在本发明的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈