基于前-后向代价参考粒子滤波的瞬时频率曲线估计方法 |
|||||||
申请号 | CN201510394916.4 | 申请日 | 2015-07-07 | 公开(公告)号 | CN104977577A | 公开(公告)日 | 2015-10-14 |
申请人 | 西安电子科技大学; | 发明人 | 水鹏朗; 蒋晓薇; 卢锦; 施赛楠; | ||||
摘要 | 本 发明 公开了一种基于前-后向代价参考粒子滤波的瞬时 频率 曲线估计方法。其实现步骤为:1、构建非线性调频 信号 的 状态方程 和观测方程;2、用户根据状态方程和观测方程定义粒子代价;3、产生初始化粒子,并根据粒子代价计算粒子 风 险;4、根据粒子风险计算重 采样 权值;5、根据重采样权值重采样并对粒子代价进行 迭代 更新得到L个时刻的粒子-代价集合,以最小代价为估计准则,得到前向状态估计;6、构建后向动态系统信号的状态方程和观测方程;7、将观测数据逆序输入后向动态系统,得到最小代价状态估计8、利用最小状态估计得到瞬时频率曲线估计。本发明提高了信号状态估计的 稳定性 ,减小了估计误差,可用于非线性动态系统中的目标状态估计。 | ||||||
权利要求 | 1.一种基于前-后向代价参考粒子滤波的瞬时频率曲线估计方法,其特征在于,包括以下步骤: |
||||||
说明书全文 | 基于前-后向代价参考粒子滤波的瞬时频率曲线估计方法技术领域背景技术[0002] 在雷达和声呐领域,噪声或杂波中微弱机动目标的检测总是一个具有挑战性的问题。由于目标运动状态和雷达工作模式的不同,目标回波模型可以分为两大类,即参数模型或非参数模型。当观测时间较短且目标运动平稳时,回波信号可以用包含少量未知参数的参数模型来模拟。例如幅度、初始相位和多普勒频移未知的线性调频信号。当观测时间较长且目标运动复杂时,回波信号的幅度和多普勒频移是关于时间的未知平滑函数,很难用参数模型来模拟。例如未知的非线性调频信号。 [0003] 噪声中未知非线性调频信号检测问题的关键在于目标回波的瞬时频率曲线的估计。文献“P.L.Shui,Z.Bao,and H.T.Su,"Nonparametric detection of FM signals using time-frequency ridge energy,"IEEE Trans.Signal Process.,56(5):1749-1760,2008.”中将沿着时频分布的脊能量的最大值作为瞬时频率曲线的估计,这种方法的检测性能很大程度上依赖于当前的时频分布。文献“E.Chassande-Mottin and A Pai,"Best chirplet chain:Near-optimal detection of gravita-tional wave chirps,"Phys.Rev.D.,73(4):042003,2007.”中利用Chirplet链结合动态规划方法从时频分布中估计回波信号的参数,用以检测未知的调频信号。 [0004] 基于机动目标的运动方程,可以利用一个统计特性未知的非线性动态系统来描述目标在连续两小段观测时间中的转移,则瞬时频率曲线的估计问题就可以转化为动态系统中的状态估计问题。粒子滤波是研究非线性、非高斯动态系统状态估计的有力工具,并且被广泛应用于目标追踪与检测领域。但是大多数粒子滤波及其改进算法都要求动态系统的统计特性是已知的,而在实际应用中这个要求很难达到。例如剩余杂波和噪声背景下机动目标检测问题中的观测噪声,以及描述未知调频信号瞬时频率曲线的动态系统中的系统噪声,都将导致动态系统的统计特性是未知的,这使得传统的粒子滤波方法会产生较大估计误差甚至失效。 发明内容[0005] 本发明的目的在于提出一种基于前-后向代价参考粒子滤波的瞬时频率曲线估计方法,以实现对统计特性未知的动态系统的目标状态和瞬时频率曲线估计。 [0006] 为实现上述技术目的,本发明的技术方案包括如下步骤: [0007] (1)将观测时间区间[0,T]等分为L个不相交的子区间:[(k-1)ΔT,kΔT],构建第k个观测时刻信号状态向量xk的状态方程和观测向量zk的观测方程: [0008] [0009] 其中,ΔT=T/L,A是状态转移矩阵,E噪声转移矩阵,vk表示第k时刻统计特性未知的噪声向量,ak表示第k时刻信号的幅度, 表示第k时刻信号的初始相位,h(xk)表示幅度为1的线性调时频粒子,wk表示第k时刻的观测噪声,服从均值为零,方差为σ2的高斯分布; [0010] (2)用户根据状态向量xk和观测向量zk定义粒子代价ck为: [0011]2 [0012] 其中 表示二范数的平方,|·|表示模平方, 表示zk的共轭转置,M表示观测向量的长度,ck的值越小,则表明h(xk)近似观测zk的程度越好; [0016] 其中,0≤λ<1为遗忘因子,zk+1为k+1时刻的观测向量, 的值越小的粒子对下一时刻状态的估计越重要; [0017] (5)根据步骤(4)的粒子风险 计算重采样权值: [0018] [0019] 其中q≥1是一个经验参数; [0020] (6)在k+1时刻,根据k时刻N个粒子的重采样权值之和进行重采样和粒子代价更新,得到k+1时刻的粒子-代价集合Λk+1; [0021] (7)重复步骤(4)至步骤(6)直至迭代到最后时刻L,得到L个观测时刻的粒子-代价集合:Λ1,Λ2,…Λk,…,ΛL,以每个时刻最小的代价为估计准则,得到基于前向代价参考粒子滤波的信号状态估 [0022] [0023] 其中 表示 最小时n的取值,n0表示代价最小时对应粒子的序号; [0024] (8)构建后向动态系统信号的状态方程和观测方程: [0025] [0026] 其中,AB为后向动态系统的状态转移矩阵,EB为噪声转移矩阵,vk-1表示k-1时刻统计特性未知的噪声向量; [0027] (9)将步骤(7)得到的第L时刻的粒子-代价集合作为初始粒子-代价集合,并将观测数据逆序代入后向动态系统的状态方程和观测方程,得到L个前-后向动态系统的粒子-代价集合 以每个时刻最小的代价为估计准则,得到基于前-后向代价参考粒子滤波的信号状态估计 [0028] [0029] 其中, 表示前-后向动态系统中k时刻的第n个粒子, 表示粒子 的代价, 表示中心频率的估计,表示频率变化率的估计; [0030] (10)利用基于前-后向代价参考粒子滤波的信号状态估计 中的中心频率估计与频率变化率估计 得到信号瞬时频率曲线的估计: [0031] [0032] 本发明与现有技术相比具有以下优点: [0034] 2)由于本发明利用信号的状态方程和观测方程进行状态更新,与时频脊估计器和Chirplet链估计器相比不涉及时频分布,允许使用较少的样本数,极大地减小了计算量,估计时间短。 [0036] 图1为本发明的实现流程图; [0037] 图2为用本发明和现有方法得到的瞬时频率曲线估计的RMSE与粒子数关系对比图; [0038] 图3为用本发明和现有方法得到的瞬时频率曲线估计的RMSE随时间变化对比图; [0039] 图4为用本发明和现有方法在不同信噪比下的瞬时频率曲线估计的RMSE对比图; [0040] 图5为用本发明和现有方法在不同幅度调制参数b下的瞬时频率曲线估计的RMSE对比图。 具体实施方式[0041] 下面结合附图对本发明作进一步说明: [0042] 参照图1,本发明的实现步骤如下: [0043] 步骤1,构建非线性调频信号的状态方程和观测方程。 [0044] (1.1)将观测时间区间[0,T]等分为L个不相交的子区间:[(k-1)ΔT,kΔT],在第k个观测时刻,用线性调频时频粒子h(xk)模拟非线性调频信号sk(t): [0045] [0046] 其中k=1,2,...,L,ak表示第k时刻信号的幅度, 表示第k时刻信号的初始相位,fk表示第k时刻信号的中心频率,rk表示第k时刻信号的频率变化率; [0047] (1.2)用幅度ak、初始相位 中心频率fk和频率变化率rk四个参数描述每个子区间中的非线性调频信号sk(t),并忽略幅度ak和初始相位 得到第k时刻信号的状态向量: [0048] xk=[fk,rk] <2> [0049] (1.3)将信号瞬时频率曲线fd(t)及其导数fd′(t)在tk-1=(k-1.5)ΔT处进行泰勒展开,得到展开后k时刻的中心频率fk和频率变化率rk: [0050] fk=fd((k-0.5)ΔT)=fk-1+ΔTrk-1+0.5(ΔT)2fd″(ξ1), <3>[0051] rk=fd′((k-0.5)ΔT)=rk-1+ΔTfd″(ξ2), [0052] 其中,fd((k-0.5)ΔT)表示fd(t)在tk=(k-0.5)ΔT处的值,fd′((k-0.5)ΔT)表示fd′(t)在tk=(k-0.5)ΔT处的值,ξ1、ξ2∈((k-1.5)ΔT,(k-0.5)ΔT),ΔTfd″(ξ1)是fd(t)在tk-1处泰勒展开式的余项,ΔTfd″(ξ2)是fd′(t)在tk-1处泰勒展开式的余项,ΔTfd″(ξ1)与ΔTfd″(ξ2)表示两个统计特性未知的噪声变量; [0053] (1.4)根据式<3>的中心频率fk和频率变化率rk及式<2>得到状态向量xk的状态方程和观测向量zk的观测方程: [0054] [0055] 其中 表示第k时刻统计特性未知的噪声向量。 [0056] 步骤2,用户根据状态向量xk和观测向量zk定义粒子代价ck。 [0057] 将粒子代价ck定义为观测向量zk在线性调频时频粒子h(xk)补空间上投影的模平方,如式<5>所示: [0058]2 [0059] 其中 表示二范数的平方,|·|表示模平方, 表示zk的共轭转置,M表示观测向量的长度,ck的值越小,则表明h(xk)近似观测zk的程度越好。 [0060] 步骤3,将第0个观测时刻作为初始时刻,产生初始化粒子。 [0061] 将第0个观测时刻作为初始时刻,在状态向量xk所属的状态空间Ω中均匀采样产生N个初始粒子 [0062] 设每个初始粒子的初始代价为0,即 得到初始时刻的粒子-代价集合为 [0063] 步骤4,计算k时刻第n个粒子的风险 [0064] 根据第k时刻的粒子-代价集合 通过式<4>表示的状态方程和观测方程预测出第k+1时刻的粒子 计算k时刻第n个粒子的风险 [0065] [0066] 其中,0≤λ<1为遗忘因子,zk+1为k+1时刻的观测向量, 值越小的粒子对下一时刻状态的估计越重要; [0067] 步骤5,根据式<6>表示的粒子风险 计算重采样权值 [0068] 计算重采样权值就是对粒子风险 归一化,即: [0069] [0070] 其中q≥1是一个经验参数。 [0071] 步骤6,在k+1时刻,根据k时刻N个粒子的重采样权值之和进行重采样和粒子代价更新,得到k+1时刻的粒子-代价集合Λk+1。 [0072] (6.1)计算k时刻N个粒子的重采样权值之和: 其中,n=1,2,…,N,[·]表示取整运算; [0073] (6.2)在k+1时刻,根据重采样权值之和αn进行重采样和粒子代价更新: [0074] 当αn≥1时,利用粒子 重采样产生αn个重采样粒子: l=1,2,…,αn,并更新每个重采样粒子的代价为: [0075] [0076] 其中, 表示重采样粒子, 表示重采样粒子的代价, 是随机数; [0077] 当αn<1时,不进行重采样,则k+1时刻的粒子-代价集合为: [0078] [0079] 步骤7,重复步骤4至步骤6直至迭代到最后时刻L,得到L个观测时刻的粒子-代价集合。 [0080] 重复步骤4至步骤6直至迭代到最后时刻L,得到L个观测时刻的粒子-代价集合:Λ1,Λ2,…Λk,…,ΛL,其中每个粒子-代价集合中的元素如式<10>所示: [0081] [0082] 步骤8,以每个时刻最小的代价为估计准则,得到基于前向代价参考粒子滤波的信号状态估计向量 [0083] [0084] 其中 表示 最小时n的取值,n0表示代价最小时对应粒子的序号。 [0085] 步骤9,构建后向动态系统信号的状态方程和观测方程。 [0086] (9.1)将信号瞬时频率曲线fd(t)及其导数fd′(t)在tk=(k-0.5)ΔT处进行泰勒展开,得到展开后k-1时刻的中心频率fk-1和频率变化率rk-1:2 [0087] fk-1=fd((k-1.5)ΔT)=fk-ΔTrk-1+0.5(ΔT)fd″(ξ3), <12>[0088] rk-1=fd′((k-1.5)ΔT)=rk-ΔTfd″(ξ4),ξ3,ξ4∈((k-1.5)ΔT,(k-0.5)ΔT) [0089] 其中,fd((k-1.5)ΔT)表示fd(t)在tk=(k-1.5)ΔT处的值,fd′((k-1.5)ΔT)表示fd′(t)在tk=(k-1.5)ΔT处的值,ξ3、ξ4∈((k-1.5)ΔT,(k-0.5)ΔT),ΔTfd″(ξ3)是fd(t)在tk处泰勒展开式的余项,ΔTfd″(ξ4)是fd′(t)在tk处泰勒展开式的余项;ΔTfd″(ξ3)与ΔTfd″(ξ4)表示两个统计特性未知的噪声变量; [0090] (9.2)根据式<12>的中心频率fk-1和频率变化率rk-1,得到后向动态系统信号的状态方程和观测方程: [0091] [0092] 其中 表示k-1时刻统计特性未知的噪声向量。 [0093] 步骤10,将步骤8得到的第L时刻的粒子-代价集合作为初始粒子-代价集合,并将观测数据逆序代入后向动态系统的状态方程xk-1和观测方程zk-1,以每个时刻最小的代价为估计准则,得到基于前-后向代价参考粒子滤波的信号状态估计 [0094] (10.1)将步骤8得到的第L时刻的粒子-代价集合作为初始粒子-代价集合,并将观测数据逆序代入后向动态系统的状态方程和观测方程,得到L个时刻前-后向动态系统的粒子-代价集合 每个粒子-代价集合 中的元素如式<14>所示: [0095] [0096] 其中 表示前-后向动态系统中k时刻的第n个粒子, 表示粒子 的代价; [0097] (10.2)以每个时刻最小的代价为估计准则,得到基于前-后向代价参考粒子滤波的信号状态估计 [0098] [0099] 其中, 表示中心频率的估计,表示频率变化率的估计。 [0100] 步骤11,利用式<15>表示的信号状态估计 得到信号瞬时频率曲线的估计[0101] 利用式<15>表示的信号状态估计 中的中心频率估计 与频率变化率估计 得到信号瞬时频率曲线的估计 [0102] [0103] 步骤1到步骤11,实现了基于前-后向代价参考粒子滤波的瞬时频率曲线估计。 [0104] 下面结合仿真实验对本发明的效果做进一步说明。 [0105] 1.仿真参数 [0106] 仿真实验中采用的测试信号s(t)为:2 3 4 [0107] s(t)=A(t)exp{2πj(νt+μt/2+rt/3+υt/4)},0<b<1, [0108] A(t)=a(1+bcos(12πt)) [0109] 其中t∈[0,1],A(t)表示幅度变化函数,a表示幅度大小,参数b用于调节幅度起伏,0<b<1; [0110] 信号s(t)的瞬时频率曲线fd(t)为:2 3 [0111] fd(t)=v+μt+rt+υt [0112] 其中,参数v,μ,r,υ在区间[-20,20]间随机取值,以保证瞬时频率曲线的范围为[-80Hz,80Hz],避免样本混叠; [0113] 信噪比的定义为: [0114] [0115] 其中σ2为背景噪声的方差。 [0116] 实验中采样间隔Δt=1/512,将长度为512的信号分成32段,每段信号的长度为16,粒子风险计算中的遗忘因子λ=0.9,重采样中的参数q=8,测试信号状态向量所属的状态空间Ω为[-80,80]×[-120,120],在Ω的每一维均匀采样p个点,产生初始粒子, 2 总粒子数为N=P。 [0117] 实验中采用的三种现有方法分别为:前向代价参考粒子滤波方法,Chirplet链估计器和时频脊估计器。 [0118] 2.仿真实验内容 [0119] 仿真实验中分别采用本发明方法和现有的三种方法得到测试信号瞬时频率曲线的估计,通过均方根误差RMSE分析比较四种估计方法的效果,RMSE值越小表明瞬时频率曲线的估计越接近真实状态。 [0120] 仿真实验1,在不同粒子数目条件下,利用本发明和前向代价参考粒子滤波方法估计测试信号的瞬时频率曲线,考察粒子数目对这两种方法估计性能的影响。 [0121] 为避免实验结果依赖某一特殊信号,做1000次蒙特卡洛实验并对实验结果取平均,每次实验中测试信号的幅度调制参数b=0.9,信噪比SNR=-10dB,每一维的采样数从2 2 4变化至20,即粒子数从4变化至20 。得到这两种方法的RMSE与粒子数的关系对比如图 2所示,图2中横轴表示每一维的采样数P,纵轴表示瞬时频率曲线估计的RMSE。 [0122] 从图2中可以看出:在不同粒子数目条件下,本发明的估计性能明显优于前向代价参考粒子滤波方法的估计性能,并且当P≥10时两种方法的估计性能都趋于稳定。以下2 实验中均取P=10,即粒子数为N=10。 [0123] 仿真实验2,随着观测时间的演变,利用本发明和前向代价参考粒子滤波方法估计测试信号的瞬时频率曲线,考察这两种方法的估计性能随观测时间的变化。 [0124] 实验中,测试信号的幅度调制参数b=0.9,信噪比SNR=-10dB,粒子数N=102,做1000次蒙特卡洛实验并对实验结果取平均,得到两种方法的RMSE随时间的变化关系,如图3所示,图3中横轴表示观测时间,纵轴表示瞬时频率曲线估计的RMSE。 [0125] 从图3中可以看出:随着观测时间的演变前向代价参考粒子滤波方法的估计性能逐渐变好,本法明的估计性能一直很稳定,并且优于前向代价参考粒子滤波方法的估计性能。 [0126] 仿真实验3,在不同信噪比环境下,利用本发明和时频脊估计器、Chirplet链估计器估计测试信号的瞬时频率曲线,考察不同信噪比条件下三种估计方法的估计性能。 [0127] 实验中,测试信号的幅度调制参数b=0.9,粒子数N=102,信噪比SNR从-13dB变化至-5dB,做1000次蒙特卡洛实验并对实验结果取平均,得到不同信噪比环境下三种方法的RMSE对比图,如图4所示,图4中横轴表示信噪比变化,纵轴表示瞬时频率曲线估计的RMSE。 [0128] 从图4中可以看出:不同信噪比环境下本发明的估计性能最好,Chirplet链估计器的性能次之,时频脊估计器的性能最差。 [0129] 仿真实验4,在不同幅度起伏条件下,利用本发明和Chirplet链估计器估计测试信号的瞬时频率曲线,考察幅度起伏对这两种估计方法估计性能的影响。 [0130] 实验中,测试信号的信噪比SNR=-10dB,粒子数N=102,幅度调制参数b从0变化至0.9,b=0表示信号幅度没有起伏,b=0.9表示信号幅度起伏很大,做1000次蒙特卡洛实验,得到两种方法的RMSE随参数b的变化关系,如图5所示,图5中横轴表示参数b的取值,纵轴表示瞬时频率曲线估计的RMSE。 [0131] 从图5可以看出:不同幅度起伏条件下,本发明的估计性能优于Chirplet链估计器的估计性能。 [0132] 综上所述,对非线性调频信号的状态和瞬时频率曲线估计而言,本发明提出的基于前-后向代价参考粒子滤波的瞬时频率曲线估计方法的估计性能稳定,优于已有的时频脊估计器和Chirplet链估计器的估计性能,好的状态和瞬时频率曲线估计有利于后续的信号检测。 |