基于相位变换加权广义互相关算法的自主寻人智能拐杖

申请号 CN201611203517.6 申请日 2016-12-23 公开(公告)号 CN106723736A 公开(公告)日 2017-05-31
申请人 南京医科大学; 发明人 朱松盛; 季倩云; 周文君; 张艳妮; 蒋志林; 王翰林; 吴小玲;
摘要 本 发明 公开了基于 相位 变换加权广义互相关 算法 的自主寻人智能拐杖,包括以下步骤:当使用者发出声音指令后,装置在底盘周围六个 拾音器 形成的麦克 风 阵列对语音 信号 进行采集。采集到的 声音信号 送到声强检测 电路 和 单片机 以及其他外部电路,声强检测电路选出采集到的声音信号最强的3个拾音器,单片机利用GCC‑PHAT(相位变换加权广义互相关)时延差估计算法计算时延,并对使用者进行 定位 ;然后根据定位,单片机自主控制拐杖运动至使用者处。
权利要求

1.基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,包括手柄、收缩杆、底盘、轮子和自主寻人智能模,所述手柄设置于收缩杆上方,收缩杆下方与底盘连接,轮子设置于底盘底部;所述底盘为圆形;
所述自主寻人智能模块包括麦克阵列和设置于底盘内部的语音定位模块、声强检测电路、红外避障模块、单片机以及其他外部电路、电机驱动模块、螺旋推杆电机和底轮机;
所述麦克风阵列分别与语音定位模块、单片机以及其他外部电路和声强检测电路相连,红外避障模块和单片机以及其他外部电路相连,单片机以及其他外部电路和电机驱动模块相连,电机驱动模块分别与螺旋推杆电机和底轮舵机相连,底轮舵机与轮子相连接;
所述麦克风阵列包括6个拾音器,该6个拾音器围绕圆形底盘设置,每60°安装一个拾音器,6个拾音器的中心为拐杖的中心原点;
所述麦克风阵列用于将声音信号传给语音定位模块进行处理;
所述语音信号识别模块是将麦克风阵列传来的声音信号进行特征提取,并与特征模板比较,如果二者达到了88%及以上的匹配度,则输入的语音被识别;
所述语音定位模块是将拾音器收集来的声音信号送入单片机,利用声强检测电路检测出接收到的声音信号最强的3个拾音器,通过计算确定声源的位置,将位置信息传送至单片机,进而准备驱动螺旋推杆电机和底轮舵机;
所述声强检测电路获取每个拾音器的声强峰值并进行比较,将对应声强峰值最大的3路电信号传入单片机中进行自主寻人定位,其余的电信号自动舍弃;
所述红外避障模块用于检测正前方是否有障碍物,并将相应的信号发送至单片机;
所述电机驱动模块通过H桥式功率驱动电路;
所述底轮舵机通过单片机驱动,使电机向指定度旋转,并适当调整速度。
2.根据权利要求1所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,所述自主寻人智能模块还包括语音播放模块,语音播放模块与单片机以及其他外部电路相连,所述语音播放模块是运用语音芯片作为语音播放的执行装置,在控制播放时,通过单片机向语音芯片发送相应的地址控制指令,从而实现语音的播放。
3.根据权利要求2所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,所述手柄为防滑手柄。
4.根据权利要求3所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,所述轮子为可折叠轮子。
5.根据权利要求4所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,所述自主寻人智能模块执行如下步骤:
步骤1,利用声强检测电路检测出接收到声音信号最强的3个拾音器,记为拾音器a,拾音器b和拾音器c,分别选取拾音器a,拾音器b和拾音器b,拾音器c两组拾音器接收声音信号,并对声音信号进行傅里叶变化,计算互相关函数;
步骤2,分别计算拾音器a,拾音器b和拾音器b,拾音器c两组拾音器接收到声音信号的互相关函数最大值的点,当选取拾音器a和拾音器b时,以拾音器a为第1路,拾音器b为第2路,当选取拾音器b和拾音器c时,以拾音器b为第1路,拾音器c为第2路,分别求它们的相位,计算得到它们的时延差;
步骤3,判断时延差,进行定位;
步骤4,根据步骤3的定位结果判断出拐杖行进方向,并控制轮子向前方,后方,左侧或右侧移动。
6.根据权利要求5所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,步骤1中,通过如下公式计算基于时间t的互相关函数

其中x1表示第1路拾音器,x2表示第2路拾音器,X1(ω)、 分别表示第1路拾音器接收声音信号基于频率ω的傅立叶变换和第2路拾音器接收声音信号基于频率ω的傅立叶变换的共轭, 为权重函数,X1(ω) 表示互功率谱
7.根据权利要求6所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,步骤2中,通过如下公式计算时延差τ12:

其中Tmax表示一对拾音器之间的最大时延差。
8.根据权利要求7所述的基于相位变换加权广义互相关算法的自主寻人智能拐杖,其特征在于,步骤3包括:将声强检测电路检测出接收到声音信号最强的3个拾音器按顺时针依次记为a1点,b1点和c1点,声源为s,a1和b1中点为o1;
当选取的3个点为右上方的3个拾音器时,将空间区域分为o1b1中间区域和b1右侧区域进行分析:声源s在o1b1中间区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动,然后选取第三个点c1作为辅助点,计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
声源s在b1右侧区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动,计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
当选取的3个点为左上方的3个拾音器时,按顺时针依次记为a2点,b2点和c2点,声源为s,b2和c2中点为o2;
将空间区域分为b2o2中间区域和b2左侧区域进行分析:声源s在b2o2中间区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动,然后选取第三个点a2作为辅助点,计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方;
声源s在b2左侧区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动,计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方。

说明书全文

基于相位变换加权广义互相关算法的自主寻人智能拐杖

技术领域

[0001] 本发明涉及一种智能拐杖的设计与应用,特别是涉及基于相位变换加权广义互相关算法的自主寻人智能拐杖。

背景技术

[0002] 随着我国医疗平的改善和生活质量的提高,中国的老龄化进程加快,从上个世纪末开始,中国就正式步入了老龄化社会。根据2010年第六次人口普查结果:65岁及以上人口约为1亿多,占8.87%,同比增长1.91%。
[0003] 大量高龄老年人口的出现,意味着老年人因病腿脚不便和视衰退的概率增高。拐杖的现实应用也面临着严峻的挑战:多数老人平时生活出行仅靠一根普通的拐杖,结构简单、功能较为单一;现有的智能拐杖虽然能够提供如定位报警求救、播放Mp3、照明、展开当椅子坐、设有药箱来提醒老人吃药等的功能,但多为附加功能的智能化,没有针对拐杖本身功能进行智能化的设计。
[0004] 本设计的受益对象主要为独居老人:一方面,他们因行动不便,家中无他人照料,难以在需要时获得拐杖支撑;另一方面,又因视力的衰退和记忆力的减退存在着将拐杖丢落等问题。为了解决这些问题,这款基于相位变换加权广义互相关算法的智能拐杖应运而生。
[0005] 智能拐杖前期需要进行训练,通过语音信号采集模多次采集,自行录制一系列形象化声音指令,此后老人只需发出如“拐杖,你在哪!”、“拐杖,快过来!”、“停下!”的声音指令,拐杖进行内部一系列算法后,就能控制拐杖的运动和静止,实现自行回到老人身边后静止的功能。并且,在此过程中,拐杖能够给予老人一系列反馈如“我在这儿!”“我正在过来,请稍等!”。整个过程实现了语音信号的采集、语音信号的识别、基于相位变换加权广义互相关算法和红外线避障以及进行路径的合理规划,最终,自行运行到老人身边。同时,拐杖的设计具有三段可收放结构,能够自动适应老年人高度。

发明内容

[0006] 本发明公开了基于相位变换加权广义互相关算法的自主寻人智能拐杖的设计与应用,目的是为解决关于独居老人,一方面他们因行动不便,家中无他人照料,有时难以在需要使用拐杖时获得拐杖,另一方面又因视力的衰退和记忆力的减退存在将拐杖丢落等问题。包括以下步骤:当使用者发出声音指令后,装置在底盘周围六个拾音器形成的麦克阵列对语音信号进行采集。采集到的声音信号送到声强检测电路单片机以及其他外部电路,声强监测电路选出采集到的声音信号最强的3个拾音器,单片机利用GCC-PHAT(相位变换加权广义互相关)时延差估计算法计算时延,并对使用者进行定位;然后根据定位,单片机自主控制拐杖运动至使用者处。
[0007] 本发明包括手柄、收缩杆、底盘、轮子和自主寻人智能模块,所述手柄设置于收缩杆上方,收缩杆下方与底盘连接,轮子设置于底盘底部;所述底盘为圆形;
[0008] 所述自主寻人智能模块包括麦克风阵列和设置于底盘内部的语音定位模块、声强检测电路、红外避障模块、单片机以及其他外部电路(通过编写程序,并烧进单片机,使得单片机可以控制各模块,外部电路起的是连接单片机和模块、部件的作用)、电机驱动模块、螺旋推杆电机和底轮机;
[0009] 所述麦克风阵列分别与语音定位模块、单片机以及其他外部电路和声强检测电路相连,红外避障模块和单片机以及其他外部电路相连,单片机以及其他外部电路和电机驱动模块相连,电机驱动模块分别与螺旋推杆电机和底轮舵机相连,底轮舵机与轮子相连接;
[0010] 所述麦克风阵列包括6个拾音器,该6个拾音器围绕圆形底盘设置,每60°安装一个拾音器,6个拾音器的中心为拐杖的中心原点;
[0011] 所述麦克风阵列用于将声音信号传给语音定位模块进行处理;
[0012] 所述语音信号识别模块是将麦克风阵列传来的声音信号进行特征提取,并与特征模板比较,如果二者达到了88%及以上的匹配度,则输入的语音被识别;所述语音定位模块是将拾音器收集来的声音信号送入凌阳单片机SPCE061A,利用声强检测电路检测出接收到的声音信号最强的3个拾音器,分别记为a、b和c,分别选取a,b和b,c两组麦克风声音信号,通过GCC-PHAT(相位变换加权广义互相关)时延差估计算法,对信号进行傅里叶变换,计算互相关函数,从而求得它们的相位和时延差。通过对时延差大小的判断,进行相应的度变换,从而确定声源的位置。最后,将位置信息传送至凌阳单片机SPCE061A,进而准备驱动螺旋推杆电机和底轮舵机。
[0013] 所述声强检测电路获取每个拾音器的声强峰值并进行比较,将对应声强峰值最大的3路电信号传入单片机中进行自主寻人定位,其余的电信号自动舍弃;
[0014] 所述红外避障模块用于检测正前方是否有障碍物,并将相应的信号发送至单片机;
[0015] 所述电机驱动模块通过H桥式功率驱动电路;
[0016] 所述底轮舵机通过单片机驱动,使电机向指定角度旋转,并适当调整速度。
[0017] 本发明所述自主寻人智能模块还包括语音播放模块。语音播放模块与单片机以及其他外部电路相连,所述语音播放模块是运用ISD4004语音芯片作为语音播放的执行装置,凌阳单片机SPCE061A采用SPI总线对语音芯片进行控制。事先,通过麦克风阵列在语音芯片ISD4004中将需要播放的语音录入,在凌阳单片机SPCE061A的内存中记录下录入语音的首地址。在控制播放时,通过凌阳单片机SPCE061A向ISD4004芯片发送相应的地址控制指令,从而实现语音的播放。
[0018] 本发明所述手柄为防滑手柄。
[0019] 本发明所述轮子为可折叠轮子。
[0020] 本发明所述自主寻人智能模块执行如下步骤:
[0021] 步骤1,利用声强检测电路检测出接收到声音信号最强的3个拾音器,记为a,b和c,分别选取a,b和b,c两组拾音器接收声音信号,并对声音信号进行傅里叶变化,计算互相关函数;
[0022] 步骤2,分别计算拾音器a,拾音器b和拾音器b,拾音器c两组拾音器接收到声音信号的互相关函数最大值的点,当选取拾音器a和拾音器b时,以拾音器a为第1路,拾音器b为第2路,当选取拾音器b和拾音器c时,以拾音器b为第1路,拾音器c为第2路,分别求它们的相位,计算得到它们的时延差;
[0023] 步骤3,判断时延差,进行定位;
[0024] 步骤4,根据步骤3的定位结果判断出拐杖向前方,后方,左侧或右侧移动。
[0025] 本发明步骤1中,通过如下公式计算基于时间t的互相关函数
[0026]
[0027] 其中x1表示第1路拾音器,x2表示第2路拾音器,X1(ω)、 分别表示第1路拾音器接收声音信号基于频率ω的傅立叶变换和第2路拾音器接收声音信号基于频率ω的傅立叶变换的共轭, 为权重函数, 表示互功率谱。当 恒为1时,GCC退化为普通的互相关函数。(其他几个字符的都是通式)
[0028] 本发明步骤2中,通过如下公式计算时延差τ12:
[0029]
[0030] 其中Tmax表示一对拾音器之间的最大时延差。
[0031] 本发明步骤3包括:将声强检测电路检测出接收到声音信号最强的3个拾音器按顺时针依次记为a1点,b1点和c1点,声源为s,a1和b1中点为o1;
[0032] 当选取的3个点为右上方的3个拾音器时,将空间区域分为o1b1中间区域和b1右侧区域进行分析:声源s在o1b1中间区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动,然后选取第三个点c1作为辅助点,计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0033] 声源s在b1右侧区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动。计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0034] 当选取的3个点为左上方的3个拾音器时,按顺时针依次记为a2点,b2点和c2点,声源为s,b2和c2中点为o2;
[0035] 将空间区域分为b2o2中间区域和b2左侧区域进行分析:声源s在b2o2中间区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动,然后选取第三个点a2作为辅助点,计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方;
[0036] 声源s在b2左侧区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动。计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方。
[0037] 本发明步骤1~步骤4中关于GCC-PHAT(相位变换加权广义互相关)时延差估计算法的具体过程如下:
[0038] 利用声强检测电路检测出接收到声音信号最强的3个拾音器,顺时针依次记为a,b,c。利用GCC-PHAT(相位变换加权广义互相关)时延差估计算法计算时延。(主要参考资料来自:程超.基于麦克风阵列的语音增强实现[D].硕士2013:1-57.)
[0039] 算法如下:
[0040] 理想自由声场下2个麦克风的接收信号模型分别为
[0041]
[0042] 其中x1(t)为第1路接收信号,x2(t)为第2路接收信号,s(t)是发射源信号,s(t-τ1)是延时τ1之后的信号,s(t-τ2)是延时τ2之后的信号,α1,β1分别为第1、2路麦克风信号的衰减系数,τ1,τ2分别表示第1、2路麦克风接收到的直达信号的时延,n1(t)和n2(t)分别为第1、2路麦克风信号的加性噪声。
[0043] 为简化讨论,假设加性环境噪声与声源信号不相关,且加性噪声之间互不相关。通过计算两路信号的互相关函数来估计声源至两个麦克风之间的时延差τ12,其中
[0044] τ12=τ1-τ2。两路信号间的互相关函数的表达式见公式(2):
[0045]
[0046] 其中 表示第1、2路麦克风接收信号的互相关函数,Rss(t)表示声源信号本身的自相关函数。由于Rss(t)函数最大值为Rss(0),因此只须找出 函数的最大值,其对应的时间变量即为τ12。因此,在理想自由声场下,通过互相关计算即可获取时间差的估计值。
[0047] 然而在混响模型下,会有反射信号叠加,第1路和第2路麦克接收的反射信号有无数多个不同的反射路径,分别用i(i=2,3,…),j(j=2,3,…)表示。信号接收模型见式(3):
[0048]
[0049] 其中 和 分别表示第1、2路麦克风接收信号的混响信号,αi和βj分别表示第1路麦克在不同反射路径下的衰减系数和第2路麦克在不同反射路径下的衰减系数;此时,第1、2路麦克风接收信号的互相关函数,见式(4):
[0050]
[0051] 此时的互相关函数等价于无穷多个互相关函数的累加,虽然α1>α2>α3>α4…>α+∞>0(β分量同理),即信号中直达分量能量最大,但由于函数叠加, 未必就是最大值;类似光波的衍射, 可能往往只是一个普通值,且函数的峰值点亦可能有多个。因此在混响环境中利用普通互相关函数来估计时延差是不够的。所以有人在互相关的基础上提出了广义互相关,所谓广义互相关(GCC:Generalized Cross Correlation)指的是在互相关的基础上在频域给予一定的加权;GCC的获取可通过先计算出这麦克风接收信号的广义互功率谱,再做傅立叶反变换获得,见式(5):
[0052]
[0053] 其中x1表示第1路拾音器,x2表示第2路拾音器,X1(ω)、 分别表示第1路拾音器接收声音信号基于频率ω的傅立叶变换和第2路拾音器接收声音信号基于频率ω的傅立叶变换的共轭, 为权重函数, 表示互功率谱。当 恒为1时,GCC退化为普通的互相关函数。(其他几个字符的都是通式)
[0054] 的峰值点对应的自变量为声源至两个麦克风之间的时延差估计值,见式(6):
[0055]
[0056] 其中Tmax表示一对麦克风之间的最大时延差。
[0057] 由于语音信号的短时相关性,导致互相关函数的峰值范围较宽,再加上混响及噪声的干扰,很难得到准确的时延差估计,因此权重函数的选取对于GCC时延差估计的性能起着至关重要的作用。其中以相位变换加权(PHAT:Phase Trallsfom)最具代表性,只利用信号的相位信息进行时延差估计,见式(7):
[0058]
[0059] 将其代入式(5),,这就是著名的GCC—PHAT,见式(8):
[0060]
[0061] PHAT加权白化了功率谱,使得互相关函数的峰值更加尖锐。因此,与普通的互相关相比,GCC-PHAT具有更高的估计精度;在混响环境下,GCC-PHAT亦具有更好的鲁棒性。
[0062] 算法的详细步骤如下:
[0063] (1).利用声强检测出接收到声音信号最强的3个拾音器,分别选取a,b和b,c两组拾音器接收声音信号,并对信号进行傅里叶变化,利用公式(5)计算互相关函数。
[0064] (2).分别计算a,b和b,c两组麦克风接收到信号的互相关函数最大值的点,当选取拾音器a和拾音器b时,以拾音器a为第1路,拾音器b为第2路,当选取拾音器b和拾音器c时,以拾音器b为第1路,拾音器c为第2路,分别求它们的相位,利用公式(6)得到它们的时延差。
[0065] (3).判断时延差,进行定位。设利用声强选取的三个点顺时针一次为a点,b点,c点,声源为s,a,b中点为o;当选取的3个点为右上方的3个麦克时,将空间区域分为ob中间区域和b右侧区域进行分析;声源s在ob区域时,计算声源s到达a,b的时间延迟,>0,说明距离b近,往右侧移动。但无法判断声源s在a,b前方还是后方,故选取了第三个点c,作为辅助点;计算c点与a,b两点间任意一点时间延迟τ,假设选择计算b,c两点,当<0时,说明声源s在a,b前方;当>0时,说明声源s在a,b后方。声源s在b右侧区域时,同样计算,>0,距离b近,,往右侧移动。再计算,当<0时,说明声源s在a,b前方;当>0时,说明声源s在a,b后方。当选取的3个点为左上方的3个麦克时,将空间区域分为ob中间区域和b左侧区域进行分析,分析过程与第1种情况相似。
[0066] (4).已知检测的时域信号的采样值,根据第3步判断出拐杖应该是向前方,后方,左侧或右侧移动。
[0067] 本发明的有益效果在于:
[0068] 本发明拐杖的设计具有三段可收放结构,能够自动适应老年人高度,并记住老人常用的高度,自适应使用,免去老年人因病腿脚不便带来的困扰。GCC-PHAT(相位变换加权广义互相关)时延差估计算法能够精准定位,算法运算结果可靠,有效节省了不必要的重复运算时间,提高了整个过程的行进效率。在语音识别方面,芯片SPCE061A会对采集的语音信号进行特征提取,由DTW模型算法进行特征训练,匹配度比较,辨识后进行运动与否。正是由于需要前期的训练:这样就能够有效地规避智能拐杖被他人盗用,即不是主人的指令,智能拐杖就不会进行相应工作,不会跟着他人乱跑。智能拐杖能够识别语音信号,对使用者进行语音应答,进行的相应反馈既能让使用者觉得智能拐杖的设计富于人性化,又为即将到达使用者身边的结果作相应的准备。附图说明
[0069] 下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
[0070] 图1是拐杖整体外观设计的示意图。
[0071] 图2是拐杖收缩杆外观伸长与收缩示意图。
[0072] 图3是拐杖收缩杆内部伸长与收缩示意图。
[0073] 图4是底部轮子的示意图。
[0074] 图5是底部轮子通过内部滑杆进行伸出与收缩的示意图。
[0075] 图6为拐杖周围六个拾音器在拐杖上相对位置分布的主视图。
[0076] 图7为拐杖3号位横切面的俯视图。
[0077] 图8是本发明内部电路模块示意图。

具体实施方式

[0078] 下面结合附图及实施例对本发明做进一步说明。
[0079] 如图1所示,本发明包括手柄、收缩杆、底盘、轮子和自主寻人智能模块,所述手柄设置于收缩杆上方,收缩杆下方与底盘连接,轮子设置于底盘底部;所述底盘为圆形;图1中,1为防滑手柄,2为收缩杆(长度可由使用者自己调节,收缩杆最长可达750mm),如图2何图3所示,为收缩杆示意图,3为底盘,4为可折叠轮子。
[0080] 如图8所示,所述自主寻人智能模块包括麦克风阵列和设置于底盘内部的语音定位模块、声强检测电路、红外避障模块、单片机以及其他外部电路、电机驱动模块、螺旋推杆电机和底轮舵机;
[0081] 所述麦克风阵列分别与语音定位模块、单片机以及其他外部电路和声强检测电路相连,红外避障模块和单片机以及其他外部电路相连,单片机以及其他外部电路和电机驱动模块相连,电机驱动模块分别与螺旋推杆电机和底轮舵机相连,底轮舵机与轮子相连接;
[0082] 所述麦克风阵列包括6个拾音器,该6个拾音器围绕圆形底盘设置,如图6所示,标明的3号位对应拐杖整体图1中的3号位。每60°安装一个拾音器,如图7所示,6个拾音器的中心为拐杖的中心原点;
[0083] 所述麦克风阵列用于将声音信号传给语音定位模块进行处理;
[0084] 所述语音信号识别模块是将麦克风阵列传来的声音信号进行特征提取,并与特征模板比较,如果二者达到了88%及以上的匹配度,则输入的语音被识别;
[0085] 所述语音定位模块是将拾音器收集来的声音信号送入凌阳单片机SPCE061A,利用声强检测电路检测出接收到的声音信号最强的3个拾音器(a,b,c),分别选取a,b和b,c两组拾音器接收声音信号,通过GCC-PHAT(相位变换加权广义互相关)时延差估计算法,对信号进行傅里叶变换,计算互相关函数,从而求得它们的相位和时延差。通过对时延差大小的判断,进行相应的角度变换,从而确定声源的位置。最后,将位置信息传送至凌阳单片机SPCE061A,进而准备驱动螺旋推杆电机和底轮舵机。
[0086] 所述声强检测电路获取每个拾音器的声强峰值并进行比较,将对应声强峰值最大的3路电信号传入单片机中进行自主寻人定位,其余的电信号自动舍弃;
[0087] 所述红外避障模块用于检测正前方是否有障碍物,并将相应的信号发送至单片机;
[0088] 所述电机驱动模块通过H桥式功率驱动电路;
[0089] 所述底轮舵机通过单片机驱动,使电机向指定角度旋转,并适当调整速度。
[0090] 本发明所述自主寻人智能模块还包括语音播放模块。所述语音播放模块是运用ISD4004语音芯片作为语音播放的执行装置,凌阳单片机SPCE061A采用SPI总线对语音芯片进行控制。事先,通过麦克风阵列在语音芯片ISD4004中将需要播放的语音录入,在凌阳单片机SPCE061A的内存中记录下录入语音的首地址。在控制播放时,通过凌阳单片机SPCE061A向ISD4004芯片发送相应的地址控制指令,从而实现语音的播放。
[0091] 本发明所述手柄为防滑手柄。
[0092] 本发明所述轮子为可折叠轮子,如图和图5所示。
[0093] 本发明所述自主寻人智能模块执行如下步骤:
[0094] 步骤1,利用声强检测电路检测出接收到声音信号最强的3个拾音器,记为a,b和c,分别选取a,b和b,c两组拾音器接收声音信号,并对声音信号进行傅里叶变化,计算互相关函数;
[0095] 步骤2,分别计算a,b和b,c两组拾音器接收到声音信号的互相关函数最大值的点,当选取拾音器a和拾音器b时,以拾音器a为第1路,拾音器b为第2路,当选取拾音器b和拾音器c时,以拾音器b为第1路,拾音器c为第2路,分别求它们的相位,计算得到它们的时延差;
[0096] 步骤3,判断时延差,进行定位;
[0097] 步骤4,根据步骤3的定位结果判断出拐杖向前方,后方,左侧或右侧移动。
[0098] 本发明步骤1中,通过如下公式计算基于时间t的互相关函数
[0099]
[0100] 其中x1表示第1路拾音器,x2表示第2路拾音器,X1(ω)、 分别表示第1路拾音器接收声音信号基于频率ω的傅立叶变换和第2路拾音器接收声音信号基于频率ω的傅立叶变换的共轭, 为权重函数, 表示互功率谱。当 恒为1时,GCC退化为普通的互相关函数。
[0101] 本发明步骤2中,通过如下公式计算时延差τ12:
[0102]
[0103] 其中Tmax表示一对拾音器之间的最大时延差。
[0104] 本发明步骤3包括:将声强检测电路检测出接收到声音信号最强的3个拾音器按顺时针依次记为a1点,b1点和c1点,声源为s,a1和b1中点为o1;
[0105] 当选取的3个点为右上方的3个拾音器时,将空间区域分为o1b1中间区域和b1右侧区域进行分析:声源s在o1b1中间区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动,然后选取第三个点c1作为辅助点,计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0106] 声源s在b1右侧区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动。计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0107] 当选取的3个点为左上方的3个拾音器时,按顺时针依次记为a2点,b2点和c2点,声源为s,b2和c2中点为o2;
[0108] 将空间区域分为b2o2中间区域和b2左侧区域进行分析:声源s在b2o2中间区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动,然后选取第三个点a2作为辅助点,计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方;
[0109] 声源s在b2左侧区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动。计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方。
[0110] 实施例
[0111] 用拾音器可以很好地采集使用者的声音特点,一般拾音器大小为20mm*60mm,壳体采用合金材料制作,可以有效屏蔽电磁干扰。本实施例采用的拾音器具体型号为邮科YK-QA601微型隐蔽拾音器。该处理芯片:采用普通放大器,隐蔽性强,耗电量小,适用ATM机,监狱,审讯室等场所。具有噪声小、保真度高、工作电压范围宽、耗电小、传输距离远、采用普通放大器等优点。产品参数:频率范围:100Hz~~10kHz,频率响应:2.5dB,输出阻抗:600Ω,外观尺寸:L=35mmΦ=6.6mm。为降低噪声,电路板采用四层PCB,并设计成圆形,通过四个螺丝固定在圆形合金底座上。麦克风对准壳体顶部小孔。这种半圆形结构能够更好地保证拾音器的全向性。拾音器还具有心形指向性的特点,心形指向是指在0°到60°区域内接收灵敏度无明显改变,频响曲线基本平直。圆形底盘的直径为140mm,(考虑拐杖主体部分是圆形360°÷60°=6)所以比较合理的分布拾音器的方法是围绕整个拐杖每60°安装一个拾音器(一共安装6个)。通过拾音器来把声音信号传给语音识别模块进行处理。
[0112] 语音定位模块通过拾音器来收集声音信号,本实施例用凌阳语音芯片SPCE061A的精简开发板作为语音模块来实现语音的识别,在语音处理方面,该模块可以实现对语音实现放大、滤波、采样、A/D转换的功能,在语音识别方面,芯片SPCE061A会对采集的语音信号进行特征提取,由DTW模型算法进行特征训练,并将训练结果存储在Flash中作为模板。使用时,会将新获得的语音信号进行特征提取与特征模板进行比较,如果二者达到了一定的匹配度,则输入的语音被识别。如果辨识结果是停止,停止当前的动作并进入待命状态,然后等待动作命令。如果辨识结果为动作指令拐杖会语音告知相应动作并执行该动作。
[0113] 声强检测电路包括两个LMV358放大器,二极管三极管,保持器电容和一些电阻构成。首先,放大后的信号从LMV358(U2A)的同向输入端输入。通过控制电容C3的放电过程,即当P2.0端口为高电压时,三极管Q1导通,保持器电容放电;当P2.0端口为低电压时,三极管Q1截止,峰值信号可以被存在保持器中。同时,电路中用LMV358(U2B)和电阻构成电压跟随器,从而对整个电路加入了保护措施。检波后的信号由LMV358(U2B)的输出端进行输出,通过I/O口P1.3端口与单片机相连。
[0114] 当声源有声音信号发出时,声波被拐杖前端YK-QA601拾音器(共6个)所接收,引起各拾音器内的驻极体薄膜振动,电容的变化从而产生与之对应的微小电压,这一电压经放大电路和滤波的处理后,分别传入声强检测电路中,并获得对应每个拾音器的声强峰值且进行比较,将对应峰值较大的电信号,通过I/O口传入凌阳单片机SPCE061A中继续做语音识别,其余的电压信号自动舍弃。
[0115] 本发明采用的是红外避障。红外避障模块采用TK-20光电传感器,TK-20是一种反射式光电传感器,其体积小,使用方便和可靠性高,有效的探测距离达5cm,通过调节电位器,最远可以达到10cm。
[0116] 红外避障的基本原理是利用物体的反射性质。当有障碍物时,红外线遇到障碍物,被反射达传感器接收头,将光信号转换成电信号,并将电信号传输给集成运放,构成电压比较器,得到相关的电平信号,送入SPCE061A单片机,通过判断送入电平信号的高低,便可检测前方是否有障碍物,进而SPCE061A单片机可以通过输入内部的算法,改变由舵机控制的轮子的方向,达到躲避障碍物的目的。
[0117] 进行红外避障时首先对SPCE061A单片机进行初始化。由于红外发射与接收电路是独立于SPCE061A单片机的,它不需要SPCE061A单片机给予驱动信号,只需在检测到障碍物时,给SPCE061A单片机提供一个低电平信号即可。在SPCE061A单片机运行时,每隔一段时间检测输入进来的信号。当检测到低电平时,即可知前方存在障碍物(需要躲避)。
[0118] 电动机的驱动使用典型的“H”桥式功率驱动电路,由四个三极管组成4个桥臂,控制这两组4个三极管的状态,就可使电动机作正转、反转、停止。
[0119] 由凌阳61A单片机的I/O口I0B8、I0B9控制前轮电机运动,I0810、I0811控制后轮电机运动小车的运动状态和I/0口输出的关系表如表1所示。
[0120] 表1:
[0121]
[0122]
[0123] 程序识别出使用者说出何种语音命令后,根据表1的I/0口输出和小车运动姿态的状态的对应关系,对相应的I/0口置位或清零,输出到电机驱动电路,控制电机运转,小车作相应的动作。
[0124] 底轮舵机的控制:底轮舵机通过凌阳61A单片机的一种输出方式:单通道脉宽调制(PWM)驱动,使电机向指定角度旋转,并适当调整速度。
[0125] 操作步骤:
[0126] (1).利用声强电路检测出接收到声音信号最强的3个拾音器,分别选取a,b和b,c两组拾音器接收声音信号,并对信号进行傅里叶变化,利用公式(5)计算互相关函数。
[0127] (2).分别计算a,b和b,c两组麦克风接收到信号的互相关函数最大值的点,当选取拾音器a和拾音器b时,以拾音器a为第1路,拾音器b为第2路,当选取拾音器b和拾音器c时,以拾音器b为第1路,拾音器c为第2路,分别求它们的相位,利用公式(6)得到它们的时延差。
[0128] (3).判断时延差,进行定位。
[0129] 将声强检测电路检测出接收到声音信号最强的3个拾音器按顺时针依次记为a1点,b1点和c1点,声源为s,a1和b1中点为o1;
[0130] 当选取的3个点为右上方的3个拾音器时,将空间区域分为o1b1中间区域和b1右侧区域进行分析:声源s在o1b1中间区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动,然后选取第三个点c1作为辅助点,计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0131] 声源s在b1右侧区域时,计算声源s到达a1,b1的时间延迟,如果大于0,表示声源距离b1近,拐杖往右侧移动。计算c1点与a1,b1两点间任意一点时间延迟τ,假设选择计算b1,c1两点,当τ<0时,表示声源s在a1,b1前方;当τ>0时,表示声源s在a1,b1后方;
[0132] 当选取的3个点为左上方的3个拾音器时,按顺时针依次记为a2点,b2点和c2点,声源为s,b2和c2中点为o2;
[0133] 将空间区域分为b2o2中间区域和b2左侧区域进行分析:声源s在b2o2中间区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动,然后选取第三个点a2作为辅助点,计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方;
[0134] 声源s在b2左侧区域时,计算声源s到达b2,c2的时间延迟,如果小于0,表示声源距离b2近,拐杖往左侧移动。计算a2点与b2,c2两点间任意一点时间延迟τ,假设选择计算a2,b2两点,当τ>0时,表示声源s在b2,c2前方;当τ<0时,表示声源s在b2,c2后方。
[0135] (4).已知检测的时域信号的采样值,根据第3步判断出拐杖应该是向前方,后方,左侧或右侧移动,并在移动的过程中自主避障,每隔10s检测一次声源信号,重复以上步骤,当拐杖运动到距离使用者20cm处停下。
[0136] 本发明提供了基于相位变换加权广义互相关算法的自主寻人智能拐杖,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
QQ群二维码
意见反馈