一种基于声音频谱特征的杯内空气柱高度检测算法

专利类型 发明公开 法律事件 公开; 实质审查;
专利有效性 实质审查 当前状态 实质审查
申请号 CN202211693546.0 申请日 2022-12-28
公开(公告)号 CN116256040A 公开(公告)日 2023-06-13
申请人 南京美基森信息技术有限公司; 申请人类型 企业
发明人 马依航; 吴佳昱; 刘伟; 第一发明人 马依航
权利人 南京美基森信息技术有限公司 权利人类型 企业
当前权利人 南京美基森信息技术有限公司 当前权利人类型 企业
省份 当前专利权人所在省份:江苏省 城市 当前专利权人所在城市:江苏省南京市
具体地址 当前专利权人所在详细地址:江苏省南京市栖霞区兴智路6号兴智科技园A幢9楼 邮编 当前专利权人邮编:210000
主IPC国际分类 G01F23/296 所有IPC国际分类 G01F23/296G06F17/10G06N20/00
专利引用数量 0 专利被引用数量 0
专利权利要求数量 1 专利文献类型 A
专利代理机构 专利代理人
摘要 本 发明 公开了一种基于声音 频谱 特征的 水 杯内空气柱高度检测 算法 。基于在倒水过程中,水杯内空气柱振动的 频率 具有特定的频谱特征,与空气柱的高度具有很大关联,设计一个适用在AI芯片上的网络模型和后处理算法去预测水杯内空气柱高度,进而完成水位检测。本发明可以解决液位检测难以运用在民用饮水机的问题,从而解决现有具有饮水加热功能的饮水机在被使用时,使用者容易疏忽从而导致热水溢出水杯烫伤使用者的问题。
权利要求

1.一种具有检测饮机倒水过程中水杯的剩余空气柱高度的算法,其特征在于:核心计算网络的学习模型采用卷积神经网络提取频谱特征,全连接网络回归出水杯内空气柱高度真值,并且在接近水满时,由于水声频谱特征不明显,采用了后处理算法进行最终预测,后处理算法的步骤包括:
步骤S1:以固定片段的水声频谱作为一,以特定的帧移将频谱送入空气柱高度检测深度学习网络,得到空气柱高度列表,均取其最后一个预测值;
步骤S2:以固定点数的预测值作为一帧,以特定的帧移将预测值送入最小二乘法估计出预测曲线的斜率,综合斜率系数的标准误差和设定的斜率阈值来计算当前斜率的置信度
步骤S3:对得到的预测斜率根据其置信度加权求平均,得到最终的斜率,并以此计算水杯内空气柱高度接近0时的预测值。

说明书全文

一种基于声音频谱特征的杯内空气柱高度检测算法

技术领域

[0001] 本发明属于生活电器技术领域,具体涉及到一种具有检测倒水过程中水杯的剩余空气柱高度,间接进行水位检测的算法。

背景技术

[0002] 目前,根据人们的饮水需求,带有饮水加热功能的饮水机越来越普及。然而在现有技术中,饮水机普遍存在以下缺点:使用者需自己根据水杯有没有接满来判断何时停止水,从而很容易出现疏忽导致热水溢满杯子的现象,造成使用者的烫伤,由此可见带有饮水加热功能的饮水机对使用者,尤其对于孩童存在一定险。
[0003] 因此,需要一种具有水位检测功能的饮水机,实时地检测水杯中的剩余高度,并在水杯即将灌满同时使用者仍未手动停止水阀时自动停止水阀,从而切实保障使用者的安全。
[0004] 现有技术中,工业生产中检测水位有如下几种主流方法:静压式测量:该测量方式采用安装于底部的压传感器,通过检测底部压力,转换计算出液位高度。但是该测量方式存在精度要求高、水杯必须水平对准传感器放置、需要不断进行校准、受到水杯重量影响等缺陷,难以运用于本领域。
[0005] 电容式测量:该测量方式依据电容感应原理,当被测介质测量电极的高度变化时,引起其电容变化。它可将各种物位、液位介质高度的变化转换成标准电流信号,从而进行显示、报警或自动控制。但是该测量方式存在接触式测量、受到不同的容器材质和溶液属性影响的缺陷,难以运用于本领域。
[0006] 光学测量:该测量方式可分为激光测量和光电折射式测量。其中激光测量基于光学检测原理,通过物体表面反射光线至接收器进行检测,其光斑较小且集中。但透明液体容易折射光线,导致光线无法反射至接收器。而光电折射式测量。光电折射式测量通过传感器内部发出光源,光源全反射至传感器接受器。在遇到液面时,部分光线将折射至液体,从而传感器检测全反射回来光量值的减少来监控液面。但是该测量方式存在对液体透明度有不同的要求、以传感器安装位置为基准而非杯口的缺陷,难以运用于本领域。
[0007] 计算机视觉测量:该方式基于计算机视觉原理,提取监控视图中杯壁和杯中液体的特征,从而判断当前液位。但是该测量方式存在摄像头容易收到蒸汽凝结水滴的污损导致无法获取有效视图、透明液体难以提取特征、水纹波动带来的噪声导致算法失效等缺陷,难以运用于本领域。

发明内容

[0008] 本发明公开了一种基于声音频谱特征的水杯内空气柱高度检测算法。可以解决液位检测难以运用在民用饮水机的问题,从而解决现有具有饮水加热功能的饮水机在被使用时,使用者容易疏忽从而导致热水溢出水杯烫伤使用者的问题。
[0009] 为解决上述技术问题,本发明公开了基于声音频谱特征的水杯内空气柱高度检测算法。其检测算法主要包括声音接收、核心计算网络、后处理算法。所述算法基于声音接收模传回的声音信号转换为频谱图,计算出当前打水水杯内的剩余空气柱高度,在接近水满时,由于水声频谱特征不明显,采用后处理进行预测最终剩余空气柱高度。
[0010] 上述的具有检测水杯水杯内剩余空气柱高度的检测方法,其特征在于所述声音接收算法中包含波束成形算法。
[0011] 并且,在本算法中,在对倒水声音进行预处理的过程中,包括如下步骤:步骤S1:用16Khz采样率对音频进行重采样,并切割成2s片段
[0012] 步骤S2:用STFT算法输出音频频谱,将窗口时间长度设置为32ms,移设置为窗口大小的一半,分帧之后进行FFT,FFT的点数设置成与窗口大小一致的512点。
[0013] 步骤S3:进行频谱图截断,只截取一半的频谱,最终得到要输入网络的频谱图。
[0014] 并且,在本算法中,在对倒水声音制作液位状态的数据集包括:剔除带有长时间静音、大片静电噪声、夹杂说话等其他噪音的数据样本;对音频数据增加本段数据平均振幅1%的高斯噪声;在5%的范围内随机提高或者降低本段音频的频率样本;在5%的范围内随机提高或者降低本段音频的振幅样本;
并且,在本算法中,在对深度学习模型的设计部分采用了CNN网络。模型要能够实地部署在一些AI芯片上,需要设计比较简单、参数量比较小的CNN网络,达到既能完成特征提取进行水位检测,又能够控制参数量方便实地部署。网络只使用芯片支持的卷积层和全连接层。卷积完成得到特征图之后,将其平铺送入到一个全连接层中,最终输出一段向量,表示输入的频谱图对应的这段时间内水杯中空气柱长度的变化。
[0015] 并且,在本算法中,为了评估模型的表现,设置了空气柱长度预测准确率,计算表达式为:其中L表示总共的帧数, 和 表示第t帧的预测值和真值,thres表示设置的阈值
[0016] 假定模型一共预测出L帧的空气柱长度变化向量,将预测的向量与真值向量的每一帧进行一一对比,如果一帧内的预测值和真值的绝对差值在预先设定的阈值内,则表示这一帧的长度预测正确,那么总体的准确率可以表示为预测对的帧数占所有帧数的比例。
[0017] 而且,在基于音频频谱特征进行水杯内水位检测时,在水杯内空气柱高度接近0时,音频频谱特征会消失,导致难以预测最终的水位。本算法提出一种后处理算法,步骤包括:步骤S1:以2s片段水声频谱作为一帧,帧移100ms,每一段水声频谱送入CNN网络,得到空气柱高度列表,均取其最后一个预测值。
[0018] 步骤S2:每20点预测值作为一帧,帧移10点,通过最小二乘法估计出预测曲线的斜率,综合斜率系数的标准误差和设定的斜率阈值来计算当前斜率的置信度,其中斜率系数的标准误差如下式:其中, 表示真实的y值, 表示回归的y值。
[0019] 步骤S3:对步骤S2中得到的可靠的预测斜率根据其置信度加权求平均,得到最终的斜率,并以此计算水杯内空气柱高度接近0时的预测值。附图说明
[0020] 图1 为本发明实施例的空气柱高度检测方法麦克风安装示意图。
[0021] 图2 为本发明实施例的空气柱高度检测方法原理示意图。
[0022] 图3 为本发明实施例的空气柱高度检测方法总体流程图
[0023] 图4 为本发明实施例的空气柱高度检测方法深度学习模型结构示意图。

具体实施方式

[0024] 以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
[0025] 如图1所示,本发明通过固定在出水口轴线上的两个麦克风采集的音频作为输入,通过波束成形算法增加性噪比,之后进行水位检测。如图2所示,本发明的原理是通过检测倒水过程中水杯的剩余空气柱高度,间接进行水位检测。其中输入的是两个麦克风采集的音频频谱图,在倒水过程中,有一条明显的发亮的曲线,这一条曲线实际上就是对应的空气柱振动的频率变化曲线。可以认为水杯内水位的高度和空气振动频率有着很大的关联。本发明通过设计一个网络模型去训练两者之间的对应关系,但在接近水满时,由于水声频谱特征不明显,采用后处理进行预测最终剩余空气柱高度。
[0026] 如图3所示,其中空气柱高度检测功能主要包括如下步骤:(1)构建水声数据集,其中包括了预处理部分。首先在对倒水声音制作液位状态的数据集包括:剔除带有长时间静音、大片静电噪声、夹杂说话等其他噪音的数据样本;对音频数据增加本段数据平均振幅1%的高斯噪声;在5%的范围内随机提高或者降低本段音频的频率样本;在5%的范围内随机提高或者降低本段音频的振幅样本;其次是数据集的预处理:包括如下步骤:
步骤S1:用16Khz采样率对音频进行重采样,并切割成2s片段。
[0027] 步骤S2:用STFT算法输出音频频谱,将窗口时间长度设置为32ms,帧移设置为窗口大小的一半,分帧之后进行FFT。
[0028] 步骤S3:进行频谱图截断,只截取一半的频谱,最终得到要输入网络的频谱图。
[0029] (2)构建空气柱高度检测深度学习模型。深度学习模型如图4所示:网络包括卷积层和全连接层。卷积完成得到特征图之后,将其平铺送入到一个全连接层中,最终输出一段向量,表示输入的频谱图对应的这段时间内水杯中空气柱长度的变化。
[0030] (3)训练模型。模型采用ADAM作为优化器,训练的epoch设置为350,初始学习率为0.001,采用余弦退火作为学习度下降策略;音频样本最多被训练三次,训练时打乱音频样本顺序,随机组成批次,每批次256个音频样本。
[0031] (4)用测试集评估模型。设置了空气柱长度预测准确率,计算表达式为:其中L表示总共的帧数, 和 表示第t帧的预测值和真值,thres表示设置的阈值。假定模型一共预测出L帧的空气柱长度变化向量,将预测的向量与真值向量的每一帧进行一一对比,如果一帧内的预测值和真值的绝对差值在预先设定的阈值内,则表示这一帧的长度预测正确,那么总体的准确率可以表示为预测对的帧数占所有帧数的比例。
[0032] (5)模型部署和后处理,模型部署在AI芯片上,之后进行后处理算法,步骤包括:步骤S1:以2s片段水声频谱作为一帧,帧移100ms,每一段水声频谱送入CNN网络,得到空气柱高度列表,均取其最后一个预测值。
[0033] 步骤S2:每20点预测值作为一帧,帧移10点,通过最小二乘法估计出预测曲线的斜率,综合斜率系数的标准误差和设定的斜率阈值来计算当前斜率的置信度。其中斜率系数的标准误差如下式:其中, 表示真实的y值, 表示回归的y值。
[0034] 步骤S3:对步骤S2中得到的可靠的预测斜率根据其置信度加权求平均,得到最终的斜率,并以此计算水杯内空气柱高度接近0时的预测值。
[0035] 本算法通过采用上述技术方案,可以得到以下效果:通过利用打水时声音的特征,通过深度学习自动提取高维特征的方式,切实有效的解决了现有技术中液位检测难以运用在民用饮水机的问题,进而有效防止了在使用具有饮水加热功能的饮水机时,使用者因疏忽从而导致热水溢出水杯烫伤使用者的问题,提高了具有饮水加热功能的饮水机的安全性,保障了使用者的使用安全,同时自动关阀功能进一步提高了饮水机的便捷性。
QQ群二维码
意见反馈