首页 / 专利库 / 人工智能 / 语音技术 / 语音识别 / 一种交互式语音识别装置

一种交互式语音识别装置

阅读:379发布:2020-05-08

专利汇可以提供一种交互式语音识别装置专利检索,专利查询,专利分析的服务。并且本实用新型涉及一种交互式 语音识别 装置,包括 控制器 及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸 跟踪 监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服 电机 和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制 信号 给电机控制装置,驱动 伺服电机 调整第一摄像头 角 度实现人脸跟踪;通过设置人脸跟踪功能,可以实现更精确的语音识别 定位 ,提高语音识别效率和准确度;设置的远程 数据中心 可以对语音识别的过程进行数据备份,同时可以对存储装置内的语音识别装置的 数据库 进行更新,提高语音识别 精度 , 人脸识别 装置可提高安全和 保密性 。,下面是一种交互式语音识别装置专利的具体信息内容。

1.一种交互式语音识别装置,其特征在于:包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头度实现人脸跟踪;所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头采集监控图像并经控制器传输至存储装置进行存储;所述控制器可以输出语音识别信号并通过语音输出装置进行播放。
2.根据权利要求1所述的一种交互式语音识别装置,其特征在于:所述语音输入装置为麦克,所述语音输出装置为扬声器。
3.根据权利要求1所述的一种交互式语音识别装置,其特征在于:所述第一通讯装置支持RS485、RS232或者CAN接口进行数据传输。
4.根据权利要求1-3任一所述的一种交互式语音识别装置,其特征在于:所述控制器通过第二通讯装置与远程数据中心连接,用于同步第二摄像头采集的监控图像。
5.根据权利要求4所述的一种交互式语音识别装置,其特征在于:所述第二通讯装置支持无线wifi、4G或GPRS通信方式。
6.根据权利要求5所述的一种交互式语音识别装置,其特征在于:所述控制器设置有人脸识别装置,其接收第一摄像头采集的人脸图像,并与存储装置预先存储的人脸数据比对。

说明书全文

一种交互式语音识别装置

技术领域

[0001] 本实用新型涉及智能机器人领域,具体是一种交互式语音识别装置。

背景技术

[0002] 语音识别作为人工智能下很火爆的一学科,是当下研究的一个重要领域。现阶段语音识别大多实现于智能硬件中,比如和机器人进行人机交互,或者我们智能手机输入法中的语音识别,可以将听到的声音转化为文字,但现有语音识别装置只能被动接受语音进行识别,当声源发生移动或者位置改变时,识别装置极容易受到外部干扰,甚至对干扰源进行识别,从而出现识别错误,并且现有语音识别开启后即进行识别,不能根据声源的类型来确定是否开始工作,造成识别干扰,在有些需要保密的应用场景也不能满足具体要求。实用新型内容
[0003] 本实用新型所要解决的技术问题是提供一种交互式语音识别装置,以解决现有技术中存在的缺陷
[0004] 本实用新型解决上述技术问题的技术方案如下:
[0005] 一种交互式语音识别装置,包括控制器及与控制器分别连接的存储装置、电源装置、通过第一通讯装置连接的语音输入装置、语音输出装置、显示屏和人脸跟踪监测装置,所述人脸跟踪监测装置与第一摄像头和第二摄像头连接,所述人脸跟踪监测装置包括伺服电机和电机控制装置,控制器根据第一摄像头采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头度实现人脸跟踪;所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头采集监控图像并经控制器传输至存储装置进行存储;所述控制器可以输出语音识别信号并通过语音输出装置进行播放。
[0006] 进一步的,所述语音输入装置为麦克,所述语音输出装置为扬声器;
[0007] 进一步的,所述第一通讯装置支持RS485、RS232或者CAN接口进行数据传输;
[0008] 进一步的,所述第二通讯装置支持无线wifi、4G或GPRS通信方式。
[0009] 进一步的,所述控制器通过第二通讯装置与远程数据中心连接,用于同步第二摄像头采集的监控图像;
[0010] 进一步的,所述控制器设置有人脸识别装置,其接收第一摄像头采集的人脸图像,并与存储装置预先存储的人脸数据比对,符合则控制语音识别装置开始工作;
[0011] 本实用新型的有益效果是:通过设置人脸跟踪功能,可以实现更精确的语音识别定位,提高语音识别效率和准确度;设置的远程数据中心可以对语音识别的过程进行数据备份,同时可以对存储装置内的语音识别装置的数据库进行更新,提高语音识别的精度,人脸识别装置可提高安全性和保密性附图说明
[0012] 图1为本实用新型结构示意图;
[0013] 附图标记说明如下:
[0014] 1、控制器,2、语音输入装置、3、语音输出装置,4、电源装置,5、人脸跟踪监测装置,6、存储装置,7、第一通讯装置,8、第二通讯装置,9、远程数据中心,10、第一摄像头,11、第二摄像头,12、显示屏;

具体实施方式

[0015] 以下结合附图对本实用新型的原理和特征进行描述,所举实例只用于解释本实用新型,并非用于限定本实用新型的范围。
[0016] 如图1所示,一种交互式语音识别装置,包括控制器1及与控制器1分别连接的存储装置6、电源装置4、通过第一通讯装置7连接的语音输入装置2、语音输出装置3、显示屏12和人脸跟踪监测装置5,所述人脸跟踪监测装置5与第一摄像头10和第二摄像头11连接,所述人脸跟踪监测装置5包括伺服电机和电机控制装置,控制器1根据第一摄像头10采集的人脸图像输出控制信号给电机控制装置,驱动伺服电机调整第一摄像头10角度实现人脸跟踪,所述第一摄像头、第二摄像头、语音输入装置和语音输出装置集成在一起进行联动;所述第二摄像头11采集监控图像并经控制器1传输至存储装置6进行存储;所述控制器1包含语音识别装置,其对语音输入装置2的语音进行识别后,输出相应信号并通过语音输出装置3进行播放,所述控制器1连接电源装置4,该电源装置为整个装置提供电源;
[0017] 在一个具体应用中,该识别装置可应用于儿童教育机器人,由于儿童生性活泼,喜欢晃来晃去,通过该识别装置可以保证机器人可以一直对准儿童进行监控和语音交互,提高了语音交互的效率。
[0018] 所述语音输入装置2为麦克风,所述语音输出装置3为扬声器;
[0019] 在具体实施时,第一通讯装置连接的部件集成在一起,其通讯方式可以采取稳定可靠的有线通讯方式,如第一通讯装置7可采用支持RS485、RS232或者CAN的接口进行数据传输;
[0020] 而进行数据备份及更新时,由于其对稳定性要求不高,但对装置操控的简便性有要求,要求装置与外界的连线仅可能少,所述第二通讯装置8支持无线wifi、4G或GPRS通信方式,不需要设置长距离的线缆,可以使得装置简洁、成本也较低。
[0021] 所述控制器1通过第二通讯装置8与远程数据中心9连接,用于同步第二摄像头11采集的监控图像;
[0022] 在另一个具体实施例中,该识别装置可应用于行柜台服务终端,可对整个业务办理过程进行录像并存储至远程数据中心,以备以后查询使用;
[0023] 作为本实用新型技术方案的进一步改进,所述控制器1还设置有人脸识别装置,其接收第一摄像头10采集的人脸图像,并与存储装置6预先存储的人脸数据比对,符合则控制语音识别装置开始工作;从而进一步提高应用该语音识别装置的装置安全性和保密性能。
[0024] 以上所述仅为本实用新型的较佳实施例,并不用以限制本实用新型,凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈