专利汇可以提供一种具有语音和图像识别功能的向导机器人专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种具有语音和 图像识别 功能的向导 机器人 ,具体包括:语音输入单元, 图像采集 单元,触摸输入单元,语音处理单元, 图像处理 单元,文本处理单元,决策单元,运动控制单元,存储单元和输出单元。所述决策单元用于接收语音处理单元、图像处理单元和文本处理单元发送的信息,综合上述信息确定机器人的运动轨迹和需要输出的信息,并分别发送至运动控制单元和输出单元。该向导机器人,能够通过采集用户的语音信息、图像信息以及用户输入的辅助信息,自主判断用户类型,并基于用户的类型选择合适的信息输出形式,能够实现针对不同的用户群体提供特定的向导服务。同时向导机器人能够针对用户的提问实现与用户的简单交流。,下面是一种具有语音和图像识别功能的向导机器人专利的具体信息内容。
1.一种具有语音和图像识别功能的向导机器人,具体包括:语音输入单元,图像采集单元,触摸输入单元,语音处理单元,图像处理单元,文本处理单元,决策单元,运动控制单元,存储单元和输出单元;
所述语音输入单元用于采集语音信息;
所述图像采集单元用于采集图像信息,所述图像采集单元采集的图像信息包括环境图像和人物图像;
所述触摸输入单元用于辅助用户输入;
所述语音处理单元用于接收语音输入单元采集的语音信息,对接收的语音信息进行处理,并将处理结果发送至决策单元;
所述图像处理单元用于接收图像采集单元采集的图像信息,对接收的图像信息进行处理,并将处理结果发送至决策单元;
所述文本处理单元用于接收触摸输入单元的输入,对接收的信息进行处理,并将处理结果发送至决策单元;
所述决策单元用于接收语音处理单元、图像处理单元和文本处理单元发送的信息,综合上述信息确定机器人的运动轨迹和需要输出的信息,并分别发送至运动控制单元和输出单元;
所述存储单元用于存储各种语言对应的景点相关信息,各种语种及对应幼儿、中小学生、成年人和老年人四种不同人群的声音及图像模板,所述景点相关信息具体包括景点地图,针对该景点的简单问题及对应的答案,对各种语种及对应幼儿,中小学生,成年人和老年人四种不同人群的景点的向导信息,所述向导信息具体包括语音和图像信息;
所述输出单元包括语音播放器及显示屏,用于输出景点信息。
2.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述语音处理单元用于接收语音输入单元采集的语音信息,对接收的语音信息进行处理的具体步骤如下:
针对采集到的语音信息进行预处理,所述预处理包括确定声源主体,滤除噪声和语音增强;
针对预处理后的语音数据进行语音分析和识别,确定语种和用户年龄段,所述年龄段包括幼儿,中小学生,成年人和老年人。
3.根据权利要求2所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述预处理后的语音数据进行语音分析和识别的具体步骤如下:针对预处理后的语音信息进行分帧处理,每帧长为25ms,对分帧数据进行加汉明窗处理,针对处理后的语音数据进行特征提取,确定基频和MFCC系数,将提取的基频和MFCC系数与存储单元中存储的各类型声音模板的基频和MFCC系数进行比对,选择匹配概率最高的语种和用户年龄段作为最终匹配结果。
4.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述图像处理单元基于图像采集单元采集的环境图像生成地图信息,并将该地图信息发送至决策单元。
5.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述图像处理单元基于图像采集单元采集的人物图像确定用户所属年龄段的具体方法如下:
基于采集到的人物图像确定用户身高信息,同时提取人脸区域,针对提取的人脸区域图像进行预处理,所述预处理过程包括人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正和滤波处理;针对预处理后的人脸图像进行特征提取,提取的特征包括眼睛、鼻子、耳朵、嘴巴、发际线特征,将用户身高信息以及根据人脸图像提取的眼睛、鼻子、耳朵、嘴巴、发际线特征与存储单元中预先存储的图像模型进行比对,选择匹配概率最高的用户年龄段作为最终匹配结果。
6.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述文本处理单元用于接收触摸输入单元的输入,输入信息包括语种和/或年龄段,还可输入与景区相关的问题,文本处理单元将用户输入的问题进行文本处理后发送至决策单元。
7.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述决策单元接收图像处理单元发送的地图信息,将该地图信息与存储单元中预先存储的地图信息进行匹配,基于预设的路径规划算法进行路径规划,并将规划后的路径发送至运动控制单元。
8.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述决策单元接收语音处理单元发送的用户年龄段最终匹配结果M1和图像处理单元发送的用户年龄段最终匹配结果M2,根据语音处理单元的匹配概率k1和图像处理单元的匹配概率k2,确定匹配结果M1和M2的可信度r1和r2,其中 基于匹配结果
和可信度确定最终用户所属年龄段,其公式如下:Age=r1*M1+r2*M2。
9.根据权利要求8所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述决策单元基于语音处理单元发送的语种和最终确定的用户所属年龄段,在存储单元预先存储的语音数据中选择合适该用户类型的语音信息,并通过输出单元进行输出。
10.根据权利要求1所述的一种具有语音和图像识别功能的向导机器人,其特征在于,所述语音输入单元为麦克风,所述图像采集单元为摄像头,所述触摸输入单元为可触摸式显示屏。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法 | 2020-05-08 | 717 |
一种基于场景的开放式神经网络模型管理系统 | 2020-05-14 | 528 |
基于空调机器人的温度用户调节方法和装置 | 2020-05-15 | 519 |
一种基于神经网络的群机器人利用信息素通信实现协作觅食的方法 | 2020-05-18 | 500 |
输电线路单相断线短接杆塔的生物安全评估平台及方法 | 2020-05-21 | 931 |
面向大规模SLAM的多传感器融合与数据管理机制 | 2020-05-15 | 966 |
一种基于任务分配协调策略与粒子群算法的任务分配方法 | 2020-05-16 | 151 |
雷击下计及土壤分层的单相断线接杆塔风险评估平台及方法 | 2020-05-22 | 82 |
一种分布式多机器人协同过未知随机迷宫的编队导航方法 | 2020-05-11 | 150 |
一种无人值守工作站 | 2020-05-18 | 610 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。