[0003] 传统的机器人需要人来控制,它不能自主地根据外部环境的信息来处理外部环境中的事件,也不能针对曾经发生过的事件吸取经验,并且它不能跟人们很好地互动,智能化
水平、对各方面的应对能
力以及对外界的学习能力不高。
[0005] 根据本发明的一个方面,本发明提供了一种机器人,包括:信息采集单元,用于采集环境中的信息;信息处理单元,用于对信息采集单元采集的信息进行处理并根据处理结果产生任务执行命令;任务执行单元,用于根据信息处理单元生成的任务执行命令执行任务。
[0006] 优选地,所述信息采集单元包括声音获取单元,信息处理单元包括
语音识别单元,任务执行单元包括运动单元和/或发声单元。
[0007] 优选地,所述语音识别单元包括:语音检测单元,用于从语音数据中检测出人的语音;特征提取单元,用于从语音数据中提取出语音特征;匹配单元,用于将语音特征与分别存储在模型存储单元、字典存储单元、语法存储单元中的模型、字词、语法进行匹配,以得出语音识别结果;模型存储单元,用于存储语音模型;字典存储单元,用于存储跟语音相对应的字词;语法存储单元,用于存储跟语音相对应的语法。
[0011] 优选地,所述信息采集单元包括摄像单元,信息处理单元包括
人脸识别单元,任务执行单元包括发生单元。
[0012] 优选地,所述信息采集单元包括传感单元,信息处理单元包括数据分析单元,任务执行单元包括通信单元。
附图说明
[0018] 参考图1。在本实施例中,信息采集单元为录音单元101,信息处理单元为语音识别单元102,任务执行单元为运动单元103。录音单元101录入声音信息后对声音信息进行
模数转换,然后把转换后的声音数据传到语音识别单元102。参考图2,语音识别单元102包括语音检测单元202、特征提取单元203、匹配单元205、模型存储单元204、字典存储单元206、语法存储单元207和噪声存储单元201,语音检测单元202、特征提取单元203、匹配单元205、模型存储单元204、字典存储单元206、语法存储单元207和噪声存储单元201之间的电连接关系如图2所示。声音数据传到语音检测单元202和特征提取单元203。接收到该声音数据后,特征提取单元203以
帧为单位执行该声音数据的MFCC(Mel Frequency Cepstrum Coefficient,麦尔
频率对数倒
频谱系数)分析,并向匹配单元205输出MFCC分析结果作为特征参数(
特征向量)。特征提取单元203提取特性参数,如线性预测系数、对数倒频谱系数、线谱对和在每个预定频带中的功率(
滤波器组的输出)。根据从特征提取单元203提供的特性参数,匹配单元205根据一个连续分布HMM(Hidden Markov Model,隐藏
马尔科夫)方法通过引用模型存储单元204、字典存储单元206和语法存储单元207执行声音数据的语音识别。模型存储单元204存储用于指示语音中每个
音素或每个音节的声音特征的声音模型。语音识别根据连续分布HMM方法执行。HMM被用作声音模型。字典存储单元206存储包含每个字词的发音的信息(音素信息)。语法存储单元207存储语法规则,该语法规则描述在字典存储单元206中记录的字词如何连接和联系。例如,语法规则可以是上下文无关的语法或基于统计单词连接概率的规则。匹配单元205引用字典存储单元206中的字词数据以连接存储在模型存储单元204中的声音模型,因此形成字词的声音模型(字词模型)。匹配单元205也引用存储在语法存储单元207中的语法规则,以连接字词模型,并使用所连接的单词模型,以通过使用连续分布HMM方法和根据特性参数识别声音数据。也就是说,匹配单元205检测特征提取单元203输出的一系列字词模型,输出对应于所述字词模型序列的字
词串的音素信息作为语音识别结果。匹配单元205累加对应于所连接的单词模型的单词串的每个特性参数的概率,并将所累加的数值作为分数。匹配单元
205输出关于具有最高分数的字词串的音素信息作为语音识别结果。语音检测单元202按照特征提取单元203执行MFCC分析的方式计算每个帧中的功率。语音检测单元202将每个帧中的功率与预定
阈值比较,并检测由功率大于或等于预定阈值的一个帧形成的部分作为语音数据。语音检测单元202向特征提取单元203和匹配单元205提供所检测的语音数据。特征提取单元203和匹配单元205执行语音数据的识别处理。噪声存储单元201存储了多个接近要消除的噪声的字。以前曾经被识别为噪声的字以及来自语音环境的与噪声字数据类似的一些字存储在噪声存储单元201中。当语音识别的结果是在噪声存储单元201中的一个字时,匹配单元201将此语音识别结果判定为噪声。当特征提取单元203和匹配单元205无法对声音数据进行语音识别并且噪声存储单元201中也没有存储对应该声音数据的噪声时,匹配单元205将该声音数据判定为噪声并反馈归噪声存储单元201。
[0019] 任务执行单元还可以是发声单元303,如图3所示,发声单元303根据语音识别单元302对语音数据的识别结果调用语音
数据库并发声。
[0020] 参考图4。在本实施例中,信息采集单元是摄像单元401,信息处理单元是人脸识别单元402,任务执行单元是发声单元403。摄像单元401获取周围环境中的图像,并将拍摄到的人脸图像发送到人脸识别单元402中。人脸识别单元402对人脸图像进行识别并把识别结果发送给发声单元403,发声单元403根据人脸识别的结果从数据库中查找人名并调用语音数据库以将人名说出来。
[0021] 参考图5。在本实施例中,信息采集单元是传感单元501,信息处理单元是数据分析单元502,任务执行单元是通信单元503。传感单元501探测周围环境中的信息,如
温度、气体、湿度,并将模拟
信号转换为
数字信号,发送到数据分析单元502中。数据分析单元502从传感单元501中接收以数字信号为载体的环境信息并进行分析。通信单元503将分析结果发送给外部设备,如
服务器、手机、电脑等。