1 |
声纹认证方法和装置 |
CN201510337291.8 |
2015-06-17 |
CN105185379B |
2017-08-18 |
李超; 关勇 |
本发明提出一种声纹认证方法和装置,该声纹认证方法包括向用户展示提示文本,所述提示文本是所述用户预先注册的短语的组合;获取所述用户朗诵所述提示文本的语音;在所述语音与所述提示文本一致时,获取预先建立的注册模型,并根据所述语音和所述注册模型,确定声纹认证结果。该方法能够既保证了用户在认证时不需要说太长时间的话,也保证了语音内容的变化性,从而防止录音欺骗。 |
2 |
一种提高声纹识别速度的方法及系统 |
CN201610024091.1 |
2016-01-14 |
CN106981287A |
2017-07-25 |
祝铭明 |
本发明属于语音信号处理领域,尤其涉及一种提高声纹识别速度的方法及系统,应用于家用机器人,具体工作步骤包括:S1:采集语音信号;S2:对语音信号进行预处理;S3:自预处理后的语音信号中提取语音特征参数;S4:为每一个家庭成员建立声学模型;S5:预先根据使用频率将所述声学模型区分为第一声学模型和第二声学模型,其中,第一声学模型的使用频率大于第二声学模型,并在通电时将第一声学模型加载至缓存中;S6:依据所述第一声学模型和第二声学模型对待测语音信号进行模式匹配,获取识别结果。以上技术方案可以自适应地实现声纹识别,并有效提高了声纹识别的速度。 |
3 |
一种基于智能体重秤的数据关联保存方法及装置 |
CN201611160315.8 |
2016-12-15 |
CN106845070A |
2017-06-13 |
陈理; 罗泽英 |
本申请公开了一种基于智能体重秤的数据关联保存方法,用用以解决由于现有的智能体重秤在使用过程中与指定的一个用户进行绑定,而造成现有的智能体重秤无法多人使用的问题。方法包括:智能体重秤获得用户的生理特征以及体重数据;确定与所述生理特征对应的用户账号;将所述体重数据与确定的用户账号关联保存。本申请还公开了一种基于智能体重秤的数据关联保存装置。 |
4 |
语音唤醒实现方法、装置及终端 |
CN201510859545.2 |
2015-11-30 |
CN106815507A |
2017-06-09 |
刘汝虎; 刘攀 |
本发明提供了一种语音唤醒实现方法、装置及终端,属于智能终端领域。其中,语音唤醒实现方法,应用于智能终端,所述方法包括:接收用户输入的语音唤醒指令;利用预设的语音唤醒词对所述语音唤醒指令进行唤醒词识别判断得到第一判断结果,所述语音唤醒词包括有声纹信息;利用所述语音唤醒词对所述语音唤醒指令进行声纹判断得到第二判断结果;当所述第一判断结果与所述第二判断结果均符合预设条件时,对所述智能终端进行解锁和唤醒。本发明的技术方案能够简化用户唤醒并操控智能终端的过程。 |
5 |
基于相位变换加权广义互相关算法的自主寻人智能拐杖 |
CN201611203517.6 |
2016-12-23 |
CN106723736A |
2017-05-31 |
朱松盛; 季倩云; 周文君; 张艳妮; 蒋志林; 王翰林; 吴小玲 |
本发明公开了基于相位变换加权广义互相关算法的自主寻人智能拐杖,包括以下步骤:当使用者发出声音指令后,装置在底盘周围六个拾音器形成的麦克风阵列对语音信号进行采集。采集到的声音信号送到声强检测电路和单片机以及其他外部电路,声强检测电路选出采集到的声音信号最强的3个拾音器,单片机利用GCC‑PHAT(相位变换加权广义互相关)时延差估计算法计算时延,并对使用者进行定位;然后根据定位,单片机自主控制拐杖运动至使用者处。 |
6 |
一种基于深度神经网络的特定声源检测方法与系统 |
CN201611099733.0 |
2016-12-02 |
CN106710599A |
2017-05-24 |
蔡钢林 |
本发明一种基于深度神经网络的特定声源检测方法与系统,其方法包括,提取实时声音信号的声学特征,生成声学特征向量;利用深度神经网络方法对预设声音信号进行训练,建立DNN训练模型;使用所述DNN训练模型对所述声学特征向量进行检测判定,采用深度神经网络技术实现对不同声源信号的建模。由于深度神经网络有着更为精确的建模能力,尤其是在数据较为充分的前提下,建模的准确性更高,可以处理一些特征空间很近似的声源检测问题。本项发明采用前后时间帧融合特征技术,可以实现较高的单帧检测准确率,实时性高,判定延迟不会大于0.5秒,实用性强。 |
7 |
一种复杂环境下的说话人识别系统及方法 |
CN201610839912.7 |
2016-09-21 |
CN106340299A |
2017-01-18 |
谢敏 |
本发明提供了一种复杂环境下的说话人识别系统及方法,涉及导航领域。其特征在于,所述系统包括:训练语音预处理装置;所述训练语音预处理装置信号连接于训练语音特征提取单元;所述训练语音特征提取单元信号连接于训练建模单元;所述训练建模单元信号连接于模型参数库;系统还包括:测试语音预处理装置;所述测试语音预处理装置信号连接于测试语音特征提取单元;所述测试语音特征提取单元信号连接于模式匹配单元;所述模式匹配单元分别信号连接于判决输出单元和模型参数库。本发明具有识别准确、成本低、智能化和运行效率高等优点。 |
8 |
一种声纹识别系统及方法 |
CN201610456548.6 |
2016-06-23 |
CN106128465A |
2016-11-16 |
何云鹏 |
本发明涉及信息处理技术及人工智能领域,尤其涉及了一种声纹识别系统,其包括声谱图转换模块、CNN声纹特征提取模块、CNN参数模块、用户声纹特征模型库模块和声纹特征谱匹配解码模块,外部声音输入所述声谱图转换模块,所述声谱图转换模块将所述外部声音进行转换并将转换结果输入所述CNN声纹特征提取模块,所述CNN声纹特征提取模块从所述CNN参数模块中读取CNN参数结合所述转换结果进行声纹特征提取并将提取结果输入所述声纹特征谱匹配解码模块,在所述声纹特征谱匹配解码模块中,将所述提取结果与所述用户声纹特征模型库中的用户声纹特征进行匹配解码识别,识别结果输出即为身份识别结果,本发明还公开了一种声纹识别方法,本发明将语音转成频率‑时间的二维声谱图,利用CNN进行声谱图的特征提取,从而实现了更为准确的声纹识别。 |
9 |
一种推荐方法和装置 |
CN201510880599.7 |
2015-12-02 |
CN105979376A |
2016-09-28 |
王蕊; 田伟森; 耿雷 |
本发明实施例提供一种推荐方法和装置,其中的方法具体包括:采集当前用户的语音数据;提取所述语音信息的声纹特征;根据所述声纹特征识别所述当前用户;根据所述当前用户的行为习惯特征,获取推荐给所述当前用户的节目内容;其中,所述行为习惯特征包括:依据用户的历史行为数据分析得到的历史节目内容的相关属性;在智能电视上显示所述节目内容。本发明实施例能够提高推荐的节目内容的准确度。 |
10 |
一种降低移动终端通话功耗的方法及移动终端 |
CN201110122338.0 |
2011-05-12 |
CN102781075B |
2016-08-24 |
蔡晓光; 占明 |
本发明公开了一种降低移动终端通话功耗的方法及移动终端,所述方法包括:在语音通话过程中,移动终端对本身采集到的音频信号进行声纹建模,判断得到的声纹模型与已存储的用户声纹模型是否匹配;若不匹配,则放弃对所采集的所述音频信号进行无线发射或者放弃对所采集的所述音频信号进行基带和射频处理及无线发射,若匹配,则对所述音频信号进行基带和射频处理及无线发射。所述移动终端的基带射频处理模块包括声纹处理子模块和音频信号控制处理子模块,用于实现上述方法,这种方法及移动终端降低了移动终端语音通话的功耗,减少了无效数据的发送,从而减轻了系统的负载,提高了系统资源的有效利用率,降低了基带和射频的功率消耗。 |
11 |
基于支持向量机的说话人确认方法及其系统 |
CN201610172974.7 |
2016-03-23 |
CN105845143A |
2016-08-10 |
陈昊亮 |
本发明公开了一种基于支持向量机的说话人确认方法,包括如下步骤:建立通用信道模型;将纯净语音经过所述通用信道模型,提取纯净特征参数;对测试语音直接提取测试特征参数;将纯净特征参数和测试特征参数融合,组合成融合特征参数;将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。所述建立通用信道模型具体是:通过对来自不同信道的训练语音融合为一个多通道信息的带通滤波器;其中,所述训练语音为纯净语音。本发明还对应公开了一种基于支持向量机的说话人确认系统,包括建模模块、提取模块、融合模块和确认模块。采用本发明,具有识别率高的特点。 |
12 |
基于信道鲁棒的说话人确认模型及说话人确认方法和装置 |
CN201610172765.2 |
2016-03-23 |
CN105845141A |
2016-08-10 |
陈昊亮 |
本发明涉及说话人确认模型及说话人确认方法和装置,所述一种基于信道鲁棒的说话人确认模型的实现方法包括:将若干语音信号分别利用MLLR方法在若干子空间内进行自适应处理;构建与所述语音信号在所述子空间内对应的M矢量,得到与所述子空间对应的M矢量集合;将所述M矢量集合作为支持向量机的输入特征,得到与所述语音信号对应的支持向量机模型。本发明实施方式提供的说话人确认模型及说话人确认方法和装置对数据量和运算量要求要小很多;不需要任何有文本标注信息的数据,从而节省了大量人力和财力资源,而且能够取得较高的识别性能及很强的与其他确认系统的互补性。 |
13 |
应用于短语音条件下的说话人确认方法和装置 |
CN201610172730.9 |
2016-03-23 |
CN105845140A |
2016-08-10 |
陈昊亮 |
本发明涉及应用于短语音条件下的说话人确认方法和装置,该方法包括:从目标语音信号中提取线性预测倒谱系数、Mel频谱倒谱系数和Delta特征;对所述线性预测倒谱系数、Mel频谱倒谱系数和Delta特征进行组合,得到若干有效特征向量;利用局部模糊PCA方法降低所述有效特征向量的维数;根据高斯混合模型利用降低后的有效特征向量进行建模,对所述目标语音信号的说话人进行辨识。与现有技术相比,本发明采用特征组合代替单一特征,以提高有效特征维数来弥补特征样本的不足,并用局部模糊PCA对组合特征进行有效降维,在对识别率影响很小的前提下,降低了系统的时空复杂度。 |
14 |
一种声纹采集和处理系统及其采集和处理方法 |
CN201610083104.2 |
2016-02-03 |
CN105719651A |
2016-06-29 |
杨飞; 陈然然 |
本发明提供了一种声纹采集和处理系统及其采集和处理方法,所述系统根据收集到的用户的音频信息,获得其中的声纹特征,并扩充已建立的声纹特征信息库,同时辨别该声纹特征所属的用户编号;本发明提供的声纹采集和处理系统能够实时收集一区域内的音频信息,并对所收集的音频信息中的声纹特征进行分类,以判断与该声纹特征关联的用户,从而不断的扩展用户的声纹特征,由于在数据处理端会存有不断扩充的声纹特征,以使得其在声纹识别的效率和精确度上都得到了很大的改进。 |
15 |
基于人工智能的声纹认证方法以及装置 |
CN201511020415.6 |
2015-12-30 |
CN105656887A |
2016-06-08 |
李超; 李骁; 吴本谷 |
本发明公开了一种基于人工智能的声纹认证方法以及装置,其中,该方法包括:接收用户的注册请求,并将注册字符串提供至用户;接收用户阅读注册字符串的语音信息,并根据语音信息生成N段语音,其中,N为正整数;根据性别分类模型和N段语音确定用户的性别标签;以及根据性别标签和N段语音生成用户的注册声纹模型。实现了在注册的过程中,通过先获取该用户的性别标签,之后根据该性别标签使用不同的模型以生成对应的注册声纹模型,使得在登录时提高了声纹密码作为认证手段的可用性,提高了声纹匹配的性能,并使得用户通过语音即可完成注册,简化了用户的操作步骤。 |
16 |
声纹认证处理方法及装置 |
CN201511024873.7 |
2015-12-30 |
CN105513597A |
2016-04-20 |
李超; 吴本谷; 朱林 |
本申请提出一种声纹认证处理方法和装置,其中,该方法包括:应用混合性别的深度神经网络DNN声纹基线系统,提取训练集中每条语音的第一特征向量;根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器;根据所述训练集中不同性别的语音数据,分别训练不同性别的DNN模型;根据不同性别的DNN模型以及所述训练集中不同性别的语音数据,分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。建立了区分性别的声纹认证处理模型,以便提高了声纹认证的效率和准确性。 |
17 |
一种基于声纹特征进行安全认证的方法及设备 |
CN201410413286.6 |
2014-08-20 |
CN105357006A |
2016-02-24 |
刘雪芹 |
本发明公开了一种基于声纹特征进行安全认证的方法,该方法包括:终端接收到语音采集指令时,采集用户录入的待测语音数据;对所述待测语音数据进行声纹特征提取,得到声纹特征信息;根据当前提取的声纹特征信息与预存的声纹特征信息,对当前用户的身份进行认证。本发明还同时公开了一种终端。 |
18 |
声纹认证方法和装置 |
CN201510337291.8 |
2015-06-17 |
CN105185379A |
2015-12-23 |
李超; 关勇 |
本发明提出一种声纹认证方法和装置,该声纹认证方法包括向用户展示提示文本,所述提示文本是所述用户预先注册的短语的组合;获取所述用户朗诵所述提示文本的语音;在所述语音与所述提示文本一致时,获取预先建立的注册模型,并根据所述语音和所述注册模型,确定声纹认证结果。该方法能够既保证了用户在认证时不需要说太长时间的话,也保证了语音内容的变化性,从而防止录音欺骗。 |
19 |
使用基于人工神经网络的亚语音单位区分的说话人验证及识别 |
CN201380069560.6 |
2013-12-05 |
CN104903954A |
2015-09-09 |
约翰-保罗·荷索姆; 彼得·J·韦尔默朗; 乔纳森·肖 |
在一个实施例中,计算机系统存储多个说话人的话音数据,其中所述话音数据包含多个特征向量及每一特征向量的相关联亚语音类。所述计算机系统接着基于所述话音数据,建置人工神经网络ANN以对所述多个说话人中的目标说话人的话音进行建模,其中所述ANN经配置以区分由所述目标说话人说出的亚语音类的实例与由所述多个说话人中的其他说话人说出的亚语音类的实例。 |
20 |
说话人识别方法及设备 |
CN201180003380.9 |
2011-12-16 |
CN103562993B |
2015-05-27 |
张翔; 万华林; 张军; 卢鲤 |
本发明提供一种说话人识别方法及设备。本发明通过采用SVM对得分函数中的第一向量(即权重向量)进行可鉴别性的重新估计,使得测试语音的特征参数的识别结果更加准确,从而提高了说话人识别的可鉴别性。 |