序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
61 基于声纹识别的汽车用户快速验证方法及装置 CN201710138285.9 2017-03-09 CN106921668A 2017-07-04 曹敬轩; 刘心文; 陈文强; 任珂; 韩玉强
发明涉及一种基于声纹识别的汽车用户快速验证方法及装置。通过为每个信息模板分配对应的存储单元,用于存储用户的声纹信息,并限定每个信息模板的使用上限,在登入验证时,通过用户输入的声纹数据所对应的文字信息,缩小声纹特征码的检索范围,从而大大缩短了声纹特征码比对的时间,从而使语音识别可应用于用户身份识别。通过用户的声纹数据即可验证用户的身份,用户无需手动输入用户名与密码,大大提高了用户登入操作的便捷性与智能性。
62 声纹识别方法及装置 CN201710083629.0 2017-02-16 CN106847292A 2017-06-13 王健宗; 郭卉; 宋继程; 肖京
发明公开了一种声纹识别方法及装置。该声纹识别方法包括:客户端采集用户的测试语音,并向后台服务器发送语音识别请求,语音识别请求包括用户ID和所述测试语音;后台服务器接收语音识别请求,采用消息队列和异步机制确定待处理语音识别请求;后台服务器获取与待处理语音识别请求的用户ID相对应的目标声纹特征,并获取与待处理语音识别请求的测试语音相对应的测试声纹特征;后台服务器根据述目标声纹特征和测试声纹特征判断是否对应同一用户,并向客户端输出判断结果;客户端接收并显示判断结果。本发明所提供的声纹识别方法及装置,可达到快速语音识别效果,提高语音识别效率。
63 一种声音重录攻击的识别方法 CN201610889813.X 2016-09-30 CN106409298A 2017-02-15 王泳; 李山路
发明涉及多媒体信息安全领域,具体是涉及一种声音重录攻击的识别方法;其特征在于,主要包括以下步骤:首先,提取MFCC;其次,对语音片段x(n)分;第三,提取语音识别特征;第四,训练出SVM分类器;输入原始语音作为正例训练样本,输入录制语音作为反例训练样本,从正反例样本中提取特征F以训练出SVM分类器;最后,测试识别;提取特征测试语音的特征F并输入SVM分类器进行判别。本发明技术方案在识别性能上能达到99.67%,能在大多数应用场合中成功识别重录声音。
64 一种基于语音识别的医疗健康记录自动填写方法 CN201610634563.5 2016-08-04 CN106251865A 2016-12-21 胡琴敏; 宋扬; 贺樑
发明公开了一种基于语音识别的医疗健康记录自动填写方法,包括:预先获取用于语音识别训练的训练集文件;调用深度神经网络语音识别模型,训练模型得到改进语音识别模型;调用条件随机场模型,训练条件随机场模型,得到信息抽取模型;输入待识别的语音数据,经改进语音识别模型自动识别后转换成文本数据;获取每个词的特征形成文本特征数据,对文本特征数据进行标注,得到文本特征数据中每个词语的标签,根据标签将每个词语录入相应的数据中,得到自动填写的记录。本发明与现有技术相比自动填写的结果结合了客观事实和主管诊断,具有很强的可靠性,有效的将医务工作者从手动填写病人健康记录的繁琐工作中解放出来,方法简便,准确性好。
65 一种大数据并行化声纹认证方法 CN201610490536.5 2016-06-27 CN106209786A 2016-12-07 彭倍; 李有福; 刘静
发明公开了一种大数据并行化声纹认证方法,包括以下步骤:收集语音文件,并对收集的语音文件进行分片,存储在分布式计算集群的节点中;对收集的语音文件并行化声纹特征提取,并将提取的声纹特征进行哈希运行,将声纹特征存储到相应的计算集群的节点中,形成声纹特征库;当接收到声纹认证请求时,提取声纹特征,计算待认证声音的声纹与声纹特征库中的声纹之间的距离,建立全局距离模型,根据各个节点中的声纹特征数据,计算待认证声纹特征与声纹特征库中声纹特征的相似度;整理相似度结果,并反馈。本发明可以实现对声纹库的动态、批量加载与特征提取,同时基于大数据框架实现声纹相似度计算与认证的并行化。
66 一种管理分级密码的方法和装置 CN201510128223.0 2015-03-23 CN106161018A 2016-11-23 姚立哲; 陈军; 尚国强
发明公开了一种管理分级密码的方法和装置,包括:建立不同安全级别和对应的语音口令之间的对应关系;其中,对应关系中各安全级别对应的语音口令为预先设置的语音口令中的一部分或全部;接收到来自用户的语音口令,在获得的对应关系中查找与接收到的语音口令相匹配的语音口令对应的安全级别。通过本发明的方案,用户只需要输入预先设置的语音口令就能够获得不同安全级别对应的语音口令,而不需要输入多个不同的语音口令来实现不同安全级别的验证,简单地实现了用户验证,从而提高了用户的体验度。
67 基于声纹和人脸识别机器人交互方法 CN201610473742.5 2016-06-27 CN106127156A 2016-11-16 吴义坚; 赖伟; 张峰
发明公开了一种基于声纹和人脸识别机器人交互方法,其包括人脸识别部分和声纹识别部分;人脸识别部分是基于人的脸部特征,对输入的人脸图像或者视频流判断其是否存在人脸,来自用户集内哪位用户;声纹识别部分是通过一段语音信号来判断这段语音来自用户集内的哪位用户。本发明通过人脸识别技术、表情检测技术和声纹技术实现基于说话人身份和情绪的智能问答,能很好的与提问者进行交流。
68 基于Rnorm得分归一化的说话人确认方法 CN201610172918.3 2016-03-23 CN105976819A 2016-09-28 陈昊亮
发明公开了一种基于Rnorm得分归一化的说话人确认方法,包括如下步骤:获取训练阶段的目标说话人的身份认证矢量ωtar和通用背景模型的身份认证矢量WUBM;获取测试阶段的被测试语音的身份认证矢量ωtest;通过目标说话人的身份认证矢量ωtar、通用背景模型的身份认证矢量WUBM和被测试语音的身份认证矢量ωtest通过Rnorm得分归一化计算得分Λ6(ωtest,ωclm);判断所述得分Λ6(ωtest,ωclm)是否高于一阈值,如果是,表示确认,则接收;否则,拒绝。采用本发明,在保证确认准确率较高的基础上,大大简化了计算的复杂度和节省了计算的时间。
69 一种基于简单直接度量学习算法的说话人识别方法 CN201610281884.1 2016-04-29 CN105931646A 2016-09-07 雷震春; 杨印根; 朱明华
发明提供一种基于简单直接度量学习算法的说话人识别方法,包括:采集多个说话人的语音样本,提取所有样本的i‑vector,采用LDA或WCCN方法进行信道补偿处理,并进行长度规整,形成训练样本集;根据训练样本集的i‑vector和说话人身份,构造相似样本对集和非相似样本对集;采用KISS算法,在相似样本对集和非相似样本对集上训练得到度量矩阵;对于新的两条语音,先将它们的i‑vector提取出来,采用LDA或WCCN方法进行信道补偿处理,并进行长度规整,使用前面计算出来的度量矩阵,计算出两个i‑vector之间的氏距离,并和阈值进行比较,判定这两条新的语音是否属于同一个说话人。本发明所得到的马氏距离度量矩阵更能真实反映样本空间的相似性和区分性,从而提高说话人识别系统的性能。
70 一种可通过声纹识别进行报警综合处置管理系统 CN201510859779.7 2015-11-30 CN105303794A 2016-02-03 阚涛
发明公开一种可通过声纹识别进行报警综合处置管理系统,该系统包括:词典场景语音模,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;相似度比较模块,适于将输入语音信号的特征矢量依次与词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;语音识别引擎模块,适于根据语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统的目标信息。本发明能快速找到各个子系统中的目标信息如视频、报警地点等进行描述、辨认、检索和快速执行,从而能将各个子系统有机整合在一起。
71 视频录制方法和装置 CN201510465309.2 2015-07-31 CN105120191A 2015-12-02 傅强; 王阳; 侯恩星
本公开是关于一种视频录制方法和装置,属于信息技术领域。所述方法包括:获取视频录制装置周围的环境信息,所述环境信息用于表征所述视频录制装置周围的环境特征;检测所述环境信息是否满足预设条件;在所述环境信息满足所述预设条件时,启动视频的录制。本公开通过检测视频录制装置周围的环境信息是否满足预设条件,并在环境信息满足预设条件时,启动视频的录制,解决了相关技术中视频录制的过程较为繁琐的问题;达到了录制视频的过程简单方便的效果。
72 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 CN201080070323.8 2010-12-10 CN103221996B 2015-09-30 马龙; 沈海峰; 张丙奇
提供用于验证说话人的口令建模的设备和方法、以及说话人验证系统。设备包括:前端,从目标说话人获得登记语音;以及模板生成单元,基于登记语音利用普通说话人模型生成口令模板。在设备、方法、以及系统中,通过考虑普通说话人模型中包含的丰富的变异,即使在登记数据不充分的情况下,或者来自目标说话人的可利用的口令仅有一个时,也能可靠地进行鲁棒的口令建模。
73 通话声音识别方法及装置 CN201310728622.1 2013-12-25 CN104751848A 2015-07-01 雷杨; 华国栋; 王勿英
发明公开了通话声音识别方法及装置,其中,该方法包括:获取进行通话的通话对象的声音样本;将该声音样本与声音模型库中的声音进行比较;根据比较结果对通话声音进行识别。通过本发明解决了相关技术中终端因不能通过通话声音辨别对端通话人的身份,容易导致诈骗事件发生的问题,实现了终端能够通过通话声音辨别对端通话人的身份,提高了安全性。
74 声纹模型自动重建的方法和装置 CN201510061721.8 2015-02-05 CN104616655A 2015-05-13 郑方; 李蓝天; 邬晓钧; 别凡虎; 王军
申请提供了一种声纹模型自动重建的方法和装置,包括:将语音数据以时间点为标签构建时数据库,其中,所述时变数据库包括:参数化的语音数据、语音数据对应的音素和语音数据对应的音素的空间分布信息;以时间窗管道为基本单元,按照语音数据的时间顺序获取时变数据库中参数化的语音数据;确定获取的参数化的语音数据对应的音素的空间分布信息,根据确定的所述音素的空间分布信息筛选时间窗管道中的语音数据,获得筛选后的多组语音数据;使用筛选后的多组语音数据更新时间窗管道中的语音数据;使用更新后的时间窗管道中的语音数据自动重建声纹模型。从而解决了由于时间变化导致说话人模型波动,进而导致话说人识别正确率低的问题。
75 话音认证和语音识别系统及方法 CN201380016170.2 2013-01-23 CN104185868A 2014-12-03 哈比卜·E·泰欧哈米; 阿米特·萨达南德·马勒高恩卡; 雷努卡·阿米特·马勒高恩卡; 克莱夫·戴维·萨默菲尔德
一种用于配置语音识别系统的方法包括获得一个话音认证系统在一个话音认证过程中所利用的一个语音样本。对该语音样本进行处理以生成与该语音样本相关联的多个语音单元的多个声学模型。对这些声学模型进行存储以便随后由该语音识别系统用作一个语音识别过程的一部分。
76 模型生成装置、模式识别设备及其方法 CN201310064923.9 2013-03-01 CN104021390A 2014-09-03 沈海峰; 赵元; 陶训强; 山本宽树
发明公开了用于模式识别的模型生成装置、模式识别设备及其方法。根据本发明的模型生成方法包括以下步骤:混合层级方差共享步骤,用于利用第二模型来生成第一模型的混合层级的方差共享结构;以及第一模型生成步骤,用于利用所述第一模型的训练数据来生成具有所述方差共享结构的所述第一模型。其中,在所述方差共享结构中,各状态中的混合分量具有相同顺序的相同共享方差。本发明至少能够在有限训练数据的情况下提供较好的模型参数估计,从而提供较好的识别性能。
77 语音质量评估的方法和装置 CN201210387204.6 2012-10-12 CN103730131A 2014-04-16 肖玮
语音质量评估的方法包括:对语音信号进行人听觉建模处理,得到第一信号;对第一信号进行可变分辨率的时间-频率分析,得到第二信号;基于第二信号进行特征提取和分析,获得针对该语音信号的语音质量评估的结果。通过上述技术方案,可以解决语音质量评估的准确性不高的问题,其中通过人耳听觉建模处理,再将待测信号通过变换为表示可变分辨率的时间-频率信号,通过进一步分析可变分辨率的时间-频率信号,提取信号对应的特征,做进一步分析,最终获得较高准确性的语音质量评估的结果。
78 用于识别说话人的建模设备和方法、以及说话人识别系统 CN201080070321.9 2010-12-10 CN103229233A 2013-07-31 沈海峰; 马龙; 张丙奇
发明实现用于识别说话人的建模设备和方法、以及说话人识别系统。建模设备包括:前端,从各目标说话人取得登记语音数据;参考锚集合生成单元,基于锚空间使用登记语音数据生成参考锚集合;以及声纹生成单元,基于参考锚集合和登记语音数据生成声纹。在本公开中,通过考虑登记语音和说话人自适应技术,能够生成尺寸更小的锚模型,因而能够进行具有尺寸更小的参考锚集合的、可靠性高的鲁棒的说话人识别。这对于进行计算速度的改善以及大幅度的存储器削减是非常有利的。
79 声纹标识 CN201180025755.1 2011-05-09 CN102985965A 2013-03-20 D·J·拉斯姆森
可提供声纹标识。可记录多个讲话者并将其与身份指示符相关联。可为每个讲话者创建声纹。如果根据身份指示符至少一个讲话者的声纹相对应于已知用户,可创建将用户与该声纹相关联的数据库条目。还可显示与用户相关联的附加信息。
80 用于提供语音识别的方法和系统 CN200780043145.8 2007-09-25 CN101542591B 2013-02-06 戴维·桑内鲁德
发明公开了一种用于提供语音识别的方法。基于由用户所提供的数据来从用户获取名字。向用户询问用户的名字。接收来自用户的响应于该询问的第一音频输入。使用名字语法数据库将语音识别应用于第一音频输入,以输出被识别的名字。确定该被识别的名字是否与所获取的名字匹配。如果确定没有匹配,则向用户重新询问用户的名字,以用于第二音频输入。使用具有少于名字语法数据库的条目的信任度数据库将语音识别应用于第二音频输入。
QQ群二维码
意见反馈