序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
21 声纹标识 CN201180025755.1 2011-05-09 CN102985965B 2015-04-01 D·J·拉斯姆森
可提供声纹标识。可记录多个讲话者并将其与身份指示符相关联。可为每个讲话者创建声纹。如果根据身份指示符至少一个讲话者的声纹相对应于已知用户,可创建将用户与该声纹相关联的数据库条目。还可显示与用户相关联的附加信息。
22 语料数据的查询方法和装置 CN201410549904.X 2014-10-16 CN104268279A 2015-01-07 张征; 张烁
发明公开了一种语料数据的查询方法和装置。其中,该语料数据的查询方法包括:获取用户的第一声纹模型;从语料数据库的预存声纹模型中查找与第一声纹模型的相匹配的声纹模型,得到第二声纹模型;根据语料数据库中预先存储的预存声纹模型与语料数据的关联关系,获取与第二声纹模型相关联的第一语料数据;以及将第一语料数据发送给用户。通过本发明,解决了现有技术中查找语料数据的效率比较低的问题,进而达到了提高查找语料数据的效率的效果。
23 一种声纹特征模型更新方法及终端 CN201210235593.0 2012-07-09 CN102760434A 2012-10-31 卢霆
发明适用于语音识别技术领域,提供了一种声纹特征模型更新方法及终端,所述方法包括:获取包含至少一个说话者的原始音频流;根据预设的说话人分割与聚类算法,获取所述原始音频流中所述至少一个说话者中每一个说话者的分别的音频流;将所述至少一个说话者中每一个说话者的分别的音频流分别与原始声纹特征模型进行匹配,获取匹配成功的音频流;将所述匹配成功的音频流作为生成所述原始声纹特征模型的追加音频流训练样本,对所述原始声纹特征模型进行更新。本发明通过自适应提取通话过程中的有效音频流作为追加的音频流训练样本,用以动态修正原有的声纹特征模型,达到了在保证较高的实用性的前提下,提高声纹特征模型精确度及识别准确率的目的。
24 用于说话者认证的模型自适应系统和方法 CN98812890.X 1998-11-03 CN1302427A 2001-07-04 K·法雷尔; W·米斯特雷塔
发明的模型自适应系统是一种说话者认证系统,该系统体现了能够调整在注册分量过程中学习到的模型以跟踪用户声音时效的能。该系统具有以下优点:仅需要用于识别模型的单个注册,其中的识别模型包括神经树网络(22)、高斯混合模型(26),动态时间规划(16)或多个模型(30)(即,神经树网络(22)、高斯混合模型(26),动态时间规划(16)的组合(30))。此外,本发明可以应用于文本相关或文本无关系统。
25 语音基准登记方法 CN98810981.6 1998-08-17 CN1278944A 2001-01-03 小R·W·博斯梅尔
一种语音基准登记方法,它包含下述步骤:(a)请一用户说出一单词;(b)检测一第一发音(354);(c)请用户说出该单词;(d)检测第二个发音(358);(e)确定第一个发音和第二个发音之间的第一个相似性(362);(f)当第一个相似性小于一预定的相似性时,请用户说出该单词;(g)检测第三个发音(366);(h)确定第一个发音和第三个发音之间的第二个相似性(370);以及(i)当第二个相似性大于或等于预定的相似性时,产生一基准(364)。
26 说话者验证系统 CN96194550.8 1996-06-06 CN1197526A 1998-10-28 R·J·曼蒙; 凯文·法雷尔; 马尼什·夏尔马; 奈克·德旺; 张晓宇; 哈立德·阿萨雷; 刘汉生
发明涉及一种模式识别系统(图1),它使用数据组合,从而把来自多个提取特征(60、61、62)的数据与多个分类器(70、71、72)组合起来。利用以判别式为基础和以失真为基础的分类器,可准确地验证说话者的模式。可使用一种利用一组“留下一个”的训练数据的新方案,从而以减少的数据组对系统进行训练(图7A、7B、7C)。可使用减小信道效应的极点滤波方法(图11B)以及改善训练和测试数据之间相关性的仿射变换(图14)来改善提取的特征。
27 使用基于人工神经网络的亚语音单位区分的说话人验证及识别 CN201380069560.6 2013-12-05 CN104903954B 2017-09-29 约翰-保罗·荷索姆; 彼得·J·韦尔默朗; 乔纳森·肖
在一个实施例中,计算机系统存储多个说话人的话音数据,其中所述话音数据包含多个特征向量及每一特征向量的相关联亚语音类。所述计算机系统接着基于所述话音数据,建置人工神经网络ANN以对所述多个说话人中的目标说话人的话音进行建模,其中所述ANN经配置以区分由所述目标说话人说出的亚语音类的实例与由所述多个说话人中的其他说话人说出的亚语音类的实例。
28 基于声纹识别的身份验证的方法及系统 CN201710147695.X 2017-03-13 CN107068154A 2017-08-18 王健宗; 丁涵宇; 郭卉; 肖京
发明涉及一种基于声纹识别的身份验证的方法及系统,所述基于声纹识别的身份验证的方法包括:在接收到进行身份验证的用户的语音数据后,获取所述语音数据的声纹特征,并基于所述声纹特征构建对应的声纹特征向量;将所述声纹特征向量输入预先训练生成的背景信道模型,以构建出所述语音数据对应的当前声纹鉴别向量;计算所述当前声纹鉴别向量与预存的该用户的标准声纹鉴别向量之间的空间距离,基于所述距离对该用户进行身份验证,并生成验证结果。本发明能够提高用户身份验证的准确率及效率。
29 基于语音降噪的声纹识别的方法及系统以及智能终端 CN201610025060.8 2016-01-14 CN106971733A 2017-07-21 祝铭明
发明公开了基于语音降噪的声纹识别的方法及系统以及智能终端。方法为步骤S1采集外部输入的语音,并判断语音的声音强度是否高于一预设的强度阈值,并在声音强度高于强度阈值时将语音确认为待判断语音,转向步骤S2;步骤S2根据待判断语音的频谱,生成对应待判断语音上每个频带的估计标识;步骤S3生成对应于待判断语音的纯语音的概率模型;步骤S4以每个估计标识作为对应的待判断语音的频带的权重指标,依据概率模型处理得到关联于语音的纯语音估计值;步骤S5判断纯语音估计值是否大于一预设的估计阈值,若是执行步骤S6,若否返回步骤S1;步骤S6根据纯语音估计值获取语音流,依据预设的声纹识别模型对语音流进行声纹识别。
30 一种自适应的基于码本的声纹识别方法及系统 CN201610024241.9 2016-01-14 CN106971726A 2017-07-21 祝铭明
发明属于语音信号处理领域,尤其涉及一种自适应的基于码本的声纹识别方法及系统,应用于家用机器人,包括:S1:采集语音信号;S2:对语音信号进行预处理;S3:自预处理后的语音信号中提取语音特征参数;S4:为每一个家庭成员建立声学模型;S5:在一预定时间内对声学模型中的训练语句的使用频率进行统计,并根据统计结果以码本为单位将声学模型区分为第一声学模型和第二声学模型,第一声学模型的中码本的使用频率大于第二声学模型,并在通电时将第一声学模型加载至缓存中;S6:依据第一声学模型和第二声学模型对待测语音信号进行模式匹配,获取识别结果。以上技术方案可以自适应地实现声纹识别,并有效提高了声纹识别的速度。
31 一种猪呼吸道疾病自动识别报警方法 CN201611237416.0 2016-12-28 CN106847262A 2017-06-13 黎煊; 龚永杰; 高云; 雷明刚; 刘望宏; 赵建; 李永泽; 周鹏; 严鹤; 郦志浩
发明公开了一种猪呼吸道疾病自动识别报警方法,包括建立猪咳嗽声音与所患疾病的支持向量机模型以及采集猪的咳嗽声音并对信号进行识别两个步骤。本发明通过采集猪的咳嗽声音信号并通过支持向量机模型对其进行分析,实现了对猪呼吸道疾病的自动识别和报警,能适时、远程监控猪的健康状况,节省了猪呼吸道疾病检测的大量人和物力,提高了猪的饲养效率。
32 一种手机来电接听装置及来电接听方法 CN201710140731.X 2017-03-10 CN106791210A 2017-05-31 耿凯悦
发明公开了一种手机来电接听装置,包括:麦克,用于接收用户的语音信号;声纹提取单元,用于提取语音信号中的声纹信号;声纹识别单元,用于将所提取的声纹信号与预先存储的参考声纹信号进行对比;以及控制接听单元,当所提取的声纹信号与预先存储的声纹信号对比正确时自动接听,其中所述控制接听单元仅当手机来电时开启所述声纹识别单元。本发明的可以让用户通过声纹控制方便快捷地接听电话。
33 恶意电话的语音特征库的配置方法和装置 CN201510808778.X 2015-11-20 CN106790949A 2017-05-31 王务志; 王军
发明公开了一种恶意电话的语音特征库的配置方法和装置,在接听电话过程中,根据用户指令,在检测到用户选择恶意电话选项时,将对方来电标识为恶意电话,并对恶意电话的语音进行一定时长的录音;将恶意电话的语音发送给服务器,以使所述云端服务器对恶意电话的语音进行语音分析,得到恶意电话的语音特征点,将所述恶意电话的语音特征点保存到恶意电话语音特征数据库中。可以实现通过语音特征点的匹配对恶意电话的拦截。
34 儿童启动方法及装置 CN201510605365.1 2015-09-21 CN106548779A 2017-03-29 龚松
发明公开了一种儿童启动方法及装置,其中,该方法包括:提取受限用户的预定时间长度的声音特征;判断该声音特征与预先设置的声音特征是否匹配;在判断结果为是的情况下,启动儿童锁模式,解决了相关技术中对儿童锁的启动方式不够智能的问题,能够根据声音启动儿童锁,提高了用户体验。
35 机器人的声纹服务系统及其服务控制方法 CN201610698911.5 2016-08-22 CN106297790A 2017-01-04 高子庆
发明公开一种机器人的声纹服务系统及其服务控制方法,该系统包括设置在机器人内部的语音输出模、引导模块、语音输入模块、语音解析模块、声纹记录模块、声纹识别模块和业务模块。通过各模块的配合,引导模块能够引导用户根据语音输出模块播放的提示音进行录音,语音解析模块能够处理语音输入模块的音频文件,声纹记录模块将语音输入模块所存储的音频文件建立声音模型,且声纹识别模块能将语音输入模块所存储的音频文件匹配声纹记录模块所存储的声音模型,并判定用户身份,实现用户的声纹记录和识别,使得声纹可作为一种可存储且可读取的数据,业务模块可根据声纹记录模块提供的声音模型进行对应的操作处理,针对不同用户身份,实现不同的服务。
36 语音质量评估的方法和装置 CN201210387204.6 2012-10-12 CN103730131B 2016-12-07 肖玮
语音质量评估的方法包括:对语音信号进行人听觉建模处理,得到第一信号;对第一信号进行可变分辨率的时间-频率分析,得到第二信号;基于第二信号进行特征提取和分析,获得针对该语音信号的语音质量评估的结果。通过上述技术方案,可以解决语音质量评估的准确性不高的问题,其中通过人耳听觉建模处理,再将待测信号通过变换为表示可变分辨率的时间-频率信号,通过进一步分析可变分辨率的时间-频率信号,提取信号对应的特征,做进一步分析,最终获得较高准确性的语音质量评估的结果。
37 动态选择语音模型的语音识别方法及装置 CN201510849106.3 2015-11-26 CN105895078A 2016-08-24 王永庆
发明实施例提供一种动态选择语音模型的语音识别方法及装置。获取待测语音的第一个语音包,并对所述第一个语音包进行基频的提取,其中所述基频为声带振动的频率;根据所述基频对所述待测语音的来源进行分类并选择预先训练的相应类别的语音模型;对待测语音进行前端处理以获取所述待测语音的特征参数的值,并将处理后的所述待测语音与所述语音模型进行匹配打分,从而获取语音识别的结果。实现了女性语音和儿童语音识别率的提升,具有高效率,低成本的优势。
38 基于深度学习的声纹认证方法和装置 CN201610353878.2 2016-05-25 CN105869644A 2016-08-17 吴本谷; 李超; 关勇
发明提出一种基于深度学习的声纹认证方法和装置,该基于深度学习的声纹认证方法包括:接收说话人的语音;提取所述语音的d?vector特征;获取所述说话人在注册阶段确定的d?vector特征;计算上述两个d?vector特征之间的匹配值;如果所述匹配值大于或等于阈值,则确定所述说话人通过认证。该方法能够提高声纹认证的效果。
39 基于自适应调整的高斯混合模型的人声识别方法 CN201510977077.9 2015-12-22 CN105590628A 2016-05-18 沈希忠; 包玲玲
发明涉及一种基于自适应调整的高斯混合模型的人声识别方法,利用概率差值的绝对值之和对传统的高斯混合模型进行改进,对每一个高斯子分量在拟合语音信号的特征时所作的贡献,进行动态的调整高斯子分量,最大限度的利用每一个高斯子分量,充分表达有用信息,从而提高说话人确认的识别性能。
40 基于全局变化空间及深度学习混合建模的声纹识别方法 CN201610000675.5 2016-01-04 CN105575394A 2016-05-11 徐明星; 车浩
发明公开一种基于全局变化空间及深度学习混合建模的声纹识别方法,包括以下步骤:获取语音段训练数据,采用全局变化空间建模的方法进行身份认证矢量,获取TVM-IVECTOR;采用深度神经网络的方法进行训练,获取NN-IVECTOR;将同一个音频文件的两个向量进行融合,得到新的I-VECTOR特征提取器;对于待测试音频,将TVM-IVECTOR和NN-IVECTOR两个向量融合后,提取最终的I-VECTOR;经过信道补偿后,与模型库中的说话人模型进行打分识别,得到识别结果。本发明方法对环境不匹配、多信道变化以及噪声等环境因素的干扰具有更强的鲁棒性,能够提高声纹识别方法的性能。
QQ群二维码
意见反馈