首页 / 专利库 / 电子零件及设备 / 模版 / 一种门禁系统的认证方法和装置

一种禁系统的认证方法和装置

阅读:429发布:2020-05-11

专利汇可以提供一种禁系统的认证方法和装置专利检索,专利查询,专利分析的服务。并且本 申请 提供一种 门 禁系统的认证方法和装置,其中方法包括:对采集到的 音频流 进行 语音识别 ,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的 模版 声纹特征;对所述音频流进行声纹识别,得到所述音频流的声纹特征;将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。本申请简化了门禁系统的认证流程,提高了认证的效率。,下面是一种禁系统的认证方法和装置专利的具体信息内容。

1.一种禁系统的认证方法,其特征在于,所述方法包括:
对采集到的音频流进行语音识别,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;
将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的模版声纹特征;
对所述音频流进行声纹识别,得到所述音频流的声纹特征;
将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。
2.根据权利要求1所述的方法,其特征在于,所述对采集到的音频流进行语音识别之前,所述方法还包括:
获取所述目标对象的待注册音频流;
对所述待注册音频流进行语音识别,将识别得到的语音内容作为所述目标对象的对象标识;
对所述待注册音频流进行声纹识别,得到所述待注册音频流的所述模版声纹特征;
将所述目标对象的对象标识及所述模版声纹特征,对应存储在所述对象注册信息中。
3.根据权利要求2所述的方法,其特征在于,所述对待注册音频流进行声纹识别,得到所述待注册音频流的所述模版声纹特征,包括:
当获取的所述待注册音频流的数量为多条时,分别由每条所述待注册音频流中提取声纹特征向量
在确定多条待注册音频流的声纹特征向量满足一致性时,根据所述多条待注册音频流的声纹特征向量生成所述模版声纹特征。
4.根据权利要求2所述的方法,其特征在于,所述对所述待注册音频流进行声纹识别之前,所述方法还包括:
确定所述待注册音频流的音频质量满足质量标准条件。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述对象注册信息中未包括所述对象标识,则确定所述目标对象未注册,所述目标对象认证失败。
6.一种门禁系统的认证装置,其特征在于,所述装置包括:
语音识别模,用于对采集到的音频流进行语音识别,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;
信息管理模块,用于将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的模版声纹特征;
声纹识别模块,用于对所述音频流进行声纹识别,得到所述音频流的声纹特征;
认证处理模块,用于将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。
7.根据权利要求6所述的装置,其特征在于,
所述语音识别模块,还用于获取所述目标对象的待注册音频流;对所述待注册音频流进行语音识别,将识别得到的语音内容作为所述目标对象的对象标识;
所述声纹识别模块,还用于对所述待注册音频流进行声纹识别,得到所述待注册音频流的所述模版声纹特征;
所述信息管理模块,还用于将所述目标对象的对象标识及所述模版声纹特征,对应存储在所述对象注册信息中。
8.根据权利要求7所述的装置,其特征在于,所述声纹识别模块,包括:
特征提取子模块,用于当获取的所述待注册音频流的数量为多条时,分别由每条所述待注册音频流中提取声纹特征向量;
模版生成子模块,用于在确定多条待注册音频流的声纹特征向量满足一致性时,根据所述多条待注册音频流的声纹特征向量生成所述模版声纹特征。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
质量判断模块,用于在对所述待注册音频流进行声纹识别之前,确定所述待注册音频流的音频质量满足质量标准条件。
10.根据权利要求6所述的装置,其特征在于,
所述认证处理模块,还用于:若所述对象注册信息中未包括所述对象标识,则确定所述目标对象未注册,所述目标对象认证失败。

说明书全文

一种禁系统的认证方法和装置

技术领域

[0001] 本申请涉及网络技术,特别涉及一种门禁系统的认证方法和装置。

背景技术

[0002] 门禁系统可以作为一种用于管理人员进出的智能控制系统,例如各个企事业单位可以通过门禁系统控制只能本单位的员工进入,人员要进入该单位时,需要通过门禁系统的认证,认证通过才能进入单位,以此保证单位的安全运营。门禁系统可以采用多种方式进行认证,比如,声纹门禁可以通过识别人员的声纹特征是否是注册过的声纹来控制门禁。但是现有技术中存在的问题是,用户在注册声纹时需要输入自己的ID(比如,员工的工号),在认证时也需要输入ID再认证声纹,这种方式使得用户操作较为繁琐,并且认证效率较低,耗时较长。发明内容
[0003] 有鉴于此,本申请提供一种门禁系统的认证方法和装置,以简化门禁系统的认证流程,提高认证的效率。
[0004] 具体地,本申请是通过如下技术方案实现的:
[0005] 第一方面,提供一种门禁系统的认证方法,所述方法包括:
[0006] 对采集到的音频流进行语音识别,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;
[0007] 将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的模版声纹特征;
[0008] 对所述音频流进行声纹识别,得到所述音频流的声纹特征;
[0009] 将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。
[0010] 第二方面,提供一种门禁系统的认证装置,所述装置包括:
[0011] 语音识别模,用于对采集到的音频流进行语音识别,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;
[0012] 信息管理模块,用于将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的模版声纹特征;
[0013] 声纹识别模块,用于对所述音频流进行声纹识别,得到所述音频流的声纹特征;
[0014] 认证处理模块,用于将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。
[0015] 本申请提供的门禁系统的认证方法和装置,通过一次采集音频流得到对象标识和声纹特征,使得用户在门禁认证时只要读一次自己的标识即可,简化了门禁系统的认证流程,提高了认证的效率。附图说明
[0016] 图1是本申请一示例性实施例示出的一种门禁系统的注册流程;
[0017] 图2是本申请一示例性实施例示出的一种声纹识别的流程图
[0018] 图3是本申请一示例性实施例示出的一种门禁系统的认证流程;
[0019] 图4是本申请一示例性实施例示出的一种门禁系统的认证装置的结构图;
[0020] 图5是本申请一示例性实施例示出的另一种门禁系统的认证装置的结构图。

具体实施方式

[0021] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0022] 本申请实施例提供的门禁系统的认证方法,综合使用了语音识别和声纹识别技术,以提高门禁认证的效率。如下以一个简单的例子来说明这种语音和声纹的综合使用:
[0023] 以某个企业单位的门禁为例,该单位的每个员工都要在门禁系统进行注册,门禁系统可以依据员工注册的信息来控制员工的日常进出单位。通常在注册时包括两类信息:
[0024] 一类信息是:员工标识;如果将员工称为目标对象,那么员工标识可以称为目标对象的对象标识,例如,可以采用员工在单位的工号123456作为该员工的标识。
[0025] 另一类信息是:能够唯一标识员工的生理性信息;在本例子中,基于不同人的声纹差异,该生理性信息可以采用声纹,用员工的声纹来标识各个员工,可以将标识员工的声纹称为员工的模版声纹特征。
[0026] 将上述两类信息建立对应关系,并进行存储,可以将对应存储的目标对象的对象标识和模版声纹特征,称为“对象注册信息”。例如,员工小张可以存储其对象标识和对应的模版声纹特征为“123456——声纹A”,员工小李可以存储其对象标识和对应的模版声纹特征为“789012——声纹B”。
[0027] 如果按照传统的门禁系统的处理方式,在注册时,员工需要分两次注册对象注册信息,例如,可以手动输入自己的工号作为标识,然后朗读一个预定的内容(比如,清凉的夏天)作为输入的语音,由门禁系统根据该语音识别员工的声纹特征;在后续的认证过程中,员工仍然要输入自己的工号,并朗读预定内容,门禁系统可以根据工号查找之前存储的对象注册信息,获得工号对应的声纹特征进行本次认证中的比对。而相比较的,本申请实施例的方法中,可以通过结合语音识别和声纹识别,将上面提到的两类信息即对象标识和模版声纹特征融合在一起,简化用户操作,比如,员工读出自己的工号“123456”即可,通过一次朗读,就可以从员工朗读的音频中利用语音识别得到员工ID,并通过声纹识别得到员工声纹,实现了就一次朗读同时得到对象标识和声纹特征,从而简化流程,提高效率。
[0028] 如下分别描述如何使用本申请的方法执行门禁系统的注册和认证流程:
[0029] 注册
[0030] 如果要使用门禁系统对某个目标对象进行认证,通常目标对象要先在门禁系统进行注册,使得门禁系统预先存储对象注册信息,后续才能根据该对象注册信息对目标对象进行认证。
[0031] 图1示例了一个例子中的门禁系统的注册流程,包括如下处理:
[0032] 在步骤101中,获取目标对象的待注册音频流。
[0033] 例如,仍以一个企业单位的门禁系统对员工进行门禁控制为例,员工在门禁系统注册时,可以对着门禁系统的麦克读出自己的工号“123456”。本例子中,可以将正在注册的员工成为目标对象,员工朗读自己工号的音频称为待注册音频流。
[0034] 在本步骤中获取到待注册音频流之后,接着对该音频流进行处理,主要包括两方面的处理,一个是对音频流进行语音识别得到对象标识,另一个是对音频流进行声纹识别得到声纹特征,这两方面的处理可以先后执行,或者并列执行。图1中是以并列执行为例进行描述,如下的步骤不限制执行顺序。
[0035] 此外,如果门禁系统是一个包括多个设备的系统,比如包括位于单位门口的音频采集设备比如麦克风,而处理采集音频流的设备是后端的音频处理设备,那么可以由前端的音频采集设备在采集到待注册音频流后,通过网络传输到音频处理设备。
[0036] 在步骤102中,对待注册音频流进行语音识别,将识别得到的语音内容作为目标对象的对象标识。
[0037] 例如,语音识别即使用计算机技术自动识别人所说语音的内容,即由语音到内容的识别过程。比如,对于待注册音频流即员工朗读“123456”的音频进行语音识别后,得到该音频流中的语音内容即“123456”,可以将识别得到的内容作为员工的标识,即员工ID。
[0038] 在步骤103中,对待注册音频流进行声纹识别,得到所述待注册音频流的模版声纹特征。
[0039] 本实施例中,对待注册音频流进行声纹识别,即由音频流中提取出能唯一标识该目标对象的声纹信息,比如,声纹特征向量。可以将声纹识别最终得到的后续用于认证对象的声纹信息称为模版声纹特征。该模版声纹特征的获取可以有多种方法,在后续的图2中将示例一种声纹识别的执行过程。
[0040] 在步骤104中,将所述目标对象的对象标识及所述模版声纹特征,对应存储在所述对象注册信息中。
[0041] 本步骤中,可以将根据员工朗读的待注册音频流“123456”,在步骤102中语音识别得到的对象标识、以及步骤103中得到的模版声纹特征,建立对应关系,并将两者对应存储。本实施例中,可以将对象标识和对应的模版声纹特征称为该目标对象的对象注册信息,该对象注册信息可以存储在数据库
[0042] 在一个例子中,对待注册音频流进行声纹识别的处理过程可以参见图2。
[0043] 在步骤201中,获取目标对象的待注册音频流。
[0044] 在步骤202中,判断待注册音频流的音频质量是否满足质量标准条件。
[0045] 例如,采集的音频流的质量较好时,对音频进行声纹识别的效果就更好,因此,可以在进行后续的声纹识别之前,先对音频流的质量进行判定。比如,可以计算音频流中的人声信号强度、信噪比等信息,来判断这段语音是否符合质量标准条件,比如,该质量标准条件可以是设定信噪比在一定的范围内,人声信号强度高于一定的强度阈值等。
[0046] 如果采集的音频流的质量较差,不满足质量要求,可以返回执行步骤201,指示正在注册的员工重新朗读其工号,即门禁系统重新采集待注册音频流。如果采集的音频流的质量较好,满足质量要求,则继续执行步骤203。
[0047] 在步骤203中,由待注册音频流中提取声纹特征向量。
[0048] 本例子中,门禁系统获取的待注册音频流的数量可以有多条,比如,在步骤201中,员工可以读两次自己的工号,那么门禁系统将采集到两条音频流。本步骤中,门禁系统可以提取其中的每一条音频流的声纹特征向量,该特征向量的提取可以采用多种常规方式,不再详述,比如,可以从音频流的语音信号中提取语音特征参数MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数)特征,然后使用i-vector(一种说话人识别算法)和PLDA(Probabilistic Linear Discriminant Analysis,声纹识别的信道补偿算法)等方法计算特征向量。
[0049] 在步骤204中,判断多条待注册音频流的声纹特征向量是否满足一致性。
[0050] 例如,当员工在步骤201中朗读了至少两次自己的工号时,门禁系统采集的音频流是对应的至少两条。为了保证该多条音频流之间的声纹特征的差别不会过大,所以可以进行多条音频流之间的声纹一致性判断。比如,可以根据在步骤203中由每条音频流提取的声纹特征向量,计算该多条音频流之间的相似度分数。
[0051] 若该相似度分数在一定的分数阈值范围内,表示音频流之间满足相似要求,可以继续执行步骤205;否则,表明员工输入的这多次音频差别太大,可以返回步骤201,指示正在注册的员工重新朗读其工号,即门禁系统重新采集待注册音频流。
[0052] 在步骤205中,根据多条待注册音频流的声纹特征向量生成模版声纹特征。本步骤中,可以根据在前面步骤中分别对各条音频流提取的声纹特征向量进行加权求和,得到模版声纹特征,并将该模版声纹特征和语音识别音频流得到的员工ID,组成对象注册信息存储在数据库中。
[0053] 在完成上述的注册流程后,门禁系统中已经存储了目标对象的对象注册信息,门禁系统可以根据该对象注册信息执行对象的认证处理。
[0054] 认证
[0055] 图3示例了一个例子中的门禁系统的认证流程,包括如下处理:
[0056] 在步骤301中,获取待认证的目标对象产生的音频流。
[0057] 例如,假设某员工上班时要进行单位的门禁系统的认证,本步骤中,员工可以通过门禁系统的音频采集设备比如麦克风,用普通话读出自己的工号“123456”,然后等待门禁系统对其语音进行认证。
[0058] 在步骤302中,对音频流进行语音识别,得到音频流的语音内容。
[0059] 例如,通过对步骤301中的音频流进行语音识别,识别得到的语音内容即为该员工的工号“123456”。可以将识别到的语音内容作为目标对象的对象标识。
[0060] 在步骤303中,判断预存储的对象注册信息中是否包括所述对象标识。
[0061] 例如,将识别到的内容“123456”作为员工的工号,判断在注册时数据库中存储的对象注册信息中是否包括该工号。比如,可以将识别到的工号作为索引,在数据库中进行检索,如果能够检索到该工号,表明该员工已经注册,继续执行步骤304;否则,如果数据库的对象注册信息中未包括上述识别到的工号,则可以确认该员工尚未注册,可以提示该员工认证失败,门禁不开,并且还可以提示员工返回步骤301重新采集一次音频流,以防止由于某些处理上的失误导致误判,让员工再重新读一次其工号。
[0062] 在步骤304中,对音频流进行声纹识别,得到音频流的声纹特征。
[0063] 本步骤的声纹特征的提取,可以采用与注册流程中相同的处理方法,比如,提取MFCC特征,并使用i-vector计算声纹特征向量,提取的声纹特征向量即得到的音频流的声纹特征。
[0064] 在步骤305中,将音频流的声纹特征与对象注册信息中获取的对象标识对应的模版声纹特征进行比对,判断比对结果是否满足认证条件。
[0065] 例如,可以根据步骤302中识别到的对象标识,由数据库中的对象注册信息中获取与该对象标识对应的模版声纹特征,这是目标对象即正在认证的员工在注册时存储的声纹特征。两者的比对结果可以用声纹比对分数来表示,如果比对分数超过一定的分数阈值,则可以认为比对结果满足认证条件,当前认证的员工的声纹与注册时存储的声纹之间,两者足够相似,则确认目标对象通过认证,门禁打开。否则门禁不开。
[0066] 在图3所示的认证流程中,当确定语音识别得到的员工ID存储在数据库中时,对该员工进行声纹识别,声纹识别的过程与注册流程类似,比如,可以先判断采集的音频流的质量,若指令通过,再对该音频流提取声纹特征向量,与数据库中的模版声纹特征进行比对。
[0067] 本申请实施例的门禁系统的认证方法,使得用户在认证时,只需要产生一次音频流即可,比如员工读一次自己的工号即可,门禁系统就可以根据该音频流综合使用语音识别和声纹识别,通过语音识别得到员工ID,通过声纹识别得到员工声纹特征,这种方式相对于分别输入自己的ID以及朗读某个预定内容的繁琐操作,显著简化了认证的流程,简化了用户操作,进而提高了认证效率;并且,保持了1:1的声纹认证方式,即识别到的声纹特征只与数据库中的对象标识对应的特征比较,保证了识别的精度,通过该方法可以快速准确的验证用户身份。
[0068] 为了实现上述的门禁系统的认证方法,本申请实施例还提供了一种门禁系统的认证装置,该装置可以用于门禁系统。如图4所示,该装置可以包括:语音识别模块41、信息管理模块42、声纹识别模块43和认证处理模块44。
[0069] 语音识别模块41,用于对采集到的音频流进行语音识别,得到所述音频流的语音内容,所述音频流由待认证的目标对象产生;
[0070] 信息管理模块42,用于将所述语音内容作为所述目标对象的对象标识,若预存储的对象注册信息中包括所述对象标识,在所述对象注册信息中获取所述对象标识对应的模版声纹特征;
[0071] 声纹识别模块43,用于对所述音频流进行声纹识别,得到所述音频流的声纹特征;
[0072] 认证处理模块44,用于将所述音频流的声纹特征与所述模版声纹特征比对,若比对结果满足认证条件,则确认所述目标对象通过认证。
[0073] 在一个例子中,语音识别模块41,还用于获取所述目标对象的待注册音频流;对所述待注册音频流进行语音识别,将识别得到的语音内容作为所述目标对象的对象标识;
[0074] 所述声纹识别模块43,还用于对所述待注册音频流进行声纹识别,得到所述待注册音频流的所述模版声纹特征;
[0075] 所述信息管理模块42,还用于将所述目标对象的对象标识及所述模版声纹特征,对应存储在所述对象注册信息中。
[0076] 在一个例子中,参见图5所示,声纹识别模块43可以包括:
[0077] 特征提取子模块431,用于当获取的所述待注册音频流的数量为多条时,分别由每条所述待注册音频流中提取声纹特征向量;
[0078] 模版生成子模块432,用于在确定多条待注册音频流的声纹特征向量满足一致性时,根据多条待注册音频流的声纹特征向量生成所述模版声纹特征。
[0079] 在一个例子中,该装置还可以包括:质量判断模块45,用于在对所述待注册音频流进行声纹识别之前,确定所述待注册音频流的音频质量满足质量标准条件。
[0080] 在一个例子中,认证处理模块44,还用于:若所述对象注册信息中未包括所述对象标识,则确定所述目标对象未注册,所述目标对象认证失败。
[0081] 以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈