首页 / 专利库 / 人工智能 / 人工神经网络 / 前馈神经网络 / 深度神经网络 / 一种基于神经网络的文本分类方法和装置

一种基于神经网络的文本分类方法和装置

阅读:1025发布:2020-06-07

专利汇可以提供一种基于神经网络的文本分类方法和装置专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于神经网络的 文本分类 方法,包括:将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到原始分类对象集中的各待分类对象的分类结果,分类结果包括分类归属概率;筛选出分类归属概率小于预设概率 阈值 的待分类对象,以构成更新分类对象集;以及,更新神经网络分类模型,以得到新神经网络分类模型,新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;将更新分类对象集中的各待分类对象分别输入至新神经网络分类模型,以进行分类处理,得到更新待分类对象集中的各待分类对象的分类结果。通过对原始分类对象集进行多次分类处理,以提高待分类对象个体的分类正确率。,下面是一种基于神经网络的文本分类方法和装置专利的具体信息内容。

1.一种基于神经网络的文本分类方法,其特征在于,包括:
将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到所述原始分类对象集中的各待分类对象的分类结果,所述分类结果包括分类归属概率;
筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;
以及,更新神经网络分类模型,以得到新神经网络分类模型,所述新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;
将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理,得到所述更新待分类对象集中的各待分类对象的分类结果。
2.根据权利要求1所述的方法,其特征在于,在所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集的步骤之前,还包括:
统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比,并判断所述占比是否小于或等于预设占比阈值;
当判断出所述占比大于所述预设占比阈值时,则继续执行所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集的步骤。
3.根据权利要求1或2所述的方法,其特征在于,在所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤之后,还包括:
统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比,并判断所述占比是否小于或等于预设占比阈值;
当判断出所述占比小于或等于所述预设占比阈值时,则分类结束;
当判断出所述占比大于所述预设占比阈值时,则继续执行所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;以及,更新神经网络分类模型,以得到新神经网络分类模型的步骤。
4.根据权利要求1所述的方法,其特征在于,所述新神经网络分类模型的深度大于更新前的神经网络分类模型的深度。
5.根据权利要求4所述的方法,其特征在于,在所述更新神经网络分类模型,以得到新神经网络分类模型的步骤之后,且在所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤之前,还包括:
判断所述新神经网络分类模型的深度是否达到预设深度阈值;
当判断出所述新神经网络分类模型的深度达到预设深度阈值时,结束方法流程;
当判断出所述新神经网络分类模型的深度未达到预设深度阈值时,则执行所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤。
6.一种基于神经网络的文本分类装置,其特征在于,包括:
第一分类单元,用于将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到所述原始分类对象集中的各待分类对象的分类结果,所述分类结果包括分类归属概率;
筛选单元,用于基于所述第一分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;
模型更新单元,用于更新神经网络分类模型,以得到新神经网络分类模型,所述新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;
第二分类单元,用于将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理,得到所述更新待分类对象集中的各待分类对象的分类结果。
7.根据权利要求6所述的装置,其特征在于,还包括:
第一统计单元,用于在所述筛选单元基于所述第一分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集之前,统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比;
第一判断单元,用于判断所述第一统计单元所统计出的占比是否小于或等于预设占比阈值;
所述筛选单元具体用于当所述第一判断单元判断出所述占比大于所述预设占比阈值时,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
8.根据权利要求6或7所述装置,其特征在于,还包括:
第二统计单元,用于在所述第二分类单元将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理之后,统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比;
第二判断单元,用于判断所述第二统计单元所统计出的所述占比是否小于或等于预设占比阈值;
所述筛选单元具体用于当所述第二判断单元判断出所述占比大于所述预设占比阈值时,基于所述第二分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
9.根据权利要求6所述的装置,其特征在于,所述新神经网络分类模型的深度大于更新前的神经网络分类模型的深度。
10.根据权利要求9所述的装置,其特征在于,还包括:
深度判断单元,用于在所述模型更新单元更新神经网络分类模型,以得到新神经网络分类模型之后,且在所述第二分类单元将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理之前,判断所述新神经网络分类模型的深度是否达到预设深度阈值;
所述第二分类单元具体用于当所述深度判断单元判断出所述新神经网络分类模型的深度未达到预设深度阈值时,将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理。

说明书全文

一种基于神经网络的文本分类方法和装置

技术领域

[0001] 本发明涉及通信技术领域,具体涉及一种基于神经网络的文本分类方法和装置。

背景技术

[0002] 文本分类是文本处理过程中的一项常规流程,当前,常用的文本分类方法为利用TXTCNN算法(文本卷积神经网络算法)进行分类,TXTCCN算法具有网络结构简单、参数量少、计算量小以及计算速度快的特点,现有技术中,在利用TXTCNN算法对批量文本进行分类时,常规方法为选择一个预设深度的神经网络模型对待分类的批量文本进行分类处理,而当批量文本的整体正确率未达到期望值时,则进一步通过增加神经网络模型的深度来重新进行分类处理,直到达到期望值,现有的这种分类处理方法虽然使批量文本的整体正确率达到预期值,但其无法保证批量文本中的每个文本都达到较优的分类效果,从而导致文本的整体分类效果较差。

发明内容

[0003] 本发明旨在至少解决现有技术中存在的技术问题之一,提出了一种基于神经网络的文本分类方法和装置,用以解决现有技术中存在的批量文本的文本分类效果差的问题。
[0004] 为解决上述技术问题,本发明一方面提供一种基于神经网络的文本分类方法,包括:
[0005] 将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到所述原始分类对象集中的各待分类对象的分类结果,所述分类结果包括分类归属概率;
[0006] 筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;以及,更新神经网络分类模型,以得到新神经网络分类模型,所述新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;
[0007] 将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理,得到所述更新待分类对象集中的各待分类对象的分类结果。
[0008] 优选的,在所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集的步骤之前,还包括:
[0009] 统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比,并判断所述占比是否小于或等于预设占比阈值;
[0010] 当判断出所述占比大于所述预设占比阈值时,则继续执行所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集的步骤。
[0011] 优选的,在所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤之后,还包括:
[0012] 统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比,并判断所述占比是否小于或等于预设占比阈值;
[0013] 当判断出所述占比小于或等于所述预设占比阈值时,则分类结束;
[0014] 当判断出所述占比大于所述预设占比阈值时,则继续执行所述筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;以及,更新神经网络分类模型,以得到新神经网络分类模型的步骤。
[0015] 优选的,所述新神经网络分类模型的深度大于更新前的神经网络分类模型的深度。
[0016] 优选的,在所述更新神经网络分类模型,以得到新神经网络分类模型的步骤之后,且在所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤之前,还包括:
[0017] 判断所述新神经网络分类模型的深度是否达到预设深度阈值;
[0018] 当判断出所述新神经网络分类模型的深度达到预设深度阈值时,结束方法流程;
[0019] 当判断出所述新神经网络分类模型的深度未达到预设深度阈值时,则执行所述将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理的步骤。
[0020] 另一方面,本发明还提供一种基于神经网络的文本分类装置,包括:
[0021] 第一分类单元,用于将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到所述原始分类对象集中的各待分类对象的分类结果,所述分类结果包括分类归属概率;
[0022] 筛选单元,用于基于所述第一分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;
[0023] 模型更新单元,用于更新神经网络分类模型,以得到新神经网络分类模型,所述新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;
[0024] 第二分类单元,用于将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理,得到所述更新待分类对象集中的各待分类对象的分类结果。
[0025] 优选的,该装置还包括:
[0026] 第一统计单元,用于在所述筛选单元基于所述第一分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集之前,统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比;
[0027] 第一判断单元,用于判断所述第一统计单元所统计出的占比是否小于或等于预设占比阈值;
[0028] 所述筛选单元具体用于当所述第一判断单元判断出所述占比大于所述预设占比阈值时,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
[0029] 优选的,该装置还包括:
[0030] 第二统计单元,用于在所述第二分类单元将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理之后,统计所述分类归属概率小于预设概率阈值的待分类对象的数量与所述原始分类对象集中的待分类对象的数量的占比;
[0031] 第二判断单元,用于判断所述第二统计单元所统计出的所述占比是否小于或等于预设占比阈值;
[0032] 所述筛选单元具体用于当所述第二判断单元判断出所述占比大于所述预设占比阈值时,基于所述第二分类单元所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
[0033] 优选的,所述新神经网络分类模型的深度大于更新前的神经网络分类模型的深度。
[0034] 优选的,还包括:
[0035] 深度判断单元,用于在所述模型更新单元更新神经网络分类模型,以得到新神经网络分类模型之后,且在所述第二分类单元将所述筛选单元所筛选出的更新分类对象集中的各待分类对象分别输入至所述模型更新单元所更新出的新神经网络分类模型,以进行分类处理之前,判断所述新神经网络分类模型的深度是否达到预设深度阈值;
[0036] 所述第二分类单元具体用于当所述深度判断单元判断出所述新神经网络分类模型的深度未达到预设深度阈值时,将更新分类对象集中的各待分类对象分别输入至所述新神经网络分类模型,以进行分类处理。
[0037] 本发明的有益技术效果:
[0038] 本发明所提供的基于神经网络的文本分类方法和装置,在对原始分类对象集中的各待分类对象进行第一次的基于神经网络分类模型的分类处理后,将分类归属概率未达到预期值的待分类对象筛选出来以输入至新的神经网络分类模型中进行再次分类,相较于现有技术中的一次性通过神经网络分类模型对待分类对象进行分类,本发明利用多个神经网络分类模型对待分类对象集中的待分类对象进行分类处理,能够在保证整体分类正确率的前提下,进一步提高待分类对象个体的分类正确率,从而使分类效果更好。附图说明
[0039] 图1为本发明实施例提供的一种基于神经网络的文本分类方法的方法流程图
[0040] 图2为本发明实施例提供的另一种基于神经网络的文本分类方法的方法流程图;
[0041] 图3为本发明实施例提供的又一种基于神经网络的文本分类方法的方法流程图;
[0042] 图4为本发明实施例提供的再一种基于神经网络的文本分类方法的方法流程图;
[0043] 图5为本发明实施例提供的一种基于神经网络的文本分类装置的结构示意图;
[0044] 图6为本发明实施例提供的另一种基于神经网络的文本分类装置的结构示意图。

具体实施方式

[0045] 为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图来对本发明提供的基于神经网络的文本分类方法和装置进行详细描述。
[0046] 图1为本发明实施例提供的一种基于神经网络的文本分类方法的方法流程图,如图1所示,该方法包括:
[0047] 步骤S101、将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到原始分类对象集中的各待分类对象的分类结果。
[0048] 原始分类对象集是指由待分类对象构成的集合,优选的,待分类对象指的是待分类文本。
[0049] 需要说明的是,本实施例中,神经网络分类模型并非是特指,而是泛指,即是说,在步骤S101中可将各待分类对象输入至任意一个神经网络分类模型中,而不限定神经网络模型的各参数的具体值。
[0050] 所述分类结果包括分类归属概率,分类归属概率指的是一个待分类对象归属于某一类别的概率值,分类归属概率的值越大,则对应的待分类对象归属于相应类别的可能性越高,反之则越低。
[0051] 步骤S102、筛选出分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
[0052] 预设概率阈值由本领域技术人员根据实际需要设置,例如,可以设置为85%、90%等。
[0053] 步骤S103、更新神经网络分类模型,以得到新神经网络分类模型,该新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度。
[0054] 对神经网络分类模型的参数进行更新,本实施例不限定所更新神经网络分类模型的参数的种类,但至少要包括对神经网络分类模型的深度进行更新,且确保更新后的新神经网络分类模型的深度不等于更新前的神经网络模型的深度,这是因为,理论上,神经网络分类模型的深度越大,其分类的准确率越高,但在实际应用中,并非是所有的待分类对象在经过深度较大的神经网络分类模型进行分类后都能得到较高的分类归属概率,经研究,有些待分类对象适用于较低深度的神经网络分类模型,而有些待分类对象适用于较高深度的神经网络分类模型。因此,在步骤S103中,通过更新神经网络分类模型而使新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度,能够对更新分类对象集基于新神经网络分类模型进行新的分类处理,从而能够在一定程度上提高更新分类对象集中待分类对象个体的分类正确率。
[0055] 需要说明的是,本实施例中,步骤S103与步骤S102可同步执行也可顺序执行,并且,可先执行步骤S103,也可先执行步骤S102,图1仅示出了本发明实施例的一种实施方式,但并不能对本发明起限定作用。
[0056] 步骤S104、将更新分类对象集中的各待分类对象分别输入至新神经网络分类模型,以进行分类处理,得到该更新待分类对象集中的各待分类对象的分类结果。
[0057] 本发明实施例所提供的基于神经网络的文本分类方法,在对原始分类对象集中的各待分类对象进行第一次的基于神经网络分类模型的分类处理后,将分类归属概率未达到预期值的待分类对象筛选出来以输入至新的神经网络分类模型中进行再次分类,相较于现有技术中的一次性通过神经网络分类模型对待分类对象进行分类,本发明利用多个神经网络分类模型对待分类对象集中的待分类对象进行多次分类处理,能够在保证整体分类正确率的前提下,进一步提高待分类对象个体的分类正确率,从而使分类效果更好。
[0058] 图2为本发明实施例提供的另一种基于神经网络的文本分类方法的方法流程图,如图2所示,在一些实施例中,在步骤S101和步骤S102之间,还包括:
[0059] 步骤S101a、统计分类归属概率小于预设概率阈值的待分类对象的数量与原始分类对象集中的待分类对象的数量的占比。
[0060] 步骤S101b、判断步骤S101a中所统计的占比是否小于或等于预设占比阈值。
[0061] 在步骤S101b中,当判断出步骤S101a中所统计的占比大于预设占比阈值时,则继续执行步骤S102;而当判断出该占比小于预设占比阈值时,则结束方法流程。
[0062] 本实施例提供了一种图1所示方法的应用场景的判断方法,即通过在步骤S101与S102之间执行步骤S101a和步骤S101b,以判断出原始分类对象集在经过第一次分类处理后,分类正确率是否已达到预期值,若判断出未达到,则执行后续步骤S102以进入图1所示的方法应用场景中,若判断出已达到,则结束整个流程。
[0063] 图3为本发明实施例提供的又一种基于神经网络的文本分类方法的方法流程图,如图3所示,在一些实施例中,在步骤S104之后还包括:
[0064] 步骤S105、统计分类归属概率小于预设概率阈值的待分类对象的数量与原始分类对象集中的待分类对象的数量的占比。
[0065] 步骤S106、判断步骤S105中所统计的占比是否小于或等于预设占比阈值。
[0066] 在步骤S106中,当判断出步骤S105中所统计的占比大于预设占比阈值时,则继续执行步骤S102;而当判断出该占比小于预设占比阈值时,则结束方法流程。
[0067] 本实施例中的步骤S105与步骤S106分别与图2所示方法中的步骤S101a和步骤S101b对应,此处不再赘述。
[0068] 本实施例通过在步骤S104之后,统计分类归属概率小于预设概率阈值的待分类对象的数量与原始分类对象集中的待分类对象的数量的占比,并判断占比是否超过预设占比阈值,能够使整个原始类对象集的分类处理进入多次循环过程,即只要判断出分类归属概率小于预设概率阈值的待分类对象的占比未达到要求,则继续筛选出该部分未达到要求的待分类对象,并同时更新神经网络分类模型,以基于新的神经网络分类模型对未达要求的待分类对象进行新一轮的分类处理,从而能够使最终得到分类结果中,待分类对象个体的分类准确率更高,进而提高整体的分类效果。
[0069] 图4为本发明实施例提供的再一种基于神经网络的文本分类方法的方法流程图,如图4所示,在一些实施例中,在步骤S103和步骤S104之间,还包括:
[0070] 步骤S103a、判断新神经网络分类模型的深度是否达到预设深度阈值。
[0071] 在步骤S103a中,当判断出新神经网络分类模型的深度达到预设深度阈值时,结束方法流程;当判断出新神经网络分类模型的深度未达到预设深度阈值时,则执行步骤S104。
[0072] 与步骤S103a对应的,本实施例中,在经过步骤S103后得到的新神经网络分类模型的深度大于更新前的神经网络分类模型的深度,即是说,本实施例中,在步骤S103中,在对神经网络分类模型进行更新时,神经网络分类模型的深度呈递增趋势。
[0073] 在实际应用中,当神经网络分类模型的深度越高时,相应的计算量越高,本实施例通过设置步骤S103a,能够对神经网络分类模型的深度进行上限值的限定,从而限制整个方法流程的计算量不会过高,进而确保整个分类处理流程顺利进行。
[0074] 在一些实施例中,步骤S103a还可以通过判断新神经网络分类模型的深度的递增值是否超过预设值实现。
[0075] 图5为本发明实施例提供的一种基于神经网络的文本分类装置的结构示意图,如图5所示,该装置包括:第一分类单元11、筛选单元12、模型更新单元13以及第二分类单元14。
[0076] 其中,第一分类单元11用于将原始分类对象集中的各待分类对象分别输入至神经网络分类模型,以进行分类处理,得到原始分类对象集中的各待分类对象的分类结果,所述分类结果包括分类归属概率;筛选单元12用于基于第一分类单元11所得到的各待分类对象的分类结果,筛选出分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集;模型更新单元13用于更新神经网络分类模型,以得到新神经网络分类模型,所述新神经网络分类模型的深度不等于更新前的神经网络分类模型的深度;第二分类单元14用于将筛选单元12所筛选出的更新分类对象集中的各待分类对象分别输入至模型更新单元13所更新出的新神经网络分类模型,以进行分类处理,得到所述更新待分类对象集中的各待分类对象的分类结果。
[0077] 本实施例所提供的基于神经网络的文本分类装置用于实现图1所示的基于神经网络的文本分类方法,具体本实施例中该装置所具有的功能模和各功能模块之间的交互过程,请参见图1所示方法的对应步骤的介绍,本实施例不再赘述。
[0078] 本发明实施例所提供的基于神经网络的文本分类装置,在对原始分类对象集中的各待分类对象进行第一次的基于神经网络分类模型的分类处理后,将分类归属概率未达到预期值的待分类对象筛选出来以输入至新的神经网络分类模型中进行再次分类,相较于现有技术中的一次性通过神经网络分类模型对待分类对象进行分类,本发明利用多个神经网络分类模型对待分类对象集中的待分类对象进行分类处理,能够在保证整体分类正确率的前提下,进一步提高待分类对象个体的分类正确率,从而使分类效果更好。
[0079] 图6为本发明另一些实施例所提供的基于神经网络的文本分类装置的结构示意图。
[0080] 如图6所示,在一些实施例中,该装置还包括:第一统计单元15和第一判断单元16;该第一统计单元15用于在筛选单元12基于所述第一分类单元11所得到的各待分类对象的分类结果,筛选出所述分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集之前,统计分类归属概率小于预设概率阈值的待分类对象的数量与原始分类对象集中的待分类对象的数量的占比;第一判断单元16用于判断第一统计单元15所统计出的占比是否小于或等于预设占比阈值。
[0081] 本实施例中,筛选单元12具体用于当第一判断单元16判断出所述占比大于预设占比阈值时,筛选出分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
[0082] 继续参见图6,在一些实施例中,所述装置还包括:第二统计单元17和第二判断单元18。
[0083] 其中,第二统计单元17用于在第二分类单元14将筛选单元12所筛选出的更新分类对象集中的各待分类对象分别输入至模型更新单元13所更新出的新神经网络分类模型以进行分类处理之后,统计分类归属概率小于预设概率阈值的待分类对象的数量与原始分类对象集中的待分类对象的数量的占比;第二判断单元18用于判断第二统计单元17所统计出的所述占比是否小于或等于预设占比阈值。
[0084] 本实施例中,筛选单元12具体用于当第二判断单元18判断出所述占比大于预设占比阈值时,基于第二分类单元14所得到的各待分类对象的分类结果,筛选出分类归属概率小于预设概率阈值的待分类对象,以构成更新分类对象集。
[0085] 继续参见图6,在一些实施例中,该装置还包括:深度判断单元19。
[0086] 本实施例中,模型更新单元13所更新出的新神经网络分类模型的深度大于更新前的神经网络分类模型的深度,即是说,本实施例中,模型更新单元13在对神经网络分类模型进行更新时,神经网络分类模型的深度呈递增趋势。
[0087] 深度判断单元19用于在模型更新单元13更新神经网络分类模型以得到新神经网络分类模型之后,且在第二分类单元14将筛选单元12所筛选出的更新分类对象集中的各待分类对象分别输入至模型更新单元13所更新出的新神经网络分类模型以进行分类处理之前,判断新神经网络分类模型的深度是否达到预设深度阈值。
[0088] 本实施例中,第二分类单元14具体用于当深度判断单元19判断出新神经网络分类模型的深度未达到预设深度阈值时,将更新分类对象集中的各待分类对象分别输入至新神经网络分类模型,以进行分类处理,而当判断出新神经网络分类模型的深度达到预设深度阈值时,则结束方法流程。
[0089] 图6所示的基于神经网络的文本分类装置用于实现本发明图2至图4所示的基于神经网络的文本分类方法,具体该装置所具有的各模块的功能以及各功能模块之间的交互过程,请参见图2至图4所示方法的对应步骤的介绍,本实施例不再赘述。
[0090] 可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈