首页 / 专利库 / 人工智能 / 人工智能 / 自然语言处理 / 共指消解 / 基于共指消解的科技服务资源分类体系构建方法及装置

基于共指消解的科技服务资源分类体系构建方法及装置

阅读:879发布:2020-05-08

专利汇可以提供基于共指消解的科技服务资源分类体系构建方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 共指消解 的科技服务资源分类体系构建方法及装置,其中,方法包括以下步骤:采集至少一个分类体系;对至少一个分类体系中不满足第一预设条件的类目进行预处理;根据共指消解规则整合预处理后的至少一个分类体系,并根据整合后的至少一个分类体系构建最终分类体系。该方法应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。,下面是基于共指消解的科技服务资源分类体系构建方法及装置专利的具体信息内容。

1.一种基于共指消解的科技服务资源分类体系构建方法,其特征在于,包括以下步骤:
采集至少一个分类体系;
对所述至少一个分类体系中不满足第一预设条件的类目进行预处理;以及根据共指消解规则整合预处理后的至少一个分类体系,并根据整合后的至少一个分类体系构建最终分类体系。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少一个分类体系中不满足第一预设条件的类目进行预处理,包括:
去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
3.根据权利要求1所述的方法,其特征在于,所述根据共指消解规则整合预处理后的至少一个分类体系,包括:
采用人工方式对至少一个分类体系进行整合。
4.根据权利要求1所述的方法,其特征在于,所述根据整合后的至少一个分类体系构建最终分类体系,包括:
将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成所述最终分类体系。
5.根据权利要求4所述的方法,其特征在于,所述第二预设条件为类目最细。
6.一种基于共指消解的科技服务资源分类体系构建装置,其特征在于,包括:
分类体系调研模,用于采集至少一个分类体系;
预处理模块,用于对所述至少一个分类体系中不满足第一预设条件的类目进行预处理;
整合模块,用于根据共指消解规则整合预处理后的至少一个分类体系;
分类体系构建模块,用于根据整合后的至少一个分类体系构建最终分类体系。
7.根据权利要求6所述的装置,其特征在于,所述预处理模块进一步用于去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
8.根据权利要求6所述的装置,其特征在于,所述整合模块进一步用于采用人工方式对至少一个分类体系进行整合。
9.根据权利要求6所述的装置,其特征在于,所述分类体系构建模块进一步用于将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成所述最终分类体系。
10.根据权利要求9所述的方法,其特征在于,所述第二预设条件为类目最细。

说明书全文

基于共指消解的科技服务资源分类体系构建方法及装置

技术领域

[0001] 本发明涉及科技服务资源分类体系构建技术领域,特别涉及一种基于共指消解的科技服务资源分类体系构建方法及装置。

背景技术

[0002] 当前对于科技服务资源分类体系的构建并没有一个统一的方法,而科技服务资源种类繁多、各大科技服平台分类异构明显的问题给科技服务资源的共享带来了巨大的阻碍。目前已有的分类体系构建方法主要有以下几点:
[0003] 1、文本的分类体系构建
[0004] 由于文本本身包含一定的信息量,故当前对于文本的分类体系构建在于对文本进行预处理以及一定的自然语言处理后,得到该文本的主题,最后根据主题进行聚类等方法将文本进行分类。
[0005] 2、非文本的分类体系构建
[0006] 非文本类型的数据由于包含的信息量不够,故不能采用上述方法进行分类。目前其使用的方法可以分为两类:类目具有一定分类特征:有的类目本身具有一定的分类特征,例如知识图谱中包含的实体结点和关系结点就可以作为分类体系构建的依据,这些类目的分类体系能利用自身特征来构建。其他类目:对于没有明显分类特征的类目,可以进行特征提取和聚类分析,然后根据聚类结果构建分类体系,也可以采用计算相似度的方法进行迭代,将相似的类目划分到一起,直至迭代结束。
[0007] 如上所述,目前已有的分类体系构建方法主要有:1)利用文本进行主题提取,然后根据主题构建分类体系;2)利用类目本身具有的分类特征进行分类体系的构建;3)进行特征提取或者相似度计算,划分相似度接近的或者特征类似的类目在一起,并进行迭代。
[0008] 然而,方法1对于科技服务资源不适用,因为科技服务资源不属于文本类型;方法2也不适用于科技服务资源分类体系的构建,因为科技服务资源没有明显的分类特征;方法3能够适用于科技服务资源分类体系的构建,但是有两个缺点:第一,由于目前科技服务资源自身的界定就不够清晰,故使用该方法构建出的分类体系科学性不强;第二,由于科技服务资源具有种类繁多、各大科技服资源平台分类异构明显的特征,利用该方法构建的分类体系会出现共指问题,完善性不足。

发明内容

[0009] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0010] 为此,本发明的一个目的在于提出一种基于共指消解的科技服务资源分类体系构建方法,该方法应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0011] 本发明的另一个目的在于提出一种基于共指消解的科技服务资源分类体系构建装置。
[0012] 为达到上述目的,本发明一方面实施例提出了一种基于共指消解的科技服务资源分类体系构建方法,包括以下步骤:采集至少一个分类体系;对所述至少一个分类体系中不满足第一预设条件的类目进行预处理;根据共指消解规则整合预处理后的至少一个分类体系,并根据整合后的至少一个分类体系构建最终分类体系。
[0013] 本发明实施例的基于共指消解的科技服务资源分类体系构建方法,通过综合各大平台分类体系,解决现有技术构建的分类体系科学性不强的问题,通过引入NLP中的共指消解思想,解决现有技术构建的分类体系中类目重叠的问题,从而应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0014] 另外,根据本发明上述实施例的基于共指消解的科技服务资源分类体系构建方法还可以具有以下附加的技术特征:
[0015] 进一步地,在本发明的一个实施例中,所述对所述至少一个分类体系中不满足第一预设条件的类目进行预处理,包括:去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
[0016] 进一步地,在本发明的一个实施例中,所述根据共指消解规则整合预处理后的至少一个分类体系,包括:采用人工方式对至少一个分类体系进行整合。
[0017] 进一步地,在本发明的一个实施例中,所述根据整合后的至少一个分类体系构建最终分类体系,包括:将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成所述最终分类体系。
[0018] 进一步地,在本发明的一个实施例中,所述第二预设条件为类目最细。
[0019] 为达到上述目的,本发明另一方面实施例提出了一种基于共指消解的科技服务资源分类体系构建装置,包括:分类体系调研模,用于采集至少一个分类体系;预处理模块,用于对所述至少一个分类体系中不满足第一预设条件的类目进行预处理;整合模块,用于根据共指消解规则整合预处理后的至少一个分类体系;分类体系构建模块,用于根据整合后的至少一个分类体系构建最终分类体系。
[0020] 本发明实施例的基于共指消解的科技服务资源分类体系构建装置,通过综合各大平台分类体系,解决现有技术构建的分类体系科学性不强的问题,通过引入NLP中的共指消解思想,解决现有技术构建的分类体系中类目重叠的问题,从而应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0021] 另外,根据本发明上述实施例的基于共指消解的科技服务资源分类体系构建装置还可以具有以下附加的技术特征:
[0022] 进一步地,在本发明的一个实施例中,所述预处理模块进一步用于去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
[0023] 进一步地,在本发明的一个实施例中,所述整合模块进一步用于采用人工方式对至少一个分类体系进行整合。
[0024] 进一步地,在本发明的一个实施例中,所述分类体系构建模块进一步用于将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成所述最终分类体系。
[0025] 进一步地,在本发明的一个实施例中,所述第二预设条件可以为类目最细。
[0026] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明
[0027] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0028] 图1为根据本发明实施例的基于共指消解的科技服务资源分类体系构建方法的流程图
[0029] 图2为根据本发明一个实施例的基于共指消解的科技服务资源分类体系构建方法的流程图;
[0030] 图3为根据本发明实施例的基于共指消解的科技服务资源分类体系构建装置的结构示意图。

具体实施方式

[0031] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0032] 当前科技服务资源种类繁多、各大科技服务资源平台分类异构明显,没有一种有效的分类体系构建方法,对于科技资源的共享造成了严重的负面作用,为了能够达到科技资源共享的目的,必须采用一种有效的科技服务资源分类体系构建方法。
[0033] 共指消解是自然语言处理、机器翻译、信息抽取信息检索等领域的关键技术之一,在自然语言中起超链接的作用。人们为了避免重复,习惯用代词、称谓和缩略语来指代前面提到的实体全称。例如,在文章开始处会写“哈尔滨工业大学”,后面可能会说“哈工大”、“工大”等,还会提到“这所大学”、“她”等,这种现象称为共指现象。共指消解就是将现实世界中同一实体的不同描述合并到一起的过程。在分类体系的构建过程中,由于各大平台没有统一约定,很容易出现对于同一科技服务资源的不同称呼,这成为了科技资源共享的主要障碍之一,利用共指消解的思想,本发明实施例旨在整合各大平台的分类体系优点,消除平台整合过程中出现的共指现象,构建完善的分类体系。
[0034] 下面参照附图描述根据本发明实施例提出的基于共指消解的科技服务资源分类体系构建方法及装置,首先将参照附图描述根据本发明实施例提出的基于共指消解的科技服务资源分类体系构建方法。
[0035] 图1是本发明一个实施例的基于共指消解的科技服务资源分类体系构建方法的流程图。
[0036] 如图1所示,该基于共指消解的科技服务资源分类体系构建方法包括以下步骤:
[0037] 在步骤S101中,采集至少一个分类体系。
[0038] 可以理解的是,如图2所示,本发明实施例首先进行分类体系的调研,搜集分析科技服务平台网络分类体系,而调研网站质量决定了最终构建的分类体系的上限。
[0039] 具体而言,目前国家和地方都在大支持科技服务资源的共享,也有大量的科技服务网站与平台,包括很多国家级的、地方级的,还有企业创办的平台,当然还有很多专服务于某一领域的科技服务平台,例如精于提供“检验检测”服务的牵翼网等等,都是本发明实施例能够选取的。而平台选取的数量需要尽可能的多,才能保证分类体系的科学性。有了平台之后就是深入研究每一个平台的分类体系,找到各家平台的特色。
[0040] 在步骤S102中,对至少一个分类体系中不满足第一预设条件的类目进行预处理。
[0041] 可以理解的是,如图2所示,本发明实施例通过预处理去除体系中合理的类目。其中,第一预设条件可以设置为分类体系类目不重叠、且包含关系相符。因此,不满足第一预设条件可以理解为:如果一些分类体系总存在类目重叠,包含关系不符的情况,则可以确定类目重叠、且包含关系不符的类目不满足第一预设条件,从而需要对不满足第一预设条件的类目进行预处理。
[0042] 进一步地,在本发明的一个实施例中,对至少一个分类体系中不满足第一预设条件的类目进行预处理,包括:去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
[0043] 可以理解的是,由于平台的数量较多,难免会遇到一些分类体系总存在类目重叠,包含关系不符的情况,因此,需要对每个平台的分类体系做预处理,以去除其中不合理的类目,合并重叠项以及挪动非包含关系类目等,以保证得到的每个子分类体系都是科学合理的,进而可以有效提高构建分类体系的科学性和专业性。
[0044] 在步骤S103中,根据共指消解规则整合预处理后的至少一个分类体系,并根据整合后的至少一个分类体系构建最终分类体系。
[0045] 可以理解的是,如图2所示,本发明实施例利用共指消解的思想,整合不同体系,从而完成整合,形成科学的分类体系。
[0046] 进一步地,在本发明的一个实施例中,根据共指消解规则整合预处理后的至少一个分类体系,包括:采用人工方式对至少一个分类体系进行整合。
[0047] 可以理解的是,在当前各大科技服平台分类异构明显的情况下,采用共指消解的思想能够很好的整合各大平台分类体系,从而能够消除类目重叠。
[0048] 具体而言,由于本发明实施例的数据量不会特别大,所以可以采用人工的方式进行整合,因为现在的共指消解算法都达不到100%的准确率,而在数据量可以接受的情况下,人工则能完全的保证该方法的正确性。例如,在重庆科技资源共享平台中有“科技人才”的服务资源,但在上海科技创新平台中称为“专家人才”,而在南京科技资源共享服务平台中叫做“服务人才”,还有“科技专家”和“人才服务”等不同的称呼,但其实它们表示的都是同一个资源。本发明实施例要做的就是把这种现象消除,用一个常用的名称来代替不同平台下不同的称呼。
[0049] 进一步地,在本发明的一个实施例中,根据整合后的至少一个分类体系构建最终分类体系,包括:将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成最终分类体系,其中,第二预设条件可以为类目最细。
[0050] 可以理解的是,本发明实施例通过共指消解的思想对各子分类体系进行了简化与整合,得到了很多小的类目,然后将这些类目形成一个科学完整的分类体系。
[0051] 具体而言,本发明实施例采用聚类的方法,将相似的类目聚到同一类目之下,然后在二级类目之下还可以进行聚类,直至无法分出更细的类目为止,最终将得到一个较为科学标准的分类体系。
[0052] 综上,本发明实施例的方法具有如下优点:
[0053] (1)现有的技术在构建科技服务资源分类体系时,由于当前并没有标准的科技服务资源的界定,会出现分类方法科学性不强的缺陷;而本发明实施例中综合了大量不同平台的分类体系,得到的结果具有一定的科学性,构建的分类体系也更加科学和专业。
[0054] (2)由于科技服务资源具有种类繁多、各大科技服资源平台分类异构明显的现状,现有的技术在应用于科技服务资源分类体系的构建时,无法消除不同平台间资源名称的共指问题,很容易导致分类重叠的现象,而本发明实施例通过引入NLP中共指消解的思想,可以有效解决这个问题,从而使得构建出的分类体系也更加完善和标准。
[0055] 根据本发明实施例提出的基于共指消解的科技服务资源分类体系构建方法,通过综合各大平台分类体系,解决现有技术构建的分类体系科学性不强的问题,通过引入NLP中的共指消解思想,解决现有技术构建的分类体系中类目重叠的问题,从而应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0056] 其次参照附图描述根据本发明实施例提出的基于共指消解的科技服务资源分类体系构建装置。
[0057] 图3是本发明一个实施例的基于共指消解的科技服务资源分类体系构建装置的结构示意图。
[0058] 如图3所示,该基于共指消解的科技服务资源分类体系构建装置10包括:分类体系调研模块100、预处理模块200、整合模块300和分类体系构建模块400。
[0059] 其中,分类体系调研模块100用于采集至少一个分类体系;预处理模块200用于对至少一个分类体系中不满足第一预设条件的类目进行预处理;整合模块300用于根据共指消解规则整合预处理后的至少一个分类体系;分类体系构建模块400用于根据整合后的至少一个分类体系构建最终分类体系。本发明实施例的装置10应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0060] 进一步地,在本发明的一个实施例中,预处理模块200进一步用于去除不合理的类目,并合并重叠的类目,及挪动非包含关系的类目。
[0061] 进一步地,在本发明的一个实施例中,整合模块300进一步用于采用人工方式对至少一个分类体系进行整合。
[0062] 进一步地,在本发明的一个实施例中,分类体系构建模块400进一步用于将相似度大于预设值的类目聚到同一类目之下,直至达到第二预设条件,生成最终分类体系。
[0063] 进一步地,在本发明的一个实施例中,第二预设条件可以为类目最细。
[0064] 需要说明的是,前述对基于共指消解的科技服务资源分类体系构建方法实施例的解释说明也适用于该实施例的基于共指消解的科技服务资源分类体系构建装置,此处不再赘述。
[0065] 根据本发明实施例提出的基于共指消解的科技服务资源分类体系构建装置,通过综合各大平台分类体系,解决现有技术构建的分类体系科学性不强的问题,通过引入NLP中的共指消解思想,解决现有技术构建的分类体系中类目重叠的问题,从而应用共指消解思想来构建科技服务资源分类体系,整合了各大平台的优点,构建的分类体系也更加科学和专业、也更加完善和标准。
[0066] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0067] 在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
[0068] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0069] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈