首页 / 专利库 / 人工智能 / 机器学习 / 人工神经网络 / 递归神经网络 / 一种基于大数据的产业链分析系统及方法

一种基于大数据的产业链分析系统及方法

阅读:445发布:2020-05-08

专利汇可以提供一种基于大数据的产业链分析系统及方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于 大数据 的产业链分析系统及方法,采用机器 深度学习 对关联企业进行分类,得到与产业高度关联的企业数据,降低人工分析的不准确性,并基于大数据分析获得优化配置的产业创新资源,提高产业创新资源的利用率,创新资源与企业的配套合作,促进产业技术创新能 力 的提高。,下面是一种基于大数据的产业链分析系统及方法专利的具体信息内容。

1.一种基于大数据的产业链分析系统,包括相互数据连通的产业链数据获取模、产业链数据清洗模块、数据人工筛查模块、机器深度学习模型建立模块、产业链数据分类模块、创新资源数据汇总模块;
所述产业链数据获取模块从公开渠道获得初级已知产业链数据和初级未知产业链数据并将获得的初级已知产业链数据和初级未知产业链数据发送至产业链数据清洗模块;
所述产业链数据清洗模块依据清洗原则对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据,并将获得的高级已知产业链数据发送至数据人工筛查模块、机器深度学习模型建立模块,将获得的高级未知产业链数据发送至产业链数据分类模块;
所述数据人工筛查模块,通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成人为逻辑目标结果并将人为逻辑目标结果发送至机器深度学习模型建立模块;
所述机器深度学习模型建立模块以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类直至所得结果与对照组的相对误差小于预设误差阈值为止,得到符合人为逻辑的机器深度学习分类依据模型,并将所得机器深度学习分类依据模型发送至产业链数据分类模块;
所述产业链数据分类模块利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图、产业链各节点企业列表的产业链分类结果并将产业链分类结果发送至创新资源数据汇总模块;
所述创新资源数据汇总模块根据产业链分类结果获取并汇总对应产业链的创新资源数据并形成包括企业空间分布图、企业热图及创新资源空间分布图的产业地图。
2.如权利要求1所述的系统,其特征在于,所述初级已知产业链数据包括现有产业领域及链条位置的企业基本信息、相关新闻报道、技术标准、专利数据、产品数据;所述初级未知产业链数据包括需要进行产业领域和链条位置划分的产业动态、产业领域、企业名称、企业业务范围、相关新闻报道、技术标准、专利数据、产品数据。
3.如权利要求1所述的系统,其特征在于,所述清洗原则包括数据生成时间节点、数据有效性判断、数据完整性判断。
4.如权利要求1所述的系统,其特征在于,所述人为逻辑目标结果包括人为分类依据及小范围多度数据的分类结果。
5.如权利要求1所述的系统,其特征在于,所述创新资源数据包括对应产业链的高校、科研院所、创业孵化载体、科技服务机构、创新平台数据。
6.如权利要求1所述的系统,其特征在于,所述产业链图包括总产业链图、细分产业链图和关联企业信息;所述总产业链图为依据产业链分类结果的一级整体链图;所述细分产业链图为总产业链图下的二级和/或多级细分产业链图;所述关联企业信息为依据细分产业链图内细分产业链环节下的相关企业信息,包括企业名称、企业简介、企业地址、企业重大事件。
7.一种基于大数据的产业链分析方法,包括以下步骤:
S1、从公开渠道获得初级已知产业链数据和初级未知产业链数据;
S2、依据清洗原则对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据;
S3、通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成人为逻辑目标结果;
S4、以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类,得到符合人为逻辑的机器深度学习分类依据模型;
S5、利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图、产业链各节点企业列表的产业链分类结果;
S6、获取并汇总对应产业链的创新资源数据并形成包括企业空间分布图、企业热力图及创新资源空间分布图的产业地图。
8.如权利要求7所述的方法,其特征在于,所述初级已知产业链数据包括现有产业领域及链条位置的企业基本信息、相关新闻报道、技术标准、专利数据、产品数据;所述初级未知产业链数据包括需要进行产业领域和链条位置划分的产业动态、产业领域、企业名称、企业业务范围、相关新闻报道、技术标准、专利数据、产品数据。
9.如权利要求7所述的方法,其特征在于,所述步骤S2中的数据清洗操作包括去除无效、过期数据和/或对不完整数据进行补充。
10.如权利要求7所述的方法,其特征在于,所述步骤S4包括以下分步骤:
S41、数据准备,将人为逻辑目标结果作为对照组用以评测分类依据模型的分类能力,将高级已知产业链数据作为训练组用以训练分类依据模型;
S42、模型类型选择,根据分析需求、用户指定选择一种模型类型进行训练,或选择多种模型类型分别进行训练;所述模型类型包括深度信念网络卷积神经网络递归神经网络
S43、模型训练,依据分步骤S42所选择的模型类型对分步骤S41确定的训练组数据进行训练得到训练结果,所述训练包括对训练组数据的若干次分类操作;
S44、模型评估,依据分步骤S41所选择的对照组对分步骤S43得到的训练结果进行评估得到优选模型,所述评估包括判断训练结果与对照组的相对误差是否小于预设误差阈值;
S45、人工调整,针对分步骤S44得到的优选模型进行人工参数微调,得到符合人为逻辑的机器深度学习分类依据模型。

说明书全文

一种基于大数据的产业链分析系统及方法

技术领域

[0001] 本发明涉及产业分析技术领域,尤其涉及一种基于大数据的产业链分析系统及方法。

背景技术

[0002] 随着生产技术的发展,生产规模的逐步扩大,现有生产过程越来越倾向于一系列互相关联的生产环节的组合,即产业链。根据产业链的定义,产业链是根据特定的逻辑联系和时空布局形成的上下关联的动态的链式结构。对于绝大部分企业来说,均处在某一个或某几个产业链中充当一定色并与产业链中的其他企业形成链式关系,企业的发展越发依赖于产业链整体的发展。因此,对于产业链的有效、合理分析成为了产业链建设以及促进产业链内所有参与者共同发展的关键步骤。现有的产业链分析,针对的是企业群体的上下联动的链式组织关系分析,通过人工分析产业链的上下游关系及企业之间的关系,但是不能准确分析企业与相关产业的关联度高低,以及每个产业链节点下企业的配套创新资源,导致在产业链补强环节中无法针对性的招商,对创新资源不合理的配置导致资源浪费,利用率低。因此,为提高产业招商的准确性和创新资源的利用率,急需一种全新的产业链分析系统及方法。

发明内容

[0003] 为解决现有技术的不足,本发明提出一种基于大数据的产业链分析系统及方法,采用机器深度学习对关联企业进行分类,得到与产业高度关联的企业数据,降低人工分析的不准确性,并基于大数据分析获得优化配置的产业创新资源,提高产业创新资源的利用率,创新资源与企业的配套合作,促进产业技术创新能的提高。
[0004] 为实现以上目的,本发明所采用的技术方案包括:
[0005] 一种基于大数据的产业链分析系统,包括相互数据连通的产业链数据获取模、产业链数据清洗模块、数据人工筛查模块、机器深度学习模型建立模块、产业链数据分类模块、创新资源数据汇总模块;
[0006] 所述产业链数据获取模块从公开渠道获得初级已知产业链数据和初级未知产业链数据并将获得的初级已知产业链数据和初级未知产业链数据发送至产业链数据清洗模块;
[0007] 所述产业链数据清洗模块依据清洗原则对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据,并将获得的高级已知产业链数据发送至数据人工筛查模块、机器深度学习模型建立模块,将获得的高级未知产业链数据发送至产业链数据分类模块;
[0008] 所述数据人工筛查模块,通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成人为逻辑目标结果并将人为逻辑目标结果发送至机器深度学习模型建立模块;
[0009] 所述机器深度学习模型建立模块以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类直至所得结果与对照组的相对误差小于预设误差阈值为止,得到符合人为逻辑的机器深度学习分类依据模型,并将所得机器深度学习分类依据模型发送至产业链数据分类模块;
[0010] 所述产业链数据分类模块利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图、产业链各节点企业列表的产业链分类结果并将产业链分类结果发送至创新资源数据汇总模块;
[0011] 所述创新资源数据汇总模块根据产业链分类结果获取并汇总对应产业链的创新资源数据并形成包括企业空间分布图、企业热力图及创新资源空间分布图的产业地图。
[0012] 进一步地,所述初级已知产业链数据包括现有产业领域及链条位置的企业基本信息、相关新闻报道、技术标准、专利数据、产品数据;所述初级未知产业链数据包括需要进行产业领域和链条位置划分的产业动态、产业领域、企业名称、企业业务范围、相关新闻报道、技术标准、专利数据、产品数据。
[0013] 进一步地,所述清洗原则包括数据生成时间节点、数据有效性判断、数据完整性判断。
[0014] 进一步地,所述人为逻辑目标结果包括人为分类依据及小范围多角度数据的分类结果。
[0015] 进一步地,所述创新资源数据包括对应产业链的高校、科研院所、创业孵化载体、科技服务机构、创新平台数据。
[0016] 进一步地,所述产业链图包括总产业链图、细分产业链图和关联企业信息;所述总产业链图为依据产业链分类结果的一级整体链图;所述细分产业链图为总产业链图下的二级和/或多级细分产业链图;所述关联企业信息为依据细分产业链图内细分产业链环节下的相关企业信息,包括企业名称、企业简介、企业地址、企业重大事件。
[0017] 一种基于大数据的产业链分析方法,包括以下步骤:
[0018] S1、从公开渠道获得初级已知产业链数据和初级未知产业链数据;
[0019] S2、依据清洗原则对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据;
[0020] S3、通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成人为逻辑目标结果;
[0021] S4、以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类,得到符合人为逻辑的机器深度学习分类依据模型;
[0022] S5、利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图、产业链各节点企业列表的产业链分类结果;
[0023] S6、获取并汇总对应产业链的创新资源数据并形成包括企业空间分布图、企业热力图及创新资源空间分布图的产业地图。
[0024] 进一步地,所述初级已知产业链数据包括现有产业领域及链条位置的企业基本信息、相关新闻报道、技术标准、专利数据、产品数据;所述初级未知产业链数据包括需要进行产业领域和链条位置划分的产业动态、产业领域、企业名称、企业业务范围、相关新闻报道、技术标准、专利数据、产品数据。
[0025] 进一步地,所述步骤S2中的数据清洗操作包括去除无效、过期数据和/或对不完整数据进行补充。
[0026] 进一步地,所述步骤S4包括以下分步骤:
[0027] S41、数据准备,将人为逻辑目标结果作为对照组用以评测分类依据模型的分类能力,将高级已知产业链数据作为训练组用以训练分类依据模型;
[0028] S42、模型类型选择,根据分析需求、用户指定选择一种模型类型进行训练,或选择多种模型类型分别进行训练;所述模型类型包括深度信念网络卷积神经网络递归神经网络
[0029] S43、模型训练,依据分步骤S42所选择的模型类型对分步骤S41确定的训练组数据进行训练得到训练结果,所述训练包括对训练组数据的若干次分类操作;
[0030] S44、模型评估,依据分步骤S41所选择的对照组对分步骤S43得到的训练结果进行评估得到优选模型,所述评估包括判断训练结果与对照组的相对误差是否小于预设误差阈值;
[0031] S45、人工调整,针对分步骤S44得到的优选模型进行人工参数微调,得到符合人为逻辑的机器深度学习分类依据模型。
[0032] 本发明的有益效果为:
[0033] 采用本发明所述基于大数据的产业链分析系统及方法对产业链数据进行归类分析,与传统高度依赖人工的产业链分析方法相比创新性的采用机器深度学习对关联企业进行分类,得到与产业高度关联的企业数据,降低人工分析的不准确性,为精准招商提供有效参考;同时基于大数据分析,能够进一步获得优化配置的产业创新资源,提高了产业创新资源的利用率,创新资源与企业的配套合作,促进产业技术创新能力的提高;灵活利用分析结果输出空间分布图、产业链图,能够展示产业链资源集聚度,帮助用户更加直观了解产业链内整体情况。附图说明
[0034] 图1为本发明的基于大数据的产业链分析系统结构示意图。
[0035] 图2为本发明基于大数据的产业链分析方法流程示意图。

具体实施方式

[0036] 为了更清楚的理解本发明的内容,将结合附图和实施例详细说明。
[0037] 如图1所示为本发明的基于大数据的产业链分析系统结构示意图,包括相互数据连通的产业链数据获取模块、产业链数据清洗模块、数据人工筛查模块、机器深度学习模型建立模块、产业链数据分类模块、创新资源数据汇总模块;其中所述产业链数据获取模块从公开渠道获得初级已知产业链数据(包括现有产业领域及链条位置的企业基本信息、相关新闻报道、技术标准、专利数据、产品数据)和初级未知产业链数据(包括需要进行产业领域和链条位置划分的产业动态、产业领域、企业名称、企业业务范围、相关新闻报道、技术标准、专利数据、产品数据)并将获得的初级已知产业链数据和初级未知产业链数据发送至产业链数据清洗模块;所述产业链数据清洗模块依据清洗原则(包括数据生成时间节点、数据有效性判断、数据完整性判断)对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据,并将获得的高级已知产业链数据发送至数据人工筛查模块、机器深度学习模型建立模块,将获得的高级未知产业链数据发送至产业链数据分类模块;所述数据人工筛查模块,通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成包括人为分类依据及小范围多角度数据分类结果的人为逻辑目标结果并将人为逻辑目标结果发送至机器深度学习模型建立模块;所述机器深度学习模型建立模块以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类直至所得结果与对照组的相对误差小于预设误差阈值为止,得到符合人为逻辑的机器深度学习分类依据模型,并将所得机器深度学习分类依据模型发送至产业链数据分类模块;所述产业链数据分类模块利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图(包括总产业链图、细分产业链图和关联企业信息,其中所述总产业链图为依据产业链分类结果的一级整体链图;所述细分产业链图为总产业链图下的二级和/或多级细分产业链图;所述关联企业信息为依据细分产业链图内细分产业链环节下的相关企业信息,包括企业名称、企业简介、企业地址、企业重大事件)、产业链各节点企业列表的产业链分类结果并将产业链分类结果发送至创新资源数据汇总模块;所述创新资源数据汇总模块根据产业链分类结果获取并汇总对应产业链的创新资源数据(包括对应产业链的高校、科研院所、创业孵化载体、科技服务机构、创新平台数据)并形成包括企业空间分布图、企业热力图及创新资源空间分布图(包括高校、科研院所分布图,创业孵化载体分布图,科技服务机构分布图)的产业地图。
[0038] 本发明还涉及一种基于大数据的产业链分析方法,如图2所示所述方法具体包括以下步骤:
[0039] S1、从公开渠道获得初级已知产业链数据和初级未知产业链数据。
[0040] S2、依据清洗原则对初级已知产业链数据和初级未知产业链数据进行数据清洗操作得到高级已知产业链数据和高级未知产业链数据;所述数据清洗操作包括去除无效、过期数据(如已经失效的专利,早年的新闻等数据)和/或对不完整数据进行补充。
[0041] S3、通过数据的关键字和/或高频词交叉匹配、数据覆盖率统计、数据覆盖范围统计对高级已知产业链数据进行人工筛查生成人为逻辑目标结果。
[0042] S4、以人为逻辑目标结果为对照组,通过机器深度学习算法对高级已知产业链数据进行若干次自动分类,得到符合人为逻辑的机器深度学习分类依据模型;具体包括以下分步骤:S41、数据准备,将人为逻辑目标结果作为对照组用以评测分类依据模型的分类能力,将高级已知产业链数据作为训练组用以训练分类依据模型;S42、模型类型选择,根据分析需求、用户指定选择一种模型类型进行训练,或选择多种模型类型分别进行训练;所述模型类型包括深度信念网络、卷积神经网络、递归神经网络;S43、模型训练,依据分步骤S42所选择的模型类型对分步骤S41确定的训练组数据进行训练得到训练结果,所述训练包括对训练组数据的若干次分类操作;S44、模型评估,依据分步骤S41所选择的对照组对分步骤S43得到的训练结果进行评估得到优选模型,所述评估包括判断训练结果与对照组的相对误差是否小于预设误差阈值;S45、人工调整,针对分步骤S44得到的优选模型进行人工参数微调,得到符合人为逻辑的机器深度学习分类依据模型。
[0043] S5、利用机器深度学习分类依据模型对高级未知产业链数据进行自动分类,得到包括产业链内关联企业数据、产业链图、产业链各节点企业列表的产业链分类结果。
[0044] S6、获取并汇总对应产业链的创新资源数据并形成包括企业空间分布图、企业热力图及创新资源空间分布图的产业地图。根据已获取的产业链条分类数据,按照产业的关键词,爬取相关区域中高校、科研院所、创新平台、科技服务机构、创业孵化载体等创新资源数据,提取创新资源中的关键指标数据,如“研究方向”、“研究领域”、“重点学科”等,对产业链环节中的高频词汇进行统计,综合高频词汇及关键词对创新资源进行分析,筛选出符合对应产业领域的创新资源,形成创新资源的空间分布图。
[0045] 在整理产业链数据过程中,通过爬取产业相关研究报告、提取产业关键词,可以按照产业架构划分一级产业链、二级产业链、三级产业链;将同技术领域、同链条位置的企业的相关数据内容汇总,确定企业的关键词模式,例如集成电路产业链中IC设计环节中关键词样式为“*IC设计*”,按照该模式在企业简介、业务范围等数据中提取关键词,符合该关键词的提取出来,对产业链环节中的高频词汇进行统计,综合高频词汇及关键词对企业进行分析,筛选出对应产业链节点的企业。
[0046] 产业链图由总产业链图和细分产业链图以及关联企业三部分构成,其中总产业链图是指经过S5步骤后形成的产业的整体链图,细分产业链图指在总产业链图中每个一级产业链环节下的细分产业链,如在半导体产业链图中,总的产业链图由集成电路、传感器、光电器件等若干产业组成,半导体产业链下的集成电路产业链下又细分为若干环节,形成细分产业链图;关联企业则为每个细分产业链环节下的关联企业,通过提取企业的业务范围、企业简介等关键内容,结合机器学习,与产业链进行匹配。产业地图指产业链分析中基于S6步骤,所形成的每个产业细分链条上的企业分布图、企业热力图,以及产业领域的高校科研院所创新平台、创业孵化载体、科技服务机构分布图;基于步骤S6,形成企业和创新资源的空间分布和空间集聚程度,针对每个细分链条上的企业数量和创新资源分布情况,进行精准招商,合理配置产业创新资源,促进产学研合作,提高科技成果转化率,促进区域产业技术创新能力的提高;汇总同产业领域的高校、科研院所、创新平台数据,形成空间分布图,得到产业配套的创新资源数据,根据企业关联度及产业链环节,对产业链各节点的资源进行优化配置,形成企业空间分布图、热力图及创新资源空间分布图。企业空间分布图包括整体产业链的关联企业分布情况以及各细分产业链环节下关联企业的分布情况。关联企业分布情况指关联企业的空间集聚程度,以及具体企业的简介和详情。根据关联企业的数据,包括但不限于企业的名称、企业的简介、企业地址、企业成立事件等数据,制作关联企业的内容简介及详情页面。创新资源空间分布图与企业空间分布图结构相同,同样由创新资源的空间集聚地图和具体创新资源的简介和详情构成;创新资源包括高校、科研院所、创业孵化载体、科技服务机构。
[0047] 以上所述仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换等都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈