首页 / 专利库 / 资料储存系统 / 挖矿 / 数据挖掘 / 一种基于数据挖掘的结构安全评估及预报方法

一种基于数据挖掘的结构安全评估及预报方法

阅读:850发布:2020-05-11

专利汇可以提供一种基于数据挖掘的结构安全评估及预报方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 数据挖掘 的结构安全评估及预报方法,解决了现有方法难度大、对人员要求高、评估可靠性不足的弊端,其技术方案要点是包括有以下步骤:收集结构全生命周期内各类相关资料,形成分析 数据库 ; 抽取 全因素的特征数据形成样本库;基于 随机森林 挖掘 算法 ,生成评估模型与 预测模型 ;将需评估的结构当前生命周期内的资料输入分析数据库,抽取相关特征数据进行评估和预测;将评估及预测结果以及重要性的对应特征数据进行推送;将评估预测结果及该结构对应的特征数据加入样本库,作为下一次评估的训练样本。本发明的一种基于数据挖掘的结构安全评估及预报方法,能够解决现有问题,为结构提供更为准确和快速的安全评估和预报。,下面是一种基于数据挖掘的结构安全评估及预报方法专利的具体信息内容。

1.一种基于数据挖掘的结构安全评估及预报方法,其特征是,包括有以下步骤:
收集结构全生命周期内各类相关资料,处理形成特征数据并存储以形成分析数据库
按照结构所处不同阶段抽取结构处于不同安全状态下全因素的特征数据,形成样本库;
基于随机森林挖掘算法,对样本库进行训练,通过参数优化,生成结构现状安全的评估模型与下阶段结构安全状态的预测模型
将需要评估的结构当前生命周期内的资料输入分析数据库,按照相同规则抽取需要评估阶段的相关特征数据,导入评估模型及预测模型进行现阶段结构安全状态的评估和下阶段结构安全状态的预测;
将评估及预测结果以及重要性排序在前的对应特征数据进行推送;
将评估预测结果及该结构对应的特征数据加入样本库,作为下一次评估的训练样本。
2.根据权利要求1所述的基于数据挖掘的结构安全评估及预报方法,其特征是,相关数据资料的收集处理具体包括有:
收集结构的建设及运营期间勘察、设计、施工、监测、运营监护时获取的结构前期工程勘察资料、结构设计资料、结构施工及监测资料、结构使用过程的监护资料、结构周边环境资料、结构收周边活动影响资料,并将对应资料解析获得对应特征数据存储至分析数据库;
结构全生命周期内解析获得的结构地质数据、结构设计数据、结构施工数据、结构监护数据、周边环境数据、周边活动影响数据形成结构全因素的特征数据。
3.根据权利要求1所述的基于数据挖掘的结构安全评估及预报方法,其特征是:样本库的样本中同类结构数目大于100,每个结构覆盖全生命周期的不同安全状态的特征数据。
4.根据权利要求1所述的基于数据挖掘的结构安全评估及预报方法,其特征是,所述随机森林算法模型训练的步骤包括有:
调用基本算法环境,导入样本库中的特征数据;
调用随机森林算法,将导入的特征数据划分为预测样本集和验证样本集;
对建立的评估模型及预测模型进行训练及参数优化;
返回最优模型,输出最优模型及精度
5.根据权利要求4所述的基于数据挖掘的结构安全评估及预报方法,其特征是,所述随机森林算法参数优化方法及步骤包括有:
设定随机森林参数较大取值范围;
采用考虑贪心策略的随机搜索方法快速获取模型参数的较优取值;
以较优取值确定较小的取值范围,采用小步长网络搜索方法进一步确定本结构安全评估的参数最优取值,以获取最优训练精度的模型。
6.根据权利要求5所述的基于数据挖掘的结构安全评估及预报方法,其特征是,所述考虑贪心策略的随机搜索方法包含:
随机选取一组参数对模型进行训练,在改变各参数取值的情况下,通过模型评价指标确定参数取值方向,进而找出各参数的较优取值。
7.根据权利要求6所述的基于数据挖掘的结构安全评估及预报方法,其特征是,进一步确定本结构安全评估的参数最优取值具体为:
以较优参数取值为基础,加减随机搜索中设定的较大取值范围上限的5%~10%作为模型参数新取值范围的上下限,采用上下限之差的5%~10%作为网络搜索的步长,进一步确定模型参数的最优取值。
8.根据权利要求7所述的基于数据挖掘的结构安全评估及预报方法,其特征是,模型最优训练精度的评价指标包含:准确率、精确率和F1分数,且模型的质量与三个指标取值大小成正相关。
9.根据权利要求1所述的基于数据挖掘的结构安全评估及预报方法,其特征是,特征数据重要性的排序获取具体为:
采用基尼指数衡量特征的重要性,选取基尼系数排名靠前的若干特征作为影响结构安全的重要特征;
所述基尼指数的计算公式为:
其中,k代表数据集中类别的个数,pi代表第i个类别的样本数量占总样本的比例。

说明书全文

一种基于数据挖掘的结构安全评估及预报方法

技术领域

[0001] 本发明涉及结构安全及预报技术领域,特别涉及一种基于数据挖掘的结构安全评估及预报方法。

背景技术

[0002] 结构从施工至使用的整个生命周期内,都会受到自身及外部诸多因素的影响,结构的施工及使用一旦超过一定的安全状态,如果不进行及时跟踪及处理将严重威胁人们的生命财产安全。因此,需要采取有效的方法对结构的当前安全状态进行实时评估,对结构接下来安全状态的发展进行预测及预报,对结构安全事故的预防至关重要。
[0003] 结构安全评估的方法一般包括模糊综合评价法、层次分析法、故障树分析法等等。模糊综合评价法是根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价,而在使用过程中,其指标权重矢量的确定主观性较强,当指标较多时,受权重矢量和为1的约束下,会因为相对隶属权系数偏小的原因产生超模糊现象;层次分析法是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法,该方法在指标过多时,指标权重难以确定,判断矩阵的特征值和特征向量精确求解较为困难;故障树分析法是利用布林逻辑组合低阶事件,由上往下的演绎式失效分析法,在应用过程中,构建故障树的多余量相当繁重,难度也较大,对分析人员的要求也较高,很容易发生错误和失察,因此造成评估结果可能存在可靠性不足的情况。

发明内容

[0004] 本发明的目的是提供一种基于数据挖掘的结构安全评估及预报方法,能够解决现有问题,为结构提供更为准确和快速的安全评估和预报。
[0005] 本发明的上述技术目的是通过以下技术方案得以实现的:
[0006] 一种基于数据挖掘的结构安全评估及预报方法,包括有以下步骤:
[0007] 收集结构全生命周期内各类相关资料,处理形成特征数据并存储以形成分析数据库
[0008] 按照结构所处不同阶段抽取结构处于不同安全状态下全因素的特征数据,形成样本库;
[0009] 基于随机森林挖掘算法,对样本库进行训练,通过参数优化,生成结构现状安全的评估模型与下阶段结构安全状态的预测模型
[0010] 将需要评估的结构当前生命周期内的资料输入分析数据库,按照相同规则抽取需要评估阶段的相关特征数据,导入评估模型及预测模型进行现阶段结构安全状态的评估和下阶段结构安全状态的预测;
[0011] 将评估及预测结果以及重要性排序在前的对应特征数据进行推送;
[0012] 将评估预测结果及该结构对应的特征数据加入样本库,作为下一次评估的训练样本。
[0013] 作为优选,相关数据资料的收集处理具体包括有:
[0014] 收集结构的建设及运营期间勘察、设计、施工、监测、运营监护时获取的结构前期工程勘察资料、结构设计资料、结构施工及监测资料、结构使用过程的监护资料、结构周边环境资料、结构收周边活动影响资料,并将对应资料解析获得对应特征数据存储至分析数据库;
[0015] 结构全生命周期内解析获得的结构地质数据、结构设计数据、结构施工数据、结构监护数据、周边环境数据、周边活动影响数据形成结构全因素的特征数据。
[0016] 作为优选,样本库的样本中同类结构数目大于100,每个结构覆盖全生命周期的不同安全状态的特征数据。
[0017] 作为优选,所述随机森林算法模型训练的步骤包括有:
[0018] 调用基本算法环境,导入样本库中的特征数据;
[0019] 调用随机森林算法,将导入的特征数据划分为为预测样本集和验证样本集;
[0020] 对建立的评估模型及预测模型进行训练及参数优化;
[0021] 返回最优模型,输出最优模型及精度
[0022] 作为优选,所述随机森林算法参数优化方法及步骤包括有:
[0023] 设定随机森林参数较大取值范围;
[0024] 采用考虑贪心策略的随机搜索方法快速获取模型参数的较优取值;
[0025] 以较优取值确定较小的取值范围,采用小步长网络搜索方法进一步确定本结构安全评估的参数最优取值,以获取最优训练精度的模型。
[0026] 作为优选,所述考虑贪心策略的随机搜索方法包含:
[0027] 随机选取一组参数对模型进行训练,在改变各参数取值的情况下,通过模型评价指标确定参数取值方向,进而找出各参数的较优取值。
[0028] 作为优选,进一步确定本结构安全评估的参数最优取值具体为:
[0029] 以较优参数取值为基础,加减随机搜索中设定的较大取值范围上限的5%~10%作为模型参数新取值范围的上下限,采用上下限之差的5%~10%作为网络搜索的步长,进一步确定模型参数的最优取值。
[0030] 作为优选,模型最优训练精度的评价指标包含:准确率、精确率和F1分数,且模型的质量与三个指标取值大小成正相关
[0031] 作为优选,特征数据重要性的排序获取具体为:
[0032] 采用基尼指数衡量特征的重要性,选取基尼系数排名靠前的若干特征作为影响结构安全的重要特征;
[0033] 所述基尼指数的计算公式为:
[0034]
[0035] 其中,k代表数据集中类别的个数,pi代表第i个类别的样本数量占总样本的比例。
[0036] 综上所述,本发明具有以下有益效果:
[0037] 通过构建全生命周期相关资料的分析数据库和样本库,采用随机森林数据挖掘算法实现隧道结构安全现状评估及后续安全状态预测;可对全生命周期内任何时刻的结构进行安全状态评价,且可根据样本数据和训练模型对结构后续安全状态的发展进行预测;将每次完成预测评估的结构的特征数据加入样本库内,实现了样本数据的自增长方法,可保证样本数据量的持续增长,提高评估结果的可靠性。附图说明
[0038] 图1为本方法的流程图
[0039] 图2为本方法采用的随机森林算法模型训练的步骤流程图。

具体实施方式

[0040] 以下结合附图对本发明作进一步详细说明。
[0041] 根据一个或多个实施例,公开的一种基于数据挖掘的结构安全评估及预报方法,如图1所示,包括有以下步骤:
[0042] 1)对结构全生命周期内各类相关资料进行收集,并形成分析数据库;
[0043] 2)按照结构所处不同阶段抽取结构处于不同安全状态全因素的特征数据形成样本库;
[0044] 3)基于随机森林挖掘算法,对样本库进行训练,并通过参数优化,生成结构现状安全的评估模型和下阶段结构安全状态的预测模型;
[0045] 4)将需要评估的结构当前生命周期内的资料输入分析数据库,按照相同规则抽取需要评估阶段的相关特征数据,导入评估模型及预测模型进行现状安全的评估和下阶段结构安全状态的预测;
[0046] 5)将评估预测结果和重要性靠前的特征所对应数据推送给本项目各相关方;
[0047] 6)将最终评估结果和该结构相对应的特征数据加入样本库,作为下一次评估项目的训练样本,实现结构安全评估样本数量的持续增长。
[0048] 全生命周期内各类相关资料包括有:在结构的建设及运营期间,勘察、设计、施工、监测、运营监护时获取的结构前期工程勘察资料(如地层信息、文信息)、结构设计资料(如结构形式、设计等级)、结构施工及监测资料(如施工工况、施工内变形监测)、结构使用过程的监护资料(如结构变形、结构损伤、结构养护)、结构周边环境资料(如所处地域、气候条件)、结构受周边活动影响资料(如周边工程施工、降水等)。
[0049] 将相关资料解析形成特征数据后存储至分析数据库内,结构全生命周期内解析获得的结构地质数据、结构设计数据、结构施工数据、结构监护数据、周边环境数据、周边活动影响数据形成结构全因素的特征数据。
[0050] 样本库中作为样本数据的特征数据则包括有:结构地质数据、结构设计数据、结构施工数据、结构监护数据、周边环境数据、周边活动影响数据。样本库应包含大于100个同类结构项目,且每个项目结构覆盖全生命周期的不同安全状态的特征数据,以保证数据挖掘模型能够涵盖预评估对象所有可能的安全状态。
[0051] 用于数据挖掘的算法为随机森林算法,应用该算法进行模型训练流程如图2所示,其主要包括:调用基本算法环境;导入基于分析数据库抽取生成的结构安全状态样本数据的样本库中的特征数据;调用随机森林算法;拆分样本数据,其中2/3为训练样本集,1/3作为验证样本集;进行模型训练及模型参数的优化;返回最优模型;输出最优模型及精度。
[0052] 随机森林算法参数优化包含:设定随机森林参数较大取值范围;采用考虑贪心策略的随机搜索方法快速获取模型参数的较优取值;以较优取值确定较小的取值范围,采用小步长网络搜索方法进一步确定本结构安全评估的参数最优取值,以获取最优训练精度的模型。
[0053] 根据随机森林算法常规取值范围及本结构评估的特点,确定模型参数足够大的取值范围,一般的,比如决策树的个数取值范围可定位20~1000,分列属性取值范围可定位1~60;通过考虑贪心策略的随机搜索方法,先随机选取一组参数对模型进行训练,再在改变各参数取值的情况下,通过模型评价指标确定参数取值方向,从而快速找出各参数的较优取值。
[0054] 采用小步长网络搜索方法进一步确定本结构安全评估的参数最优取值具体为,以较优参数取值为基础,加减随机搜索中设定的较大取值范围上限的5%~10%作为模型参数新取值范围的上下限,采用上下限之差的5%~10%作为网络搜索的步长,进一步确定模型参数的最有取值。
[0055] 模型最优精度的评价指标包含:准确率(accuracy)、精确率(precision)和F1分数(F1-score),模型的质量与三个指标取值的大小成正相关关系,三个指标取值越大,模型质量越好。
[0056] 对数据特征的重要性的获取具体为:采用基尼指数衡量特征的重要性,一般选取基尼系数排名前五的特征作为影响结构安全的重要特征,重要特征个数也可根据结构特点进行调整基尼指数的计算公式为:
[0057]
[0058] 式中,k代表数据集中类别的个数,pi代表第i个类别的样本数量占总样本的比例。
[0059] 实现结构安全评估样本数量的持续增长,具体为将结构当前安全状态评估的最终结果及相对应的特征数据作为新的样本加入样本库,下一次进行新的结构评估时,采用新增后的样本库进行模型训练和评估。
[0060] 本发明提供的一种基于数据挖掘的结构安全评估及预报方法,通过构建结构全生命周期全面资料数据库及样本库,采用数据挖掘技术实现隧道结构安全现状评估和后续安全状态预评估,本安全评估及预报方法对全生命周期内任何时刻的结构进行安全状态评价,且可根据样本数据和训练模型对结构后续安全状态的发展进行预测,此外,本方法包含了样本数据的自增长方法,可能保证样本数据量的持续增长。本评估模型样本特征涵盖了影响结构尽可能多的因素,大大提高了模型评估及预测的精度及准确性,并且本发明广发适用于工民建、桥梁、隧道、基坑等各类结构工程。
[0061] 本具体实施例仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈