首页 / 专利库 / 生物防治 / 生物活性成分 / 信息化学物质 / 一种基于深度学习的微型化学实验系统及方法

一种基于深度学习的微型化学实验系统及方法

阅读:648发布:2020-05-15

专利汇可以提供一种基于深度学习的微型化学实验系统及方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度学习 的微型化学实验方法,包括:输入要合成的物质的数据;在与 绿色化学 配套的 大数据 平台中获取所述要合成的物质的历史大数据;在所述大数据平台中提取所述要合成的物质的特征信息;依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的 试剂 ;应用计算机仿真技术模拟所述试剂合成;结合所述合成的动态演化规律得到实时数据的性能评估指标;将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。本发明将深度学习应用于微型化学实验中,为今后微型化学实验的发展提供技术支持。本发明解决了传统的人工手动实验方法耗时长、效率低的问题,提高了微型化学实验的完成效率。,下面是一种基于深度学习的微型化学实验系统及方法专利的具体信息内容。

1.一种基于深度学习的微型化学实验系统,其特征在于:包括数据录入模数据处理模块、数据显示模块、数据分析模块、性能评估模块、数据存储与反馈模块,数据录入模块与数据处理模块相连,数据处理模块与数据显示模块相连,数据显示模块与数据分析模块相连,数据分析模块与性能评估模块相连,性能评估模块与数据存储与反馈模块相连;
所述数据录入模块,用于输入要合成的物质的数据;
所述数据处理模块,用于在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据,如果存在所述历史大数据,则将历史大数据在数据显示模块显示,否则,在所述大数据平台中提取所述要合成的物质的特征信息;
所述数据显示模块,用于在所述大数据平台中,将所述历史大数据或所述性能评估指标进行可视化处理并显示出来;
所述数据分析模块,用于依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂
所述性能评估模块,用于应用计算机仿真技术模拟所述试剂合成;结合所述合成的动态演化规律得到实时数据的性能评估指标;
所述数据存储与反馈模块,将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。
2.一种基于深度学习的微型化学实验方法,其特征在于,具体的方法步骤如下:
步骤一:输入要合成的物质的数据;
步骤二:在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据;
步骤三:在所述大数据平台中提取所述要合成的物质的特征信息;
步骤四:依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂;
步骤五:应用计算机仿真技术模拟所述试剂合成;
步骤六:结合所述合成的动态演化规律得到实时数据的性能评估指标;
步骤七:将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。
3.根据权利要求2所述的方法,其特征在于,步骤二中采用关联规则和聚类算法获取所述要合成的物质的历史大数据。
4.根据权利要求2所述的方法,其特征在于,步骤三中使用Spark MLlib提供的文本特征提取方法Countvectorizer,Countvectorizer和Countvectorizermodel旨在通过计数来将一个文档转换为向量,当不存在先验字典时,Countvectorizer可作为Estimator来提取词汇,并生成一个Countvectorizermodel,该模型产生文档关于词语的稀疏表示,其表示可以传递给其他算法如LDA,在fitting过程中,countvectorizer将根据语料库中的词频排序选出前vocabsize个词,一个可选的参数minDF也影响fitting过程中,它指定词汇表中的词语在文档中最少出现的次数,另一个可选的二值参数控制输出向量,如果设置为真那么所有非零的计数为1,这对于二值型离散概率模型非常有用。
5.根据权利要求2所述的方法,其特征在于,步骤四中使用并行粒子群优化神经网络算法,具体包括:
(1)读入训练样本和测试样本,数据预处理,设定最大迭代次数Tmax;
(2)随机初始化每个粒子的速度Vid(t)和位置Xid(t);
(3)初始化个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
(4)更新每个粒子的速度Vid(t)和位置Xid(t);
(5)计算每个粒子对应的适应度值(即NN的输出误差)F(Xi);
(6)更新个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
(7)若达到最大迭代次数Tmax,则将训练样本和测试样本带入训练好的NN,得到网络输出;否则返回更新每个粒子的速度Vid(t)和位置Xid(t);
(8)将训练样本和测试样本带入训练好的NN,得到网络输出;
其中,算法的速度更新和位置更新公式:
Vid(t+1)=ωVid(t)+c1r1(Pbestid(t)-Xid(t))+c2r2(Gbestid(t)-Xid(t))
Xid(t+1)=Xid(t)+Vid(t+1)
其中,粒子群由N个粒子组成,每个粒子的位置代表优化问题在D维搜索空间(D为NN权阈值的数目)中的一个潜在的解;i为粒子数,i=1,2...,N,d=1,2...,D;c1和c2是学习因子,非负的常数;r1和r2是介于[0,1]的均匀分布的随机数;Vid(t)∈[-Vmax,Vmax],Vmax限制了粒子飞行的最大速度,Xid(t)∈[-Xmax,Xmax],Xmax限制了粒子搜索空间的范围,可设定Vmax=kVmax,0≤k≤1;ω是惯性权重,介于[0,1],用来平衡粒子的全局搜索能
6.根据权利要求2所述的方法,其特征在于,步骤五采用滚动优化算法应用计算机仿真技术模拟所述试剂合成。
7.根据权利要求2所述的方法,其特征在于,步骤六的具体过程包括:
(1)通过迭代优化算法建立性能评估指标;
(2)计算所述性能评估指标的最小值。
8.根据权利要求2所述的方法,其特征在于,还包括:通过所述实时数据对所述个体的最优参数序列进行矫正更新。

说明书全文

一种基于深度学习的微型化学实验系统及方法

技术领域

[0001] 本发明属于绿色化学数据分析领域,涉及一种基于深度学习的微型化学实验系统及方法。

背景技术

[0002] 所谓微型化学实验,就是以尽可能少的化学试剂来获取所需化学信息的实验方法与技术。虽然它的化学试剂用量一般只为常规实验用量的几十分之一乃至几千分之一,但其效果却可以达到准确、明显、安全、方便和防止环境污染等目的。微型化学实验与常规实验相比,具有明显的绿色环保、节约药品和节省时间的特点。微型化学实验的优势已经在教学中呈现出来,受到了广大师生的欢迎。目前,国内已有800余所大、中院校开始采用微型化学实验。
[0003] 深度学习是机器学习中一种基于对数据进行表征学习的方法,是一种能够模拟出人脑的神经结构的机器学习方法。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
[0004] 目前,微型化学实验仍然采用传统的人工手动实验方法,耗时长、效率低,因此有必要引入新技术,推进国内外微型化学实验进程

发明内容

[0005] 本发明的目的是提供一种基于深度学习的微型化学实验系统及方法,以解决传统微型化学实验方法不足的问题。
[0006] 本发明是这样实现的:一种基于深度学习的微型化学实验系统,包括数据录入模数据处理模块、数据显示模块、数据分析模块、性能评估模块、数据存储与反馈模块,数据录入模块与数据处理模块相连,数据处理模块与数据显示模块相连,数据显示模块与数据分析模块相连,数据分析模块与性能评估模块相连,性能评估模块与数据存储与反馈模块相连。
[0007] 所述数据录入模块,用于输入要合成的物质的数据;
[0008] 所述数据处理模块,用于在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据,如果存在所述历史大数据,则将历史大数据在数据显示模块显示,否则,在所述大数据平台中提取所述要合成的物质的特征信息;
[0009] 所述数据显示模块,用于在所述大数据平台中,将所述历史大数据或所述性能评估指标进行可视化处理并显示出来;
[0010] 所述数据分析模块,用于依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂;
[0011] 所述性能评估模块,用于应用计算机仿真技术模拟所述试剂合成;结合所述合成的动态演化规律得到实时数据的性能评估指标;
[0012] 所述数据存储与反馈模块,将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。
[0013] 一种基于深度学习的微型化学实验方法,具体的方法步骤如下:
[0014] 步骤一:输入要合成的物质的数据;
[0015] 步骤二:在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据;
[0016] 步骤三:在所述大数据平台中提取所述要合成的物质的特征信息;
[0017] 步骤四:依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂;
[0018] 步骤五:应用计算机仿真技术模拟所述试剂合成;
[0019] 步骤六:结合所述合成的动态演化规律得到实时数据的性能评估指标;
[0020] 步骤七:将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。
[0021] 优选地,采用关联规则和聚类算法获取所述要合成的物质的历史大数据。
[0022] 进一步地,在所述大数据平台中提取所述要合成的物质的特征信息时使用Spark MLlib提供的文本特征提取方法Countvectorizer。Countvectorizer和Countvectorizermodel旨在通过计数来将一个文档转换为向量。当不存在先验字典时,Countvectorizer可作为Estimator来提取词汇,并生成一个Countvectorizermodel。该模型产生文档关于词语的稀疏表示,其表示可以传递给其他算法如LDA。在fitting过程中,countvectorizer将根据语料库中的词频排序选出前vocabsize个词。一个可选的参数minDF也影响fitting过程中,它指定词汇表中的词语在文档中最少出现的次数。另一个可选的二值参数控制输出向量,如果设置为真那么所有非零的计数为1。这对于二值型离散概率模型非常有用。
[0023] 进一步地,依据所述特征信息,在所述大数据平台中寻找与所述要合成物质的特征信息相关的试剂时使用并行粒子群优化神经网络算法,具体包括:
[0024] (1)读入训练样本和测试样本,数据预处理,设定最大迭代次数Tmax;
[0025] (2)随机初始化每个粒子的速度Vid(t)和位置Xid(t);
[0026] (3)初始化个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
[0027] (4)更新每个粒子的速度Vid(t)和位置Xid(t);
[0028] (5)计算每个粒子对应的适应度值(即NN的输出误差)F(Xi);
[0029] (6)更新个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
[0030] (7)若达到最大迭代次数Tmax,则将训练样本和测试样本带入训练好的NN,得到网络输出;否则返回更新每个粒子的速度Vid(t)和位置Xid(t);
[0031] (8)将训练样本和测试样本带入训练好的NN,得到网络输出。
[0032] 其中,算法的速度更新和位置更新公式:
[0033] Vid(t+1)=ωVid(t)+c1r1(Pbestid(t)-Xid(t))+c2r2(Gbestid(t)-Xid(t))[0034] Xid(t+1)=Xid(t)+Vid(t+1)
[0035] 其中,粒子群由N个粒子组成,每个粒子的位置代表优化问题在D维搜索空间(D为NN权阈值的数目)中的一个潜在的解。i为粒子数,i=1,2...,N,d=1,2...,D;c1和c2是学习因子,非负的常数;r1和r2是介于[0,1]的均匀分布的随机数;Vid(t)∈[-Vmax,Vmax],Vmax限制了粒子飞行的最大速度,Xid(t)∈[-Xmax,Xmax],Xmax限制了粒子搜索空间的范围,可设定Vmax=kVmax,0≤k≤1;ω是惯性权重,介于[0,1],用来平衡粒子的全局搜索能
[0036] 进一步地,采用滚动优化算法应用计算机仿真技术模拟所述试剂合成。
[0037] 进一步地,所述结合所述个体的动态演化规律得到所述实时数据的性能评估指标具体包括:
[0038] (1)通过迭代优化算法建立性能评估指标;
[0039] (2)计算所述性能评估指标的最小值。
[0040] 进一步地,还包括:通过所述实时数据对所述个体的最优参数序列进行矫正更新。
[0041] 本发明基于大数据分析技术,提供一种基于深度学习的微型化学实验系统及方法,可以有效地克服传统微型化学实验方法的不足。附图说明
[0042] 图1为本发明的一种基于深度学习的微型化学实验方法组成模块图。
[0043] 图2为本发明的实施例的流程示意图。

具体实施方式

[0044] 实施例:
[0045] 为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
[0046] 如图1所示,本发明所提供的一种基于深度学习的微型化学实验系统,包括数据录入模块1、数据处理模块2、数据显示模块3、数据分析模块4、性能评估模块5、数据存储与反馈模块6,数据录入模块1与数据处理模块2相连,数据处理模块2与数据显示模块3相连,数据显示模块3与数据分析模块4相连,数据分析模块4与性能评估模块5相连,性能评估模块5与数据存储与反馈模块6相连。
[0047] 所述数据录入模块1,用于输入要合成的物质的数据;
[0048] 所述数据处理模块2,用于在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据,如果存在所述历史大数据,则将历史大数据在数据显示模块显示,否则,在所述大数据平台中提取所述要合成的物质的特征信息;
[0049] 所述数据显示模块3,用于在所述大数据平台中,将所述历史大数据或所述性能评估指标进行可视化处理并显示出来;
[0050] 所述数据分析模块4,用于依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂;
[0051] 所述性能评估模块5,用于应用计算机仿真技术模拟所述试剂合成;结合所述合成的动态演化规律得到实时数据的性能评估指标;
[0052] 所述数据存储与反馈模块6,将所述性能评估指标存储到所述大数据平台中,同时反馈给用户。
[0053] 由上述实施例可知,本发明所述的基于深度学习的微型化学实验方法通过数据录入模块1,输入要合成的物质的数据;通过数据处理模块2在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据,如果存在所述历史大数据,则将历史大数据通过可视化处理后在数据显示模块3显示,否则,在所述大数据平台中提取所述要合成的物质的特征信息;在数据分析模块4,依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂;然后在性能评估模块5,应用计算机仿真技术模拟所述试剂合成;结合所述合成的动态演化规律得到实时数据的性能评估指标;得到所述实时数据的性能评估指标后,在数据存储与反馈模块6,将所述性能评估指标存储到所述大数据平台中,同时反馈给用户,在数据显示模块3显示。
[0054] 如图2所示,为本发明提供的一种基于深度学习的微型化学实验方法的实施例流程示意图,详细步骤如下:
[0055] 步骤一:输入要合成的物质的数据S1;其中,具体的所述输入数据包括所述要合成物质的类别、功能、应用范围等。
[0056] 步骤二:在与绿色化学配套的大数据平台中获取所述要合成的物质的历史大数据S2;其中,所述历史大数据不仅包括所述要合成的物质的详细历史数据信息,还包括与其具有相同功能的所有物质的历史数据信息。
[0057] 进一步地,采用关联规则和聚类算法获取所述要合成的物质的历史大数据。
[0058] 步骤三:在所述大数据平台中提取所述要合成的物质的特征信息S3;其中,如果步骤二中能够获取到所述要合成的物质的历史大数据,则优先考虑所述历史大数据。
[0059] 进一步地,在所述大数据平台中提取所述要合成的物质的特征信息时使用Spark MLlib提供的文本特征提取方法Countvectorizer。Countvectorizer和Countvectorizermodel旨在通过计数来将一个文档转换为向量。当不存在先验字典时,Countvectorizer可作为Estimator来提取词汇,并生成一个Countvectorizermodel。该模型产生文档关于词语的稀疏表示,其表示可以传递给其他算法如LDA。在fitting过程中,countvectorizer将根据语料库中的词频排序选出前vocabsize个词。一个可选的参数minDF也影响fitting过程中,它指定词汇表中的词语在文档中最少出现的次数。另一个可选的二值参数控制输出向量,如果设置为真那么所有非零的计数为1。这对于二值型离散概率模型非常有用。
[0060] 步骤四:依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂S4。
[0061] 进一步地,依据所述特征信息,在所述大数据平台中寻找与所述要合成的物质的特征信息相关的试剂时使用并行粒子群优化神经网络算法,具体包括:
[0062] (1)读入训练样本和测试样本,数据预处理,设定最大迭代次数Tmax;
[0063] (2)随机初始化每个粒子的速度Vid(t)和位置Xid(t);
[0064] (3)初始化个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
[0065] (4)更新每个粒子的速度Vid(t)和位置Xid(t);
[0066] (5)计算每个粒子对应的适应度值(即NN的输出误差)F(Xi);
[0067] (6)更新个体最优位置Pbestid(t)和全局最优位置Gbestid(t);
[0068] (7)若达到最大迭代次数Tmax,则将训练样本和测试样本带入训练好的NN,得到网络输出;否则返回更新每个粒子的速度Vid(t)和位置Xid(t);
[0069] (8)将训练样本和测试样本带入训练好的NN,得到网络输出。
[0070] 其中,算法的速度更新和位置更新公式:
[0071] Vid(t+1)=ωVid(t)+c1r1(Pbestid(t)-Xid(t))+c2r2(Gbestid(t)-Xid(t))[0072] Xid(t+1)=Xid(t)+Vid(t+1)
[0073] 其中,粒子群由N个粒子组成,每个粒子的位置代表优化问题在D维搜索空间(D为NN权阈值的数目)中的一个潜在的解。i为粒子数,i=1,2...,N,d=1,2...,D;c1和c2是学习因子,非负的常数;r1和r2是介于[0,1]的均匀分布的随机数;Vid(t)[-Vmax,Vmax],Vmax限制了粒子飞行的最大速度,Xid(t)[-Xmax,Xmax],Xmax限制了粒子搜索空间的范围,可设定Vmax=kVmax,0≤k≤1;ω是惯性权重,介于[0,1],用来平衡粒子的全局搜索能力。
[0074] 步骤五:应用计算机仿真技术模拟所述试剂合成S5。
[0075] 进一步地,采用滚动优化算法应用计算机仿真技术模拟所述试剂合成。
[0076] 预测控制的优化不是一次离线进行,而是随着采样时刻的前进反复地在线进行,故称为滚动优化。这种滚动优化虽然得不到理想的全局最优解,但是反复对每一采样时刻的偏差进行优化计算,将可及时地校正控制过程中出现的各种复杂情况。
[0077] 滚动优化算法对反应时间和反应物的质量具有严格的限制,是在有限时间段和有限反应物的滚动优化。所得最优值应该基于对反应时间、反应物的质量及反应条件的综合考虑。
[0078] 步骤六:结合所述合成的动态演化规律得到实时数据的性能评估指标S6。
[0079] 进一步地,所述结合所述个体的动态演化规律得到所述实时数据的性能评估指标具体包括:
[0080] (1)通过迭代优化算法建立性能评估指标;
[0081] (2)计算所述性能评估指标的最小值。
[0082] 进一步地,还包括:通过所述实时数据对所述个体的最优序列进行矫正更新。
[0083] 步骤七:将所述性能评估指标存储到所述大数据平台中,同时反馈给用户S7。
[0084] 本发明基于大数据分析技术,提供一种基于深度学习的微型化学实验系统及方法,可以有效地克服传统微型化学实验方法的不足。
[0085] 以上对本发明所提供的基于深度学习的微型化学实验方法进行了详细介绍。说明书中各个实施例之间相同相似部分互相参见即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈