首页 / 专利库 / 银行与财务事项 / 收益曲线 / 联邦学习的沙盒机制

联邦学习的沙盒机制

阅读:493发布:2020-05-19

专利汇可以提供联邦学习的沙盒机制专利检索,专利查询,专利分析的服务。并且本 发明 公开了联邦学习的沙盒机制,包括以下步骤:建立联邦学习沙盒训练环境、建立联邦学习沙盒市场环境、测量联邦学习相关参数、对加密测量的参数的报告与解密。本发明为联邦学习系统提供了一套沙盒机制,使得联邦学习的意向用户在正式采用联邦学习系统之前,可以先在沙盒中测试联邦学习系统,并提前测量所需参数,帮助参与者提前量化自身属性,制定联邦学习策略,并建立联合建模的信心;为参与者了解自身属性提供了有效途径;量化的参与者属性有助于联邦学习系统更加有效地对联邦学习模型产生的收入进行分配;沙盒机制提供试错途径,支持参与者试验并应用最佳策略;增加联邦学习在实际应用中的安全性、 稳定性 和可操作性。,下面是联邦学习的沙盒机制专利的具体信息内容。

1.一种联邦学习的沙盒机制,其特征在于,所述沙盒机制包括以下步骤:
建立联邦学习沙盒训练环境;
建立联邦学习沙盒市场环境;
测量联邦学习相关参数;
对加密测量的参数的报告与解密。
2.根据权利要求1所述联邦学习的沙盒机制,其特征在于,所述沙盒训练环境和实际投入使用的生产环境相互独立,沙盒训练环境内的所有操作不会影响到生产环境。
3.根据权利要求1或2所述联邦学习的沙盒机制,其特征在于,还包括,联邦学习参与者能够将沙盒训练环境下载到本地运行;所述沙盒训练环境由安装有沙盒训练环境的沙盒服务器提供,沙盒服务器独立于生产环境的服务器。
4.根据权利要求1或2所述联邦学习的沙盒机制,其特征在于,还包括,所述沙盒训练环境中安装有联邦学习模型训练算法。
5.根据权利要求1或2所述联邦学习的沙盒机制,其特征在于,还包括,参与者通过下载联邦学习系统提供的沙盒,或利用安装有沙盒的服务器来模拟联邦学习训练过程。
6.根据权利要求1或2所述联邦学习的沙盒机制,其特征在于,还包括,在所述沙盒训练环境中存储有一个加密的沙盒联邦学习模型,所述该加密的沙盒联邦学习模型是将生产联邦学习模型的一个拷贝加密后的结果。
7.根据权利要求1所述联邦学习的沙盒机制,其特征在于,还包括,系统使用模拟数据训练不同于生产联邦学习模型的沙盒联邦学习模型,存储于所述沙盒训练环境中。
8.根据权利要求1-7任一项所述联邦学习的沙盒机制,其特征在于,还包括,模拟虚拟参与者的行为,所述虚拟参与者会模拟向沙盒联邦学习模型贡献数据、调用沙盒联邦学习模型、以及攻击或退出模型行为中的一者或多者。
9.根据权利要求1-8任一项所述联邦学习的沙盒机制,其特征在于,还包括,在所述联邦学习沙盒市场环境中建有模拟供需曲线。
10.根据权利要求1-9任一项所述联邦学习的沙盒机制,其特征在于,所述联邦学习沙盒市场环境包括模拟数据提供者的行为、模拟虚拟数据提供者行为、模拟模型用户的行为、模拟虚拟模型用户行为中的一者或多者。
11.根据权利要求1所述联邦学习的沙盒机制,其特征在于,所述测量联邦学习相关参数包括测量联邦学习模型的安全性、效率、经济效益、以及数据提供者提供的数据有效性和成本类型、模型用户的收益类型中的一者或多者。
12.根据权利要求11所述联邦学习的沙盒机制,其特征在于,还包括,所述沙盒环境中建立有沙盒测量环境,测量联邦学习相关参数。
13.根据权利要求12所述沙盒测量环境,其特征在于,所述沙盒测量环境包括联邦学习安全性测量模块、联邦学习效率测量模块、联邦经济效益测算模块、数据有效性测量模块、成本测量模块、收益测量模块、支付计算模块中的一者或多者。
14.根据权利要求13所述联邦学习的沙盒机制,其特征在于,在所述联邦学习模型安全性测量模块中,联邦学习模型的安全性包括数据安全性、隐私性和传输安全性中的一者或多者。
15.根据权利要求13所述联邦学习的沙盒机制,其特征在于,所述联邦学习效率测量模块中联邦学习模型的效率衡量为计算时间、挂钟时间和模型质量中的一者或多者。
16.根据权利要求13所述联邦学习的沙盒机制,其特征在于,所述联邦经济效益测测算模块中联邦经济效益包括联邦收入、联邦成本和联邦利润中的一者或多者。
17.根据权利要求1所述联邦学习的沙盒机制,其特征在于,所述对加密测量的参数的报告与解密,还包括,将沙盒环境中加密测量的参数中的部分或全部加密传输给生产环境。
18.根据权利要求11所述联邦学习的沙盒机制,其特征在于,所述测量联邦学习模型的安全性,在测量联邦学习安全性时,衡量联邦学习系统的隐私性,沙盒支持参与者采用同态加密技术加密更新过的神经网络,用模型加密算法的安全级别来衡量模型的隐私性。
19.根据权利要求13所述联邦学习的沙盒机制,其特征在于,所述联邦学习模型安全性测量模块,通过衡量传输安全防护指标中一者或多者的实现情况来衡量所述传输安全性,包括端对端数据加密、验签、报文时效校验和接口对接HTTPS协议中的一者或多者。
20.根据权利要求1-19任一项所述联邦学习的沙盒机制,其特征在于,所述建立联邦学习沙盒训练环境包括,沙盒环境中的联邦学习模型训练算法使用加密后的参与者本地数据训练沙盒联邦学习模型。
21.根据权利要求1所述联邦学习的沙盒机制,其特征在于,还包括,将联邦学习模型拆分并加密发送给对应的参与者,加密模型单独不可使用。
22.根据权利要求1所述联邦学习的沙盒机制,其特征在于,所述联邦学习沙盒市场环境,还包括,所述联邦学习沙盒市场环境中包括对虚拟模型用户行为的模拟,虚拟模型用户模拟市场竞价、调用不同版本的模型、生成不同数量的预测、利润最大化或不完全理性、合谋等行为中的一者或多者。
23.根据权利要求1所述联邦学习的沙盒机制,其特征在于,所述对加密测量的参数的报告与解密,沙盒支持将所选数据和相关参数利用参与者的第一私钥自动加密,生成第一密文,并将解密第一公钥使用新的第二私钥加密,生成第二密文,存储在参与者本地;所述参数的报告与解密包括将相关参数的第二密文发送给生产环境。

说明书全文

联邦学习的沙盒机制

技术领域

[0001] 本发明涉及计算机科学中的联邦学习,特别是关于联邦学习过程中的沙盒机制。

背景技术

[0002] 近年来,依赖数据驱动的人工智能应用陷入困境。虽然人工智能算法发展迅速,但是训练人工智能模型通常需要大量的数据,这些数据往往分布在不同的机构手中,出于保护数据隐私和安全的严格监管造成数据孤岛化。因此,联邦学习(Federated Machine Learning)系统应运而生。联邦学习在满足数据安全和用户隐私保护的前提下通过加密的参数交换机制建立一个多方共有的机器学习模型,使得在没有任何一方数据被泄露的情况下也能联合建立机器学习模型,解决了数据孤岛问题。因此,联邦学习可以被应用于诸多需要数据训练的人工智能场景中。例如,再保险公司可以将不同保险公司的数据通过联邦学习联合建立保险险模型,然后每一家保险公司都可以使用这个模型更好地管理风险。然而,当联邦学习系统被实际应用之前,如何为参与者提供测试环境、模拟学习过程、测量所需参数,如何保障并证明联邦学习平台的安全性、完整性、隐私性等还没有一个完善的机制。
[0003] 由于联邦学习是计算机科学的新兴分支,目前并没有关于联邦学习沙盒机制的深入研究。关于联邦学习技术的已有研究可以参考微众行AI项目组发布的《联邦学习白皮书V1.0》。另外。关于沙盒技术,可以参考其他计算机领域的沙盒机制,比如,专利《一种沙盒测试环境构建系统及构建方法》(CN103699479B)提供了一种应用沙盒测试对象部署模和数据构建模块的方法,减少了构建及运维工作中的错误安全隐患。但是这些其他计算机领域的沙盒机制难以被直接应用至联邦学习场景下。

发明内容

[0004] 针对现有技术不足,本发明为联邦学习系统提供了一套沙盒(sandbox)机制,使得联邦学习的意向参与者在正式采用联邦学习系统之前,可以先在沙盒中测试联邦学习系统,并提前测量所需参数。这一方法旨在帮助参与者提前量化自身属性,制定联邦学习策略,并建立联合建模的信心。一方面,联邦学习所需参数,如数据有效性和参与者类型等不易测量,沙盒机制为参与者了解自身属性提供了有效途径。量化的参与者属性也有助于联邦学习系统更加有效地对联邦学习模型产生的收入进行分配。另一方面,参与者如何在实际联邦学习过程中获得最大收益不易计算,沙盒机制提供试错途径,支持参与者试验并应用最佳策略。一套设计完善的沙盒机制能够增加联邦学习在实际应用中的安全性、稳定性和可操作性,帮助系统在短期内吸引参与者、增加参与者粘性,以及在长期内提高发展的可持续性
[0005] 本发明提供如下技术方案:
[0006] 一种联邦学习的沙盒机制,所述沙盒机制包括以下步骤:
[0007] 102、建立联邦学习沙盒训练环境;
[0008] 103、建立联邦学习沙盒市场环境;
[0009] 104、测量联邦学习相关参数;
[0010] 105、对加密测量的参数的报告与解密。
[0011] 优选的,在所述步骤102中沙盒训练环境和生产环境相互独立,沙盒训练环境内的所有操作不会影响到生产环境。
[0012] 优选的,在所述步骤102中,联邦学习参与者可以将沙盒训练环境下载到本地运行,所述沙盒训练环境由安装有沙盒环境的沙盒服务器提供,沙盒服务器独立于生产环境的服务器。
[0013] 优选的,在所述步骤102中,所述沙盒训练环境中还安装有联邦学习模型训练算法,参与者通过下载联邦学习系统提供的沙盒,或利用安装有沙盒的服务器来模拟联邦学习训练过程。
[0014] 优选的,在所述步骤102中,沙盒训练环境中存储有一个加密的沙盒联邦学习模型,所述该加密的沙盒联邦学习模型是将生产环境中的联邦学习模型(称为生产联邦学习模型)的一个拷贝加密后的结果。优选的,在所述步骤102中,系统使用模拟数据训练不同于生产联邦学习模型的沙盒联邦学习模型,存储于所述沙盒训练环境中。
[0015] 优选的,所述联邦学习的沙盒机制还包括模拟虚拟参与者的行为,虚拟参与者会对模拟向沙盒联邦学习模型贡献数据、调用沙盒联邦学习模型、以及攻击或退出模型等行为中的一者或多者。
[0016] 优选的,在所述步骤103中,联邦学习沙盒的市场环境中建有模拟供需曲线。
[0017] 优选的,在所述步骤103中,联邦学习沙盒的市场环境包括模拟数据提供者的行为、模拟虚拟数据提供者行为、模拟模型用户的行为、模拟虚拟模型用户行为的一者或多者。
[0018] 优选的,在所述步骤104中,测量联邦学习过程中的相关参数包括测量联邦学习模型的安全性、效率、经济效益、以及数据提供者提供的数据有效性和成本类型、模型用户的收益类型中的一者或多者。
[0019] 优选的,在所述沙盒环境中建立有沙盒测量环境,测量联邦学习相关参数。
[0020] 优选的,所述沙盒测量环境中包括联邦学习安全性测量模块、联邦学习效率测量模块、联邦经济效益测算模块、数据有效性测量模块、成本测量模块、收益测量模块、支付计算模块中的一者或多者。
[0021] 优选的,在所述联邦学习安全性测量模块中,所述联邦学习模型的安全性包括数据安全性、隐私性和传输安全性中的一者或多者。
[0022] 优选的,在所述测量联邦学习安全性时,衡量联邦学习系统的隐私性,沙盒支持参与者采用同态加密技术加密更新过的神经网络,用模型加密算法的安全级别来衡量模型的隐私性。
[0023] 优选的,所述联邦学习模型安全性测量模块包括,通过衡量传输安全防护指标中一者或多者的实现情况来衡量所述传输安全性,包括端对端数据加密、验签、报文时效校验和接口对接HTTPS协议中的一者或多者。
[0024] 优选的,在所述联邦学习效率测量模块中,联邦学习模型的效率衡量为计算时间、挂钟时间和模型质量中的一者或多者。
[0025] 优选的,在所述联邦经济效益测测算模块中,联邦学习的经济效益包括联邦收入、联邦成本和联邦利润中的一者或多者。
[0026] 优选的,在所述步骤105中,还包括,将沙盒环境中加密测量的参数中的部分或全部加密报告给生产环境。
[0027] 优选的,在所述步骤102中,沙盒训练环境中的联邦学习模型训练算法使用加密后的参与者本地数据进一步训练沙盒联邦学习模型。
[0028] 优选的,所述联邦学习的沙盒机制将联邦学习模型拆分并加密发送给对应的参与者,加密模型单独不可使用。
[0029] 优选的,所述联邦学习沙盒市场环境中还包括对虚拟模型用户行为的模拟,虚拟模型用户模拟市场竞价、调用不同版本的模型、生成不同数量的预测、利润最大化或不完全理性、合谋等行为中的一者或多者。
[0030] 优选的,在所述步骤105中,沙盒支持将所选数据和相关参数利用参与者的第一私钥自动加密,生成第一密文,并将解密第一公钥使用新的第二私钥加密,生成第二密文,存储在参与者本地。参数的报告与解秘即将相关参数的第二密文发送给生产环境。
[0031] 与现有技术相比,本发明具有以下有益效果:
[0032] (1)本发明为实际联邦学习系统提供了沙盒机制。沙盒帮助潜在参与者测试联邦学习系统,并测量包括模型属性、数据有效性和成本等的有关参数。沙盒还支持参与者通过反复实验为实际联合建模过程确定最佳策略,建立合作信心。沙盒机制使得联邦学习系统安全稳定、容易操作、便于实现。
[0033] (2)本发明联邦学习沙盒机制,使得联邦学习的意向用户在正式采用联邦学习系统之前,可以先在沙盒中测试联邦学习系统,并提前测量所需参数。帮助参与者提前量化自身属性,制定联邦学习策略,并建立联合建模的信心。
[0034] (3)在数据有效性和参与者类型等不易测量的情况下沙盒机制为参与者了解自身属性提供了有效途径。并且,如何在实际联邦学习过程中获得最大收益不易计算,沙盒机制提供试错途径,支持参与者试验并应用最佳策略。而且,量化的参与者属性有助于联邦学习系统更加有效地对联邦学习模型产生的收入进行分配,使得联邦学习在经济上可持续。
[0035] (4)设计完善的沙盒机制能够增加联邦学习在实际应用中的安全性、稳定性和可操作性,帮助系统在短期内吸引参与者、增加参与者粘性,以及在长期内提高发展的可持续性。附图说明
[0036] 为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。附图中对模块和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时,应当明白,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0037] 图1示意性地示出根据本申请的一些实施例的流程框图
[0038] 图2示意性地示出根据本申请的一些实施例的建立联邦学习沙盒训练环境流程图
[0039] 图3示意性地示出根据本申请的一些实施例的建立联邦学习沙盒市场环境流程图。
[0040] 图4示意性地示出根据本申请的一些实施例的测量联邦学习相关参数的流程图。
[0041] 图5示意性地示出根据本申请的一些实施例的数据和参数的加密与解密过程示意图。
[0042] 图6示意性地示出根据本申请的一些实施例的对加密测量的参数的报告与解密流程图。

具体实施方式

[0043] 为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述。显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
[0044] 因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
[0045] 在以下详细描述中,阐述了许多具体细节以提供对所描述的示例性实施例的透彻理解。但是,对于本领域技术人员清楚的是,所描述的实施例可以在没有这些具体细节中的一些或全部的情况下进行实践。在所描述的示例性实施例中,为了避免不必要地模糊本公开的概念,没有详细描述众所周知的结构或处理步骤。
[0046] 下文所示的每个框图内的方框可以通过硬件软件固件或其任意组合来实现以实现本公开的原理。本领域技术人员应该理解的是,每个框图中描述的方框可以被组合或分成子框来实现本公开的原理。
[0047] 本公开中呈现的方法的步骤旨在是说明性的。在一些实施例中,该方法可以用未描述的一个或多个附加步骤来完成和/或在没有所讨论的一个或多个步骤的情况下完成。此外,方法的步骤被示出和描述的顺序并不旨在是限制性的。
[0048] 实施例一:
[0049] 参见图1,本申请提供一种联邦学习的沙盒机制,所述沙盒机制包括以下步骤:
[0050] 102、建立联邦学习沙盒训练环境;
[0051] 103、建立联邦学习沙盒市场环境;
[0052] 104、测量联邦学习相关参数;
[0053] 105、对加密测量的参数的报告与解密。
[0054] 在所述步骤102中沙盒训练环境和生产环境相互独立,沙盒训练环境内的所有操作不会影响到生产环境。
[0055] 在所述步骤102中,联邦学习参与者可以将沙盒训练环境下载到本地运行,所述沙盒训练环境由安装有沙盒环境的沙盒服务器提供,沙盒服务器独立于生产环境的服务器。
[0056] 在所述步骤102中,沙盒训练环境中还安装有联邦学习模型训练算法,参与者通过下载联邦学习系统提供的沙盒,或利用安装有沙盒的服务器来模拟联邦学习训练过程。
[0057] 在所述步骤102中,沙盒训练环境中存储有一个加密的沙盒联邦学习模型,所述该加密的沙盒联邦学习模型是将生产环境中的联邦学习模型(称为生产联邦学习模型)的一个拷贝加密后的结果。
[0058] 在所述步骤102中,还可以选择,系统使用模拟数据训练不同于生产联邦学习模型的沙盒联邦学习模型,存储于沙盒环境中。
[0059] 在所述步骤102中,沙盒训练环境还模拟“虚拟参与者”的行为,虚拟参与者会对模拟向沙盒联邦学习模型贡献数据、调用沙盒联邦学习模型、以及攻击或退出模型等行为中的一者或多者。
[0060] 在所述步骤103中,联邦学习沙盒的市场环境建有模拟供需曲线。
[0061] 在所述步骤103中,联邦学习沙盒的市场环境包括模拟数据提供者的行为、模拟虚拟数据提供者行为、模拟模型用户的行为、模拟虚拟模型用户行为中的一者或多者。
[0062] 在所述步骤104中,测量联邦学习过程中的相关参数包括测量联邦学习模型的安全性、效率、经济效益、以及数据提供者提供的数据有效性和成本类型、模型用户的收益类型等,沙盒建立有沙盒测量环境,测量联邦学习相关参数。
[0063] 在所述步骤104中,沙盒测量环境中包括联邦学习安全性测量模块、联邦学习效率测量模块、联邦经济效益测算模块、数据有效性测量模块、成本测量模块、收益测量模块、支付计算模块中的一者或多者。
[0064] 在所述联邦学习安全性测量模块中,联邦学习模型的安全性包括数据安全性、隐私性和传输安全性中的一者或多者。
[0065] 在所述测量联邦学习安全性测量时,衡量联邦学习系统的隐私性,沙盒支持参与者采用同态加密技术加密更新过的神经网络,用模型加密算法的安全级别来衡量模型的隐私性。
[0066] 所述传输安全性衡量数据和模型在传输过程中的安全性,沙盒通过衡量传输安全防护指标中一者或多者的实现情况来衡量传输安全性,包括端对端数据加密、验签、报文时效校验和接口对接HTTPS协议中的一者或多者。
[0067] 在所述联邦学习效率测量模块中,联邦学习模型的效率衡量为计算时间、挂钟时间和模型质量中的一者或多者。
[0068] 在所述联邦经济效益测测算模块中,联邦学习的经济效益包括联邦收入、联邦成本和联邦利润中的一者或多者。
[0069] 在所述步骤105中,联邦学习系统支持参与者将沙盒测试环境测量的参数中的部分或全部加密报告给生产环境。
[0070] 在所述步骤102中,沙盒环境中的联邦学习模型训练算法使用加密后的参与者本地数据训练沙盒联邦学习模型。
[0071] 在模拟联合建模过程中,沙盒将联邦学习模型拆分并加密发送给对应的参与者,加密模型单独不可使用。
[0072] 沙盒市场环境中还包括对虚拟模型用户行为的模拟,虚拟模型用户模拟市场竞价、调用不同版本的模型、生成不同数量的预测、利润最大化或不完全理性、合谋等行为中的一者或多者。
[0073] 在所述步骤105中,沙盒支持将所选数据和相关参数利用参与者的第一私钥自动加密,生成第一密文,并将解密第一公钥使用新的第二私钥加密,生成第二密文,存储在参与者本地。所述参数的报告与解密包括将相关参数的第二密文发送给生产环境。
[0074] 沙盒通过以上步骤帮助潜在参与者测试联邦学习系统,并测量包括模型属性、数据有效性和成本等的有关参数。沙盒还支持参与者通过反复实验为实际联合建模过程确定最佳策略,沙盒机制使得联邦学习系统安全稳定、容易操作、便于实现。
[0075] 实施例二:
[0076] 一种联邦学习的沙盒机制,所述沙盒机制包括以下步骤:
[0077] 步骤102、建立联邦学习沙盒训练环境。
[0078] 所述沙盒为参与者提供模拟实际联邦学习模型训练过程的环境。沙盒内的模型训练环境(称为沙盒训练环境)和实际投入使用的联邦学习模型训练环境(称为生产环境)相互独立,沙盒训练环境内的所有操作不会影响到生产环境。
[0079] 联邦学习参与者可以将沙盒训练环境下载到本地运行。或者沙盒训练环境由安装有沙盒环境的沙盒服务器提供,沙盒服务器独立于生产环境的服务器。
[0080] 沙盒训练环境中存储有一个“沙盒联邦学习模型”,系统将生产环境中的联邦学习模型(称为生产联邦学习模型)的一个拷贝使用公钥加密后作为沙盒联邦学习模型存储于沙盒环境中。或者系统使用模拟数据训练不同于生产联邦学习模型的沙盒联邦学习模型,存储于沙盒环境中。此时,沙盒将一组按一定规则生成的模拟训练数据集用公钥加密后送入沙盒联邦学习模型,根据网络的实际输出与期望输出间的差别使用加密联邦学习算法来调整连接权重,得到训练后的沙盒联邦学习模型。
[0081] 沙盒训练环境中还安装有“联邦学习模型训练算法”,参与者通过下载联邦学习系统提供的沙盒,或利用安装有沙盒的服务器来模拟联邦学习训练过程。沙盒环境中的联邦学习模型训练算法使用加密后的参与者本地数据训练沙盒联邦学习模型。参与者无法解密系统提供的神经网络,沙盒采用同态加密技术,支持参与者用加密过的数据训练加密神经网络,而不泄露双方信息。这个过程中,沙盒仅仅获得加密过的梯度信息和更新后的加密神经网络,未获得参与者的密钥,沙盒无法获得参与者的数据,保障了参与者贡献的数据的安全性。
[0082] 沙盒训练环境中还模拟“虚拟参与者”的行为,虚拟参与者会对模拟向沙盒联邦学习模型贡献数据、调用沙盒联邦学习模型、以及攻击或退出模型等行为中的一者或多者。
[0083] 本步骤通过模拟联邦学习模型的训练环境,构建沙盒联邦学习模型,图2所示的流程是本步骤的一个实现方法,包括以下子步骤:
[0084] 子步骤102.1参与者下载联邦学习系统提供的沙盒训练环境(202),(或)参与者连接安装有沙盒训练环境的服务器(203)。
[0085] 子步骤102.2参与者将加密后的数据发送至沙盒训练环境(204)。
[0086] 子步骤102.3应用联邦学习模型训练算法和加密后的数据在沙盒训练环境中训练沙盒联邦学习模型(205)。
[0087] 子步骤102.4(可选)沙盒训练环境中的虚拟参与者模拟向沙盒联邦学习模型贡献数据、调用沙盒联邦学习模型、攻击联邦学习模型、或中途退出联邦学习模型等行为(206)。
[0088] 图2仅仅是步骤102的示意性流程,用于建立联邦学习沙盒训练环境的方法还可以包括比所示出的步骤更多或更少的步骤,或者可以包括上述步骤中任意步骤的组合步骤。此外,图2中的一些步骤可以同时发生或者按照与所示出的顺序不同的顺序发生。
[0089] 步骤103、建立联邦学习沙盒市场环境。
[0090] 基于步骤102中建立的沙盒联邦学习训练环境,沙盒还建立有沙盒市场环境,来模拟联邦学习的市场环境。
[0091] 在沙盒市场环境中建立模拟供需曲线,预测参与者贡献单位数据的回报,以及调用模型需要支付的费用。模拟需求曲线通过对实际市场中潜在用户对不同价格点的敏感度和接受度的测试,绘制得出用户可以接受的价格区间以及预测收入最高时的定价模拟供应曲线,测算系统应付给每单位数据有效性参数的转移支付,根据预测的参与者的数据有效性和成本类型,以及优化目标的不同而不同。
[0092] 沙盒市场环境中包括模拟数据提供者的行为,数据提供者可以贡献不同的数据,以及报告不同的成本类型。在沙盒市场环境中,沙盒支持参与者在子步骤102.2中提供部分或全部数据,并改变模拟报告的数据有效性参数和类型参数,以获得最大利润。参与者通过在沙盒中模拟数据上传和参数报告,判断最优策略,进而在实际市场中的联合建模过程获取最大收益。
[0093] 若参与者在子步骤102.1中选择通过安装有沙盒的服务器进行模拟联合建模,服务器端沙盒允许多个数据提供者共同模拟联合建模过程。在模拟联合建模过程中,沙盒将联邦学习模型拆分并加密发送给对应的参与者,加密模型单独不可使用。沙盒根据拆分给每个参与者的模型匹配虚拟参与者,允许参与者和虚拟参与者形成有效同盟,模拟合谋行为。例如,沙盒提供合谋沟通渠道,允许参与者商讨虚报参数,形成有效同盟。沙盒为参与者提供合谋前后收益的比较。若联邦模型选择了抗合谋的优化目标,沙盒支持进一步证明合谋无法为参与者带来更高收益,甚至损害参与者的利益。沙盒还通过模拟抗合谋过程为规模较小的弱势参与者建立联合建模信心。
[0094] 沙盒环境中还包括对虚拟数据提供者行为的模拟,虚拟数据提供者模拟真实或虚假报告参数类型、贡献全部或部分数据、利润最大化或不完全理性、合谋等行为。
[0095] 沙盒市场环境中还包括模拟模型用户的行为,模型用户应用的模型等级不同,生成的预测数量不同,需要支付的使用费也不同。沙盒支持用户在沙盒市场环境中选择符合要求的模型等级,包括普通版和专业版等。级别越高的模型生成的预测质量越高,使用费用也越高。沙盒还支持参与者观测虚拟模型的质量来判断实际模型的质量。沙盒提供给用户最终计算结果,用户通过比较虚拟模型的输出结果和实际结果判断模型质量,进而预测生产联邦学习模型可能带来的收益,进而判断是否使用生产联邦学习模型以及生成的预测数量等。
[0096] 沙盒环境中还包括对虚拟模型用户行为的模拟,虚拟模型用户模拟市场竞价、调用不同版本的模型、生成不同数量的预测、利润最大化或不完全理性、合谋等行为。
[0097] 本步骤通过沙盒模拟联邦学习市场环境,帮助参与者制定联邦学习过程中的策略,图3所示的流程是本步骤的一个实现方法,包括以下子步骤:
[0098] 子步骤103.1沙盒在模拟市场中建立模拟供需曲线(302)。
[0099] 子步骤103.2数据提供者在沙盒内模拟各种可能的市场行为,包括贡献部分数据、贡献虚假数据、贡献全部数据、报告真实成本、报告虚假成本、退出模型、和其他数据提供者合谋等(303)。
[0100] 子步骤103.3模型用户在沙盒内模拟各种可能的市场行为,包括选择不同版本级别的模型、生成不同数量的预测、估测模型质量所带来的收益等(304)。
[0101] 子步骤103.4(可选)模拟虚拟数据提供者的行为,并和真实数据提供者相互作用(305)。
[0102] 子步骤103.5(可选)模拟虚拟模型用户的行为,并和真实模型用户相互作用(306)。
[0103] 图3仅仅是步骤103的示意性流程,用于建立联邦学习沙盒市场环境的方法还可以包括比所示出的步骤更多或更少的步骤,或者可以包括上述步骤中任意步骤的组合步骤。此外,图3中的一些步骤可以同时发生或者按照与所示出的顺序不同的顺序发生。
[0104] 步骤104、测量联邦学习相关参数。
[0105] 联邦学习过程中的相关参数包括联邦学习模型的安全性、效率、经济效益、以及数据提供者提供的数据有效性和成本类型、模型用户的收益类型等,沙盒建立有“沙盒测量环境”,测量上述参数中的一者或多者。
[0106] 沙盒测量环境中包括联邦学习安全性测量模块。联邦学习模型的安全性包括数据安全性、隐私性和传输安全性中的一者或多者。数据安全性用数据库安全控制技术指标中一者或多者的实现情况来衡量,包括用户标识和鉴别、存取控制、视图机制、审计和数据加密。例如,在一些实现中,数据安全性衡量为有关上述指标的实现情况的评分的线性函数:
[0107] Data Security=α·x1+β·x2+γ·x3+…
[0108] 不同指标对数据安全性的不同影响程度用不同的参数衡量。隐私性衡量联邦学习系统的保密性,沙盒支持参与者采用同态加密技术加密更新过的神经网络,用模型加密算法的安全级别来衡量模型的隐私性。传输安全性衡量数据和模型在传输过程中的安全性,沙盒通过衡量传输安全防护指标中一者或多者的实现情况来衡量传输安全性,包括端对端数据加密、验签、报文时效校验和接口对接HTTPS协议。例如在一些实现中,沙盒用上述指标中的一者或多者构建类似数据安全性的例子中的线性函数,来衡量传输安全性。“沙盒测量环境”中支持参与者对“沙盒联邦学习模型”进行各种形式的攻击,来验证联邦学习的数据安全性、隐私性、和传输安全性中的一者或多者。
[0109] 沙盒测量环境中包括联邦学习效率测量模块。联邦学习模型的效率衡量为计算时间、挂钟时间和模型质量中的一者或多者。计算时间衡量联合模型获得输入数据至生成预测的时间,计算时间越短,模型的计算效率越高。在另一些实现中,计算效率用模型的计算量来衡量,计算量测量模型生成预测的过程中所需计算的复杂程度。对于同等质量的模型,计算量越低,计算时间越短,计算效率越高。挂钟时间衡量联合模型从训练建模到生成预测的全过程的运行时间,其中包括联邦学习的时间。挂钟时间越短,模型的学习效率越高。在另一些实现中,模型的学习效率衡量为学习速率。对于同样质量的模型,学习速率越高,挂钟时间越短,学习效率越高。联合建模过程通过反复试错确定最佳学习速率,匀速提高学习速率,选择训练成本由减小转变为增大的临界点作为最佳学习速率。沙盒环境中允许用户对沙盒环境进行压测试,短时间内向沙盒环境中上传大量真实或者虚拟数据,以测量沙盒联邦学习模型的效率。
[0110] 沙盒测量环境中包括联邦经济效益测算模块。联邦经济效益包括联邦收入、联邦成本和联邦利润中的一者或多者。收入越高,成本越低,利润越高,经济效益越高。联邦学习的主要收入来源为向模型用户收取的使用费,主要成本为对数据提供者的转移支付以及学习成本等,二者差值用来衡量联邦学习的利润。向用户收取的使用费衡量为关于模型质量的函数,模型质量又衡量为关于数据有效性参数。付给参与者的转移支付以及学习成本衡量为关于数据有效性参数和参与者类型参数的函数。
[0111] 沙盒测量环境中包括数据提供者的数据有效性测量模块,支持数据提供者在不向生产环境贡献数据的情况下测量自身的数据有效性。在沙盒中对于数据有效性的测量是加密的,除了数据提供者自身其他方无法获知。
[0112] 沙盒测量环境中还包括数据提供者的成本测量模块,支持数据提供者测量自身贡献数据的成本。在沙盒中对于成本的测量是加密或者是在本地进行的,除了数据提供者自身其他方无法获知。
[0113] 沙盒测量环境中还包括模型用户的收益测量模块,支持模型用户测量自身使用不同版本模型的收益,在沙盒中对于收益的测量是加密或者是在本地进行的,除了模型用户自身其他方无法获知。
[0114] 沙盒测量环境中还包括支付计算模块,计算数据提供者贡献不同数据有效性以及报告不同的成本时给数据提供者的模拟支付,以及计算模型用户调用不同版本的模型以及对模型调用不同次数所收取的模拟使用费。
[0115] 上述这仅仅是沙盒环境的示意性结构,所述沙盒环境还可以包括比上述模块更多或更少的模块,或者可以包括上述模块中任意模块的组合模块,以及以其他方式连接的上述模块。在本步骤的一些实现中,相关参数利用加密计算方法测量,在参与者未提供密钥的情况下,系统无法解密参数。沙盒测量模块将测得的相关参数加密发送至参与者,保障数据和参与者隐私安全。
[0116] 本步骤通过联邦学习的相关参数,量化联邦学习平台、联邦学习模型和联邦学习参与者的相关属性。图4所示的流程是本步骤的一个实现方法,包括以下子步骤:
[0117] 子步骤104.1通过测量数据安全性、隐私性和传输安全性中的一者或多者来测量联邦学习模型的安全性(402)。
[0118] 子步骤104.2通过测算计算时间、挂钟时间和模型质量中的一者或多者来测量联邦学习模型的效率(403)。
[0119] 子步骤104.3通过测算模型质量、模型收入、模型成本和模型利润中的一者或多者来测量联邦学习模型的经济效益(404)。
[0120] 子步骤104.4测量联邦学习参与者的个体参数(405)。
[0121] 子步骤104.4.1测量数据提供者的成本。
[0122] 子步骤104.4.2测量数据提供者的模型质量。
[0123] 子步骤104.4.3测量模型用户的收益。
[0124] 子步骤104.4.4计算对参与者的模拟支付。
[0125] 子步骤104.4.5计算对模型用户收取的模拟使用费。
[0126] 子步骤104.5加密测量并传输上述全部或部分参数(406)。
[0127] 步骤105、对加密测量的参数的报告与解密。
[0128] 图4仅仅是本步骤的示意性流程,用于测量联邦学习相关参数的方法还可以包括比所示出的步骤更多或更少的步骤,或者可以包括上述步骤中任意步骤的组合步骤。此外,图4中的一些步骤可以同时发生或者按照与所示出的顺序不同的顺序发生。
[0129] 联邦学习系统支持参与者将沙盒测试环境测量的参数中的部分或全部加密报告给生产环境。
[0130] 在一些实现中,参与者选择使其利益最大的全部或部分数据,并确定希望报告给联邦学习系统的参数。沙盒支持将所选数据和相关参数利用参与者的第一私钥自动加密,生成第一密文,并将解密第一公钥使用新的第二私钥加密,生成第二密文,存储在参与者本地。参数的报告即将相关参数的第二密文发送给生产环境。
[0131] 如图5,在一些实现中,沙盒自动采用RSA加密方法用参与者私钥A加密数据和相关参数(501),生成第一密文A(502)。同时,沙盒自动将第一公钥A(503)用参与者的第二私钥B加密,生成第二密文B(504)。在报告参数阶段,沙盒自动将密文A(505)发送至组织者,将密文B(504)留在参与者本地。在参与者未发送密文B的情况下,组织者无法解密密文A。在参数解密阶段,组织者获得加密的报告参数后,沙盒支持参与者选择是否将加密过的解密参数的公钥发送至联邦学习系统。如图5,在上述例子中,组织者获得密文A后向参与者发送信号,沙盒提示参与者是否向组织者发送密文B。若参与者确定发送密文B给组织者,组织者利用公钥B解密密文B(507),并用明文B中包含的公钥A(508)解密密文A,获得明文A(506),得到参与者贡献的数据和报告参数。
[0132] 子步骤105.1基于步骤103中模拟支付结果和步骤104中的参数测算结果,参与者确定希望报告至联邦学习生产环境的参数,并加密发送报告参数(602)。
[0133] 子步骤105.2组织者获得加密参数后,参与者选择是否发送解密公钥(603)。
[0134] 子步骤105.3若参与者在子步骤105.2中选择发送解密公钥,生产环境用公钥解密获取相关参数(604)。
[0135] 子步骤105.4生产环境使用解密的参数计算向模型用户收取的实际使用费以及向数据提供者的实际支付(605)。
[0136] 图6仅仅是步骤105的示意性流程,用于对加密测量的参数的报告与解密的方法还可以包括比所示出的步骤更多或更少的步骤,或者可以包括上述步骤中任意步骤的组合步骤。此外,图6中的一些步骤可以同时发生或者按照与所示出的顺序不同的顺序发生。
[0137] 另外,联邦学习沙盒机制也可以包括图1步骤中任意步骤的组合步骤。此外,图1中的一些步骤可以同时发生或者按照与所示出的顺序不同的顺序发生。
[0138] 本发明使得联邦学习的意向用户提前测量所需参数,帮助参与者提前量化自身属性,制定联邦学习策略,建立联合建模的信心,为参与者了解自身属性提供了有效途径。增加了联邦学习在实际应用中的安全性、稳定性和可操作性,帮助系统在短期内吸引参与者、增加参与者粘性,以及在长期内提高发展的可持续性。
[0139] 从上述实施例中,本领域技术人员可以清楚地知晓,可以通过软件及必要的硬件来实现本公开,或者可以通过硬件、固件等来实现本公开。基于这种理解,可以部分地以软件形式来实现本公开的实施例。计算机软件可以存储在计算机的可读存储介质中,比如软盘硬盘、光盘或闪存中。计算机软件包括使得计算机(例如个人计算机、服务站或网络终端)运行根据本公开的各个实施例的方法或其一部分的一系列指令。
[0140] 以上所述仅为本发明的优选实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化;凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈