首页 / 专利库 / 电脑编程 / 高性能计算 / 面向分布式高性能计算集群调试系统

面向分布式高性能计算集群调试系统

阅读:78发布:2020-05-15

专利汇可以提供面向分布式高性能计算集群调试系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种面向分布式 高性能计算 集群调试系统,包括主服务部分和集群agent服务;所述的主服务部分提供集群agent注册、统一任务查询、统一权限管理;集群agent服务提供任务查询、任务调试。本发明提供的面向分布式高性能计算集群调试系统,具有的技术效果有:(1)统一查询多集群中运行的任务;(2)统一入口,分布式调试不同集群中运行的任务;(3)统一用户权限管理,从 云 厂商资源管理中隔离出来,方便用户操作;(4)快速横向扩展,方便添加新集群。,下面是面向分布式高性能计算集群调试系统专利的具体信息内容。

1.面向分布式高性能计算集群调试系统,其特征在于,包括主服务部分和集群agent服务;
所述的主服务部分提供集群agent注册、统一任务查询、统一权限管理;
集群agent服务提供任务查询、任务调试。
2.根据权利要求1所述的面向分布式高性能计算集群调试系统,其特征在于,所述的主服务部分包括集群agent注册子模、统一任务查询子模块,统一权限管理子模块;
所述的集群agent注册子模块,支持集群agent将自身注册到主服务,提供后续的任务查询和任务调试;
所述的统一任务查询子模块,根据用户提供的任务handle,统一查询当前系统所有集群agent,是否存在该任务,把所有查到任务返回给用户;
所述的统一权限管理子模块,主要划分用户具有什么样的权限,查询权限,调试权限。
3.根据权利要求1或2所述的面向分布式高性能计算集群调试系统,其特征在于,所述的集群agent服务包括任务查询子模块、任务调试子模块;
所述的任务查询子模块,支持查询当前系统正在运行的任务;
所述的任务调试子模块,提供网页终端服务,通过网页终端连接进入容器,实现网页终端调试任务。

说明书全文

面向分布式高性能计算集群调试系统

技术领域

[0001] 本发明属于高性能计算技术领域,具体涉及面向分布式高性能计算集群调试系统。

背景技术

[0002] 在基于公有构建的高性能计算系统,在各个不同云厂商申请到计算资源,用mesos或者kubernets资源调度系统对公有云资源管理,任务调度系统将任务调度到计算资源中运行;底层任务的运行时环境为docker container,查看任务实时情况或任务调试,通过docker或者kubernets进入到容器环境进行相应的操作,确定任务的具体情况或调试任务的异常情况,确保任务的正常运行。
[0003] 公有云环境下,进入容器调试主要有以下的问题:(1)公有云机器分布在网络上,计算资源都是动态申请的,计算完成后,资源会释放,每次的计算资源都不相同,进入容器调试需要先查找任务所在的节点,然后分配到指定人登陆到具体节点,再进入容器调试,操作不方便。
[0004] (2)所有的资源都需要权限管理,无论docker方式,还是kubernets方式进入容器调试,都需要先给调试人在指定资源上分配相应的权限才能顺利进入容器操作,如果调试任务的人多,极大增加管理资源的人的工作量,增加公司运营成本。

发明内容

[0005] 针对上述问题,本发明提供一种面向分布式高性能计算集群调试系统,实现支持多个云厂商跨多个公有云区域的多集群的调试系统;能统一查询任务,列出任务所在集群,任务调试链接;统一权限管理,什么用户,有查询和调试任务的权限;统一调试界面,通过查询得到调试链接,点开链接直接进入网页调试界面;快速扩展,新建集群能自动注册到调试系统,支持任务查询和调试。
[0006] 所采用的技术方案为:面向分布式高性能计算集群调试系统,包括主服务部分和集群agent服务;
所述的主服务部分提供集群agent注册、统一任务查询、统一权限管理;
主服务部分包括集群agent注册子模、统一任务查询子模块,统一权限管理子模块;
所述的集群agent注册子模块,支持集群agent将自身注册到主服务,提供后续的任务查询和任务调试;
所述的统一任务查询子模块,根据用户提供的任务handle,统一查询当前系统所有集群agent,是否存在该任务,把所有查到任务返回给用户;
所述的统一权限管理子模块,主要划分用户具有什么样的权限,查询权限(分集群),调试权限(分集群);
集群agent服务提供任务查询、任务调试:
集群agent服务包括任务查询子模块、任务调试子模块;
任务查询子模块,支持查询当前系统正在运行的任务;
任务调试子模块,提供网页终端服务,通过网页终端连接进入容器,实现网页终端调试任务。
[0007] 本发明提供的面向分布式高性能计算集群调试系统,具有的技术效果有:(1)统一查询多集群中运行的任务;
(2)统一入口,分布式调试不同集群中运行的任务;
(3)统一用户权限管理,从云厂商资源管理中隔离出来,方便用户操作;
(4)快速横向扩展,方便添加新集群。
附图说明
[0008] 图1是本发明的系统架构图;图2是实施例的用户交互图;
图3是实施例的结果对比图。

具体实施方式

[0009] 结合实施例说明本发明的具体技术方案。
[0010] 如图1所示,面向分布式高性能计算集群调试系统,包括主服务部分和集群agent服务;所述的主服务部分提供集群agent注册、统一任务查询、统一权限管理;
主服务部分包括集群agent注册子模块、统一任务查询子模块,统一权限管理子模块;
所述的集群agent注册子模块,支持集群agent将自身注册到主服务,提供后续的任务查询和任务调试;
所述的统一任务查询子模块,根据用户提供的任务handle,统一查询当前系统所有集群agent,是否存在该任务,把所有查到任务返回给用户;
所述的统一权限管理子模块,主要划分用户具有什么样的权限,查询权限(分集群),调试权限(分集群);
集群agent服务提供任务查询、任务调试:
集群agent服务包括任务查询子模块、任务调试子模块;
任务查询子模块,支持查询当前系统正在运行的任务;
任务调试子模块,提供网页终端服务,通过网页终端连接进入容器,实现网页终端调试任务。
[0011] 该面向分布式高性能计算集群调试系统的使用具体步骤:(1)用户通过web进入系统登陆页面,输入用户信息,完成验证登陆;通过统一权限管理子模块的认证后,进入到任务搜索模块;
(2)进入任务搜索页面,输入要搜索的任务handle,点击搜索按钮,即可完成搜索;
(3)任务搜索模块通过与注册的各个agent交互数据,查询当前搜索的任务handle,将任务相关的信息如任务在集群运行的名称,平台,命名空间,调试链接等等作为结果展示出来;
(4)点击结果页上的”shell链接”即可进入任务的调试页面;;
(5)新集群的加入,如图1中 C 集群,通过配置agent 主服务host, C集群就可以主动注册到BB8系统中,然后重复上面 1-4 步骤就可以完成任务查询和调试。
[0012] 用户通过WEB访问整个系统,在BB8服务中验证权限以及查询任务,通过web-term提供的链接,进入任务内部进行调试;操作参照图2用户交互图,整个系统参照图1系统架构图。
[0013] 图3中上半部分,本发明前的实施情况,用户是需要登陆到每一个k8s集群查找调试的任务是否在集群中,每个集群重复这个步骤,然后对资源管理的人员需要对不同用户赋予不同权限,查看不同的信息;图中下半部分,为本发明的实施情况,客户通过bb8系统分配的用户,用户对应了相应的权限,对集群哪部分资源可查看等,统一在bb8系统中查找需要调试的任务,找到任务后,通过指定链接跳转到任务容器中进行任务调试。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈