首页 / 专利库 / 电脑零配件 / 接口 / 用户界面 / web界面 / 一种支持ETL任务调度可视化的方法

一种支持ETL任务调度可视化的方法

阅读:688发布:2020-05-08

专利汇可以提供一种支持ETL任务调度可视化的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及服务端开发技术领域,具体涉及一种支持ETL任务调度 可视化 的方法,对ETL任务脚本文件校验处理; 请求 查询ETL任务脚本内容,生成DAG数据返回;若接收ETL任务脚本文件 修改 请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容;配置动态执行触发机制;实时执行ETL任务请求,并实时显示任务执行日志,本发明可以在不修改和应用ETL carte应用的情况下,实现任务可视化、上传或修改ETL任务脚本以及动态执行任务,使得运维人员可直接通过 web界面 掌控掌控ETL任务脚本的运行状态和运行结果,提升了业务的 稳定性 和扩展性。,下面是一种支持ETL任务调度可视化的方法专利的具体信息内容。

1.一种支持ETL任务调度可视化的方法,其特征在于,包括:
对ETL任务脚本文件校验处理;
请求查询ETL任务脚本内容,生成DAG数据返回;
若接收ETL任务脚本文件修改请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容;
配置动态执行触发机制;
实时执行ETL任务请求,并实时显示任务执行日志。
2.根据权利要求1所述的一种支持ETL任务调度可视化的方法,其特征在于, 对ETL任务脚本文件校验处理,包括:
在第一服务端获取客户端上传的ETL任务脚本文件,其中ETL任务脚本文件为kjb文件;
校验ETL任务脚本文件的内容合法性,包括检查ETL任务脚本文件的后缀是否规范、能否以XML方式将ETL任务脚本文件读取出来、检查是否符合kettle脚本规范;
通过vsftp服务将ETL任务脚本文件传送至第二服务端,并向客户端返回上传结果及文件地址。
3.根据权利要求1所述的一种支持ETL任务调度可视化的方法,其特征在于,请求查询ETL任务脚本内容,生成DAG数据并返回,包括:
通过第一服务端接收客户端查询ETL任务脚本内容请求,并查询文件地址;
根据查询到的文件地址在第二服务端请求下载ETL任务脚本文件,并向第一服务端返回任务文件流;
在第一服务端读取任务文件流,获取ETL任务脚本内容并组装成DAG数据结构;
返回客户端DAG数据,在客户端绘制任务DAG有向环形图。
4.根据权利要求1所述的一种支持ETL任务调度可视化的方法,其特征在于, 接收ETL任务脚本文件修改请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容,包括:
通过第一服务端接收客户端发送的ETL任务脚本文件修改请求,并保存ETL任务脚本文件;
将原始的ETL任务脚本文件解析成XML文档,并将修改的内容覆盖原XML文档的节点内容,保存成新的ETL任务脚本文件;
通过vsftp服务上传新的ETL任务脚本文件至第二服务端覆盖原文件保存。
5.根据权利要求1所述的一种支持ETL任务调度可视化的方法,其特征在于,配置动态执行触发机制,包括:
通过ThreadPoolTaskScheduler调度器创建一个新的定时任务,并将定时任务信息保存在数据库中;
到定时时间向第二服务端触发调用carte接口的请求;
第二服务端返回任务执行日志流至第一服务端,第一服务端保存日志流信息到数据库中。
6.根据权利要求1所述的一种支持ETL任务调度可视化的方法,其特征在于,执行ETL任务请求,并实时显示任务执行日志,包括:
通过第一服务端获取客户端发送的执行ETL任务请求;
调用Rest http接口执行ETL任务请求,并监听第二服务端carte服务的日志返回流至第一服务端;
第一服务端将日志流格式化组装后返回客户端,在客户端实时显示任务执行日志。
7.根据权利要求1-6任一项所述的一种支持ETL任务调度可视化的方法,其特征在于,第一服务端为应用调度服务端,第二服务端为kettle carte服务端。
8.一种计算机可读存储设备,存储有计算机程序,其特征在于,所述计算机程序被处理器执行以实现权利要求1至6任意一项所述的支持ETL任务调度可视化的方法。
9.一种移动终端,其特征在于,包括:
处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现权利要求1至6任意一项所述的支持ETL任务调度可视化的方法。
10.一种支持ETL任务调度可视化的系统,其特征在于,包括服务器
服务器包括处理器和存储设备;
处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现权利要求1至6任意一项所述的支持ETL任务调度可视化的方法。

说明书全文

一种支持ETL任务调度可视化的方法

技术领域

[0001] 本发明涉及前端开发技术领域,具体涉及一种支持ETL任务调度可视化的方法。

背景技术

[0002] Carte是一个轻量级的web服务,允许远程请求HTTP进行监控、启动、停止在Carte服务上运行的ETL job和trans。但是Carte也存在一些弊端,比如Carte没有提供任务可视化界面,不便于查看ETL任务脚本的执行细节内容,并且ETL原生的定时任务机制缺乏灵活性,不能配置任务动态执行的策略,从而导致不能满足实际业务开发需求。
[0003] 因此,行业内亟需一种能解决上述问题的方案。

发明内容

[0004] 本发明的目的在于针对现有技术的不足而提供一种支持ETL任务调度可视化的方法。本发明的目的可以通过如下所述技术方案来实现。
[0005] 一种支持ETL任务调度可视化的方法,包括:对ETL任务脚本文件校验处理;
请求查询ETL任务脚本内容,生成DAG数据返回;
若接收ETL任务脚本文件修改请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容;
配置动态执行触发机制;
实时执行ETL任务请求,并实时显示任务执行日志。
[0006] 进一步地, 对ETL任务脚本文件校验处理,包括:在第一服务端获取客户端上传的ETL任务脚本文件,其中ETL任务脚本文件为kjb文件;
校验ETL任务脚本文件的内容合法性,包括检查ETL任务脚本文件的后缀是否规范、能否以XML方式将ETL任务脚本文件读取出来、检查是否符合kettle脚本规范;
通过vsftp服务将ETL任务脚本文件传送至第二服务端,并向客户端返回上传结果及文件地址。
[0007] 进一步地,请求查询ETL任务脚本内容,生成DAG数据并返回,包括:通过第一服务端接收客户端查询ETL任务脚本内容请求,并查询文件地址;
根据查询到的文件地址在第二服务端请求下载ETL任务脚本文件,并向第一服务端返回任务文件流;
在第一服务端读取任务文件流,获取ETL任务脚本内容并组装成DAG数据结构;
返回客户端DAG数据,在客户端绘制任务DAG有向环形图。
[0008] 进一步地, 接收ETL任务脚本文件修改请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容,包括:通过第一服务端接收客户端发送的ETL任务脚本文件修改请求,并保存ETL任务脚本文件;
将原始的ETL任务脚本文件解析成XML文档,并将修改的内容覆盖原XML文档的节点内容,保存成新的ETL任务脚本文件;
通过vsftp服务上传新的ETL任务脚本文件至第二服务端覆盖原文件保存。
[0009] 进一步地,配置动态执行触发机制,包括:通过ThreadPoolTaskScheduler调度器创建一个新的定时任务,并将定时任务信息保存在数据库中;
到定时时间向第二服务端触发调用carte接口的请求;
第二服务端返回任务执行日志流至第一服务端,第一服务端保存日志流信息到数据库中。
[0010] 进一步地,执行ETL任务请求,并实时显示任务执行日志,包括:通过第一服务端获取客户端发送的执行ETL任务请求;
调用Rest http接口执行ETL任务请求,并监听第二服务端carte服务的日志返回流至第一服务端;
第一服务端将日志流格式化组装后返回客户端,在客户端实时显示任务执行日志。
[0011] 进一步地,第一服务端为应用调度服务端,第二服务端为kettle carte服务端。
[0012] 一种计算机可读存储设备,存储有计算机程序,所述计算机程序被处理器执行以实现上述的支持ETL任务调度可视化的方法。
[0013] 一种移动终端,包括:处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现上述的支持ETL任务调度可视化的方法。
[0014] 一种支持ETL任务调度可视化的系统,包括服务器;服务器包括处理器和存储设备;
处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现上述的支持ETL任务调度可视化的方法。
[0015] 与现有技术比,本发明的有益效果:本发明研发了一种支持ETL任务调度可视化的方法,可以在不修改和应用ETL carte应用的情况下,实现任务可视化、上传或修改ETL任务脚本以及动态执行任务,使得运维人员可直接通过web界面掌控掌控ETL任务脚本的运行状态和运行结果,提升了业务的稳定性和扩展性。
附图说明
[0016] 图1为本发明实施例中的流程示意图。

具体实施方式

[0017] 下面将结合具体实施例,对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通的技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明的保护范围。
[0018] 本发明针对现有技术中Carte没有提供任务可视化界面,不便于查看ETL任务脚本的执行细节内容,并且ETL原生的定时任务机制缺乏灵活性的问题,提供一种支持ETL任务调度可视化的方法,通过web管理系统可动态增加ETL任务,在线查看ETL任务的内容并可修改其中的任务执行细节,而且还可以配置任务动态执行的策略。
[0019] 一种支持ETL任务调度可视化的方法,如图1所示,基于客户端、第一服务端及第二服务端,其中第一服务端为应用调度服务端,第二服务端为kettle carte服务端,包括:为了使ETL任务请求能够适应支持ETL任务调度可视化的方法,顺利地在客户端、第一服务端及第二服务端之间进行信息通讯,对ETL任务脚本文件校验处理,使得从客户端上传的ETL任务脚本文件符合预定的要求,保证了本方法在运行过程的稳定。
[0020] 客户端向第一终端请求查询ETL任务脚本内容,由于前面已经对ETL任务脚本文件进行校验处理成预定要求,第一服务端可以根据预定的要求查询ETL任务脚本文件,通过第二服务端获取ETL任务文件生成DAG数据,并返回给客户端。
[0021] 可以通过web管理界面查看ETL任务脚本对应的DAG数据,可以了解到ETL任务脚本文件的细节内容,同时可以在线修改ETL任务脚本文件。当需要修改ETL任务脚本文件时,通过客户端向第一服务端发送ETL任务脚本文件修改请求,当第一服务端接收ETL任务脚本文件修改请求时,解析ETL任务脚本文件,完成解析后便可修改ETL任务脚本文件内容。
[0022] 为了能更好地通过web界面掌控ETL任务脚本的运行状态和运行结果,配置动态执行触发机制,完成配置动态执行触发机制后,可以实时执行ETL任务请求,并实时显示任务执行日志。
[0023] 本实施例中, 对ETL任务脚本文件校验处理,具体包括,在第一服务端获取客户端上传的ETL任务脚本文件,其中ETL任务脚本文件为kjb文件。校验ETL任务脚本文件的内容合法性,合法性包括但不限于检查ETL任务脚本文件的后缀是否规范以便识别查询ETL任务脚本文件;能否以XML方式将ETL任务脚本文件读取出来以便ETL任务脚本文件解析出来进行修改;检查是否符合kettle脚本规范以便运行任务动态执行的策略。若检测到ETL任务脚本文件的内容不具备合法性,则优选对不具备合法性的ETL任务脚本文件进行处理,转换成具备合法性的ETL任务脚本文件,若无法通过转换则需提醒重新上传具备合法性的ETL任务脚本文件。通过vsftp服务将ETL任务脚本文件传送至第二服务端,并向客户端返回上传结果及文件地址,便于进行请求查询ETL任务脚本内容。
[0024] 本实施例中,请求查询ETL任务脚本内容,生成DAG数据并返回,具体包括,当需要请求查询时,在客户端想第一服务端发送查询ETL任务脚本内容的请求,第一服务端接收客户端查询ETL任务脚本内容请求,并查询文件地址,文件地址是在对ETL任务脚本文件校验合法后确定,可快速查询到相应的ETL任务脚本内容。根据查询到的文件地址向第二服务端请求下载ETL任务脚本文件,并向第一服务端返回任务文件流。在第一服务端读取任务文件流,获取包括任务节点名称、节点间的关系、任务的起点和终点等ETL任务脚本内容组装成DAG数据结构,返回客户端DAG数据,在客户端绘制任务DAG有向环形图,方便后续进行在线修改ETL任务脚本内容。其中,DAG有向环形图是客户端使用开源组件绘制的。
[0025] 本实施例中, 接收ETL任务脚本文件修改请求,则解析ETL任务脚本文件,并修改ETL任务脚本文件内容,具体包括,在客户端修改ETL任务脚本内容,请求向第一服务端保存修改文件内容,第一服务端接收客户端发送的ETL任务脚本文件修改请求后保存ETL任务脚本文件。并且,将原始的ETL任务脚本文件解析成XML文档以便进行修改,将修改的内容覆盖原XML文档的节点内容,保存成新的ETL任务脚本文件,从而完成修改,然后再通过vsftp服务上传新的ETL任务脚本文件至第二服务端覆盖原文件保存。
[0026] 本实施例中,配置动态执行触发机制,可支持标准的cron计划任务时间配置,具体包括,通过ThreadPoolTaskScheduler调度器创建一个新的定时任务,并将定时任务信息保存在数据库中。ThreadPoolTaskScheduler本身就是spring用于创建定时任务的组件,使用方法schedule就能创建一个定时任务。定时任务的触发可以根据不同的情况进行适应性的设置。执行触发机制时,到定时时间向第二服务端触发调用carte接口的请求,第二服务端返回任务执行日志流至第一服务端,第一服务端保存日志流信息到数据库中。
[0027] 本实施例中,执行ETL任务请求,并实时显示任务执行日志,具体包括,客户端发送实时执行ETL任务请求,第一服务端获取客户端发送的执行ETL任务请求后调用Rest http接口执行ETL任务请求,监听并定时读取第二服务端carte服务的日志返回流,将日志流格式化组装后返回客户端,在客户端实时显示任务执行日志。日志流格式化组装只保留任务名称、实时状态、节点执行日志,其他的去除信息。
[0028] 本发明提供的一种支持ETL任务调度可视化的方法,通过web管理界面上传ETL任务脚本到应用调度服务器,应用调度服务器将任务脚本通过VSFTP技术上传至carte服务器上,用户还可通过web管理界面查看ETL任务脚本的执行细节内容,系统提供ETL任务的DAG有向环形图,可在线修改ETL任务脚本内容,系统将解析ETL任务脚本成XML文档,修改XML文档中的 内 容以 达到 修改 脚本的 目的 ,而且 系统 通过 Sp ri ng 框架的ThreadPoolTaskScheduler完成任务的动态调度执行。
[0029] 以此,可以在不修改和应用ETL carte应用的情况下,实现任务可视化、上传或修改ETL任务脚本以及动态执行任务,使得运维人员可直接通过web界面掌控掌控ETL任务脚本的运行状态和运行结果,提升了业务的稳定性和扩展性。
[0030] 另外,本领域普通技术人员可以理解:实现上述方法实施的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序指令可以存储于一计算机可读取存储介质或存储设备中,该程序指令在执行时,执行上述方法的步骤;而前述存储介质或存储设备包括但不限于:ROM、RAM、磁盘或者光盘等各种可以存储程序代码的介质。
[0031] 因此相应地,本发明实施例还提供了一种计算机可读存储设备,存储有计算机程序,所述计算机程序被处理器执行以实现所述支持ETL任务调度可视化的方法。
[0032] 进一步地,本发明还配套提供了一种相应的移动终端、系统来实现上述支持ETL任务调度可视化的方法,具体为:一种移动终端,包括:
处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现所述的支持ETL任务调度可视化的方法。
[0033] 支持ETL任务调度可视化的方法,包括服务器;服务器包括处理器和存储设备;处理器,适于执行程序指令;
存储设备,适于存储程序指令,所述程序指令适于由处理器加载并执行以实现所述的支持ETL任务调度可视化的方法。
[0034] 以上借助具体实施例对本发明做了进一步描述,但是应该理解的是,这里具体的描述,不应理解为对本发明的实质和范围的限定,本领域内的普通技术人员在阅读本说明书后对上述实施例做出的各种修改,都属于本发明所保护的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈