首页 / 专利库 / 软件 / 电子设计自动化 / 计算机辅助设计 / 一种基于词根表的脚本辅助设计方法及装置

一种基于词根表的脚本辅助设计方法及装置

阅读:1030发布:2020-05-15

专利汇可以提供一种基于词根表的脚本辅助设计方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于词根表的脚本辅助设计方法及装置,所述方法具体包括:建立关键字表;基于所述关键字表建立口径系统;利用所述口径系统获取用户输入的查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的 属性信息 写入预先设置的脚本模板对应的模板属性中,生成目标脚本。实施本发明可以使关键字数据规范统一,易于维护,同时无需重复建立脚本,避免了重复劳动,节省工作量。,下面是一种基于词根表的脚本辅助设计方法及装置专利的具体信息内容。

1.一种基于词根表的脚本辅助设计方法,其特征在于,所述方法包括:
建立关键字表;
基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
2.根据权利要求1所述的脚本辅助设计方法,其特征在于,所述建立关键字表,具体可以包括:
间隔预设时间对数据仓库进行验数,并统计在所述预设时间内生成的源数据表,所述源数据表包括描述字段;
将所述描述字段中的描述信息使用关键字进行替换,建立关键字表。
3.根据权利要求2所述的脚本辅助设计方法,其特征在于,所述基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字,具体包括:
获取所述源数据表中的第一源数据表,并确定所述第一源数据表中至少一个主键;
计算每一个所述第一源数据表中至少一个主键作为外键的次数,从所述第一源数据表中至少一个主键中选取所述作为外键的次数大于或等于预设次数阈值的主键作为所述第一源数据表的维度关键字;
或者,
计算每一个所述第一源数据表中至少一个主键作为外键的比例,从所述第一源数据表中至少一个主键中选取所述作为外键的比例大于或等于预设比例阈值的主键作为所述第一源数据表的维度关键字,所述第一源数据表为所述源数据表中的任意一个源数据表。
4.根据权利要求3所述的脚本辅助设计方法,其特征在于,所述基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为指标关键字,具体包括:
获取所述源数据表中的第二源数据表,并确定所述第二源数据表中除外键之外的至少一个关键字;
计算所述第二源数据表中除所述外键以外的每一个关键字的使用数量,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用数量大于或等于预设使用数量阈值的关键字;
或者,
计算所述第二源数据表中除所述外键以外的每一个关键字的使用率,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用率大于或等于预设使用率阈值的关键字;
或者,
计算所述第二源数据表中除所述外键以外的每一个关键字的使用频率,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用数量大于或等于预设使用频率阈值的关键字,所述第二源数据表为所述源数据表中除所述第一源数据表以外的任意一个源数据表。
5.根据权利要求4所述的脚本辅助设计方法,其特征在于,所述根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统,具体包括:
根据所述维度关键字按照不同的主题类别进行维度拆分,并将拆分后的维度关键字存入多个维度表,所述多个维度表对应多个主题类别;
根据所述指标关键字按照不同维度进行指标拆分,并将拆分后的指标关键字存入多个指标表,所述多个指标表对应多个维度;
根据所述多个指标表的外键和所述多个维度表自动生成维度-指标组合表,所述维度-指标组合表包括所述维度-指标组合以及所述维度-指标组合对应的标准查询指令,利用所述维度-指标组合及其对应的标准查询指令建立口径系统。
6.根据权利要求1-5任一项所述的脚本辅助设计方法,其特征在于,所述接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字,具体包括:
接收用户输入的查询指令,将所述查询指令与所述口径系统中的标准查询指令进行匹配,获取匹配成功的标准查询指令对应的维度-指标组合;
根据所述匹配成功的标准查询指令对应的维度-指标组合获取所述查询指令对应的中文关键字;
将所述查询指令对应的中文关键字拆分为至少一个中文词根,以及通过所述预先设置的中英文对照词根表获取所述至少一个中文词根对应的至少一个英文词根;
将所述至少一个英文词根进行组合生成所述查询指令对应的英文关键字。
7.根据权利要求6所述的脚本辅助设计方法,其特征在于,所述接收用户输入的查询指令,将所述查询指令与所述口径系统中的标准查询指令进行匹配,获取匹配成功的标准查询指令对应的维度-指标组合,具体包括:
接收用户输入的查询指令,将所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容进行匹配;
若所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容的匹配度大于或等于预设匹配度阈值,则确定所述查询指令与所述口径系统中的标准查询指令匹配成功,根据所述口径系统获取匹配成功的标准查询指令对应的维度-指标组合。
8.一种基于词根表的脚本辅助设计装置,其特征在于,所述装置具体包括:
第一建立模,用于建立关键字表;
第二建立模块,用于基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
英文关键字获取模块,用于接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
脚本生成模块,用于根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
9.一种基于词根表的脚本辅助设计设备,所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的一种基于词根表的脚本辅助设计方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的一种基于词根表的脚本辅助设计方法的步骤。

说明书全文

一种基于词根表的脚本辅助设计方法及装置

技术领域

[0001] 本发明涉及脚本领域,尤其涉及一种基于词根表的脚本辅助设计方法及装置。

背景技术

[0002] 脚本(Script)是批处理文件的延伸,是一种纯文本保存的程序,一般来说的计算机脚本程序是确定的一系列控制计算机进行运算操作动作的组合,在其中可以实现一定的逻辑分支,脚本通常可以由应用程序临时调用并执行。
[0003] 但现有技术中,每次建模都是通过重新撰写脚本,根据维度-指标的组合获取对应的关键字段数据,建立表格,但是这种方式不仅工作量大,而且关键字段数据没有统一的规范,造成大量的重复劳动,同时代码长度也因此而增加,不易于维护。

发明内容

[0004] 本发明实施例提供一种基于词根表的脚本辅助设计方法及装置,主要旨在解决现有技术中根据维度-指标的组合获取对应的关键字段数据,建立表格时,不仅工作量大,而且关键字段数据没有统一的规范,造成大量的重复劳动,同时代码长度也因此而增加,不易于维护的问题。
[0005] 第一方面,本发明实施例提供了一种基于词根表的脚本辅助设计方法,具体包括:
[0006] 建立关键字表;
[0007] 基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0008] 接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0009] 根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0010] 第二方面,本发明还提供了一种基于词根表的脚本辅助设计装置,所述装置包括:
[0011] 第一建立模,用于建立关键字表;
[0012] 第二建立模块,用于基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0013] 英文关键字获取模块,用于接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0014] 脚本生成模块,用于根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0015] 第三方面,本发明提供了一种基于词根表的脚本辅助设计设备,所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述实施例记载的任何一种基于词根表的脚本辅助设计方法的部分或全部步骤。
[0016] 第四方面,本发明还提供了一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时实现上述实施例记载的任何一种基于词根表的脚本辅助设计方法的部分或全部步骤。
[0017] 有益效果:本发明实施例通过预先建立关键字表,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。综上可以看出,通过预先设置的中英文对照词根表获取所述查询指令对应的英文关键字,使关键字数据规范统一,易于后期的维护,同时,利用预先设置的脚本模板完成脚本的辅助设计,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量。
[0018] 本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明
[0019] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020] 图1为本发明实施例提供的一种基于词根表的脚本辅助设计方法的流程示意图;
[0021] 图2为本发明实施例提供的另一种基于词根表的脚本辅助设计方法中建立关键字表的流程示意图;
[0022] 图3为本发明实施例提供的另一种基于词根表的脚本辅助设计方法中建立口径系统的流程示意图;
[0023] 图4为本发明实施例三提供的另一种基于词根表的脚本辅助设计方法的流程示意图;
[0024] 图5为本发明实施例提供的一种基于词根表的脚本辅助设计装置的结构示意图;
[0025] 图6为本发明实施例提供的一种基于词根表的脚本辅助设计设备的结构示意图。

具体实施方式

[0026] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0027] 以下分别进行详细说明。
[0028] 本发明的说明书权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。术语“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0029] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0030] 下面结合附图对本申请的实施例进行描述。
[0031] 实施例一
[0032] 根据本发明的一个方面,提供了一种基于词根表的脚本辅助设计方法,具体包括以下步骤,如图1所示:
[0033] S1,建立关键字表;
[0034] 需要说明的是,本发明实施例的执行主体为数据管理服务器,数据管理服务器由运行在局域网中的一台/多台计算机和数据管理系统软件共同构成,数据管理服务器提供用户数据的管理服务。
[0035] 具体的,可以通过统计每日对数据仓库中的数据进行验数时的源数据表,其中源数据表中包括表名、描述字段和描述字段对应的描述信息,将统计得到的源数据表中的各行源数据中的描述信息提取关键字,将提取所得的关键字生成关键字表,所述关键字表中的关键字与各行源数据中的描述信息一一对应。
[0036] S2,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0037] 按照预设规则从上述生成的每一个关键字表中,选取至少一个关键字作为该关键字表的维度关键字,将该维度关键字设置为所述口径系统的维度;以及选取至少一个关键字作为该关键字表的指标关键字,将该维度关键字设置为所述口径系统的指标。指标为上述设置的维度的属性取值,例如,维度为城市,其对应的指标为深圳,深圳为城市这个维度的属性取值。
[0038] 将上述选取的维度关键字和指标关键字自动生成维度-指标组合,例如城市-上海,如需从数据仓库中查询登录城市为上海的源数据,根据所生成的流量web页面访问日表-城市-上海自动生成得到其对应的数据查询指令,其中流量web页面访问日表为数据查询指令中所需的表名,通过该流量web页面访问日表和维度可确定字段名为city,根据确定的表名、字段名以及维度-指标组合生成其对应的查询指令,进一步的,可通过遍历原则,生成所有维度-指标组合对应的查询指令。利用维度-指标组合,以及其对应的查询指令建立口径系统。该口径系统包括表名、表字段、维度关键字、指标关键字和所有维度-指标组合对应的查询指令。根据维度-指标组合自动生成对应的查询指令,且需要查询时执行相应的查询指令,即可从数据仓库中查询所需源数据,减少了用户的工作量,提高了数据处理效率。
[0039] S3,接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0040] 接收用户输入的查询指令,根据上述建立的口径系统获取所述查询指令对应的中文关键字,具体的,查询指令中包含有用于设置查询条件的维度-指标组合,将查询指令中的维度-指标组合与所述口径系统中的维度-指标组合进行匹配,获取匹配成功的维度关键和指标关键字,即为该查询指令对应的中文关键字。
[0041] 需要说明的是,预先设置的中英文对照词根表为中文词根和英文词根的对照表,例如下表1所示:
[0042]
[0043]
[0044] 表1
[0045] 利用表1设置的中英文对照词根表将上述通过口径系统获取到的查询指令对应的中文关键字,进行对照翻译,获取到所述查询指令的中文关键字对应的英文关键字,通过这样的方式使关键字数据规范统一,易于后期的维护。
[0046] S4,根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0047] 需要说明的是,根据上述规范统一的英文关键字生成目标查询指令,该目标查询指令对应的属性信息中包括查询条件、查询步骤和查询结果,其中查询条件为维度和指标限定的查询条件,例如,从数据仓库中查询维度为城市,指标为访问次数的查询指令,其中查询指令的查询条件即为城市和访问次数所限定的;查询步骤为所述查询指令执行过程中,从数据仓库中提取源数据的先后顺序,例如上述从数据仓库中查询维度为城市,指标为访问次数的查询指令,查询步骤为先提取维度为城市的源数据,再从提取到的维度为城市的源数据中提取指标为访问次数的源数据;查询结果可以为针对该查询指令执行后,将查询所得的源数据进行反馈的方式,例如,包括但不限于表格、柱形图、条形图或热图等,具体不作限定。将该查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本,因此,该脚本模板可以重复使用,针对不同的查询指令,均可自动将查询指令对应的属性信息写入预先设置好的脚本模板的模板属性中,即可生成目标脚本,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量;当然,根据实际情况的需要,可以设置不同种类的脚本模板,以满足不同主题类别源数据的查询需求,或者不同应用场景的源数据查询需求,进一步的提高源数据查询效率。
[0048] 有益效果:本发明实施例通过预先建立关键字表,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。综上可以看出,通过预先设置的中英文对照词根表获取所述查询指令对应的英文关键字,使关键字数据规范统一,易于后期的维护,同时,利用预先设置的脚本模板完成脚本的辅助设计,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量。
[0049] 实施例二
[0050] 在上述实施例的基础上,本发明还提供了一种基于词根表的脚本辅助设计方法,具体包括以下步骤,如图2所示:
[0051] S1,建立关键字表;
[0052] 步骤S1的具体实施方式在上述实施例中已作了详细描述,此处不再赘述,进一步地,步骤S1还可以通过以下步骤来实现建立关键字表,具体如下:
[0053] S11,间隔预设时间对数据仓库进行验数,并统计在所述预设时间内生成的源数据表,所述源数据表包括描述字段;
[0054] 间隔预设时间,例如每天对数据仓库进行验数,验证数据仓库中的原始数据与每日更新之后的最终数据是否平衡,以便用户从源数据中可以抽取、清理对于企业有利用价值的数据,将数据仓库中原始数据与每日更新之后的最终数据不平衡的源数据清理,并最终存储在数据仓库中。数据仓库中的数据一般情况下将被长期保留,以便企业进行查询操作,从而供企业决策之用。因此,每天对数据仓库进行验数,是企业进行查询操作的数据基础。
[0055] S12,将所述描述字段中的描述信息使用关键字进行替换,建立关键字表。
[0056] 统计在所述预设时间内生成的源数据表,所述源数据表包括至少一个描述字段,其中所述描述字段中包括对应的描述信息,将所述描述字段中对应的描述信息利用关键字进行替换,建立关键字表。
[0057] 需要说明的是,上述关键字表中的关键字分别与各行源数据对应的描述信息唯一对应。例如下表2所示:
[0058]
[0059] 表2
[0060] 表2为根据源数据表释义为流量Web页面访问历史表中的描述信息使用关键字进行替换之后,建立的关键字表2。
[0061] 又例如下表3所示:
[0062]
[0063] 表3
[0064] 表3为根据源数据表释义为流量Web页面访问日表中的描述信息使用关键字进行替换之后,建立的关键字表3。
[0065] S2,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0066] 如图3所示,步骤S2建立口径系统具体可以包括以下步骤:
[0067] 优选地,在上述实施例的基础上,步骤S2中基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字,具体包括:
[0068] S21,获取所述源数据表中的第一源数据表,并确定所述第一源数据表中至少一个主键;
[0069] 从统计的在所述预设时间内对数据仓库进行验数的过程中生成的源数据表中,随机获取一个第一源数据表,确定该第一源数据表中至少一个主键,主键又称为主关键字(primary key),是表中一种唯一关键字,其值用于唯一标识表中某一条记录,可唯一确定表中某一行数据或者唯一确定某一个实体。
[0070] S22,计算每一个所述第一源数据表中至少一个主键作为外键的次数,从所述第一源数据表中至少一个主键中选取所述作为外键的次数大于或等于预设次数阈值的主键作为所述第一源数据表的维度关键字;
[0071] 或者,优选地,计算每一个所述第一源数据表中至少一个主键作为外键的比例,从所述第一源数据表中至少一个主键中选取所述作为外键的比例大于或等于预设比例阈值的主键作为所述第一源数据表的维度关键字,所述第一源数据表为所述源数据表中的任意一个源数据表;
[0072] 将上述第一源数据表中确定的至少一个主键,分别计算每一个所述主键的作为外键的次数或者比例。需要说明的是,外键又称作外关键字,如果公共关键字在一个关系中是主关键字,那么这个公共关键字被称为另一个关系的外键,外键表示了两个关系之间的相关联系。以另一个关系的外键作主关键字的表被称为主表,具有此外键的表被称为主表的从表。即,上述第一源数据表为主表,除所述第一源数据表以外的源数据表为从表,分别计算所述第一源数据中每一个主键作为所述除第一源数据表以外的源数据表的外键的次数或者比例。上述第一源数据表中的某一主键作为外键的次数,可以理解为所述第一源数据表与其它源数据表在数据仓库中处于主从关系的源数据表的数量,上述第一源数据表中的某一主键作为外键的比例,可以理解为所述第一源数据表与其它源数据表在数据仓库中处于主从关系的源数据表的数量,与所述除第一源数据表以外的源数据表的数量之比;若所述第一源数据表中某一主键作为外键的次数大于或等于预设次数阈值,则将该主键作为所述第一源数据表的维度关键字;或者,若所述第一源数据表与其它源数据表在数据仓库中处于主从关系的源数据表的数量,与所述除第一源数据表以外的源数据表的数量之比大于或等于预设比例阈值,则将该主键作为所述第一源数据表的维度关键字,将该维度关键字设置为所述口径系统的维度。
[0073] 通过选取作为外键次数大于或等于预设次数阈值的关键字作为维度关键字,或者,通过选取作为外键次比例大于或等于预设比例阈值的关键字作为维度关键字,提高维度选取的准确性,使其更能适应大数据处理需求,同时,利用外键统计来选取维度关键字,提高后期数据的处理效率以及保持数据的一致性。
[0074] 优选地,在上述实施例的基础上,步骤S2中基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为指标关键字,具体包括:
[0075] S23,获取所述源数据表中的第二源数据表,并确定所述第二源数据表中除外键之外的至少一个关键字;
[0076] 所述第二源数据表为所述第一源数据表的主从关系中的从属关系的数据表,从所述第二源数据表中将外键除外,确定至少一个关键字,该至少一个关键字中不包括作为外键且作为外键次数或比例大于或等于预设次数阈值或者预设比例阈值的主关键字。
[0077] S24,计算所述第二源数据表中除所述外键以外的每一个关键字的使用数量,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用数量大于或等于预设使用数量阈值的关键字;
[0078] 或者,优选地,计算所述第二源数据表中除所述外键以外的每一个关键字的使用率,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用率大于或等于预设使用率阈值的关键字;
[0079] 或者,优选地,计算所述第二源数据表中除所述外键以外的每一个关键字的使用频率,从所述第二源数据表中除所述外键以外的至少一个关键字中选取至少一个关键字作为指标关键字,所述指标关键字为所述使用数量大于或等于预设使用频率阈值的关键字,所述第二源数据表为所述源数据表中除所述第一源数据表以外的任意一个源数据表;
[0080] 分别计算每一个所述第二源数据表中将外键除外的至少一个关键字的使用数量、使用率或者使用频率,将其中使用数量大于或等于预设使用数量阈值的关键字选取作为指标关键字,或者使用率大于或等于预设使用率阈值的关键字选取作为指标关键字,或者使用频率大于或等于预设使用频率阈值的关键字选取作为指标关键字,将该指标关键字设置为所述口径系统的指标。通过该种方法,可以筛选不常用的关键字或者不一致的关键字,有利于数据仓库的数据清理,提高数据利用效率和保持数据一致性。
[0081] 优选地,在上述实施例的基础上,步骤S2中根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统,具体包括:
[0082] S25,根据所述维度关键字按照不同的主题类别进行维度拆分,并将拆分后的维度关键字存入多个维度表,所述多个维度表对应多个主题类别;
[0083] 将所述维度关键字按照不同的主题类别进行维度拆分,其中主题类别可以是预先设置的,对所有维度关键字进行分维度,将拆分之后维度关键字存入多个不同的维度表中,每一个维度表对应一个主题类别。例如,表2中的维度关键字登录ID、页面ID和浏览器cookie和表3中维度关键字登录ID、页面ID、浏览器cookie、IP、城市和渠道标识的主题类别为Web,还可以预设主题类别为App和用户行为等,按照主题类别将维度关键字进行拆分,实现对海量数据的分维度分层次的管理,从而实现对海量数据的收集、存储和快速精准的数据查询,提高数据处理的效率,为企业的决策提供及时准确的数据依据。
[0084] S26,根据所述指标关键字按照不同维度进行指标拆分,并将拆分后的指标关键字存入多个指标表,所述多个指标表对应多个维度;
[0085] 需要说明的是,同上述步骤S41,将所述指标关键字按照不同的主题类别进行维度拆分,其中主题类别可以是预先设置的,对所有指标关键字进行分维度,将拆分之后的指标关键字存入多个不同的指标表中,每一个指标表对应一个主题类别。例如,表2中的指标关键字首次访问日期、最后一次访问日期、插入时间、插入用户和分区日期,以及表3中指标关键字访问次数、着陆页次数、退出页次数、插入时间、插入用户和分区日期的主题类别为Web,可以看出该主题类别为Web的指标关键字为上述步骤S41中维度关键字的属性取值,还可以预设主题类别为App和用户行为等,按照主题类别将指标关键字进行拆分,实现对海量数据的分维度分层次的管理,从而实现对海量数据的收集、存储和快速精准的数据查询,提高数据处理的效率,为企业的决策提供及时准确的数据依据。
[0086] S27,根据所述多个指标表的外键和所述多个维度表自动生成维度-指标组合表,所述维度-指标组合表包括所述维度-指标组合以及所述维度-指标组合对应的标准查询指令,利用所述维度-指标组合及其对应的标准查询指令建立口径系统。
[0087] 根据所述多个指标表和所述多个维度表自动生成维度-指标组合表,例如下表4所示:
[0088]
[0089] 表4
[0090] 表4为维度-指标组合表,包括主题类别、维度和指标,此处只是为了示例说明,对本发明的保护范围不作限定。
[0091] 根据表4中的维度-指标组合自动生成相应的查询指令,例如,城市-访问次数,即从数据仓库中查询主题类别为Web,指定城市当日的网站访问次数,自动生成查询主题类型为Web,指定城市当日的网站访问次数的查询指令,该查询指令中,关于具体指定城市或者访问次数的参数可以是变量,根据用户输入具体的所需参数,通过执行赋值后的查询指令,即可从数据仓库中查询得到满足用户输入参数的相应源数据,提高源数据查询效率。
[0092] 上述表4中的每一维度-指标组合均对应一查询指令,利用所述维度-指标组合及其对应的查询指令建立口径系统,例如表5所示:
[0093]
[0094] 表5
[0095] 若用户需要查询一维度-指标组合对应的源数据,根据该维度-指标组合确定其相应的查询指令,输入具体的查询参数,自动执行该赋值后的查询指令,完成从数据仓库中查询该维度-指标组合对应的源数据,通过这种方法,可以有效的提高数据仓库源数据的查询效率。
[0096] S3,接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0097] S4,根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0098] 有益效果:本发明实施例通过通过定期进行数据仓库验数统计的源数据表,利用关键字替换源数据表中描述字段对应的描述信息,从而建立关键字表,定期验证数据仓库中的源数据与更新后的最终数据是否平衡,有利于提高数据一致性,以便用户用户从源数据中可以抽取、清理对于企业有利用价值的数据,并最终存储在数据仓库中,提供企业进行查询操作的数据基础;根据关键字表自动生成维度-指标的口径组合,建立口径系统,从而使得生成的维度-指标的组合能够与数据仓库的数据变化相适应,更好地反映数据仓库的数据变化;基于所述关键字表的关键字,通过选取作为外键次数或者比例大于或等于预设次数阈值或者预设比例阈值的关键字作为维度关键字,提高维度选取的准确性,使其更能适应大数据处理需求,同时,利用外键统计来选取维度关键字,提高后期数据的处理效率以及保持数据的一致性;基于所述关键字表的关键字,通过从除外键以外的关键字中选取使用数量、使用率和使用频率达到阈值的关键字作为指标关键字,可以筛选使用率低的关键字或者不一致的关键字,有利于数据仓库的数据清理,提高数据利用效率和保持数据一致性;根据所述维度关键字和指标关键字按照不同的主题类别进行维度拆分,并将拆分后的维度关键字和指标关键字存入多个维度表,所述多个维度表对应多个主题类别,按照主题类别将维度关键字和指标关键字进行拆分,实现对海量数据的分维度分层次的管理,从而实现对海量数据的收集、存储和快速精准的数据查询,提高数据处理的效率,为企业的决策提供及时准确的数据依据,利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字,使关键字数据规范统一,易于后期的维护;根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量。
[0099] 实施例三
[0100] 在上述实施例任一实施例的基础上,本发明还提供了另一种基于词根表的脚本辅助设计方法,具体包括以下步骤,如图4所示:
[0101] S1,建立关键字表;
[0102] S2,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0103] S3,接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0104] 优选地,步骤S3具体可以包括以下步骤:
[0105] S31,接收用户输入的查询指令,将所述查询指令与所述口径系统中的标准查询指令进行匹配,获取匹配成功的标准查询指令对应的维度-指标组合;
[0106] 接收用户输入的查询指令,根据上述建立的口径系统获取所述查询指令对应的中文关键字,具体的,查询指令中包含有用于设置查询条件的维度-指标组合,将查询指令中的维度-指标组合与所述口径系统中的维度-指标组合进行匹配,获取匹配成功的维度关键和指标关键字,即为该查询指令对应的中文关键字。
[0107] 优选地,步骤S31具体可以包括以下步骤:
[0108] S311,接收用户输入的查询指令,将所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容进行匹配;
[0109] 查询指令的文字内容包括其对应的查询条件中的维度关键字和指标关键字,将所述维度关键字和指标关键字,与口径系统中的标准查询指令的标准文字内容进行匹配,其中标准文字内容为上述表5中的维度关键字和指标关键字。
[0110] S312,若所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容的匹配度大于或等于预设匹配度阈值,则确定所述查询指令与所述口径系统中的标准查询指令匹配成功,根据所述口径系统获取匹配成功的标准查询指令对应的维度-指标组合。
[0111] 若用户输入的查询指令的文字内容与口径系统中的标准查询指令的标准文字内容之间的匹配度大于或等于预设匹配度阈值,则确定所述查询指令与所述口径系统中的标准查询指令匹配成功,否则,提示用户重新输入查询指令,进一步的,还可以记录匹配失败的日志,以便于后期对口径系统进行更新,以满足用户需求。具体实现方式可以包括,将用户输入的查询指令的文字内容与口径系统中的标准查询指令的标准文字内容进行逐字核对,若核对正确率大于或等于预设正确率,则可以确定所述用户输入的查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容之间的匹配度满足上述大于或等于预设匹配度阈值,上述核对正确率用于表示所述用户输入的查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容核对正确的字数占所述用户输入的查询指令的文字内容字数的百分比。通过这种方式,提高所述用户输入的查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容之间的匹配效率及准确率。
[0112] S32,根据所述匹配成功的标准查询指令对应的维度-指标组合获取所述查询指令对应的中文关键字;
[0113] 在所述用户输入的查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容之间匹配成功的情况下,获取匹配成功的标准查询指令对应的标准维度-指标组合,根据该标准维度-指标组合获取标准维度关键字和标准指标关键字,即上述表5中的维度关键字和指标关键字,得到所述用户输入的查询指令对应的中文关键字。
[0114] S33,将所述查询指令对应的中文关键字拆分为至少一个中文词根,以及通过所述预先设置的中英文对照词根表获取所述至少一个中文词根对应的至少一个英文词根;
[0115] 将上述获取得到的所述用户输入的查询指令对应的中文关键字进行拆分,例如城市、访问次数,拆分后得到中文词根为城市、访问和次数,通过上述表1预先设置的中英文对照词根表进行翻译,获取得到英文词根为city、visit和times。
[0116] S34,将所述至少一个英文词根进行组合生成所述查询指令对应的英文关键字。
[0117] 将上述获取得到的英文词根为city、visit和times。进行组合生成英文关键字city、visit_times。根据英文关键字city、visit_times生成目标查询指令,该目标查询指令对应的查询条件包括英文关键字组成的city-visit_times维度-指标组合。
[0118] S4,根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0119] 需要说明的是,根据上述规范统一的英文关键字生成目标查询指令,该目标查询指令对应的属性信息中包括查询条件、查询步骤和查询结果,其中查询条件为维度和指标限定的查询条件,例如,从数据仓库中查询维度为城市,指标为访问次数的查询指令,其中查询指令的查询条件即为城市和访问次数所限定的;查询步骤为所述查询指令执行过程中,从数据仓库中提取源数据的先后顺序,例如上述从数据仓库中查询维度为城市,指标为访问次数的查询指令,查询步骤为先提取维度为城市的源数据,再从提取到的维度为城市的源数据中提取指标为访问次数的源数据;查询结果可以为针对该查询指令执行后,将查询所得的源数据进行反馈的方式,例如,包括但不限于表格、柱形图、条形图或热力图等,具体不作限定。将该查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本,因此,该脚本模板可以重复使用,针对不同的查询指令,均可自动将查询指令对应的属性信息写入预先设置好的脚本模板的模板属性中,即可生成目标脚本,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量;当然,根据实际情况的需要,可以设置不同种类的脚本模板,以满足不同主题类别源数据的查询需求,或者不同应用场景的源数据查询需求,进一步的提高源数据查询效率。
[0120] 有益效果:本发明实施例通过预先建立关键字表,基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;接收用户输入的查询指令,将所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容进行匹配,若所述查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容的匹配度大于或等于预设匹配度阈值,则确定所述查询指令与所述口径系统中的标准查询指令匹配成功,根据所述口径系统获取匹配成功的标准查询指令对应的维度-指标组合,有利于提高所述用户输入的查询指令的文字内容与所述口径系统中的标准查询指令的标准文字内容之间的匹配效率及准确率;根据所述匹配成功的标准查询指令对应的维度-指标组合获取所述查询指令对应的中文关键字,将所述查询指令对应的中文关键字拆分为至少一个中文词根,以及通过所述预先设置的中英文对照词根表获取所述至少一个中文词根对应的至少一个英文词根,将所述至少一个英文词根进行组合生成所述查询指令对应的英文关键字,根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。通过设置词根表,将中文关键字拆分成多个词根,并且在词根表中获取相对应的英文词根。避免了针对每个中文关键字都要生成英文关键字的操作。从而有利于关键字的维护以及数据库的管理,使关键字数据规范统一,易于后期的维护,同时,利用预先设置的脚本模板完成脚本的辅助设计,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量。
[0121] 实施例四
[0122] 本发明实施例提供了一种基于词根表的脚本辅助设计装置500,如图5所示,所述装置包括:
[0123] 第一建立模块510,用于建立关键字表;
[0124] 第二建立模块520,用于基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;
[0125] 英文关键字获取模块530,用于接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;
[0126] 脚本生成模块540,用于根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。
[0127] 本发明实施例提供一种基于词根表的脚本辅助设计装置500是对应上述实施例一种基于词根表的脚本辅助设计方法,在所述脚本辅助设计装置500中还包括若干单元,用于对应上述脚本辅助设计方法的相应步骤,实现相应的功能。由于上述实施例中已经对脚本辅助设计方法的步骤进行了详细的说明,故在此装置500中不再赘述。
[0128] 有益效果:本发明实施例通过第一建立模块预先建立关键字表,第二建立模块基于所述关键字表的关键字,根据预设规则选取至少一个所述关键字作为维度关键字以及指标关键字,并根据所述维度关键字和所述指标关键字自动生成维度-指标组合,通过所述维度-指标组合建立口径系统;英文关键字获取模块接收用户输入的查询指令,并利用所述口径系统获取所述查询指令对应的中文关键字,以及根据预先设置的中英文对照词根表获取所述查询指令对应的英文关键字;脚本生成模块根据所述获取的查询指令对应的英文关键字生成目标查询指令,并将所述目标查询指令对应的属性信息写入预先设置的脚本模板对应的模板属性中,生成目标脚本。综上可以看出,通过预先设置的中英文对照词根表获取所述查询指令对应的英文关键字,使关键字数据规范统一,易于后期的维护,同时,利用预先设置的脚本模板完成脚本的辅助设计,无需重复建立脚本,避免大量的重复劳动,缩短了代码长度,节省工作量。
[0129] 实施例五
[0130] 本发明实施例还提供了一种基于词根表的脚本辅助设计设备600,所述设备包括存储器610、处理器620以及存储在所述存储器610中并可在所述处理器620上运行的计算机程序630,其特征在于,所述处理器620执行所述计算机程序630时实现上述实施例中记载的任一种基于词根表的脚本辅助设计方法的步骤。
[0131] 本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种基于词根表的脚本辅助设计方法的部分或全部步骤。
[0132] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0133] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0134] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0135] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0136] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0137] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0138] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
[0139] 以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈