首页 / 专利库 / 软件 / 在线分析处理 / 云端大数据系统及其构建方法

大数据系统及其构建方法

阅读:853发布:2020-05-13

专利汇可以提供大数据系统及其构建方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及 数据处理 技术领域,公开了一种 云 端 大数据 系统及其构建方法,解决了云端大数据系统的多类型数据源接入和数据在线分析及 可视化 的技术问题,其技术方案要点是将多种类型的数据源进行接入和参数设置,对设置参数后的数据源进行数据处理和数据分析,再根据分析结果生成可视化页面或智能报表,使得云端大数据系统使用简洁,数据对接简单,无需任何技术背景就可以实现数据分析,操作简单,且可视化页面中的数据实时计算,也保证了数据的即时性。,下面是大数据系统及其构建方法专利的具体信息内容。

1.一种大数据系统,其特征在于,包括:
数据接入模,接入多类型数据源D,包括:
第一类型选择单元,对接入的所述数据源D的类型进行划分,得到所述数据源D的父类型;
第二类型选择单元,对所述父类型进行划分,得到所述数据源D的子类型;
第一设置单元,根据所述子类型对所述数据源D进行第一设置;
校验单元,对完成所述第一设置的所述数据源D进行校验,所述校验通过则转入预览单元,所述校验未通过则转回所述第一设置单元;
预览单元,对通过校验的所述数据源D进行预览;
第三设置单元,预览完成后,对所述数据源D进行第三设置,得到数据源 ,提交所述数据源 ;
数据处理模块,对所述数据源 进行数据处理;
数据分析模块,对数据处理后的所述数据源 进行数据分析,得到分析结果;
数据应用模块,根据所述分析结果生成可视化页面或智能报表。
2.如权利要求1所述的云端大数据系统,其特征在于,所述数据接入模块还包括第二设置单元,预览完成后,所述第二设置单元对所述数据源D进行第二设置,所述第二设置完成后,再对所述数据源D进行第三设置。
3.如权利要求2所述的云端大数据系统,其特征在于,所述第一设置单元包括格式设置块和流程设置块;所述第二设置单元包括属性过滤设置块、属性重命名设置块、属性格式转换设置块、属性扩充设置块和属性脱密设置块;所述第三设置单元为字段信息设置块,所述字段信息包括数据源名称、导入方式和更新周期。
4.如权利要求3所述的云端大数据系统,其特征在于,所述导入方式包括全量导入和增量导入,所述增量导入包括定时导入和实时导入。
5.如权利要求4所述的云端大数据系统,其特征在于,所述数据处理模块的数据处理方式包括数据清洗、数据筛选、数据过滤、多数据转化、数据集成和数据规约。
6.如权利要求5所述的云端大数据系统,其特征在于,所述数据分析模块包括:
分析单元,对数据进行数据统计、数据分类、数据回归和数据聚类;
挖掘单元,对数据进行挖掘获取有用信息;
所述可视化页面包括WEB页面、手机APP页面和大屏,所述大屏包括LED大屏和电视大屏。
7.如权利要求6所述的云端大数据系统,其特征在于,该系统还包括数据共享模块和安全管理模块,所述数据共享模块实现数据共享,所述安全管理模块对云端大数据系统及数据进行安全管理。
8.如权利要求1-7任一所述的云端大数据系统,其特征在于,所数据源的所述父类型包括文本数据、关系型数据、非关系型数据、大数据平台数据、消息队列数据库物联网设备协议数据、API数据和公共数据。
9.一种云端大数据系统的构建方法,其特征在于,包括:
接入多类型数据源D;
对接入的所述数据源D的类型进行划分,得到所述数据源D的父类型;
对所述父类型进行划分,得到所述数据源D的子类型;
根据所述子类型对所述数据源D进行第一设置;
对完成所述第一设置的所述数据源D进行校验,所述校验通过则进行预览,所述校验未通过则转回所述第一设置;
对通过校验的所述数据源D进行预览;
预览完成后对所述数据源D进行第三设置,得到数据源,提交所述数据源;
对所述数据源 进行数据处理;
对数据处理后的所述数据源 进行数据分析,得到分析结果;
根据所述分析结果生成可视化页面或智能报表。
10.如权利要求9所述的云端大数据系统的构建方法,其特征在于,所述数据源的接入过程还包括第二设置,预览完成后,对所述数据源D进行第二设置,所述第二设置完成后,再所述数据源D进行第三设置。
11.如权利要求10所述的云端大数据系统的构建方法,其特征在于,所述第一设置包括格式设置和流程设置;所述第二设置包括属性过滤、属性重命名、属性格式转换、属性扩充和属性脱密;所述第三设置为字段信息设置,所述字段信息包括数据源名称、导入方式和更新周期。
12.如权利要求11所述的云端大数据系统的构建方法,其特征在于,所述导入方式包括全量导入和增量导入,所述增量导入包括定时导入和实时导入。
13.如权利要12所述的云端大数据系统的构建方法,其特征在于,所述数据处理的方式包括数据清洗、数据筛选、数据过滤、多数据转化、数据集成和数据规约。
14.如权利要求13所述的云端大数据系统的构建方法,其特征在于,所述数据分析包括:
对数据进行数据统计、数据分类、数据回归和数据聚类;
对数据进行挖掘获取有用信息;
所述可视化页面包括WEB页面、手机APP页面和大屏,所述大屏包括LED大屏和电视大屏。
15.如权利要求9-14任一所述的云端大数据系统的构建方法,其特征在于,数据源的所述父类型包括文本数据、关系型数据、非关系型数据、大数据平台数据、消息队列数据、物联网设备协议数据、API数据和公共数据。

说明书全文

大数据系统及其构建方法

技术领域

[0001] 本公开涉及数据处理技术领域,尤其涉及一种云端大数据系统及其构建方法。

背景技术

[0002] 随着信息技术和人类生产生活的交互融合,全球数据呈现出爆发增长、海量聚集的特点,对经济发展、社会治理、人民生活都产生了重大影响。近年来,随着大数据技术的快速发展,软硬件的不断更新迭代,大数据技术在各行各业都获得了长足发展。
[0003] 通过对用户的大数据分析,企业可以掌握用户行为偏好,实现精准推荐和营销,以客户驱动产品的研发和服务的升级,从而提供用户为导向的产品和服务,增加企业用户量;通过对行业的大数据分析,企业可以更加了解竞争对手,了解产品动态,调整战略,优化产品,使得企业在激烈的环境中更加主动;通过对业务的大数据分析,企业可以更好的掌握发展现状,优化资源配置,使得有限的资源能够产生更大的效益。
[0004] 随着5G的部署,万物互联将对大数据的要求更高。但现有大数据系统存在一些缺陷:1.系统搭建耗时耗,运维复杂,成本高:大数据涉及技术十分广泛,所用到的软件也非常多,为此,企业搭建大数据平台耗时耗力,后期运维时十分复杂,给企业带来非常大的成本;
2.对技术人员和分析人员的专业平要求比较高:大数据分析技术复杂,因此需要专业的大数据人员和数据分析人员,加之不同行业的差异较大,为此还需要领域内的专家,人员的技术水平要求高;
3.整合现有数据困难:企业数据来源十分广泛,文本数据、关系型和非关系型数据库中的数据、物联网设备产生的协议数据、消息队列中的数据、网络营销数据等等,而不同的数据对接大数据平台的方式千差万别,企业接入时十分复杂;
4.开发周期缓慢:无论是数据分析还是数据可视化,都需要很专业的技术和业务能力,加之业务场景的多变性,传统的方法开发周期长,需要不断的升级迭代;
5.数据的质量很难进行监控:数据分析的关键在于数据本身,而数据的来源受到诸如网络、采集设备等诸多因素的影响,因而数据可能传输终端,可能某些信息未采集到,而这些重要的内容在传统的分析中只能依靠后期人为的分析,有严重的滞后性,对之后的分析也产生非常严重的影响;
6.系统安全和数据安全管理复杂:大数据系统庞杂,系统会出现硬件、软件故障、数据明文保存、数据丢失等多种问题。
[0005] 综上可知,现有的云端大数据系统太复杂,在整合多类型数据源、数据处理和管理方面都存在很大的难度。发明内容
[0006] 本公开提供了一种云端大数据系统及其构建方法,使云端大数据系统实现多类型数据源整合和数据在线分析及可视化的技术目的。
[0007] 本公开的上述技术目的是通过以下技术方案得以实现的:一种云端大数据系统,包括:
数据接入模,接入多类型数据源D,包括:
第一类型选择单元,对接入的所述数据源D的类型进行划分,得到所述数据源D的父类型;
第二类型选择单元,对所述父类型进行划分,得到所述数据源D的子类型;
第一设置单元,根据所述子类型对所述数据源D进行第一设置;
校验单元,对完成所述第一设置的所述数据源D进行校验,所述校验通过则转入预览单元,所述校验未通过则转回所述第一设置单元;
预览单元,对通过校验的所述数据源D进行预览;
第三设置单元,预览完成后,对所述数据源D进行第三设置,得到数据源 ,提交所述数据源 。
[0008] 数据处理模块,对所述数据源 进行数据处理;数据分析模块,对数据处理后的所述数据源 进行数据分析,得到分析结果;
数据应用模块,根据所述分析结果生成可视化页面或智能报表。
[0009] 进一步地,所述数据接入模块还包括第二设置单元,预览完成后,所述第二设置单元对所述数据源D进行第二设置,所述第二设置完成后,再所述数据源D进行第三设置。
[0010] 进一步地,所述第一设置单元包括格式设置块和流程设置块;所述第二设置单元包括属性过滤设置块、属性重命名设置块、属性格式转换设置块、属性扩充设置块和属性脱密设置块;所述第三设置单元为字段信息设置块,所述字段信息包括数据源名称、导入方式和更新周期。
[0011] 进一步地,所述导入方式包括全量导入和增量导入,所述增量导入包括定时导入和实时导入。
[0012] 进一步地,所述数据处理模块的数据处理方式包括数据清洗、数据筛选、数据过滤、多数据转化、数据集成和数据规约。
[0013] 进一步地,所述数据分析模块包括:分析单元,对数据进行数据统计、数据分类、数据回归和数据聚类;
挖掘单元,对数据进行挖掘获取有用信息;
所述可视化页面包括WEB页面、手机APP页面和大屏,所述大屏包括LED大屏和电视大屏。
[0014] 进一步地,该系统还包括数据共享模块和安全管理模块,所述数据共享模块实现数据共享,所述安全管理模块对云端大数据系统及数据进行安全管理。
[0015] 进一步地,数据源的所述父类型包括文本数据、关系型数据、非关系型数据、大数据平台数据、消息队列数据、物联网设备协议数据、API数据和公共数据。
[0016] 一种云端大数据系统的构建方法,包括:接入多类型数据源D;
对接入的所述数据源D的类型进行划分,得到所述数据源D的父类型;
对所述父类型进行划分,得到所述数据源D的子类型;
根据所述子类型对所述数据源D进行第一设置;
对完成所述第一设置的所述数据源D进行校验,所述校验通过则进行预览,所述校验未通过则转回所述第一设置;
对通过校验的所述数据源D进行预览;
预览完成后对所述数据源D进行第三设置,得到数据源 ,提交所述数据源 。
[0017] 对所述数据源 进行数据处理;对数据处理后的所述数据源 进行数据分析,得到分析结果;
根据所述分析结果生成可视化页面或智能报表。
[0018] 进一步地,所述数据源的接入过程还包括第二设置,预览完成后,对所述数据源D进行第二设置,所述第二设置完成后,再所述数据源D进行第三设置。
[0019] 进一步地,所述第一设置包括格式设置和流程设置;所述第二设置包括属性过滤、属性重命名、属性格式转换、属性扩充和属性脱密;所述第三设置为字段信息设置,所述字段信息包括数据源名称、导入方式和更新周期。
[0020] 进一步地,所述导入方式包括全量导入和增量导入,所述增量导入包括定时导入和实时导入。
[0021] 进一步地,所述数据处理的方式包括数据清洗、数据筛选、数据过滤、多数据转化、数据集成和数据规约。
[0022] 进一步地,所述数据分析包括:对数据进行数据统计、数据分类、数据回归和数据聚类;
对数据进行挖掘获取有用信息;
所述可视化页面包括WEB页面、手机APP页面和大屏,所述大屏包括LED大屏和电视大屏。
[0023] 进一步地,数据源的所述父类型包括文本数据、关系型数据、非关系型数据、大数据平台数据、消息队列数据、物联网设备协议数据、API数据和公共数据。
[0024] 综上所述,本公开的有益效果在于:本公开支持多种类型的数据源接入并对接入的数据源进行参数设置,对设置参数后的数据源进行数据处理和数据分析,再根据分析结果生成可视化页面或智能报表,使得云端大数据系统使用简洁,数据对接简单,无需任何技术背景就可以实现数据分析,操作简单,且可视化页面中的数据实时计算,也保证了数据的即时性。
[0025]附图说明
[0026] 图1为本发明的系统框架图;图2为本发明的方法流程图

具体实施方式

[0027] 以下结合附图对本公开作进一步详细说明。
[0028] 本公开主要解决大数据对应的复杂性场景,例如:搭建和运维平台、系统安全、数据安全管理、多类型数据源整合、数据处理和分析、数据可视化、智能报表、数据质量监控等。本公开可应用在包括但不限于交通、医疗、行、电信、制造、政务、零售和电子商务等领域。
[0029] 在本公开的描述中,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量,只是用来区分不同的组成部分。
[0030] 图1为本公开系统框架图,云端大数据系统包括数据接入模块、数据处理模块、数据分析模块和数据应用模块,数据接入模块包括第一类型选择单元、第二类型选择单元、第一设置单元、校验单元、预览单元、第二设置单元和第三设置单元,第一类型选择单元对接入的数据源D的类型进行划分,得到数据源D的父类型;第二类型选择单元对父类型进行划分,得到数据源D的子类型;第一设置单元根据该子类型对数据源D进行第一设置;校验单元对完成第一设置的数据源D进行校验,校验通过则转入预览单元,校验未通过则转回第一设置单元;预览单元对通过校验的数据源D进行预览;预览完成后,第二设置单元对数据源D进行第二设置,第二设置完成后,第三设置单元对数据源D进行第三设置,得到数据源 ,提交数据源 。数据处理模块对数据源 进行数据处理,数据分析模块对处理后的数据进行数据分析,得到分析结果,数据应用模块则根据分析结果生成可视化页面或智能报表。
[0031] 第一设置单元包括格式设置块和流程设置块,格式设置块设置数据格式,例如文本数据格式、物联网协议格式、关系型/非关系型数据库的链接信息、大数据平台的地址、账号信息等;流程设置块则设置原始数据的相关流程。第一设置完成后,提交参数时校验单元对参数进行校验,若参数无效则重新返回到第一设置单元进行第一设置。
[0032] 第二设置单元包括属性过滤设置块、属性重命名设置块、属性格式转换设置块、属性扩充设置块和属性脱密设置块等,且第二设置单元为非必要单元,可根据实际情况确定是否选择该设置单元。
[0033] 第三设置单元为字段信息设置块,字段信息包括数据源名称、导入方式和更新周期。例如,设置数据源名称、导入方式及更新周期等,其中导入方式包括全量导入和增量导入,全量导入指一次性将数据源D中的数据导入到该云端大数据系统,增量导入指需分多次才能将数据源D中的数据导入到该系统。增量导入又包括定时导入或实时导入,其中定时导入指按照制定的时间进行周期性导入,实时导入指实时的对数据进行源源不断的接入。设置字段信息时,可以重新定义字段项,也可以保持字段的原始值,最终云端大数据系统根据设置的参数进行数据的导入和定时更新操作。
[0034] 数据处理模块对数据源进行数据清洗、数据筛选、数据过滤、多数据转化、数据集成和数据规约。数据分析模块包括分析单元和挖掘单元,分析单元对数据进行数据统计、数据分类、数据回归和数据聚类,分析方式例如点选式(即直接选择相应的分析方法)、类SQL式(即输入类似SQL语法的方式)、自定义算法(用户提交模型算法),系统依据数据源形式的差异来对数据进行自动的计算,无需用户干涉;挖掘单元对数据进行挖掘获取有用信息。该云端大数据系统还包括数据共享模块,能实现数据大范围的共享。
[0035] 图2为本公开方法流程图,接入多类型数据源D,对接入的数据源D的类型进行划分,得到数据源D的父类型;对父类型进行划分,得到数据源D的子类型;根据子类型对数据源D进行第一设置;对完成第一设置的数据源D进行校验,校验通过则进行预览,校验未通过则转回第一设置;对通过校验的数据源D进行预览;预览完成后对数据源D进行第三设置,得到数据源 ,提交数据源 。对数据源 进行数据处理;对数据处理后的数据源 进行数据分析,得到分析结果;根据分析结果生成可视化页面或智能报表。
[0036] 其中数据处理的方法包括数据清洗(例如缺失值和异常值处理等)、数据筛选、数据过滤、数据转化、多数据集成和数据规约等。数据处理完成后,根据具体的业务和标准可以对数据进行分析和挖掘,得到有用信息,即数据的最终可视化展示或智能报表。
[0037] 第一设置、第二设置和第三设置参见本公开系统的描述,这里不再赘述。
[0038] 以上,数据源的类型包括文本数据、关系型数据、非关系型数据、大数据平台数据库、消息队列数据库、物联网设备协议数据、API数据和公共数据。其中文本数据的格式例如普通文本、excel、csv;关系型数据库中的数据包括MySQL、Oracle、Access、DB2、PostgreSQL、SQLServer、Hive和SQLite等;非关系型数据库中的数据例如redis、MongoDB、neo4j等;大数据平台数据包括hdfs、hbase、hive等;消息队列数据库中的数据例如kafka、mqtt等;物联网设备协议数据指定解码器类型,比如指定长度解码器、指定符号解码器、换行符解码器、复杂解码器,亦可以选择提供一些行业国标解码器,如GB/T32960、JT808等,用户也可以自定义解码器;API数据选择API接入方式,如HTTP、HTTPS、WebSocket等;公共数据则为本平台采集的公开数据或由他人分享的数据集中的数据。
[0039] 另外,根据数据源类型的不同,所述数据源接入方式也各有不同,具体而言,对于文本数据,可进行单次导入、数据追加和数据替换等;对于数据库中的数据,可以使用全量或增量的方式进行导入;对于消息队列中的数据,可选择实时或者定时的方式进行导入。
[0040] 可视化页面包括WEB页面、手机APP页面和大屏,大屏包括LED大屏和电视大屏等,一般来说,用以显示的屏幕都属于可视化页面。可视化页面和智能报表会根据数据的更新而自动更新,从而实现多种形式的展示和报表下发,极大的方便了用户的使用。
[0041] 综上,本公开无需用户下载安装任何程序即可拥有一整套大数据系统,使用简洁;支持多种类型数据整合,只需要简单的配置基础信息,就可以对接用户数据,使得用户数据对接大数据平台更加简单;本系统通过点击就可以实现复杂的数据整合、数据处理、数据分析、数据挖掘和多终端可视化,无需任何技术背景就可以实现数据的分析,操作简单。
[0042] 可视化页面可以展示在WEB页面、企业大屏、app中,可视化页面中的数据实时计算,保证数据的即时性;用户可以自定义智能报表,平台计算好数据好自动填充报表,并按照用户的设置进行报表的分发。
[0043] 本系统可以对接入数据的质量进行定义和监控,全价值链管理数据,数据质量不达标可以通过邮件等多种方式进行告警,用户可选择处理或者忽略;系统对数据进行加密存储,采用多种备份机制,保障数据的安全和系统安全;用户之间可以共享数据,平台提供如如人口、经济、地理、天气等共享数据。
[0044] 以上为本公开示范性实施例,本公开的保护范围由权利要求书及其等效物限定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈