技术领域
[0001] 本
发明涉及信息技术领域,尤其是一种政务数据处理方法、系统、装置和存储介质。
背景技术
[0002] 政务数据是政务单位在提供政务服务的过程中所生成或记录的数据,主要包含事件经过、涉事人员、涉事时间、涉事地点、办理进度以及分类标签等信息。例如,负责进行噪声污染治理的部
门接受居民对工业噪声污染事件的反映,将每一条反映所包含的事件描述、受影响居民、发生时间、发生地点、严重程度、受理情况和处理结果等信息进行记录和存储,形成政务数据;气象部门将重大天气变化的类型、形成过程、影响区域、影响时间、气象等级、应急措施、信息发布日志以及与外部部门沟通情况等信息进行记录、存储和推送,形成政务数据;环境保护部门将
水质成分分析结果、检测时间、污染等级、用水建议等信息进行记录、存储和推送,形成政务数据。对政务数据的翻查、分析以及共享,有助于提高政务服务的效率和
质量。
[0003] 但是,现有的对统计数据的处理方法没有针对政务数据的特点进行考虑,以至于应用
现有技术对政务数据进行处理,难以有效提取到对改善政务服务有积极作用的信息。
发明内容
[0004] 为了解决至少一个上述技术问题,本发明的目在于提供一种政务数据处理方法、系统、装置和存储介质。
[0005] 一方面,
实施例中包括一种政务数据处理方法,包括以下步骤:
[0006] 生成政务数据的时间序列;
[0007] 从所述时间序列提取出偶发时间变化、长期变化趋势和短期变化趋势;
[0008] 输出所述偶发时间变化、长期变化趋势和短期变化趋势中的至少一者对应的政务数据。
[0009] 进一步地,所述生成政务数据的时间序列这一步骤,具体包括:
[0010] 获取政务数据的属性量;
[0011] 建立所述属性量与所述政务数据的记录时间之间的对应关系,将对应相同记录时间的所述属性量进行累积,从而获得所述时间序列。
[0012] 进一步地,所述偶发时间变化是通过以下步骤提取的:
[0013] 使用箱型图分离出所述时间序列中的离群点;
[0014] 提取出由所有所述离群点组成的子序列,从而获得所述偶发时间变化。
[0015] 进一步地,所述使用箱型图分离出所述时间序列中的离群点这一步骤,具体包括:
[0016] 根据各所述属性量累积结果中的最大值,确定所述箱型图的上界QU和下界QL;
[0017] 将小于QL-1.5×(QU-QL)或大于QU+1.5×(QU-QL)的属性量累积结果作为所述离群点分离出来。
[0018] 进一步地,所述长期变化趋势是通过以下步骤提取的:
[0019] 从所述时间序列中剔除所述偶发时间变化;
[0020] 对经过剔除的所述时间序列进行滑动平均滤波,从而获得所述长期变化趋势。
[0021] 进一步地,所述滑动平均滤波所使用的公式为:
[0022] 式中,L(t)为所述长期变化趋势,x′(t)为经过剔除的所述时间序列,t为所述政务数据的记录时间,N为自定义参数,n为求和参数。
[0023] 进一步地,所述短期变化趋势是通过以下步骤提取的:
[0024] 从所述时间序列中剔除所述偶发时间变化和所述长期变化趋势,从而获得所述短期变化趋势。
[0025] 另一方面,实施例中还包括一种政务
数据处理系统,包括:
[0026] 第一模
块,用于生成政务数据的时间序列;
[0027] 第二模块,用于从所述时间序列提取出偶发时间变化、长期变化趋势和短期变化趋势;
[0028] 第三模块,用于输出所述长期变化趋势、短期变化趋势和偶发时间变化中的至少一者对应的政务数据。
[0029] 另一方面,实施例中还包括一种政务数据处理装置,包括
存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明方法。
[0030] 另一方面,实施例中还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明方法。
[0031] 本发明的有益效果是:通过将政务数据组成的时间序列分解为偶发时间变化、长期变化趋势和短期变化趋势,其中偶发时间变化可以反映偶然发生的特定事件对政务数据生成的影响,长期变化趋势可以反映经济发展或
气候变化等宏观环境对政务数据生成的影响,短期变化趋势可以反映居民作息规律等微观因素对政务数据生成的影响,从而有利于政务单位从不同的层面进行考虑,制定出符合实际的策略。
附图说明
[0032] 图1为实施例中政务数据处理方法的
流程图;
[0033] 图2为实施例中与噪声污染有关的政务数据的时间序列;
[0034] 图3为利用实施例中的政务数据处理方法对图2进行处理所得到的偶发时间变化;
[0035] 图4为利用实施例中的政务数据处理方法对图2进行处理所得到的长期变化趋势;
[0036] 图5为利用实施例中的政务数据处理方法对图2进行处理所得到的短期变化趋势。
具体实施方式
[0037] 本实施例包括一种政务数据处理方法,参照图1,包括以下步骤:
[0038] S1.生成政务数据的时间序列x(t);
[0039] S2.从所述时间序列提取出偶发时间变化e(t)、长期变化趋势L(t)和短期变化趋势S(t);
[0040] S3.输出所述偶发时间变化e(t)、长期变化趋势L(t)和短期变化趋势S(t)中的至少一者对应的政务数据。
[0041] 所述政务数据是从政务单位的政务服务管理系统中调取的,这些政务数据由政务单位在执行步骤S1-S3之前一段时间内积累得到。根据政务单位的性质以及其所提供的政务服务类型,所述政务数据可以分别通过接受居民等特定群体反映、通过科技手段进行检测、主动发布等方式生成,例如噪声污染治理部门的部分政务数据是通过接受居民等特定群体反映获取的,气象部门以及环保部门的部分政务数据是通过天气预报以及化学检验等科技手段进行检测而获得的,气象部门以及环保部门的部分政务数据是它们对外发布信息而生成的。
[0042] 对于由特定群体反映而生成的政务数据,可以记录每条政务数据被政务单位接收的时间,即每条政务数据进入到政务单位的政务服务管理系统中的时间;对于通过科技手段进行检测而生成的政务数据,可以记录每条政务数据被检测人员或者自动化检测系统输入到政务单位的政务服务管理系统中的时间;对于主动发布而生成的政务数据,可以记录政务单位使用政务服务管理系统推送每条政务数据的时间。
[0043] 每条政务数据与其对应的时间的关系,使得多条政务数据形成时间序列。取一定尺度的时间单位对政务数据的时间序列进行考察,例如将时间的单位设为天,那么在政务数据的时间序列中,可能存在多条政务数据对应同一时间。如果将时间的单位设为月,那么在政务数据的时间序列中,可能存在更多的政务数据对应同一时间。
[0044] 为了获取到政务数据的时间序列的特征,考察政务数据的时间序列中每条政务数据的属性量。所述属性量可以从每条政务数据的内容中提取。例如,噪声污染治理部门接收的每条政务数据中包含的事件描述、受影响居民、发生时间、发生地点、严重程度、受理情况和处理结果等内容,统计一条政务数据中“事件描述”这一内容的字数,作为该条政务数据的属性量;气象部门检测的每条政务数据中包含的重大天气变化的类型、形成过程、影响区域、影响时间、气象等级、应急措施等内容,其中“气象等级”通过文字或数字等方式进行量化,作为该条政务数据的属性量;还可以通过人工或自动等方式考察每一条政务数据所包含的实质内容的有效性,如果有效,则将该条政务数据的属性量定义为1,反之定义为0。上述这些方式都可以得到每条政务数据的量化的、可执行累积等运算的属性量。
[0045] 在获得每条政务数据的属性量后,可以忽略每条政务数据的其他内容,只考察每条政务数据的属性量。此时,在政务数据的时间序列中,每个时间可能对应多个属性量,将对应相同时间的属性量累积起来获得累积值,此时时间序列被简化为时间-属性量累积值的对应关系。当所述属性量是根据“事件描述”等内容的字数或者“气象等级”等内容的具体数值得到时,由于“事件描述”等内容的字数以及“气象等级”等内容的具体数值一般反映了政务数据的性质或者严重程度,此时时间序列反映了每个时间所对应的政务数据的性质或者严重程度。当所述属性量是根据每条政务数据的实质内容有效性定义得到时,时间序列反映了每个时间所对应的有效政务数据的数量。
[0046] 对所述政务数据的时间序列x(t)进行分析,将所述政务序列分解为偶发时间变化e(t)、长期变化趋势L(t)和短期变化趋势S(t),即x(t)=e(t)+L(t)+S(t)。进一步地,分别查找偶发时间变化、长期变化趋势和短期变化趋势中的非零值、局部最大值、局部最小值或者变动剧烈区间等特定数值,然后查找这些特定数值所对应的时间,可以从政务服务管理系统中查找中对应这些时间的政务数据。将查找到的政务数据输出供政务单位分析,可以获得有益的信息。
[0047] 所述偶发时间变化e(t)反映了时间序列x(t)的个别异常值,通过查找这些异常值所对应的时间,结合从其他途径了解到的相同时间内发生的其他事件,可以分析这些个别异常值出现的原因,使得政务单位可以有针对性地采取适当的措施。所述长期变化趋势L(t)反映了时间序列x(t)的平稳变动,在实践中一般与经济发展和天气变化等周期较长的环境因素变化有关,通过向政务单位提供长期变化趋势,可以协助政务单位进行宏观的政策制定。所述短期变化趋势S(t)反映了时间序列x(t)的非平稳变动,但不如偶发时间变化剧烈,在实践中一般与工作日安排以及居民生活习惯等周期较短的环境因素变化有关,通过向政务单位提供短期变化趋势,可以协助政务单位制定符合当地实际的策略。
[0048] 执行本实施例所述政务数据处理方法的政务服务管理系统,可以分别输出偶发时间变化e(t)及其对应的政务数据、长期变化趋势L(t)及其对应的政务数据、短期变化趋势S(t)及其对应的政务数据,也可以输出它们中任意一个或两个的组合。优选地,优先输出偶发时间变化e(t)及其对应的政务数据,因为偶发时间变化e(t)所对应的政务数据具有偶然性,这与政务单位要实际处理的事项多带有突发性的特点是吻合的,即通过分析偶发时间变化e(t)及其对应的政务数据,有助于政务单位关注这类政务数据的产生原因并制定适当应对措施。
[0049] 本实施例中对政务数据的处理方法的优势在于,将政务数据组成的时间序列分解为偶发时间变化、长期变化趋势和短期变化趋势,它们分别反映了偶然发生的特定事件对政务数据生成的影响、宏观环境对政务数据生成的影响以及居民作息规律对政务数据生成的影响,从而使得政务单位可以从不同的层面进行考虑,制定出符合实际的策略。
[0050] 进一步作为优选的实施方式,所述偶发时间变化是通过以下步骤提取的:
[0051] S201A.使用箱型图分离出所述时间序列x(t)中的离群点;
[0052] S202A.提取出由所有所述离群点组成的子序列,从而获得所述偶发时间变化。
[0053] 其中步骤S201A具体包括以下子步骤:
[0054] S20101A.根据各所述属性量累积结果中的最大值,确定所述箱型图的上界QU和下界QL;优选地,将上界QU设定为各所述属性量累积结果中最大值的90%,将下界QL设定为0;
[0055] S20102A.将小于QL-1.5×(QU-QL)或大于QU+1.5×(QU-QL)的属性量累积结果作为所述离群点分离出来。
[0056] 识别出的离群点仍然保持着原先在时间序列x(t)中与时间的对应关系,这些离群点本身也组成一个时间序列,即离群点所组成的时间序列是政务数据的时间序列的子序列。保留离群点与时间的对应关系不变,将离群点提取出来,从而得到所述偶发时间变化e(t),即所述偶发时间变化e(t)是由各离群点及其与时间的对应关系组成的一个序列。
[0057] 进一步作为优选的实施方式,所述长期变化趋势是通过以下步骤提取的:
[0058] S201B.从所述时间序列x(t)中减去所述偶发时间变化e(t),即计算x′(t)=x(t)-e(t);
[0059] S202B.使用公式 对减去偶发时间变化e(t)后的所述时间序列x′(t)进行滑动平均滤波,从而获得所述长期变化趋势L(t)。
[0060] N的值代表了进行滑动平滑滤波时所使用的窗口的大小,例如设定N=30,即进行滑动平滑滤波时所使用的窗口的大小为30天,最终得到的长期变化趋势L(t)反映30天的变化规律。
[0061] 进一步作为优选的实施方式,所述短期变化趋势是通过以下步骤提取的:
[0062] S201C.从所述时间序列x(t)中剔除所述偶发时间变化e(t)和所述长期变化趋势L(t),从而获得所述短期变化趋势S(t),即S(t)=x(t)-e(t)-L(t)。
[0063] 通过上述步骤S201A-S202A、S201B-S202B和S201C,可以将政务数据的时间序列x(t)分解为偶发时间变化e(t)、长期变化趋势L(t)和短期变化趋势S(t),即x(t)=e(t)+L(t)+S(t)。
[0064] 图2所示是一个负责进行噪声污染治理的政务单位在2018年3月1日-2019年3月1日所记录到的政务数据的时间序列,其中每一条政务数据都是来自某地居民对工业噪声污染事件的反映。所使用的政务数据的属性量是其有效性,即如果一条政务数据的实质内容有效,则其属性量定义为1,反之定义为0,因此图2所示的时间序列中,每一时间(以天为单位)对应的值表示这一天所接收到的有效政务数据的数量。
[0065] 通过执行步骤S1-S3来对图2所示的时间序列进行处理,分别得到图3所示的偶发时间变化、图4所示的长期变化趋势和图5所示的短期变化趋势,其中,在通过滑动平均滤波获得长期变化趋势时,所使用的窗口大小即N的值为30。
[0066] 如图3所示,偶发时间变化表示出了时间序列中的几个非零值,它们脱离了图2所示的政务数据的时间序列的整体趋势,因此可能表示图3中这几个非零值所对应的时间发生了特定的事件,例如作为污染源的工厂在节假日前赶工期而加大产能等,这可能是导致噪声投诉量剧增的原因,提醒政务单位往这一方向进行调查,从而提高政务单位的处理效率。
[0067] 如图4所示,长期变化趋势具有较长时间尺度上的周期性,尤其是与季节相关,因此可能表示下半年属于产生噪声的工厂的旺季,提醒政务单位可制定针对工厂下半年生产作业的噪声控制安排。
[0068] 如图5所示,短期变化趋势具有较长时间尺度上的周期性,尤其是与工厂的工作日相关,而且在某些休息日也发生关于噪声的投诉,这提醒政务单位可以制定相关安排,从而限制工厂在休息日进行产生强噪音的作业。
[0069] 所述政务数据处理方法可以用政务数据处理系统来实现。所述政务数据处理系统包括:
[0070] 第一模块,用于生成政务数据的时间序列;
[0071] 第二模块,用于从所述时间序列提取出偶发时间变化、长期变化趋势和短期变化趋势;
[0072] 第三模块,用于输出所述长期变化趋势、短期变化趋势和偶发时间变化中的至少一者对应的政务数据。
[0073] 所述第一模块、第二模块和第三模块可以是计算机等设备上具有相应功能的
硬件模块、
软件模块或者硬件模块和
软件模块的结合。
[0074] 本实施例还包括一种政务数据处理装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行本发明方法。
[0075] 本实施例还包括一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行本发明方法。
[0076] 本实施例中的政务数据处理系统、装置和存储介质,可以执行本发明的政务数据处理方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
[0077] 以上是对本发明的较佳实施进行了具体说明,但对本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同
变形或替换,这些等同的变形或替换均包含在本
申请权利要求所限定的范围内。