首页 / 专利库 / 人工智能 / 词性标注 / 一种网络社交媒体中地震信息的可视化方法和系统

一种网络社交媒体中地震信息的可视化方法和系统

阅读:715发布:2020-05-13

专利汇可以提供一种网络社交媒体中地震信息的可视化方法和系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种网络社交媒体中 地震 信息的 可视化 方法和系统,包括创建分别描述震前时间段的地震宏观异常信息、 震中 时间段的地震震情信息以及震后时间段的救援信息的关键词库;基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、 定位 信息和单位观测周期,获得各单位观测周期的空间 重心 位置 ,并在地图上展示。本发明克服了 现有技术 中对地震信息的 覆盖 区域广而散,没有关注重点和准确度的弊端,集中展示了地震信息的 时空 变迁。,下面是一种网络社交媒体中地震信息的可视化方法和系统专利的具体信息内容。

1.一种网络社交媒体中地震信息的可视化方法,其特征在于,包括以下步骤:
S1、创建分别描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库;
S2、基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;
S3、对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。
2.如权利要求1所述的可视化方法,其特征在于,所述步骤S1还包括:
基于地震的发生时间,分别设置所述震前时间段、震中时间段以及震后时间段。
3.如权利要求1所述的可视化方法,其特征在于,所述步骤S1中描述地震宏观异常信息的关键词库中包括表述动物异常、地下异常、气象异常、地声异常、植物异常、地面异常、电磁异常以及地震异常的词汇。
4.如权利要求1所述的可视化方法,其特征在于,所述步骤S1中描述地震震情信息的关键词库中包括表述震感、震级、震中、震源、表达人情绪的形容词以及表达震感的动词。
5.如权利要求1所述的可视化方法,其特征在于,所述步骤S2包括以下步骤:
S2.1、对于任意一个网络社交媒体数据,检索其含有的词条与各关键词库的匹配情况以及发布时间信息与各时间段的匹配情况;以及
S2.2、将网络社交媒体数据归于同时匹配该时间段以及该时间段的关键词库的网络社交媒体数据集合。
6.如权利要求5所述的可视化方法,其特征在于,所述步骤S3包括以下步骤:
S3.1、对不同的网络社交媒体数据集合设置各自的单位观测周期,所述单位观测周期与对应的时间段的时间长度比为整数;
S3.2、对任意一个网络社交媒体数据集合,将发布时间信息属于当前单位观测周期内的网络社交媒体数据作为观测对象,基于所述观测对象的定位信息,获得该单位观测周期的空间重心位置;以及
S3.3、基于所述步骤S2.2,获得所有网络社交媒体数据集在各单位观测周期的空间重心位置。
7.如权利要求2所述的可视化方法,其特征在于,所述步骤S1中震前时间段为地震发生当天至地震发生前30天、震中时间段为地震发生时刻至地震发生后2小时以及震后时间段为地震发生后2小时至地震发生后72小时。
8.如权利要求5所述的可视化方法,其特征在于,所述步骤S2.2包括以下步骤:
S2.2.1、对任意一个网络社交媒体数据进行批注分词,并标注每个词汇的词性;
S2.2.2、基于网络社交媒体数据中的分词是否与各关键词库的匹配,获得网络社交媒体数据与关键词库的匹配情况;以及
S2.2.3、基于网络社交媒体数据中的发布时间信息是否与各时间段匹配,获得网络社交媒体数据与时间段的匹配情况。
9.如权利要求8所述的可视化方法,其特征在于,所述步骤S2.2.1之前还包括:将含有繁体中文的网络社交媒体数据转换为简体中文的网络社交媒体数据。
10.一种网络社交媒体中地震信息的可视化系统,其特征在于,包括:
关键词库模,用于创建分别描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库;
分类模块,基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;
展示模块,用于对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。

说明书全文

一种网络社交媒体中地震信息的可视化方法和系统

技术领域

[0001] 本发明涉及地震信息展示领域,更具体地,涉及网络社交媒体中地震信息的可视化方法和系统。

背景技术

[0002] 在地震发生时,公众经常会通过网络社交媒体等基于位置的网络社交媒体发布关于地震灾害的信息。大量关于地震灾害的相关数据通过网络社交媒体等基于位置的网络社交媒体进行传播,这类数据具有交互性、实时性、社会性等特点,而且隐含着大量有价值的信息,而在地震等突发自然灾害中,这些信息的传播对灾情的客观反映、顺利开展灾害救助、疏导灾区群众心理压、稳定社会都具有至关重要的作用。
[0003] 现在利用网络社交媒体数据,对地震灾害信息的研究分析,主要是从传播学的度,对灾害信息传播特征以及舆情监测进行研究。而随着基于位置服务功能被网络社交媒体广泛应用,结合网络社交媒体中的地理位置信息与数据信息的数据挖掘与分析,不仅可以更准确地对地震灾害信息传播进行分析,更以社会公众角度对地震灾害的观测提供了重要的信息补充。
[0004] 2010年,Sakaki等人利用推特中的地理信息进行地震、台等事件及其发生的大致区域的检测。2015年,徐敬海等基于位置的地震网络社交媒体信息建立了地震灾情分级表,并利用反距离空间插值方法,对地震灾害覆盖区域进行了灾情信息分析。
[0005] 发明人在实现本发明的过程中发现,针对基于位置的网络社交媒体中的地震数据数据的挖掘与分析仍存在一些问题:
[0006] 1、仅依靠关键词划分地震信息分类,其结果可能混杂了地震灾害发生前后不同时间阶段的信息;
[0007] 2、数据挖掘分析针对地震灾害发生后的信息,而没有将地震前一段时间内的宏观异常情况在网络社交媒体上的反映纳入观测之中;
[0008] 3、基于位置的网络社交媒体的地震信息发布成离散点分布,通常覆盖区域广而散,且往往呈现出明显的分布不均匀,仅依靠基于位置的网络社交媒体的地震信息,由信息点插值计算,难以得到准确的面状结果,尤其在信息点疏密差异大的区域准确度相差较大。

发明内容

[0009] 本发明提供一种克服上述问题或者至少部分地解决上述问题的网络社交媒体中地震信息的可视化方法好系统。
[0010] 根据本发明的一个方面,提供一种网络社交媒体中地震信息的可视化方法,包括:
[0011] S1、分别创建描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库;
[0012] S2、基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;
[0013] S3、对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
[0014] 其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。
[0015] 根据本发明的另一个方面,提供一种网络社交媒体中地震信息的可视化系统,包括:
[0016] 关键词库模,用于创建分别描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库;
[0017] 分类模块,基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;
[0018] 展示模块,用于对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
[0019] 其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。
[0020] 本申请提出一种网络社交媒体中地震信息的可视化方法和系统,通过以网络社交媒体为载体,以公众感知传感器,将地震前一段时间内的宏观异常情况在网络社交媒体上的反映纳入地震观测之中,为地震防灾减灾研究提供宏观异常大数据的重要数据来源;通过结合不同时间段和关键词对地震信息进行分类,其分类结果涵义指向明确,较好地排除了地震灾害不同时间阶段信息的混杂;通过应用空间重心模型计算各类型地震信息在相应单位观测周期内的空间重心位置,将地震信息的时空演化过程展示在地图上,反映地震灾害区域对不同类型地震信息的网络社交媒体用户群体的重心位置及其随时间的演化。
附图说明
[0021] 图1为根据本发明实施例的网络社交媒体中地震信息的可视化方法的流程示意图;
[0022] 图2为根据本发明实施例获得的四川雅安地震的震前时间地震信息的空间重心分布轨迹图;
[0023] 图3为根据本发明实施例获得的南彝良地震的震前时间地震信息的空间重心分布轨迹图。

具体实施方式

[0024] 下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0025] 为了克服现有技术中仅依靠关键词划分地震信息分类,忽略地震灾害发生前后不同时间段的信息关注重点的偏移,使得地震数据挖掘和展示信息不准确的问题,本发明提供了一种网络社交媒体中地震信息的可视化方法。
[0026] 图1示出了本发明实施例的网络社交媒体中地震信息的可视化方法的流程示意图,如图1可知,本方法包括:
[0027] S1、创建分别描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库。
[0028] S2、基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合。
[0029] S3、对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
[0030] 其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。
[0031] 本发明通过计算不同时间的网络社交媒体的空间重心位置,克服了现有技术中对地震信息的覆盖区域广而散,没有关注重点和准确度的弊端,集中展示了地震信息的时空变迁,一目了然。
[0032] 网络社交媒体包括微博、贴吧以及人人网等媒体,使用者可以随时在网络社交媒体上发布新消息,网络社交媒体数据即为网络社交媒体的数据内容,由文字和标点符号组成,具有最大字符限制,因此每一条网络社交媒体都需要用尽量简短的语言描述出完整、重要的信息,非常适合于进行大数据分析。
[0033] 地震信息即为该网络社交媒体包含有关键词“地震”,例如:某条网络社交媒体的内容为“今天发生地震了”,或者是“刚才地震了,有人感觉到了么?”等等,都属于地震信息。
[0034] 每一条网络社交媒体都包含有发布时间信息,但是并不是每一条网络社交媒体都含有发布人的定位信息,定位信息是指发布人在发送网络社交媒体时,将当前位置和网络社交媒体内容一道进行展示的信息,本发明只搜集含有定位信息的网络社交媒体数据。
[0035] 在一个实施例中,所述步骤S1还包括:
[0036] 基于地震的发生时间,分别设置震前时间段、震中时间段以及震后时间段。
[0037] 由于地震发生前通常会出现宏观异常状况,当人发现宏观异常状况时很可能会发网络社交媒体,因此设置震前时间段有利于将来对震前信息的集中分析,而震中时间段则代表了地震刚发生时,人们紧张不安、不知所措的时间段,这一段时间人们发送的网络社交媒体可能形容词、动词较多,情绪较为激动,和震前的心态完全不同,而震后时间段则体现了人们开始接受事实,并对地震灾区进行救援的的时间段,在该时间段中,网络社交媒体内容更多的是反应救援的积极信息。
[0038] 本发明将地震宏观异常定义为人的感官能直接感觉到或者通过简单测量工具测量到的各种与地震孕育、发生有关的自然界的异常现象。
[0039] 在一个实施例中,本发明分别创建反应震前的异常信息、震中的震情信息以及震后的救援信息的关键词。
[0040] 在一个实施例中,所述步骤S2包括:
[0041] S2.1、对于任意一个网络社交媒体数据,检索其含有的词条与各关键词库的匹配情况以及发布时间信息与各时间段的匹配情况;以及
[0042] S2.2、将网络社交媒体数据归于同时匹配该时间段以及该时间段的关键词库的网络社交媒体数据集合。
[0043] 在一个实施例中,所述步骤S3包括:
[0044] S3.1、对不同的网络社交媒体数据集合设置各自的单位观测周期,所述单位观测周期与对应的时间段的时间长度比为整数。
[0045] 假设震前时间段为地震发生前及地震发生当天共计L天,震中时间段为地震发生后M小时,震后时间段为地震发生后M-N小时,分别设置震前时间段的单位观测周期为p天;震中时间段的单位观测周期为q小时;震后时间段的单位观测周期为r小时,并且满足L/p、M/q、(M-N)/r均为正整数,以保障单位观测周期恰好均匀划分时间窗
[0046] S3.2、对任意一个网络社交媒体数据集合,将发布时间信息属于当前单位观测周期内的网络社交媒体数据作为观测对象,基于所述观测对象的定位信息,获得该单位观测周期的空间重心位置。
[0047] S3.3、基于所述步骤S2.2,获得所有网络社交媒体数据集在各单位观测周期的空间重心位置。
[0048] 在一个实施例中,所述步骤S1.1中震前时间段为地震发生当天至地震发生前30天、震中时间段为地震发生时刻至地震发生后2小时,而地震救援黄金期为72小时,地震救援信息的传播也集中在这段时间之中,所以,选择地震发生后2小时至72小时为震后时间段。
[0049] 在一个实施例中,反应震前的异常信息的关键词如表1所示,包括:动物异常、地下异常、气象异常、地声异常、植物异常、地面异常、电磁异常以及地震云异常中的一种或多种。
[0050]
[0051] 表1震前的异常信息的关键词
[0052] 地震震情是指地震活动和地震影响的情况,它包括地震发生的时间、地点、震级、震感情况、有感范围、人们的反应等。
[0053] 通常,地震震情相关的网络社交媒体数据信息中,名词用来表达对地震震级和震感情况的描述,形容词通常表达了人们对地震震情的情感态度,例如,“恐惧”、“惊恐”等,动词用来表达地震中社交媒体用户对地震的感受,例如,“摇醒”、“坍塌”等。
[0054] 在一个实施例中,震中的震情信息的关键词如表2所示,包括:震感、震级、震中、震源、表达人情绪的形容词以及表达震感的动词中的一种或多种。
[0055]
[0056]
[0057] 表2震中的震情信息的关键词
[0058] 表3示出了震后的救援信息的关键词。
[0059]
[0060] 表3震后的救援信息的关键词
[0061] 在一个实施例中,所述步骤S2.2包括:
[0062] S2.2.1、对任意一个网络社交媒体数据进行批注分词,并标注每个词汇的词性;
[0063] S2.2.2、基于网络社交媒体数据中的分词是否与各关键词库的匹配,获得网络社交媒体数据与关键词库的匹配情况;以及
[0064] S2.2.3、基于网络社交媒体数据中的发布时间信息是否各时间段匹配,获得网络社交媒体数据与时间段的匹配情况。
[0065] 数据信息中如果存在繁体字,会对语义的分词解析形成困难,造成错误结果,所以在语义的分词解析前必须进行繁转简的操作,在一个实施例中,所述步骤S2.2.1之前还包括:将含有繁体中文的网络社交媒体数据转换为简体中文的网络社交媒体数据。
[0066] 在一个实施例中,本发明还对特殊数据内容进行标注分词:如对用户名、对标点符号进行标示,URL以及Email进行自动标示;社交媒体上的转发内容进行自动分割标示。
[0067] 在一个实施例中,本发明对数据的分词是通过ICTCLAS中文分词系统,对用户名、转发内容、标点符号、URL以及Email等特殊文本内容进行标注分词,该系统中的分词词库中除了现有技术已经公开的词库内容外,还包括地震应急领域专有名词和网络用语,例如“中国国际救援队”、“中国地震局”、“盆友”,这样在分词时,就可以将这些词划分成一个词,而不是拆开,增加了分词的准确性。
[0068] 在一个实施例中,空间重心,即平均中心的概念。对于多个分散的地理空间对象,它是由一系列空间对象的几何坐标的平均值来表示。其基本计算公式为
[0069]
[0070] 式中,N为空间对象总数,这里即指网络社交媒体数据的个数,Xi和Yi是第i个空间对象的坐标值, 即为重心的坐标值。
[0071] 本发明还提供一种网络社交媒体中地震信息的可视化系统,包括:
[0072] 关键词库模块,用于创建分别描述震前时间段的地震宏观异常信息、震中时间段的地震震情信息以及震后时间段的救援信息的关键词库;
[0073] 分类模块,基于地震发生前后的不同时间段和所述关键词库,对网络社交媒体数据进行分类,获得对应不同时间段的网络社交媒体数据集合;
[0074] 展示模块,用于对各网络社交媒体数据集合设置各自的单位观测周期,基于发布时间信息、定位信息和单位观测周期,获得各单位观测周期的空间重心位置,并在地图上展示;
[0075] 其中,所述网络社交媒体数据中包含地震信息、发布时间信息和发布人的定位信息。
[0076] 在一个实施例中,对四川雅安地震前后的网络社交媒体数据数据,基于本发明的方法,获得空间重心位置,利用地理信息系统软件,进行空间可视化,将重心点标注在地图上,并将重心逐一连线,得到移动轨迹路径。
[0077] 图2示出了根据本发明实施例获得的四川雅安地震的震前时间地震信息的空间重心分布轨迹图,从图2可以看出,地震宏观异常的重心移动轨迹大致呈现为倒“8”状,且向震中方向偏移,在省会成都附近分布。从图中人口重心的分布可以看出,四川省人口分布现象明显不均匀,因为成都以西以高山、高原为主,人烟稀少,以东以丘陵为主,是人口密集地区,人口分布呈现东密西疏的特点。经济重心位于资阳市境内,向人口重心以西偏离,说明四川西部地区的人均GDP总体上高于东边地区,经济发展水平呈现西高东低的态势。
[0078] 宏观异常的重心大部分分布在GDP重心和人口重心以西,说明网络社交媒体中对宏观异常关注的分布并不是以人口多的东部为主,西部虽然人口稀少,但人们对宏观异常的关注度却较高。
[0079] 结合四川雅安烈度图,烈度级别从IX-VI,可以看出宏观异常的重心大部分落在地震烈度小于VI之外的区域,即有感区域内,且与烈度图的长轴方向平行分布。
[0080] 从GDP、人口和地震烈度三方面的角度进行分析,得出宏观异常的重心分布在地震有感区域分布比较集中,且与GDP重心和人口重心不重合,在GDP重心和人口重心以西分布,且随着时间的变化重心也在发生变化,向震中方向偏移,成都为经济发达地区而且人口吸附地,人口数量很多,对地震宏观异常的关注度较大,所以重心在成都市附近分布,而且成都市处于有感区域范围内。
[0081] 图3示出了根据本发明实施例获得的云南彝良地震的震前时间地震信息的空间重心分布轨迹图,从图3中可以看出,地震宏观异常的重心移动轨迹大致呈现为倒“8”状,在省会昆明市境内分布。从图中人口重心的分布可以看出,云南省人口分布现象明显不均匀,人口分布呈现东密西疏的特点。经济重心几乎与人口重心重合,即云南西部地区的人均GDP总体上低于东边地区,经济发展水平呈现东高西低的态势。网络社交媒体中对宏观异常关注的重心分布主要在人口多和经济比较发达的地区出现,昆明市为省会城市,经济发达且为人口吸附地,向震中方向偏移,且主要在地震烈度图长轴延长线上分布。
[0082] 最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈