首页 / 专利库 / 地球科学 / / 飓风 / 用于使用天气数据的统计分析预测经济趋势的系统和方法

用于使用天气数据的统计分析预测经济趋势的系统和方法

阅读:980发布:2020-05-14

专利汇可以提供用于使用天气数据的统计分析预测经济趋势的系统和方法专利检索,专利查询,专利分析的服务。并且所公开的是一种克服传统系统的技术问题的经济预测系统。传统的经济预测系统可以分析过去的经济行为并且构建统计模型以预知未来的行为。然而,当包括过去的天气数据时,由于天气度量的高多重共线性,传统系统生成过拟合和/或欠拟合模型。所公开的系统通过分析划分成组的天气度量(基于每组中的天气度量的多重共线性)来克服传统系统具有的该技术问题,并且使用来自每组的一个或更多个统计上最显著的天气度量来生成统计模型。,下面是用于使用天气数据的统计分析预测经济趋势的系统和方法专利的具体信息内容。

1.一种用于预测感兴趣的经济效益度量的系统,所述系统包括:
历史经济效益数据库,其存储包括所述感兴趣的经济效益度量的一个或更多个地理定位的且具有时间索引的历史经济效益度量;
历史天气数据库,其存储地理定位的且具有时间索引的历史天气度量,其中所述历史天气度量分成组使得具有高多重共线性的历史天气度量分在一组;
天气预测数据库,其存储地理定位的且具有时间索引的所预测的天气度量;以及经济预测引擎,其
执行相关性分析以识别所述历史天气度量中的每个相对于所述感兴趣的经济效益度量的相关性和统计显著性;
从每组中选择相对于所述感兴趣的经济效益度量具有最高相关性以及具有达到或超过预定阈值的统计显著性的、多达预定数量的历史天气度量;
使用从所有组中选择的历史天气度量来生成统计模型以预测所述感兴趣的经济效益度量;
使用所述统计模型和所预测的天气度量预测所述感兴趣的经济效益度量;以及输出所预测的感兴趣的经济效益度量以显示给用户。
2.如权利要求1所述的系统,其中,所述经济预测引擎使用回归分析生成所述统计模型。
3.如权利要求1所述的系统,其中,所述经济预测引擎使用决策树生成所述统计模型。
4.如权利要求1所述的系统,其中,所述经济预测引擎使用神经网络生成所述统计模型。
5.如权利要求1所述的系统,其中,所述历史天气度量分成组,使得相对于彼此具有最高绝对皮尔逊相关系数的历史天气度量在同一组中。
6.如权利要求1所述的系统,其中,所述经济预测引擎从每组中选择相对于所述感兴趣的经济效益度量具有最高绝对皮尔逊相关系数的、多达所述预定数量的历史天气度量。
7.如权利要求1所述的系统,其中:
所述组包括第一组和第二组;
所述经济预测引擎从所述第一组中选择多达第一预定数量的历史天气度量,并且从所述第一组中选择多达第二预定数量的历史天气度量;以及
所述第一预定数量与所述第二预定数量不同。
8.如权利要求1所述的系统,其中,对于统计显著性的所述预定阈值为小于或等于0.05的概率值。
9.如权利要求1所述的系统,其中,天气度量的组包括温度度量,露点相对湿度土壤温度和分度量,大气压强度量,冷却、加热、有效、生长和冻结度日数度量,度量,太阳辐照度度量,日照度量,降水度量,、冻结、和雨夹雪度量,以及春季、热带风暴、飓风和能见度度量。
10.如权利要求9所述的系统,其中,所述经济预测引擎选择多达两个温度度量,多达两个露点、相对湿度、土壤温度和水分度量,多达一个大气压强度量,多达两个冷却、加热、有效、生长和冻结度日数度量,多达两个风度量,多达一个太阳辐照度度量,多达两个日照度量,多达两个降水度量,多达三个雪、冻结、冰和雨夹雪度量,以及多达三个热带风暴、飓风和能见度度量。
11.一种用于基于地理定位的且具有时间索引的历史天气度量来预测感兴趣的经济效益度量的方法,其中,所述历史天气度量分成组使得具有高多重共线性的历史天气度量分在一组,所述方法包括:
接收包括所述感兴趣的经济效益度量的一个或更多个地理定位的且具有时间索引的历史经济效益度量;
接收地理定位的且具有时间索引的预测的天气度量;
执行相关性分析以识别历史天气度量中的每个相对于所述感兴趣的经济效益度量的相关性和统计显著性;
从每组中选择相对于所述感兴趣的经济效益度量具有最高相关性以及具有达到或超过预定阈值的统计显著性的、多达预定数量的历史天气度量;
使用从所有组中所选择的历史天气度量来生成统计模型以预测所述感兴趣的经济效益度量;
使用所述统计模型和预测的天气度量来预测所述感兴趣的经济效益度量;以及输出所预测的感兴趣的经济效益度量以显示给用户。
12.如权利要求11所述的方法,其中,使用回归分析生成所述统计模型。
13.如权利要求11所述的方法,其中,使用决策树生成所述统计模型。
14.如权利要求11所述的方法,其中,使用神经网络生成所述统计模型。
15.如权利要求11所述的方法,其中,将所述历史天气度量分成组,使得相对于彼此具有最高绝对皮尔逊相关系数的历史天气度量在同一组中。
16.如权利要求11所述的方法,其中,从每组中选择相对于所述感兴趣的经济效益度量具有最高绝对皮尔逊相关系数的、所述预定数量的历史天气度量。
17.如权利要求11所述的方法,其中:
所述组包括第一组和第二组;
从所述第一组中选择第一预定数量的历史天气度量,并且从所述第一组中选择多达第二预定数量的历史天气度量;以及
所述第一预定数量与所述第二预定数量不同。
18.如权利要求11所述的方法,其中,对于统计显著性的所述预定阈值为小于或等于
0.05的概率值。
19.如权利要求11所述的方法,其中,天气度量的组包括温度度量,露点、相对湿度、土壤温度和水分度量,大气压强度量,冷却、加热、有效、生长和冻结度日数度量,风度量,太阳辐照度度量,日照度量,降水度量,雪、冻结、冰和雨夹雪度量,以及春季、热带风暴、飓风和能见度度量。
20.如权利要求19所述的方法,其中,选择多达两个温度度量,多达两个露点、相对湿度、土壤温度和水分度量,多达一个大气压强度量,多达两个冷却、加热、有效、生长和冻结度日数度量,多达两个风度量,多达一个太阳辐照度度量,多达两个日照度量,多达两个降水度量,多达三个雪、冻结、冰和雨夹雪度量,以及多达三个热带风暴、飓风和能见度度量。
21.一种非暂时性计算机可读存储介质,存储有指令,所述指令在由计算机处理器执行时,使得所述计算机处理器基于地理定位的且具有时间索引的历史天气度量预测感兴趣的经济效益度量,其中,所述历史天气度量分成组使得具有高多重共线性的历史天气度量分成一组,所述指令使得计算机执行的过程包括:
接收包括所述感兴趣的经济效益度量的一个或更多个地理定位的且具有时间索引的历史经济效益度量;
接收地理定位的且具有时间索引的预测的天气度量;
执行相关性分析以识别历史天气度量中的每个相对于所述感兴趣的经济效益度量的相关性和统计显著性;
从每组中选择相对于所述感兴趣的经济效益度量具有最高相关性以及具有达到或超过预定阈值的统计显著性的、多达预定数量的历史天气度量;
使用从所有组中所选择的历史天气度量来生成统计模型以预测所述感兴趣的经济效益度量;
使用所述统计模型和预测的天气度量来预测所述感兴趣的经济效益度量;以及输出所预测的感兴趣的经济效益度量以显示给用户。

说明书全文

用于使用天气数据的统计分析预测经济趋势的系统和方法

背景技术

[0001] 从基础设施可用性到能源消耗,宏观和微观经济趋势通常受天气的影响。类似地,人类行为通常(有意识或无意识地)受天气的影响。因此,企业和其他组织寻求准确的预测来预知从总体经济趋势到对特定产品的需求的所有事物。
[0002] 传统经济预测系统分析过去的经济行为并且构建经济预测模型以预知未来的经济行为。天气数据库包括可能与过去的事件相关的历史天气数据。因此,一些传统经济预测系统可以包括过去的天气数据并且根据天气状况对经济行为建立模型,以便考虑到所预测的天气和气候状况来预知未来的经济行为。
[0003] 传统经济预测系统通过以下对感兴趣的经济度量建立模型:分析可能与感兴趣的经济度量相关的所有可用度量,确定与感兴趣的经济度量相关的度量,并且根据与感兴趣的经济度量统计上显著相关的所有度量来生成预测感兴趣的经济度量的模型。
[0004] 然而,由于过去的天气度量的多重共线性,因此很难基于过去的天气度量来构建传统系统以对过去的事件建立模型。多重共线性是当两个或更多个度量彼此适度或高度相关时发生的现象。在气象学和气候科学领域,天气度量的数量已显著增加。例如,目前从AccuWeather Enterprise Solutions of State College,PA可获得的天气数据库包括超过300个天气度量,包括一阶导数、二阶导数等。这些附加的天气度量中的一些比可以通过更简单的经济预测系统来考虑的更简单的天气度量对经济趋势更具有预知性。然而,在超过300个可用的天气度量的情况下,由于这些天气度量中的一些是对相同现象的高度相关的测量,因此频繁出现多重共线性。例如,日高温、低温和平均温度都是不同的度量。然而,由于它们都是在特定的一天、在特定位置处测量大气中存在的热量,所以它们是彼此高度相关的。
[0005] 由于历史天气度量的多重共线性,传统经济预测系统生成过拟合模型或欠拟合模型。过拟合是指分析结果与特定数据集过于紧密或精确对应,并且可能因此无法可靠地预知未来的观察。本质上,过拟合模型符合过去的数据中的、不期望出现在未来的数据中的、导致不准确的预测的残差变化(即,噪声)。当统计模型不能够充分获取数据的底层结构时发生欠拟合。欠拟合的简单示例是将线性模型拟合到非线性数据,这往往具有较差的预知性能。但是,欠拟合模型能够是将出现在正确特定的模型中的一些参数或项为缺失的任何模型。
[0006] 因此,需要一种在不由于历史天气度量的高度多重共线性而开发过拟合模型或欠拟合模型的情况下基于所预测的天气度量对未来经济趋势进行预测的经济预测系统。发明内容
[0007] 为克服传统预测系统具有的这些以及其他技术问题,提供了一种经济预测系统,该经济预测系统分析了分成组(基于每组中天气度量的多重共线性)的天气度量、从每组中识别统计上最显著的天气度量、使用来自每组的一个或更多个统计上最显著的天气度量来生成统计模型、接收所预测的天气度量、以及基于统计模型和所预测的天气度量对感兴趣的经济效益度量进行预测。
[0008] 与使用传统方法所生成的欠拟合或过拟合模型相反,对基于所述天气度量的多重共线性分成组的天气度量进行分析使所公开的系统有效地识别对未来的经济趋势最具预知性的天气度量,即使使用计算上测试成本很高的大量天气度量。附图说明
[0009] 参照附图可以更好地理解示例性实施例的方面。附图中的组件不必须是按比例的,而是强调说明示例性实施例的原理。
[0010] 图1是根据示例性实施例的经济预测系统的框图
[0011] 图2是根据示例性实施例的、示出过程的概述的流程图,该过程用于基于历史天气度量生成用于感兴趣的经济效益度量的模型,并且基于所预测的天气度量生成对感兴趣的经济效益度量的预测;
[0012] 图3是根据示例性实施例的、示出用于从每组中选择统计上最显著的历史天气度量的过程的框图;
[0013] 图4是根据示例性实施例的经济预测系统100的架构400的框图;
[0014] 图5是根据另一示例性实施例的经济预测系统100的另一架构500的框图;以及[0015] 图6是根据另一示例性实施例的经济预测系统100的另一架构600的框图。

具体实施方式

[0016] 现在参考示出本发明的示例性实施例的各种视图的附图。在本文的附图和附图的描述中,某些术语仅为方便所使用,并且不应视为限制本发明的实施例。此外,在附图和以下描述中,相同的标记始终表示相同的元件。
[0017] 图1是根据示例性实施例的经济预测系统100的框图。
[0018] 如图1中所示,经济预测系统100包括经济效益数据库120、历史天气数据库140、天气预测数据库160和经济预测引擎180。
[0019] 历史经济效益数据库120存储地理定位的且具有时间索引的历史经济效益度量122。历史经济效益度量122中的每个描述了在特定时间126、在特定位置124处发生的一个或更多个事件。对于每个地理定位的且具有时间索引的历史经济效益度量122,历史经济效益数据库120存储每个度量122、位置124和时间126的量值。位置124可以表示为纬度和经度、市政自治体(例如,市、县、州等)、区域等。时间126可以是日期、该日期的特定时间等。
[0020] 历史经济效益度量122可以包括零售销售额度量(例如,销售额(以美元为单位)、销售点数量、趋势的计数、按特定SKU编号的物品的销售额等)、基础设施度量(例如,位置可用性、电中断等)、商品度量(例如,能源使用、对于其他商品的需求)、人力资源度量(例如,雇员可用性)等。
[0021] 可以从第三方源获得历史经济效益度量122,第三方源包括政府源获得,如美国国家海洋和大气管理局(NOAA)、美国国家航空航天局(NASA)、美国卫生资源和服务管理局(HRSA)、美国经济分析局(BEA)和美国劳工统计局(BLS),以及私有经济数据源,如干旱监测、国家数据中心(NSIDC)、ESRI市场数据、康奈尔经济与社会研究所(CISER)、TWITTER和FACEBOOK数据、金融市场数据和电力中断数据。(FACEBOOK是Facebook有限公司的商标。TWITTER是Twitter有限公司的商标。)然而,通常来说,经济预测系统100用于基于从特定客户接收到的历史经济效益度量122来预测该特定客户的经济趋势。
[0022] 历史天气数据库140存储地理定位的且具有时间索引的历史天气度量142。此外,地理定位的且具有时间索引的历史天气度量142中的每个描述了在特定时间146、在特定位置144处的天气或环境状况。对于每个地理定位的且具有时间索引的历史天气度量142,历史天气数据库140存储每个度量142、位置144和时间146的量值。位置144可以表示为纬度和经度、市政自治体(例如,市、县、州等)、区域等。时间146可以是日期、该日期的特定时间等。
[0023] 历史天气度量142可以包括温度度量,包括最高温度、最低温度、日平均温度(所有小时)、偏离正常的最高温度、偏离正常的最低温度、偏离正常的日平均温度、日平均温度(最高/最低)等;露点相对湿度土壤温度和分度量,包括最大露点温度、最低露点温度、平均露点温度、最大相对湿度、最小相对湿度、平均相对湿度、最大湿球温度、最小湿球温度、平均湿球温度、土壤水分等;大气压强度量,包括最高压强、最低压强、日平均压强等;冷却、加热、有效、生长和冻结度日数度量,包括冷却度日数、加热度日数、有效度日数、生长度日数、冻结度日数等;度量,包括最高持续风速、最低持续风速、平均持续风速、最高阵风等;太阳辐照度度量,包括最大太阳辐射率、最小太阳辐射率、平均太阳辐射率、总太阳辐射率等;日照度量,包括总日照分钟数、可日照分钟数、可日照百分比等;降水度量,包括观察的日水当量、正常日水当量的百分比等;雪、冻结、冰和雨夹雪度量,包括降雪、积雪0.50英寸、地面上有雪、35英里内有雪等;春季、热带风暴、飓风和能见度度量,包括平均能见度、能见度0.50英里、能见度2.00英里等。历史天气度量142可以包括一阶导数、二阶导数等。历史天气度量142可以包括专有天气度量,例如日平均REALFEEL温度、日最高REALFEEL温度、日最低REALFEEL温度等。(REALFEEL是AccuWeather有限公司的注册服务商标)
[0024] 历史天气度量142可以例如从以下获得:AccuWeather有限公司、AccuWeather Enterprise Solutions有限公司、国家气象局(NWS)、国家飓风中心(NHC)、加拿大环境部(Environment Canada)、其他政府机构(例如英国气象局、日本气象厅等)、私有公司(例如Vaisalia美国国家闪电探测网、Weather Decision Technologies有限公司)、个人(例如Spotter Network的成员)等。历史天气度量142还可以包括从例如美国环境保护署(EPA)接收到的关于环境状况的信息,和/或从例如美国地质调查局(USGS)接收到的有关自然灾害(如地震)的信息。
[0025] 天气预测数据库160存储所预测的天气度量162。所预测的天气度量162包括对于特定位置164和特定时间166所预测的天气和环境状况。位置164可以表示为纬度和经度、市政自治体(例如,市、县、州等)、区域等。时间166可以是日期、该日期的特定时间等。所预测的天气度量162可以是短期预测的天气度量、长期预测的天气度量、长期气候度量等。
[0026] 所预测的天气度量162包括与历史天气度量142相同的天气度量,并且可以是从相同的源接收到的。经济预测系统100还可以包括生成所预测的天气度量162中的一些或全部的天气预测引擎(未示出),例如基于当前天气状况使用一个或更多个大气和海洋的数学模型以预知未来的天气状况。
[0027] 基于地理定位的且具有时间索引的、感兴趣的历史经济效益度量122与地理定位的且具有时间索引的历史天气度量142之间的相关性,经济预测引擎180为每个感兴趣的经济效益度量122建立统计模型。如下所详述,经济预测引擎180识别与感兴趣的历史经济效益度量122相关的历史天气度量142,使得能够生成模型并且该模型用于基于所预测的天气度量162对感兴趣的经济效益度量122进行预测。
[0028] 值得注意的是,经济预测引擎180并未将所有天气度量142一起分析或使用被发现为统计上显著的所有历史天气度量142来建立统计模型,因为,如本公开的背景技术中所述,部分归因于历史天气度量142的多重共线性,这样做将导致过拟合或欠拟合模型。
[0029] 相反,经济预测引擎180单独分析历史天气度量142的组并且识别每组中统计上最显著的历史天气度量142中的一个或更多个。每组包括基于其多重共线性而已被分在一组的历史天气度量142。
[0030] 在一个示例性实施例中,经济预测引擎180使用以下十组历史天气度量142:
[0031] 1、温度度量
[0032] a.最高温度
[0033] b.最低温度
[0034] c.日平均温度(所有小时)
[0035] d.偏离正常的最高温度
[0036] e.偏离正常的最低温度
[0037] f.偏离正常的日平均温度
[0038] g.日平均温度(最高/最低)
[0039] h.等等;
[0040] 2、露点、相对湿度、土壤温度和水分度量
[0041] a.最大露点温度
[0042] b.最小露点温度
[0043] c.平均露点温度
[0044] d.最大相对湿度
[0045] e.最小相对湿度
[0046] f.平均相对湿度
[0047] g.最大湿球温度
[0048] h.最小湿球温度
[0049] i.平均湿球温度
[0050] j.土壤水分
[0051] k.等等;
[0052] 3、大气压强度量
[0053] a.最高压强
[0054] b.最低压强
[0055] c.日平均压强
[0056] d.等等;
[0057] 4、冷却、加热、有效、生长和冻结度日数度量
[0058] a.冷却度日数
[0059] b.加热度日数
[0060] c.有效度日数
[0061] d.生长度日数
[0062] e.冻结度日数
[0063] f.等等;
[0064] 5、风度量
[0065] a.最大持续风速
[0066] b.最小持续风速
[0067] c.平均持续风速
[0068] d.最高阵风
[0069] e.等等;
[0070] 6、太阳辐照度度量
[0071] a.最大太阳辐射率
[0072] b.最小太阳辐射率
[0073] c.平均太阳辐射率
[0074] d.总太阳辐射率
[0075] e.等等;
[0076] 7、日照度量
[0077] a.总日照分钟数
[0078] b.可日照分钟数
[0079] c.可日照百分比
[0080] d.等等;
[0081] 8、降水度量
[0082] a.观察的日水当量
[0083] b.正常日水当量的百分比
[0084] c.等等;
[0085] 9、雪、冻结、冰和雨夹雪度量
[0086] a.降雪
[0087] b.积雪0.50英寸
[0088] c.地面上有雪
[0089] d.35英里内有雪
[0090] e.等等;
[0091] 10、春季、热带风暴、飓风和能见度度量
[0092] a.平均能见度
[0093] b.能见度0.50英里
[0094] c.能见度2.00英里
[0095] d.等等。
[0096] 历史天气度量142基于其多重共线性被分成组(例如,如上所示)。具体地,天气度量142被分成组使得具有最高绝对皮尔逊(Pearson)相关系数的历史天气度量142在同一组中。表1示出了在使用皮尔逊相关系数来确定多重共线性时的经验法则。
[0097]
[0098] 表1
[0099] 表2示出了基于皮尔逊相关系数、仅使用三个温度度量(最高温度、最低温度和平均温度)以及三个风度量(最高风速、最低风速和平均风速)将历史天气度量142分成组的简化示例。
[0100]
[0101] 表2
[0102] 如表2中所示,最高温度、最低温度和平均温度都具有相对于彼此的强(在这种情况下为正)相关性,并且因此被分在一组(作为温度度量)。类似地,最高风速、最低风速和平均风速都具有相对于彼此的中等到强(在这种情况下为正)的相关性,并且因此被分在一组(作为风度量)。相反,没有一个温度度量与任何风度量有即使弱的相关性(或正或负)。因此,示例温度度量和示例风度量被分成不同的组。
[0103] 图2为根据示例性实施例的、示出过程200的概述的流程图,过程200用于基于如上所述已被分成组的历史天气度量142生成用于感兴趣的经济效益度量122的模型,并且用于基于所预测的天气度量162来生成对感兴趣的经济效益度量122的预测。对于每个感兴趣的经济效益度量122,通过经济预测引擎180执行过程200。
[0104] 对于每组历史天气度量142,在步骤210中执行相关性分析。相关性分析确定每个历史天气度量142相对于感兴趣的经济效益度量122的皮尔逊相关系数和统计显著性(例如,概率值或“p值”)。
[0105] 在步骤220中,从每组历史天气度量142中选择多达预定数量的统计上最显著的历史天气度量142。参考图3,详细描述用于执行相关性分析并且从每组中选择统计上最显著的历史天气度量142的过程210和220。
[0106] 在步骤230中,使用所选择的历史天气度量142生成统计模型。可以使用回归分析(例如,线性、逻辑、最佳子集、步进式等)、决策树(例如,C5、CART、CHAID等)、神经网络(多层感知器、径向基函数等)或其他人工智能等生成预测模型。
[0107] 在步骤240中,接收所预测的天气度量162。
[0108] 在步骤250中,基于在步骤230中的所生成的统计模型以及在步骤240中所接收的预测的天气度量162,生成对感兴趣的经济效益度量122的预测。
[0109] 在步骤260中,输出在步骤250中生成的预测。预测可以通过图形用户界面输出给用户。附加地或替代地,可以将预测输出到通信网络以传输到客户计算设备(例如,感兴趣的经济效益度量122的源)。
[0110] 图3为根据示例性实施例的、示出用于从每组中确定和选择统计上最显著的历史天气度量142的过程210和220的框图。
[0111] 如图3中所示,已将历史天气度量142中的每个分成组。在该示例中,已将历史天气度量142分成组A至J,使得组A包括度量A1、度量A2等,组B包括度量B1、度量B2等。
[0112] 对于每组历史天气度量142,执行相关性分析以识别每个历史天气度量142的皮尔逊相关系数和统计显著性。具体地,对于A组,在步骤210中执行相关性分析以识别组A中的历史天气度量A1、A2等中的每个相对于感兴趣的经济效益度量122的皮尔逊相关系数和统计显著性。类似地,对于组B,在步骤211中执行相关性分析以识别组B中的历史天气度量B1、B2等中的每个相对于感兴趣的经济效益度量122的皮尔逊相关系数和统计显著性。在步骤212至219中,对组C至J中的历史天气度量142中的每个执行类似的相关性分析。
[0113] 表3示出了识别七个温度度量的皮尔逊相关系数和统计显著性的示例(以上示例中的组A)。
[0114]
[0115] 表3
[0116] 对于每组历史天气度量142,选择最显著的历史天气度量142中的多达n个。具体地,对于组A,在步骤220中,如果存在具有预定阈值内的统计显著性的nA个历史天气度量142,选择具有最高绝对皮尔逊相关系数的nA个历史天气度量142。(预定阈值可以为,例如p≤0.05、或更优选p≤0.01、或最优选p≤0.001)。类似地,对于组B,在步骤221中,(如果存在具有预定阈值内的统计显著性的nB个历史天气度量142)选择具有最高绝对皮尔逊相关系数的nB个历史天气度量142。在步骤222至229中执行类似的选择过程,以从组C中选择多达nC个度量、从组D中选择多达nD个度量等等,以及从组J中选择多达nJ个度量。
[0117] 参考回表3中的示例,如果从组A中所选择的历史天气度量142的数量nA是2,则经济预测引擎180将选择偏离正常的最高温度和偏离正常的日平均温度以建立统计模型。
[0118] 从每组中选择的历史天气度量的数量n可以因组而异。在最优选的实施例中,使用上述特定十组历史天气度量142,经济预测引擎180选择两个最显著的温度度量(组1),两个最显著的露点、相对湿度、土壤温度和水分度量(组2),一个统计上最显著的大气压强度量(组3),两个统计上最显著的冷却、加热、有效、生长和冻结度日数度量(组4),两个统计上最显著的风度量(组5),一个统计上最显著的太阳辐照度度量(组6),两个统计上最显著的日照度量(组7),两个统计上最显著的降水度量(组8),三个统计上最显著的雪、冻结、冰和雨夹雪度量(组9),以及三个统计上最显著的热带风暴、飓风和能见度度量(组10)。
[0119] 如上所述,经济预测引擎180使用了从所有组选择的历史天气度量142(在最优选的实施例中,相对于感兴趣的经济效益度量122统计上最显著的20个历史天气度量142)并且生成了统计模型以预测感兴趣的经济效益度量122。
[0120] 图4是根据示例性实施例的经济预测系统100的架构400的框图。
[0121] 如图4中所示,架构400可以包括通过例如一个或更多个客户端网络432通信的一个或更多个客户端设备420以及通过例如一个或更多个服务器端网络434来通信的一个或更多个服务器端设备440。客户端设备420可以通过广域网436(例如互联网)与服务器端设备通信。客户端设备420可以包括一个或更多个客户计算机422、424等,以及非暂时性计算机可读存储介质426。服务器端设备440可以包括一个或更多个服务器442、444等,以及非暂时性计算机可读存储介质446。
[0122] 客户计算机422、424等中的每个可以是配置为通过网络432、436等发送和/或接收数据的任何合适的硬件计算设备。例如,客户计算机422、424等中的每个可以例如网络连接的计算设备,网络连接的计算设备例如为服务器、个人计算机、笔记本计算机、智能电话、个人数字助理(PDA)、平板电脑、网络连接的车辆等。客户计算机中的每个包括内部存储设备和硬件处理器,例如中央处理单元(CPU)。客户计算机422、424等中的一些或全部可以包括输出设备(例如显示器)以及输入设备(例如键盘鼠标触摸板等)。一个或更多个服务器442、444等中的每个可以是配置为通过网络434、436等发送和/或接收数据的任何合适的硬件计算设备。一个或更多个服务器442、444等中的每个可以为例如主持客户端计算设备420可访问网站应用服务器和网络服务器。一个或更多个服务器442、444等中的每个包括内部非暂时性存储设备和至少一个硬件计算机处理器。每个非暂时性计算机可读存储介质
426和446可以包括硬盘、固态存储器等。一个或更多个网络432、434、436等可以包括互联网、蜂窝网络、广域网(WAN)、局域网(LAN)等的任何组合。通过网络432、434、436等的通信可以通过有线和/或无线连接来实现。
[0123] 参考回图1,经济预测系统100包括经济效益数据库120、历史天气数据库140、天气预测数据库160和经济预测引擎180。可以通过由硬件计算机处理器所执行的软件指令来实现经济预测引擎180。可以通过由服务器442、444等中的一个(在服务器端)和/或客户计算机422、424中的一个(在客户端)所执行的软件指令来实现经济预测引擎180。类似地,经济效益数据库120、历史天气数据库140和天气预测数据库160可以存储在非暂时性计算机可读存储介质446上(在服务器端440)和/或非暂时性计算机可读存储介质426上(在客户端420)。
[0124] 在图4中所示的架构400中,经济预测引擎180通过由服务器442、444等中的一个(在服务器端)执行的软件指令来实现,并且经济效益数据库120、历史天气数据库140和天气预测数据库160存储在非暂时性计算机可读存储介质446上(在服务器端440)。然而,经济效益度量122以及与经济效益度量122相关联的位置124和时间126可以从一个或更多个客户计算机422、424等(在客户端420)接收到。在该实施例中,经济预测引擎180可以将对每个感兴趣的经济效益度量122的预测输出到服务器端网络434来通过广域网436传输到客户计算机422或424中的一个或更多个。客户计算机422、424等可以通过图形用户界面将预测输出给用户。
[0125] 图5是根据另一示例性实施例的经济预测系统100的另一架构500的框图。
[0126] 除了经济预测引擎180通过由客户计算机422、424等中的一个(在客户端420)所执行的软件指令来实现,并且经济效益数据库120、历史天气数据库140和天气预测数据库160存储在非暂时性计算机可读存储介质426上(在客户端420)之外,图5中所示的架构500类似于图4中所示的架构400。在该实施例中,历史天气度量142(以及与历史天气度量142相关的位置144和时间146)以及所预测的天气度量162(以及与历史天气度量162相关的位置164和时间166)可以从一个或更多个服务器442、444等(在服务器端440)接收到。在该实施例中,经济预测引擎180可以通过图形用户界面向用户输出对每个感兴趣的经济效益度量122的预测。
[0127] 图6是根据另一示例性实施例的经济预测系统100的另一架构600的框图。
[0128] 图5中所示的架构600除了其还包括计算平台620(例如机器学习或其他人工智能平台)之外,类似于图4中所示的架构400。例如,云计算平台620可以为Microsoft Azure机器学习环境。在该实施例中,经济预测引擎180通过由云计算平台620所执行的软件指令来实现。类似于架构400和架构500,经济效益数据库120、历史天气数据库140和天气预测数据库160可以存储在非暂时性计算机可读存储介质446上(在服务器端440)和/或非暂时性计算机可读存储介质426上(在客户端420)。
[0129] 由于当前可用的天气数据库具有超过300个历史天气度量142,上述降维过程允许经济预测系统100发现当与所有度量一起测试时可能丢失的显著的度量142(如利用传统经济预测系统可能所做的那样),提高了用于预测感兴趣的经济效益度量122的统计模型的准确性。作为示例,当一起测试风速、温度和湿度时,由于温度和湿度的强相关性,它们可以为统计上显著的,这掩盖了风速对感兴趣的经济效益度量122的影响。然而,当经济预测系统100如上所述结合其他风速度量对风速进行测量时,经济预测系统100已发现在一定的经济效益度量122的分情况下,最高持续风速和阵风速为统计上显著的。
[0130] 在不牺牲未来模型的准确性的情况下,经济预测系统100通过将历史天气度量142的数量减少到更容易管理的集合中并且使用来自每组的统计上最显著的历史天气度量142来执行分析过程,来生成经济趋势的高准确性预测。所公开的经济预测系统100还为用户提供可重复的结果以执行各种分析项目。
[0131] 通常,可用于测试的大量历史天气度量142在计算上测试成本很高。通过在单独组中测试历史天气度量142(并且随后结合来自每一组的统计上最显著的历史天气度量142来生成统计模型),经济预测系统100能够有效地确定来自每一组的哪个历史天气度量142与感兴趣的经济效益度量122具有显著关系。
[0132] 经济预测系统100还能够为客户提供对经济趋势最准确的洞察与预测,使得它们能够使用所预测的天气度量162来获取未来销售提升事件并且最少化销售下降事件。经济预测系统100允许跨越所有产品线和地理区域更有效地规划并增加销售。
[0133] 经济预测系统100克服了传统经济预测系统具有的技术问题,部分归因于历史天气度量142的高多重共线性,该传统经济预测系统可将历史天气度量142一起分析并且因此生成欠拟合和/或过拟合统计模型。通过将历史天气度量142一起分析,传统经济预测系统可生成欠拟合统计模型,该欠拟合统计模型根据仅以下五个历史天气度量142来预测感兴趣的经济效益度量122:
[0134] ·可日照分钟数
[0135] ·计算的日照百分比
[0136] ·积雪0.50英寸
[0137] ·地面上有雪
[0138] ·总水当量。
[0139] 相比之下,使用上述降维过程,经济预测系统100能够识别历史天气度量142,该历史天气度量142与在将历史天气度量142一起分析时丢失的感兴趣的经济效益度量122具有更微妙关系。因此,使用上述降维过程,经济预测系统100生成统计模型,该统计模型根据以下13个历史天气度量142预测感兴趣的经济效益度量122:
[0140] ·平均风速
[0141] ·最大湿球温度
[0142] ·最小相对湿度
[0143] ·最小持续风速
[0144] ·可日照分钟数
[0145] ·计算的日照百分比
[0146] ·积雪0.50英寸
[0147] ·地面上有雪
[0148] ·35英里内有雪
[0149] ·土壤水分
[0150] ·总水当量
[0151] ·能见度0.50英里
[0152] ·能见度2.00英里。
[0153] 尽管上文已经阐述了优选实施例,已审阅过本公开的本领域技术人员将容易地理解能够在本发明的范围内实现其他实施例。例如,特定数量的硬件组件、软件模以及诸如此类的公开是说明性的而非限制性的。因此,本发明应该被解释为仅由所附权利要求限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈