专利汇可以提供结合财经新闻挖掘和金融历史数据的金融品种价格预测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及结合财经新闻挖掘和金融历史数据的金融品种价格预测方法。将爬取过来的新闻进行分类,为每篇新闻进行特征词词频统计,形成每篇新闻的词频向量,计算出每篇新闻的情感值,从而计算出当天财经新闻对某金融品种未来发展的情感倾向值。本发明最终结 合金 融品种每一日的情感倾向值和金融品种历史价格,利用多元线性回归和ARIMA相结合的组合 预测模型 ,对金融市场未来价格趋势进行预测,体现现代市场的多元影响因素,获得良好的预测效果。,下面是结合财经新闻挖掘和金融历史数据的金融品种价格预测方法专利的具体信息内容。
1.结合财经新闻挖掘和金融历史数据的金融品种价格预测方法,使用网络爬取技术获得财经新闻信息,使用词频向量的形式对获取到的新闻进行处理,其特征在于,首先对指定的影响度、知名度高的金融财经网站,确定相关新闻板块,使用爬虫对财经新闻进行爬取,获取相关财经新闻信息数据,并按照不同的金融品种进行分类,同时对新闻信息的转载现象进行识别,防止转载造成新闻信息重复出现的状况,先将获取到的每一篇财经新闻信息转化为词频向量的形式,每个向量与一篇新闻一一对应,定义每个词频向量包含的信息为:新闻标题,发布时间,所属分类及情感特征词词频;
定义新闻情感倾向值衡量公式:
, (1)
其中,积极词汇词频为 ,消极词汇词频为 , 代表新闻文本的情感倾
向, 越大,则表示该金融新闻信息较看好未来金融市场的发展趋势,反之,则表示对未来金融市场看跌的程度;
获得每篇新闻的情感倾向后,我们针对某一金融品种,依据下列公式获取当日情感倾向值信息:
,
其中, 表示一天中所有的新闻信息在整体上对未来金融市场的发展趋势的看好程度, 表示一天中各大财经新闻网站所发表的新闻数量, 则是一天中所有新闻情感倾向值的累加值,最终,计算获得当日财经新闻信息对未来金融市场发展趋势的看好度,以此作为依据应用到金融市场的发展趋势预测中;
预测过程使用所得的情感倾向数据,结合金融市场历史价格数据,使用组合模型建立包含多元影响因素的预测,预测技术实现过程包含新闻采集模块、新闻处理模块、情感倾向值计算模块、数据预测模块、验证模块五个部分,
所述新闻采集模块式主要用于获取相关财经新闻信息,同时对新闻进行去重处理,所述分类模块根据所设定的金融品种,将采集所得新闻进行分类,
所述新闻处理模块负责将新闻处理为预测过程易于使用的词频向量,然后计算每一篇新闻的情感倾向值,继而计算每一日的新闻对未来金融市场发展趋势的情感倾向值,所述数据预测模块负责依据所建立的模型对未来价格进行预测,
所述验证模块负责对预测过程产生的模型和预测所得数据进行验证。
2.根据权利要求1所述的结合财经新闻挖掘和金融历史数据的金融品种价格预测方法,其特征在于,所述组合模型建立包含多元影响因素的预测,具体包括:
使用多元线性回归模型和自回归差分滑动平均模型相结合的组合模型进行预测,首先使用每一日的情感倾向值序列,结合金融市场历史数据,使用多元线性回归模型进行初步预测,获得初步预测结果和初步预测残差,然后使用自回归差分滑动平均模型对初步预测残差进行拟合预测,获得最终预测残差,初步预测结果和最终预测残差结合,获得最终预测结果。
3.根据权利要求2所述的结合财经新闻挖掘和金融历史数据的金融品种价格预测方法,其特征在于,所述多元线性回归模型公式定义为:
,
其中,输入的 是特征词序列数据和历史价格数据,而输出的是金融品种的预测价格,也就是我们的模型所模拟的价格;则是我们的模型所涉及到的所有特征数量, 代表白噪声序列,在给定 个独立的观测后,可以得到线性回归的统计模型:
其中 为常数项, , ,… , 为回归系数, 为各影响因子序列, 为 为拟合值序列,也就是预测值,
线性回归模型的矩阵表示为:
,
式中 , , , 。
4.根据权利要求2所述的结合财经新闻挖掘和金融历史数据的金融品种价格预测方法,其特征在于,所述自回归差分滑动平均模型公式定义为:
其中 , , 依次代表的是时间数列中的自回归项数、时间序列成为平稳时所做的差分次数和移动平均项数, 为 时的实际值, 为该模型的自回归系数, 为时间数列模型在 时的偏差, 为时间数列在 时的预测值, 为该模型的移动平均系数。
5.根据权利要求1所述的结合财经新闻挖掘和金融历史数据的金融品种价格预测方法,其特征在于,所述验证模块使用R语言对每一日的情感倾向值和金融市场历史价格数据进行相关性分析,使用历史数据和预测数据的拟合图察看预测效果,使用实际值和预测值得相对残差折线图观察预测效果。
法
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种用于子话题划分的诱导划分方法 | 2021-03-09 | 1 |
一种出行提醒的方法及穿戴设备 | 2021-08-28 | 0 |
用于计算国家特定费用的计算机系统 | 2021-07-01 | 0 |
一种基于网购评价的细粒度情感分析方法 | 2020-06-22 | 2 |
一种基于建构的概念词义发展脉络的提取方法 | 2020-06-21 | 0 |
基于命名实体识别的模板生成、搜索及文本生成设备与方法 | 2020-08-19 | 0 |
基于双层语义分析的全文检索系统 | 2023-04-22 | 1 |
装置间的应用状态和活动传送 | 2023-06-26 | 1 |
이동통신단말장치에서 사용되는 애플리케이션의 데이터를 관리하는 시스템 및 그 방법 | 2023-10-10 | 1 |
LEARNING LANGUAGE MODELS FROM SCRATCH BASED ON CROWD-SOURCED USER TEXT INPUT | 2022-03-09 | 0 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。