专利汇可以提供一种财经博客文本分析方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种财经博客 文本分析 方法,爬取博客数据,对博文进行两类分类,对博文进行看涨看跌看平分类;通过将一段时期内博主所有博文的分类情况与其对应的接下来若干个交易日股市的涨跌情况比较来判断该博主看涨看跌的准确性,若博文的看涨看跌与股市的涨跌一致,则认为该博文预测正确,否则预测错误;计算一段时间内博主所有博文的准确率,然后根据准确率的高低对博主进行排序,将其划分不同的区间,对博主给予等级评定。本发明能够对财经博客的前几名的博主进行有效排序,他们在看盘准确率上相对较高,发表的关于股市交易指导的博文是有一定参考价值的,可考虑最为日常资讯推送给重要客户参考,一定程度上减少投资者的投资失误。,下面是一种财经博客文本分析方法专利的具体信息内容。
1.一种财经博客文本分析方法,其特征在于,包括以下步骤:
(1)爬取博客数据,对博文进行两类分类,对博文进行看涨看跌看平分类;
(2)通过将一段时期内博主所有博文的分类情况与其对应的接下来若干个交易日股市的涨跌情况比较来判断该博主看涨看跌的准确性,若博文的看涨看跌与股市的涨跌一致,则认为该博文预测正确,否则预测错误;
(3)计算一段时间内博主所有博文的准确率,然后根据准确率的高低对博主进行排序,将其划分不同的区间,对博主给予等级评定。
2.根据权利要求1所述的一种财经博客文本分析方法,其特征在于,所述步骤(1)中,包括以下步骤:(11)首先用第一类分类器将未来句子提取出来;
(12)再用第二类分类器对提取出来的未来句子进行切词;
(13)得到每个词语的重要性权重,对一篇博文的N个词匹配涨跌词典得到这些词对应的词得分;
(14)计算每篇博文的得分,当得分小于阈值下限,则博文看跌,当得分大于阈值上限,则博文看涨,当得分在阈值上限和阈值下限之间,则博文看平。
3.根据权利要求2所述的一种财经博客文本分析方法,其特征在于,所述第一类分类器为时间分类器,对于每篇博文的句子,判断句子属于未来还是过去,未来是指表达博主对于未来股市看涨看跌,或者倾向性的句子,过去是指博主对于过去股市的分析、总结,以及一些无关句子。
4.根据权利要求2所述的一种财经博客文本分析方法,其特征在于,对于一篇博文的N个词权重向量为:s=(s1,s2,…,sN),N个词的对应词得分λ=(λ1,λ2,…,λN),计算每篇博文的得分:
5.根据权利要求2所述的一种财经博客文本分析方法,其特征在于,所述涨跌词典为:
博文得分值落在[-1,1]区间上,设置得分阈值下限Scorelow和得分阈值上限Scorehigh,若Score
6.根据权利要求1所述的一种财经博客文本分析方法,其特征在于,所述步骤(2)中,首先定义股市的涨跌平如下:设置股市的涨跌阈值下限Updownlow和涨跌阈值上限Updownhigh,Updown为当日的涨跌幅,若Updown
7.根据权利要求1所述的一种财经博客文本分析方法,其特征在于,所述步骤(3)中,用numhigh、numlow、numave、num1、num-1、num0来分别表示看涨、跌、平正确的数量与看涨、跌、平的总数量,对看涨正确的,看跌正确的文章加大其重要性,对看盘准确率定义为:
计算一段时间内博主所有博文的准确率,然后根据准确率的高低对博主进行排序,对博主给予等级评定。
8.根据权利要求7所述的一种财经博客文本分析方法,其特征在于,对博主根据看涨看跌和看平进行分类排序,公式如下:
分类标签为看涨的公式:
分类标签为看跌的公式:
分类标签为看平的公式:
其中SCOREi为某篇博文的得分,BLOGER_AccMi为该博文对应博主的准确率/月。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于认证对象,尤其是安全元素的方法和安全元素 | 2020-05-12 | 492 |
一种订单数据的显示方法、装置、设备和计算机可读介质 | 2020-05-11 | 460 |
流计算方法、流计算装置、流计算系统及介质 | 2020-05-08 | 890 |
一种证券行情数据高速接入及转发平台 | 2020-05-08 | 970 |
一种财经博客文本分析方法 | 2020-05-11 | 839 |
企业价值评估云服务系统 | 2020-05-13 | 293 |
日志提取方法、日志提取装置及存储介质 | 2020-05-08 | 769 |
一种在水稻花药与花粉中特异表达的启动子PCHF7及其应用 | 2020-05-08 | 131 |
一种投资能力鉴定方法、装置及非暂存性计算机可读存储介质 | 2020-05-08 | 1008 |
一种信息的处理方法、装置及设备 | 2020-05-08 | 870 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。