专利汇可以提供一种基于股票论坛的发帖文本分析的股市情绪报告生成方法专利检索,专利查询,专利分析的服务。并且投资者的情绪变化对其投资决策的影响巨大,且对于大部分中小投资者,其情绪易受社会舆论以及其他投资者的言论所左右。本 发明 的目的是提供一种基于股票论坛发帖 文本分析 的股市情绪报告生成方法及系统,其通过收集和分析中国股票论坛上的投资者发帖,并生成对应的情绪报告,其有助于投资者理性把控情绪,优化投资决策,可为投资者决策提供参考。,下面是一种基于股票论坛的发帖文本分析的股市情绪报告生成方法专利的具体信息内容。
1.一种基于股票论坛的发帖文本分析的股市情绪报告生成方法,包括如下步骤:
1)通过网络爬虫收集每个个股论坛的投资者发帖,主要包括帖子文本、发帖时间,并将数据保存在数据库中;
2)通过金融语料情感词典对收集的发帖文本数据进行计算分析,将每条帖子分类为看涨帖子、看跌帖子或无情感帖子,具体计算方法是:
①对收集的文本进行分词,
②查找其中所包含的正向情感词(如好、涨、潜力股等)和负向情感词(如差、烂、跌停、坑爹等),记录其位置,
③在情感词前查找情感副词(如太、还算等),根据情感副词的情感强烈程度,人为地赋予副词情感权重:情感较强烈的情感副词(如非常、肯定、特别等),赋予较高的权值;对情感较不强烈的情感副词(如稍微,一点点等)赋予较低的权值;权值的变化范围在0.1-2,依据设定情感副词词权值,乘以情感词的情感值,得到新的情感值,
④在情感词前查找否定词,若找到就对情感词的情感值乘以-1,
⑤在文本末尾查找感叹号,如有感叹号,将离感叹号最近的情感词的情感值乘以2,⑥计算完所有情感词的情感值后,将所有情感词的情感值求和作为帖子文本的情感值,Tv=S1+S2+…+Sq,Sq是第q个情感词经过程度副词、否定词和标点符号权值修饰过的情感值,q表示该文本共有q个情感词,q属于(0,Q),Q为单个帖子中情感词数量最大值,⑦设定阈值1和-1,若该文本情感值大于正向阈值1,将文本分类为看涨帖子,若小于负向阈值-1,则分类为看跌帖子,否则分类为无情感帖子;
3)对于每只个股汇总计算窗口期内看涨帖子数M,看跌帖子数N,来计算每只个股的情感指数,情感指数 其中σ采用如下公式计算:
其中ε(x-y)为阶跃函数,u表示单个帖子文本包含情感词数量为情感词最多的单个帖子文本中情感词数量的80%(即80%Q),w表示判断单个帖子情感值得分高于90%的帖子情感值的分界值,
u采用如下公式计算:
w采用如下公式计算:
n表示提取的每个个股帖子总数量,i表示每个个股第i个帖子,qi表示第i个帖子的情感词数量, 表示第i个帖子的文本总情感值;
计算该窗口期内每只个股的支持度 和情感量PV
=ln(1+M+N);然后计算阈值
μagreement=avg(agreementi)-1.5*var(agreementi)和
μPV=avg(PVi)-1.5*var(PV),当支持度和情感量同时大于设定的阈值时,所对应的情感指数记为有效,其中μagreement表示支持度的阈值,μPV表示情感量的阈值,i指代计算分析的所有个股中任一只个股;
4)根据窗口期内每个个股的情感值加权求和,得到每个行业板块的情感值以及市场的情感值,根据计算的情感值自动生成报告,其中每个个股的情感值为该个股所有帖子情感值的加权和。
2.根据权利要求1所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,所述步骤1)提取个股投资者信息的方法为:先从代理ip提供商处获取代理ip,后用爬虫程序获取股票论坛数据,将文本内容以及发帖时间存储在数据库中。
3.根据权利要求1所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,所述步骤1)爬取的股票论坛包括互联网上所有股票相关论坛,保留的信息为去除公告、新闻、广告及重复发帖等噪声后的投资者发帖文本和发帖时间。
4.根据权利要求1所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,所述步骤2)中使用jieba的python库进行分词,并按照步骤2)所述的步骤编写python程序进行情感判别。
5.根据权利要求1所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,根据步骤3)计算所得的情感量和支持度进行筛选有效的情感指数。
6.根据权利要求1所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,其特征在于,步骤3)中计算窗口期可以是一天、一周或一个月。
7.根据权利要求1-6任一项所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法,其特征在于,步骤4)中所述的报告包括窗口期内情感指数最高的30只个股以及最低的30只个股,以及每个行业板块的情感值和市场的情感值变化情况。
8.一种基于股票论坛的发帖文本分析的股市情绪报告生成系统,包括论坛数据爬取存储模块、情感分析模块、情感指数计算模块、报告生成模块四个模块;其使用权利要求1-7任一项所述的基于股票论坛的发帖文本分析的股市情绪报告生成方法自动生成股市报告。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于交叉空间池化策略的弱监督图像情感分类与定位方法 | 2020-05-12 | 776 |
文本的情感识别方法、装置、服务器以及存储介质 | 2020-05-12 | 81 |
一种智能化制作短视频的方法 | 2020-05-08 | 571 |
基于虚拟现实的孤独症早期筛查评估系统及方法 | 2020-05-08 | 174 |
一种多维度舆情危机预测方法、终端设备及存储介质 | 2020-05-12 | 688 |
特征扩展卷积神经网络的案件微博观点句识别构建方法 | 2020-05-12 | 855 |
一种基于语义的大数据分析智能服务系统 | 2020-05-12 | 744 |
一种语音采集识别方法与系统 | 2020-05-11 | 14 |
基于深度学习的卫星互联网文本敏感信息检测方法及装置 | 2020-05-11 | 297 |
基于多维相似度的推荐系统及其方法 | 2020-05-11 | 115 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。