技术领域
[0001] 本
发明属于即时通信新闻价值评估技术领域,特别是涉及一种即时通信新闻价值评估方法及系统。
背景技术
[0002] 由于智能移动通信设备的普及,数据上网与即时通信成为人们最重要的通信手段之一,各类即时通信新闻如微信公众号文章、QQ咨询等也成为人们阅读新闻的主要渠道。但是大量虚假新闻或无意义的新闻无节制的通过即时通信渠道发送给用户,会对用户造成极大干扰。需要一种能够评估即时通信新闻价值的技术方案,为此提出一种即时通信新闻价值评估方法及系统。
发明内容
[0003] 本发明所要解决的技术问题是不能评估即时通信新闻价值的问题,提出一种即时通信新闻价值评估方法及系统。
[0004] 发明依托即时通信
软件系统,所述即时通信软件系统是指带有
聊天对话功能的app或网页或小程序的任一项。
[0005] 本发明的即时通信新闻价值评估方法,包括以下步骤:
[0006] 提取即时通信新闻内容关键词:识别即时通信新闻内容的关键词,关键词数量记为N,对新闻内容关键词进行编号,记为i,1≤i≤N,生成新闻内容关键词集合A;设置新闻内容关键词的权重值,记为bi。
[0007] 计算新闻内容评价系数:搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,根据负面评价内容与此次即时通信新闻的相似程度计算新闻内容关键词的评价系数,记为mi。
[0008] 所述新闻数据中的负面评价内容是指新闻数据中的投诉信息或澄清公告或虚假
声明的任一项或多项组合。
[0009] 所述负面评价内容与此次即时通信新闻的相似程度是指与关键词相关的负面评价内容与此次即时通信新闻内容相似词或句或段落的比例,记为αi;所述新闻内容关键词的评价系数 其中,g是事先设置的评价系数计算参考值。
[0010] 计算新闻发布方的可信度参考值:根据新闻发布方的账号信息识别即时通信新闻发布方的特征,计算新闻发布方特征对用户的
正面影响
力,计算新闻发布方的可信度参考值,记为d。
[0011] 所述发布方特征包括账号类型特征、订阅量特征、历史投诉特征;所述新闻发布方特征对用户的正面影响力是指发布方特征与账号类型为官方账号、订阅量超过高订
阈值、历史投诉小于投诉阈值的匹配比例,用变量β表示;所述新闻发布方的可信度参考值d=s·β,其中s是事先设置的可信度计算系数。
[0012] 评估即时通信新闻的价值:根据新闻内容关键词的权重值bi、新闻内容关键词的评价系数mi和新闻发布方的可信度参考值d计算即时通信新闻的价值评估值x。
[0013] 所述即时通信新闻的价值评估值 其中k是事先设置的价值评估计算系数。
[0014] 本发明的即时通信新闻价值评估系统,其特征在于包括:
[0015] 一个或多个处理器;
[0017] 以及
[0018] 一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括:
[0019] 提取即时通信新闻内容关键词模
块:识别即时通信新闻内容的关键词,关键词数量记为N,对新闻内容关键词进行编号,记为i,1≤i≤N,生成新闻内容关键词集合A;设置新闻内容关键词的权重值,记为bi。
[0020] 计算新闻内容评价系数模块:搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,根据负面评价内容与此次即时通信新闻的相似程度计算新闻内容关键词的评价系数,记为mi。
[0021] 所述新闻数据中的负面评价内容是指新闻数据中的投诉信息或澄清公告或虚假声明的任一项或多项组合。
[0022] 所述负面评价内容与此次即时通信新闻的相似程度是指与关键词相关的负面评价内容与此次即时通信新闻内容相似词或句或段落的比例,记为αi;所述新闻内容关键词的评价系数 其中,g是事先设置的评价系数计算参考值。
[0023] 计算新闻发布方的可信度参考值模块:根据新闻发布方的账号信息识别即时通信新闻发布方的特征,计算新闻发布方特征对用户的正面影响力,计算新闻发布方的可信度参考值,记为d。
[0024] 所述发布方特征包括账号类型特征、订阅量特征、历史投诉特征;所述新闻发布方特征对用户的正面影响力是指发布方特征与账号类型为官方账号、订阅量超过高订阈值、历史投诉小于投诉阈值的匹配比例,用变量β表示;所述新闻发布方的可信度参考值d=s·β,其中s是事先设置的可信度计算系数。
[0025] 评估即时通信新闻的价值模块:根据新闻内容关键词的权重值bi、新闻内容关键词的评价系数mi和新闻发布方的可信度参考值d计算即时通信新闻的价值评估值x。
[0026] 所述即时通信新闻的价值评估值 其中k是事先设置的价值评估计算系数。
[0027] 本发明的方法及系统具有的优点是:
[0028] (1)根据即时通信新闻负面评价及发布方的可信度,可以有效评估即时通信新闻的价值。
[0029] (2)通过评估即时通信新闻的价值,为有效减少虚假新闻或无意义的新闻提供依据。
附图说明
[0030] 图1是本发明
实施例的即时通信新闻价值评估方法
流程图;
[0031] 图2是本发明实施例的即时通信新闻价值评估系统结构示意图。
具体实施方式
[0032] 下面对本发明优选实施例作详细说明。
[0033] 发明依托即时通信软件系统,所述即时通信软件系统是指带有聊天对话功能的app或网页或小程序的任一项。本实施例中,对某即时通信软件例如微信中公众号新闻的价值进行评估。
[0034] 本发明实施例的即时通信新闻价值评估方法,按如下步骤实现:
[0035] 提取即时通信新闻内容关键词:识别即时通信新闻内容的关键词,关键词数量记为N,对新闻内容关键词进行编号,记为i,1≤i≤N,生成新闻内容关键词集合A;根据关键词对新闻含义的重要程度设置新闻内容关键词的权重值,记为bi。
[0036] 所述新闻内容的关键词是指与新闻内容相关的且对新闻的含义或信息起关键作用的字或词或句的任一项。本实施例中,提取此次即时通信新闻的内容,根据已有的新闻
关键词识别及提取
算法,识别新闻内容的关键词为“高速公路”、“倒车”和“违法”,生成新闻内容关键词集合A,数量N=3,对新闻内容关键词从1到3进行编号,记为i,根据关键词对新闻所表述含义的重要程度设置新闻内容关键词的权重值b1=0.4,b2=0.2,b3=0.4。
[0037] 计算新闻内容评价系数:搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,根据负面评价内容与此次即时通信新闻的相似程度计算新闻内容关键词的评价系数,记为mi。
[0038] 所述新闻数据中的负面评价内容是指新闻数据中的投诉信息或澄清公告或虚假声明的任一项或多项组合。
[0039] 所述负面评价内容与此次即时通信新闻的相似程度是指与关键词相关的负面评价内容与此次即时通信新闻内容相似词或句或段落的比例,记为αi;所述新闻内容关键词的评价系数 其中,g是事先设置的评价系数计算参考值。本实施例中,在
搜索引擎中搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,其中,与“高速公路”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α1=0.1,与“倒车”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α2=0.1,与“违法”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α3=0.2,事先设置的评价系数参考值g=0.1,则计算新闻内容关键词的识别评价系数[0040] 计算新闻发布方的可信度参考值:根据新闻发布方的账号信息识别即时通信新闻发布方的特征,计算新闻发布方特征对用户的正面影响力,计算新闻发布方的可信度参考值,记为d。
[0041] 所述发布方特征包括账号类型特征、订阅量特征、历史投诉特征;所述新闻发布方特征对用户的正面影响力是指发布方特征与账号类型为官方账号、订阅量超过高订阈值、历史投诉小于投诉阈值的匹配比例,用变量β表示;所述新闻发布方的可信度参考值d=s·β,其中s是事先设置的可信度计算系数。本实施例中,根据新闻发布方的账号信息识别该新闻的发布方为微信订阅号“杭州交警”,账号类型为官方新闻账号,账号的订阅量为20万,没有历史投诉,事先设置的高订阈值为1万,投诉阈值为3条/月,则此次即时通信新闻发布方特征与与账号类型为官方账号、订阅量超过高订阈值、历史投诉小于投诉阈值的匹配比例β=3/3=1,事先设置的可信度计算系数s=1,计算该新闻发布方的可信度参考值d=s·β=1×1=1。
[0042] 评估即时通信新闻的价值:根据新闻内容关键词的权重值bi、新闻内容关键词的评价系数mi和新闻发布方的可信度参考值d计算即时通信新闻的价值评估值x。
[0043] 所述即时通信新闻的价值评估值 其中k是事先设置的价值评估计算系数。本实施例中,事先设置的价值评估计算系数k=1,则计算即时通信新闻的价值评估值
[0044] 本实施例的即时通信新闻价值评估方法流程图,如图1所示。
[0045] 本实施例的即时通信新闻价值评估系统,其特征在于包括:
[0046] 一个或多个处理器;
[0047] 存储器;
[0048] 以及
[0049] 一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括:
[0050] 提取即时通信新闻内容关键词模块:识别即时通信新闻内容的关键词,关键词数量记为N,对新闻内容关键词进行编号,记为i,1≤i≤N,生成新闻内容关键词集合A;根据关键词对新闻含义的重要程度设置新闻内容关键词的权重值,记为bi。
[0051] 所述新闻内容的关键词是指与新闻内容相关的且对新闻的含义或信息起关键作用的字或词或句的任一项。本实施例中,提取此次即时通信新闻的内容,根据已有的新闻关键词识别及提取算法,识别新闻内容的关键词为“高速公路”、“倒车”和“违法”,生成新闻内容关键词集合A,数量N=3,对新闻内容关键词从1到3进行编号,记为i,根据关键词对新闻所表述含义的重要程度设置新闻内容关键词的权重值b1=0.4,b2=0.2,b3=0.4。
[0052] 计算新闻内容评价系数模块:搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,根据负面评价内容与此次即时通信新闻的相似程度计算新闻内容关键词的评价系数,记为mi。
[0053] 所述新闻数据中的负面评价内容是指新闻数据中的投诉信息或澄清公告或虚假声明的任一项或多项组合。
[0054] 所述负面评价内容与此次即时通信新闻的相似程度是指与关键词相关的负面评价内容与此次即时通信新闻内容相似词或句或段落的比例,记为αi;所述新闻内容关键词的评价系数 其中,g是事先设置的评价系数计算参考值。本实施例中,在搜索引擎中搜索与集合A中新闻内容关键词相关的新闻数据,识别新闻数据中的负面评价内容,其中,与“高速公路”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α1=0.1,与“倒车”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α2=0.1,与“违法”相关的负面评价内容与此次即时通信新闻的相似词或句或段落的比例α3=0.2,事先设置的评价系数参考值g=0.1,则计算新闻内容关键词的识别评价系数[0055] 计算新闻发布方的可信度参考值模块:根据新闻发布方的账号信息识别即时通信新闻发布方的特征,计算新闻发布方特征对用户的正面影响力,计算新闻发布方的可信度参考值,记为d。
[0056] 所述发布方特征包括账号类型特征、订阅量特征、历史投诉特征;所述新闻发布方特征对用户的正面影响力是指发布方特征与账号类型为官方账号、订阅量超过高订阈值、历史投诉小于投诉阈值的匹配比例,用变量β表示;所述新闻发布方的可信度参考值d=s·β,其中s是事先设置的可信度计算系数。本实施例中,根据新闻发布方的账号信息识别该新闻的发布方为微信订阅号“杭州交警”,账号类型为官方新闻账号,账号的订阅量为20万,没有历史投诉,事先设置的高订阈值为1万,投诉阈值为3条/月,则此次即时通信新闻发布方特征与与账号类型为官方账号、订阅量超过高订阈值、历史投诉小于投诉阈值的匹配比例β=3/3=1,事先设置的可信度计算系数s=1,计算该新闻发布方的可信度参考值d=s·β=1×1=1。
[0057] 评估即时通信新闻的价值模块:根据新闻内容关键词的权重值bi、新闻内容关键词的评价系数mi和新闻发布方的可信度参考值d计算即时通信新闻的价值评估值x。
[0058] 所述即时通信新闻的价值评估值 其中k是事先设置的价值评估计算系数。本实施例中,事先设置的价值评估计算系数k=1,则计算即时通信新闻的价值评估值
[0059] 本实施例的即时通信新闻价值评估系统结构示意图,如图2所示。
[0060] 当然,本技术领域中的普通技术人员应当认识到,以上实施例仅是用来说明本发明的,而并非作为对本发明的限定,只要在本发明的范围内,对以上实施例的变化、变型都将落入本发明的保护范围。