首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际检索单位 / 附加费 / 异议 / 一种堵绝网络谣言的方法

一种堵绝网络谣言的方法

阅读:819发布:2020-11-09

专利汇可以提供一种堵绝网络谣言的方法专利检索,专利查询,专利分析的服务。并且一种堵绝网络谣言的方法,堵绝网络谣言的方法采用以下步骤完成:Step1:源信息、源作者、源时间的标注;Step2:关联信息传播过程中的关键字提取;Step3:关联信息的数据 算法 审核;从而 锁 定源信息,并利用人工审核确定源信息;Step4:源信息传播次数的统计、报警、溯源和拦截,堵绝网络谣言的方法,以对话信息的关键字为抓取依据,通过抓取传播次数多,传播地域广的源信息,利用机器和人工审核,并对疑似谣言按照审核结果分别进行处理,本 发明 在于将谣言的发布者视为源作者,转发者不计算发布次数,他人通过转发信息时,其法律责任由源作者承担,一些影响恶劣的谣言就很容易达到刑法规定的定罪标准,以警醒喜欢恶意发布谣言信息的人,从而减少谣言信息的发布。,下面是一种堵绝网络谣言的方法专利的具体信息内容。

1.一种堵绝网络谣言的方法,其特征是:
堵绝网络谣言的方法采用以下步骤完成:
Step1:源信息、源作者、源时间的标注;
Step2:关联信息传播过程中的关键字提取;
Step3:关联信息的数据算法审核;从而定源信息,并利用人工审核确定源信息;
Step4:源信息传播次数的统计、报警、溯源和拦截,
所述的源信息分两种:即T类源信息和F类源信息:
T类源信息:T类源信息是指最初发布的信息,T类源信息中的对话信息是指完整的对话内容,不是指单条信息,T是true之意,所述的最初发布是指发布者将信息通过纸质平台或者电子数据发布平台,让该信息为他人知晓;
F类源信息:该信息已经通过其他渠道发布,发布者没有声明原作者或者发布者利用数据编辑软件编辑后规避原作者发布在社交软件上的信息,F是false之意;
所述的源作者分两类,T类源作者和F类源作者:
T类源作者、T类源作者是指T类源信息的发布者;
F类源作者、F类源作者是指F类源信息的发布者;
所述的源时间分两类,T类源时间和F类源时间:
T类源时间、T类源时间是指T类源信息的发布时间;
F类源时间、F类源时间是指F类源信息的发布时间;
所述的关联信息是指与源信息存在关联或者软件抓取过程中的待过滤信息。
2.依据权利要求1所述的堵绝网络谣言的方法,其特征是:
所述的源信息、源作者、源时间的标注按照以下步骤进行;
No.1:用户发布的T类源信息和F类源信息,社交软件程序均不进行审核,直接发布;此时用户发布的所有信息均为源信息,发布的用户为源作者;
No.2:在社交软件或者非社交软件上转发信息到社交软件时,程序设计均附带源作者和源时间、源作者和源时间随源信息一同传播,无论源信息被转发多少次,其源作者和源时间都是不变的,源作者和源时间作为后台数据随源信息传播,源作者和源时间显示在社交软件页面上,并且发布者不能更改;
No.3:信息发布者发布的是复制和粘贴后的信息,分两种情况,复制时的软件支持源作者和源时间的标注的,粘贴后源作者和源时间作为后台数据保留在社交软件上,并在社交软件页面显示源作者和源时间;
No.4:复制源信息之后利用非社交软件编辑或者复制时的软件不支持源作者和源时间的标注,从而造成源作者和源时间丢失之后,再将上述信息利用社交软件传播的,上传者视为源作者,上传者的发布时间为源时间,被他人转发时,源作者和原时间按此备注,社交软件发布朋友圈信息和对话信息时,包括PC端-PC端,PC端-手机端、手机端-手机端。
3.依据权利要求1所述的堵绝网络谣言的方法,其特征是:
所述的关联信息传播过程中的关键字提取;按照以下步骤进行:
No.1:社交软件客户端设计关键字提取,利用关键字对对话过程中的文字信息进行监控;
No.2:对话文字信息出现关键字,软件设计以该关键字所在的的信息条为基准,查找对话之前的N条对话记录,抓取对话用户发布或转发的视频、图片、音频、长文字信息;
No.3、经过检索之后,将疑似的谣言信息抓取后利用后台发送到服务器,不需要人工干预,所述的长文字信息是指字数超过30个的文字信息;
所述的N条是指≤100;
所述的信息条是指用户发布的一条信息;
所述的对话用户是指社交软件进行对话的所有用户。
4.依据权利要求1所述的堵绝网络谣言的方法,其特征是:
所述的关联信息的数据算法审核,从而锁定源信息,并利用人工审核确定源信息,其步骤如下:
No.1:利用机器统计,将疑似谣言信息利用机器统计之后分为三类:
分别是:
type1、完全相同源信息;
type2、部分相同源信息;
type3、关键字相同源信息;
type1、完全相同源信息的认定,服务器将疑似谣言信息利用二进制编码的字节数一致性进行机器算法核查,也就是疑似谣言信息的信息种类、数据字节数、源作者和源时间都相同,认定为完全相同源信息,合并处理;
type2、部分相同源信息的认定,疑似谣言信息的信息种类相同、数据字节数相同,源作者和/或源时间不相同,则列为待查信息;将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码完全相同,认定为部分相同源信息,分类记载源作者和源时间;
将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码不完全相同,则视为不同的源信息,按两条源信息进行处理;
type3:关键字相同源信息的认定,疑似谣言信息是利用关键字进行抓取的,因此,两条信息的信息种类相同,存在重合关键字,则这两条信息为关键字相同源信息;
所述的信息种类相同是指信息数据类型相同,信息数据类型是指音频、视频、图片和文字,音频、视频和图片还要求格式相同,
No.2:统计传播次数,统计时,利用源作者的账号信息或来源信息作为传播者,源信息作为依据,统计其在网络上的传播次数,统计时,设定统计的时间段,以节省服务器统计的时间和难度,所述的时间段是指源信息传播的统计开始时间和截止时间
No.3、机器审核,疑似谣言传播次数超过规定的传播次数最低值之后,对疑似谣言进行机器审核,审核分为type1文字审核、type2语音审核、type3图片审核,type1文字审核、疑似谣言信息为文字信息,直接利用关键字进行审核;
type2语音审核、疑似谣言信息为视频或音频信息,利用视频或音频的语音信息进行审核,但是,视频或音频使用方言时或者是视频或音频存在多人语音,现在的语音审核存在难度,只能作为后备技术;
type2图片审核、图片信息存在文字信息时,将图片上的文字转换后,利用关键字进行审核;
No.4:人工审核,机器审核疑似谣言,难以排除谣言嫌疑的,或者机器难以审核,服务器通知人工审核疑似谣言内容。
5.依据权利要求1所述的堵绝网络谣言的方法,其特征是:
所述的源信息传播的报警、溯源和拦截,其步骤如下:
通过人工审核源信息,对关键字相同或相近的源信息,社交软件审核人员需要对源信息传播超过500次的不同来源的源信息进行审核,确认是不是内容实质性相同的源信息,内容实质性相同的,合并处理,社交软件审核人员通过以下步骤分别处理,No.1、查找源作者,源作者对信息的真实性做出肯定性反馈的,审核人员认为传播没有问题的,允许传播;审核人员认为传播有问题的,停止传播,审核人员难以确认,需要向有关人员或单位求证的,暂停传播;
No.2、源作者对信息的真实性做出否定性反馈的,审核人员停止传播,并清空所有该源信息的传播,转发者一旦上线,即利用服务器程序指令客户端程序清空;
No.3、源作者对信息的真实性没有做出反馈的,审核人员暂停源信息的传播,已经发布的源信息不予清空;待源作者做出反馈之后处理,源作者经过一定的时间不予反馈的,清空已经发布的源信息;
No.4、谣言被确认,并且性质恶劣,传播次数多,传播地域广,服务器即启动报警程序,向公安机关报警;
No.5、源作者对源信息处理结果不服的,启动投诉或行政复议、行政诉讼、民事诉讼工作,但是,已经被确认的谣言传播的停止在源作者提出异议期间不停止执行。

说明书全文

一种堵绝网络谣言的方法

技术领域

[0001] 本发明属于信息技术,尤其是涉及一种大数据算法

背景技术

[0002] 申请人经过检索,发现两条与堵绝网络谣言相关的专利,内容都差不多,其中一件为2014105854501,其摘要为本发明为微博交互跟帖的追踪与请求方法,通过在微博账户界面的每条具体微博旁边,设置一个如:政府官方发布,媒体观察视,名流名人言说,行业专家点评,关注对象跟帖等权威账号,对该条微博所进行的发布、回应、点评、跟帖等交互内容的快捷查看功能模;或者构建一个打分点评价提示模块,用户根据对该条微博的研读判断,对其标题与内容是否对应,微博内容的真实性进行评价打分,便于给后续用户提供一个审读参考。以此方便微博用户对该条微博快速方便地获得一个有权威、更专业、可信任的认知引导,从而及时杜绝网络谣言传播,实现社交互动平台对社会价值的正向积极引导作用,但是,对于即时通讯工具微信、QQ或者其他社交通讯工具而言,上述方法并不适用,发明人通过检索,发现现在各种谣言满天飞,其根本原因是法律标准太高,技术手段没有进行管控,例如,现在某人传播了一条谣言,他(她)转发此条谣言超过500条的可能性微乎其微,法律并不能进行任何惩处,但是,这条信息经过N个人传播之后,可能产生非常严重的后果,而每一个低于500条的转发者都不用担责任,尤其是一些拐卖小孩、挖器官、喷洒迷药、抢劫等的小道消息往往都流传甚广,却没有方法进行有效的监管和堵绝,这也妨碍了人际交往。

发明内容

[0003] 技术问题的由来:谣言的传播在网络时代,比以前更加便捷和迅速,但是,现在的法律手段和技术手段均不能有效堵绝网络谣言的传播。
[0004] 技术方案:一种堵绝网络谣言的方法,其特征是:堵绝网络谣言的方法采用以下步骤完成:
Step1:源信息、源作者、源时间的标注;
Step2:关联信息传播过程中的关键字提取;
Step3:关联信息的数据算法审核;从而定源信息,并利用人工审核确定源信息;
Step4:源信息传播次数的统计、报警、溯源和拦截,
所述的源信息分两种:即T类源信息和F类源信息:
T类源信息:T类源信息是指最初发布的信息,T类源信息中的对话信息是指完整的对话内容,不是指单条信息,T是true之意,所述的最初发布是指发布者将信息通过纸质平台或者电子数据发布平台,让该信息为他人知晓;
F类源信息:该信息已经通过其他渠道发布,发布者没有声明原作者或者发布者利用数据编辑软件编辑后规避原作者发布在社交软件上的信息,F是false之意;
所述的源作者分两类,T类源作者和F类源作者:
T类源作者、T类源作者是指T类源信息的发布者;
F类源作者、F类源作者是指F类源信息的发布者;
所述的源时间分两类,T类源时间和F类源时间:
T类源时间、T类源时间是指T类源信息的发布时间;
F类源时间、F类源时间是指F类源信息的发布时间;
所述的关联信息是指与源信息存在关联或者软件抓取过程中的待过滤信息。
[0005] Step1:源信息、源作者、源时间的标注按照以下步骤进行;No.1:用户发布的T类源信息和F类源信息,社交软件程序均不进行审核,直接发布;此时用户发布的所有信息均为源信息,发布的用户为源作者;
No.2:在社交软件或者非社交软件上转发信息到社交软件时,程序设计均附带源作者和源时间、源作者和源时间随源信息一同传播,无论源信息被转发多少次,其源作者和源时间都是不变的,源作者和源时间作为后台数据随源信息传播,源作者和源时间显示在社交软件页面上,并且发布者不能更改;
No.3:信息发布者发布的是复制和粘贴后的信息,分两种情况,复制时的软件支持源作者和源时间的标注的,粘贴后源作者和源时间作为后台数据保留在社交软件上,并在社交软件页面显示源作者和源时间;
No.4:复制源信息之后利用非社交软件编辑或者复制时的软件不支持源作者和源时间的标注,从而造成源作者和源时间丢失之后,再将上述编辑后的信息利用社交软件传播的,上传者视为源作者,上传者的发布时间为源时间,被他人转发时,源作者和原时间按此备注,
社交软件发布朋友圈信息和对话信息时,包括PC端-PC端,PC端-手机端、手机端-手机端。
[0006] Step2、关联信息传播过程中的关键字提取;按照以下步骤进行:No.1:社交软件客户端设计关键字提取,利用关键字对对话过程中的文字信息进行监控;
No.2:对话文字信息出现关键字,软件设计以该关键字所在的的信息条为基准,查找对话之前的N条对话记录,抓取对话用户发布或转发的视频、图片、音频、长文字信息;
No.3、经过检索之后,将疑似的谣言信息抓取后利用后台发送到服务器,不需要人工干预,所述的长文字信息是指字数超过30个的文字信息;
所述的N条是指≤100;
所述的信息条是指用户发布的一条信息;
所述的对话用户是指社交软件进行对话的所有用户。
[0007] Step3、关联信息的数据算法审核;从而锁定源信息,并利用人工审核确定源信息,其步骤如下:No.1:利用机器统计,将疑似谣言信息利用机器统计之后分为三类:
分别是type1、完全相同源信息;
type2、部分相同源信息;
type3、关键字相同源信息;
type1、完全相同源信息的认定,服务器将疑似谣言信息利用二进制编码的字节数一致性进行机器算法核查,也就是疑似谣言信息的信息种类、数据字节数、源作者和源时间都相同,认定为完全相同源信息,合并处理;
type2、部分相同源信息的认定,疑似谣言信息的信息种类相同、数据字节数相同,源作者和/或源时间不相同,则列为待查信息;将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码完全相同,认定为部分相同源信息,分类记载源作者和源时间;
将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码不完全相
同,则视为不同的源信息,按两条源信息进行处理;
type3:关键字相同源信息的认定,疑似谣言信息是利用关键字进行抓取的,因此,两条信息的信息种类相同,存在重合关键字,则这两条信息为关键字相同源信息;
所述的信息种类相同是指信息数据类型相同,信息数据类型是指音频、视频、图片和文字,音频、视频和图片还要求格式相同,
No.2:统计传播次数,统计时,利用源作者的账号信息或来源信息作为传播者,源信息作为依据,统计其在网络上的传播次数,统计时,设定统计的时间段,以节省服务器统计的时间和难度,所述的时间段是指源信息传播的统计开始时间和截止时间
[0008] No.3、机器审核,疑似谣言传播次数超过规定的传播次数最低值之后,对疑似谣言进行机器审核,审核分为type1文字审核、type2语音审核、type3图片审核,type1文字审核、疑似谣言信息为文字信息,直接利用关键字进行审核;
type2语音审核、疑似谣言信息为视频或音频信息,利用视频或音频的语音信息进行审核,但是,视频或音频使用方言时或者是视频或音频存在多人语音,现在的语音审核存在难度,只能作为后备技术;
type2图片审核、图片信息存在文字信息时,将图片上的文字转换后,利用关键字进行审核;
No.4:人工审核,机器审核疑似谣言,难以排除谣言嫌疑的,或者机器难以审核,服务器通知人工审核疑似谣言内容。
[0009] 源信息传播的报警、溯源和拦截,通过人工审核源信息,对关键字相同的源信息,社交软件审核人员需要对源信息传播超过500次的不同来源的源信息进行审核,确认是不是内容实质性相同的源信息,内容实质性相同的,合并处理,社交软件审核人员通过以下步骤分别处理,
No.1、查找源作者,源作者对信息的真实性做出肯定性反馈的,审核人员认为传播没有问题的,允许传播;
No.2、源作者对信息的真实性做出否定性反馈的,审核人员停止传播,并清空所有该源信息的传播,发布者或者转发者没有上线的,一旦上线,即利用服务器程序指令客户端程序清空;
No.3、源作者对信息的真实性没有做出反馈的,审核人员停止源信息的传播,已经发布的源信息不予清空;待源作者做出反馈之后处理,源作者经过一定的时间不予反馈的,清空已经发布的源信息;
No.4、谣言被确认,并且性质恶劣,传播次数多,传播地域广,服务器即启动报警程序,向公安机关报警;
No.5、源作者对源信息处理结果不服的,启动投诉或行政复议、行政诉讼、民事诉讼工作,但是,谣言传播的停止在源作者提出异议期间不停止执行。
[0010] 有益效果:堵绝网络谣言的方法,依据网络谣言传播的特点,以对话信息的关键字为抓取依据,通过抓取传播次数多,传播地域广的源信息,先利用机器审核,通过机器初审后,利用人工审核,并对疑似谣言按照审核结果分别进行处理,本发明在于将谣言的发布者视为源作者,而转发者不计算发布次数,这样,他人通过转发信息时,其法律责任由源作者承担,一些影响恶劣的谣言就很容易达到刑法规定的定罪标准,以警醒喜欢恶意发布谣言信息的人,从而减少谣言信息的发布。附图说明
[0011] 附图1是现在的微信聊天截图;附图2是软件添加了堵绝谣言功能的微信聊天截图;
通过比较,可以看出二者的不同是附图2添加了转发信息的源作者和源时间内容。

具体实施方式

[0012] 控制网络谣言的法律困境,按我国的相关法律规定,只有发布、转发网络谣言超过500条,才构成犯罪,而这个槛是很高的,大部分人转发的条数都达不到这个标准,但是,网络谣言的初始肇事者往往利用普通民众的一些心理,编造挖小孩器官、拐卖小孩,官员、警察打群众,老师殴打学生等普通民众关住的热点,利用星期六、星期天政府部门放假的空隙进行传播,这样,等星期一政府部门上班时,网络谣言已经流传甚广,网警也很难追查到谣言源头,最终不了了之,但是,网络谣言追查与灰色网络交易有一个显著的区别就是,网络传播者大部分都是普通民众,而普通民众传播时,并不会对谣言的源信息进行编辑、修改,这样,造成的后果就是虽然传播用词存在一定的差别,例如,该网络谣言发生的时间、地点、事件的过程存在一定程度的差异,但是,事件的基本情况是不会改变的,例如,某杀人案视频通过无数次传播之后,可能在杀人地点、被杀对象存在差异,但杀人案这一视频的基本内容是源作者的量不能改变的,而且,源视频也能够在传播无数次之后保留的依旧是原始的视频,在传播过程中,传播者也不会刻意将“杀人”打字成“砂仁”,这样,社交软件容易通过对话提取到关键字和源信息,而灰色网络交易就难以通过关键字提取,由于将谣言的传播次数统计到源信息提供者,而不是进行转发的普通民众,这样,谣言传播者很容易满足
500条这一法定条件,并且容易溯源,那么,谣言传播者就得掂量一下后果,从而减少网络谣言的传播数量。
[0013] 发明人现介绍该发明的流程,堵绝网络谣言的方法采用以下步骤完成:
Step1:源信息、源作者、源时间的标注;
Step2:关联信息传播过程中的关键字提取;
Step3:关联信息的数据算法审核;从而锁定源信息,并利用人工审核确定源信息;
Step4:源信息传播次数的统计、报警、溯源和拦截。
[0014] 需要注意的是,无论源作者发布的是何种类型的谣言,假如该信息没有传播或者传播并不广泛,那么,从传播学的角度看,这条源信息的传播力度就很弱,相应的危害也比较小,假如对用户发布的信息需要进行前期审核才能发布的话,很可能遭到用户的抵制和反对,因此,本申请在设计时,对用户发布的信息并不需要审核,而这也是目前社交软件普遍采用的,谣言发布者发布一些民众关注的热点问题时,为了增强说服力,往往喜欢采用视频,但是,无论是客户端还是服务器直接审核视频,都存在很大的技术难度,不过,观看过视频的用户其留言是可以反应该视频的基本信息的,这样,利用用户的对话关键字抓取,就容易检索到。
[0015] 所述的源信息分两种:即T类源信息和F类源信息:T类源信息:该信息为最初发布的信息,为T类源信息;T类源信息中的对话信息是指完整的对话内容,不是指单条信息,T是true之意,所述的最初发布是指发布者将纸质记载的数据或者电子数据通过纸质平台或者电子数据发布平台,让该信息为他人知晓;
F类源信息:该信息已经通过其他渠道发布,发布者没有声明原作者或者发布者利用数据编辑软件编辑后规避原作者发布在社交软件上的信息,F是false之意;
所述的源作者分两类,T类源作者和F类源作者:
T类源作者、T类源作者是指T类源信息的发布者;
F类源作者、F类源作者是指F类源信息的发布者;
所述的源时间分两类,T类源时间和F类源时间:
T类源时间、T类源时间是指T类源信息的发布时间;
F类源时间、F类源时间是指F类源信息的发布时间;
所述的关联信息是指与源信息存在关联或者软件抓取过程中的待过滤信息;
本申请将源信息分为T类源信息和F类源信息,只是为了统计需要,并非认定F类源作者为合法的知识产权拥有者,因为F类源作者广泛存在,但社交软件审核人员很难及时查找到F类源作者发布的源信息的出处,还有一点,那就是源信息的出处的发布者和F类源作者是不同的法律主体,从备注看,T类源作者和F类源作者是相同的,不能区分。
[0016] Step1:源信息、源作者、源时间的标注按照以下步骤进行;No.1:用户发布的T类源信息和F类源信息,社交软件程序均不进行审核,直接发布;此时用户发布的所有信息均为源信息,发布的用户为源作者;
No.2:在社交软件或者非社交软件上转发信息到社交软件时,程序设计均附带源作者和源时间、源作者和源时间随源信息一同传播,无论源信息被转发多少次,其源作者和源时间都是不变的,源作者和源时间作为后台数据随源信息传播,源作者和源时间显示在社交软件页面上,并且发布者不能更改;
No.3:信息发布者发布的是复制和粘贴后的信息,分两种情况,复制时的软件支持源作者和源时间的标注的,粘贴后源作者和源时间作为后台数据保留在社交软件上,并在社交软件页面显示源作者和源时间;
No.4:复制源信息之后利用非社交软件编辑或者复制时的软件不支持源作者和源时间的标注,从而造成源作者和源时间丢失之后,再将上述编辑后的信息利用社交软件传播的,上传者视为源作者,上传者的发布时间为源时间,被他人转发时,源作者和原时间按此备注,
社交软件发布朋友圈信息和对话信息时,包括PC端-PC端,PC端-手机端、手机端-手机端。
[0017] 就同一社交软件而言,源作者以用户账号为准,由于同一社交软件,用户账户具备唯一性,因此具备识别作用,就不同的社交软件而言,备注社交软件名+用户名,进行区分,例如,微信用户转发信息到QQ用户,QQ对话页面出现的用户名为微信用户+微信用户名,对于非社交软件,该软件支持转发并且没有用户注册信息的,例如新闻网站、视频播放网站等,源作者采用源信息所在的网址,源信息发布时间为源时间,本申请所述的社交软件是该软件注册用户具备和其他在线用户进行即时互动或通信的工具,广义的社交软件还包括具备留言功能的软件。
[0018] Step2、关联信息传播过程中的关键字提取;按照以下步骤进行:No.1:社交软件客户端设计关键字提取,利用关键字对对话过程中的文字信息进行监控;
No.2:对话文字信息出现关键字,软件设计以该关键字所在的的信息条为基准,查找对话之前的N条对话记录,重点抓取对话用户发布或转发的视频、图片、音频、长文字信息;
No.3、经过检索之后,将疑似的谣言信息抓取后利用后台发送到服务器,不需要人工干预,所述的长文字信息是指字数超过30个的文字信息;
所述的N条是指≤100;
所述的信息条是指用户发布的一条信息;
所述的对话用户是指社交软件进行对话的所有用户,
例如,现在微信用户李*发布一条挖小孩器官卖钱的视频信息,张*看到之后,在微信留言,询问怎么回事,李*答:“是挖小孩肾脏的,卖钱”,张*回,“太残忍了,挖小孩肾脏”。社交软件提取到二人对话信息包括“小孩”、“肾脏”、“挖”、“残忍”这些关键字,从而检索到李*发布的视频信息,李*是转发的QQ用户***的2018年6月5日11时0分发布的一条视频,因此,为后来的机器检索提供了关键字依据。
[0019] Step3、关联信息的数据算法审核;从而锁定源信息,并利用人工审核确定源信息,其步骤如下:No.1:利用机器统计,将疑似谣言信息利用机器统计之后分为三类:
分别是type1、完全相同源信息;
type2、部分相同源信息;
type3、关键字相同源信息;
type1、完全相同源信息的认定,服务器将疑似谣言信息利用二进制编码的字节数一致性进行机器算法核查,也就是疑似谣言信息的信息种类、数据字节数、源作者和源时间都相同,认定为完全相同源信息,合并处理;
type2、部分相同源信息的认定,疑似谣言信息的信息种类相同、数据字节数相同,源作者和/或源时间不相同,则列为待查信息;将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码完全相同,认定为部分相同源信息,分类记载源作者和源时间;
将待查信息的源信息利用二进制编码进行对比,两个源信息的二进制编码不完全相
同,则视为不同的源信息,按两条源信息进行处理;
type3:关键字相同源信息的认定,疑似谣言信息是利用关键字进行抓取的,因此,两条信息的信息种类相同,存在重合关键字,则这两条信息为关键字相同源信息;
所述的信息种类相同是指信息数据类型相同,信息数据类型是指音频、视频、图片和文字,音频、视频和图片还要求格式相同,
No.2:统计传播次数,统计时,利用源作者的账号信息或来源信息作为传播者,源信息作为依据,统计其在网络上的传播次数,统计时,设定统计的时间段,以节省服务器统计的时间和难度,所述的时间段是指源信息传播的统计开始时间和截止时间。
[0020] No.3、机器审核,疑似谣言传播次数超过规定的传播次数最低值之后,对疑似谣言进行机器审核,审核分为type1文字审核、type2语音审核、type3图片审核,type1文字审核、疑似谣言信息为文字信息,直接利用关键字进行审核;
type2语音审核、疑似谣言信息为视频或音频信息,利用视频或音频的语音信息进行审核,但是,视频或音频使用方言时或者是视频或音频存在多人语音,现在的语音审核存在难度,只能作为后备技术;
type2图片审核、图片信息存在文字信息时。将图片上的文字转换后,利用关键字进行审核;
No.4:人工审核,机器审核疑似谣言,难以排除谣言嫌疑的,或者机器难以审核,服务器通知人工审核疑似谣言内容,
需要注意的是,本申请在源信息提取过程中,采用的是源信息的二进制字节数相同,对于不同的源信息,特别是视频、音频信息,其数据量大,精确的字节数,是很难相同的,尤其是谣言传播,仅限一两天时间,最多就是一个星期,在此时间段内,同一源作者发布的音频、视频信息字节数相同的可能性就更低了,统计音频、视频的字节数相比逐字节分析不同的音频、视频内容,明显能够加快统计速度,出错的几率又很低,这对阻碍谣言的传播才是有利的,
以上述视频为例说明,通过机器检索,发现QQ用户***的2018年6月5日11时0分发布的一条视频截止到2018年6月7日11时0分已经被转发113528次,通过分析,另一条微信用户发布的视频信息同样出现“细佬”、“腰子”、“挖”、“残忍”、“肾脏”、“死掉”等关键字,而且也在上述时间段内,但是机器难以审核该视频的语音信息,主要是两条视频信息的语音一是广东话,另一条是苏州话,与普通话差距很大,但语音只能审核普通话,难以审核各地方言,由于传播范围广,机器建议人工审核,
源信息传播的报警、溯源和拦截,
通过人工审核源信息,对关键字相同的源信息,社交软件审核人员需要对源信息传播超过500次的不同来源的源信息进行审核,确认是不是内容实质性相同的源信息,内容实质性相同的,合并处理,社交软件客服人员通过以下步骤分别处理,
No.1、查找源作者,源作者对信息的真实性做出肯定性反馈的,审核人员认为传播没有问题的,允许传播;审核人员认为传播有问题的,停止传播,审核人员难以确认,需要向有关人员或单位求证的,暂停传播;
No.2、源作者对信息的真实性做出否定性反馈的,审核人员停止传播,并清空所有该源信息的传播,转发者一旦上线,即利用服务器程序指令客户端程序清空;
No.3、源作者对信息的真实性没有做出反馈的,审核人员暂停源信息的传播,已经发布的源信息不予清空;待源作者做出反馈之后处理,源作者经过一定的时间不予反馈的,清空已经发布的源信息,
No.4、谣言被确认,并且性质恶劣,传播次数多,传播地域广,服务器即启动报警程序,向公安机关报警
No.5、源作者对源信息处理结果不服的,启动投诉或行政复议、行政诉讼、民事诉讼工作,但是,谣言传播的停止在源作者提出异议期间不停止执行。
[0021] 仍旧以上述视频为例说明,经过人工审核两条视频的内容,审核人员发现两条视频仅仅是配音的不同,视频内容是完全相同的,审核人员利用微信联系上李*,李*承认是将某地儿童落身亡的视频发布在发布在微信上,谎称挖小孩肾脏,审核人员检索到源视频出处,即QQ用户***于2018年6月5日11时0分发布的一条视频,通过查看其说明,与李*表述一致,经过联系QQ用户***,确认了视频的真实性,QQ用户***发布此视频的目的是提醒儿童天热,父母要注意,防止孩子发生悲剧,至此,审核人员确认李*、张*发布的视频均是谣言,而且,转发数明显超过500条,这样,就能很快溯源,并且,利用源作者和源时间,能够利用服务器快速查找到该视频传播的用户,利用源作者和源时间进行删除,以阻止该谣言信息进一步传播,并且,源信息本身是真实的,QQ用户***不用承担责任,但是,李*、张*分别通过将源信息改变说明和通过软件编辑之后,以转发的名义和首发的名义在微信上传播上述谣言,均需承担相应的法律责任。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈