专利汇可以提供基于用户发帖行为模式的多线索社会事件总结方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于用户发帖行为模式的多线索社会事件总结方法,用于解决现有多线索社会事件总结方法实用性差的技术问题。技术方案是根据相关的关键字获得社交网络中与该事件相关的微博,提取微博中的正文以及时间字段,对正文进行预处理。根据时间字段构建表示用户发帖行为模式的图模型T。根据正文内容构建表示微博内容相似性的图模型A。识别图模型T中的所有连通子图,每一个连通子图代表事件发展的不同阶段。识别图模型A中的所有连通子图,每一个连通子图代表事件中的不同线索。冗余信息剔除,得到有发展脉络的多线索社会事件总结。本发明根据用户发帖的行为模式获得更细粒度的社会事件总结,反映事件的动态发展及变化,实用性强。,下面是基于用户发帖行为模式的多线索社会事件总结方法专利的具体信息内容。
1.一种基于用户发帖行为模式的多线索社会事件总结方法,其特征在于包括以下步骤:
步骤一、当一个社会事件发生后,根据相关的关键字利用网络爬虫获得社交网络中与该社会事件相关的微博,提取微博中的正文以及时间字段,对正文进行分词预处理,过滤无用的停止词;
步骤二、根据时间字段计算不同微博间的发布时间间隔,以微博作为节点,根据微博间的发布时间间隔构建边,若时间间隔小于2.4小时,则两个节点间有一条边,以此微博作为节点,构建表示用户发帖行为模式的图模型T;
步骤三、利用TF-IDF计算正文内容中的关键词,根据关键词构建文本向量,利用余弦距离计算不同微博的文本向量的距离,以微博作为节点,根据微博间文本向量的距离构建边,若文本向量距离大于0.5,则两个节点间有一条边,以此微博作为节点,构建表示微博内容相似性的图模型A;
步骤四、利用深度优先算法搜索图模型T中的所有连通子图,不同的连通子图代表事件的不同发展阶段,同一个连通子图中的微博涉及相同的发展阶段;
步骤五、利用深度优先算法搜索图模型A中的所有连通子图,不同的连通子图代表事件的不同线索,同一个连通子图中的微博涉及相同的线索;
步骤六、根据步骤四得到事件的不同发展阶段涉及的微博,根据步骤五得到事件的不同线索涉及的微博,将步骤五的结果映射至步骤四的结果上,得到在同一线索中微博的阶段分布,即得到线索的内部发展,进而得到有发展脉络的多线索社会事件总结;
步骤七、利用贪心算法使子模性函数最大化以剔除线索中的冗余信息,得到有发展脉络的多线索社会事件总结;
其中,子模性函数为,
其中,V代表线索,S代表最后选中的微博,i,j代表微博,这个函数的意义就是使S中的微博信息覆盖率最大,冗余率最小;利用贪心算法得到使该子模性函数最大化的微博集合S,即剔除了冗余信息后的线索。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
信息的传输方法及装置、存储介质和电子装置 | 2020-05-11 | 195 |
参考信号资源的分配方法及装置 | 2020-05-11 | 459 |
一种输电断面热稳定功率极限区间识别方法及系统 | 2020-05-08 | 992 |
电子书编辑系统及其方法 | 2020-05-08 | 517 |
冗余协议数据单元会话的配置方法及装置 | 2020-05-11 | 686 |
确定资源的方法及装置、存储介质和电子装置 | 2020-05-11 | 883 |
一种K8s平台的资源控制方法、装置及相关组件 | 2020-05-08 | 102 |
持久性存储器上的键-值存贮器 | 2020-05-08 | 656 |
一种基于机器学习的应收账款兑付风险控制方法及系统 | 2020-05-08 | 180 |
一种适用于热时效成形的超声波振动子 | 2020-05-08 | 688 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。