专利汇可以提供垃圾短信中的关键词自动学习及更新方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种垃圾短信中的关键词自动学习及更新方法,其步骤为:(1)在线过滤系统根据黑白名单和短信特征进行过滤(2)离线系统对一定周期内的实时短信进行短信文本预处理,并将其转化为短语向量;(3)采用 支持向量机 (SVM)对短信向量进行高准确率的离线分类;(4)针对分类结果,对特征进行统计分析,选择关键词并计算概率信息;(5)通过 接口 将结果反馈给垃圾短信在线过滤系统。本发明可根据垃圾短信的不断变化自动学习关键词,在此 基础 上,实时更新关键词列表,以达到自适应过滤垃圾短信的目的。,下面是垃圾短信中的关键词自动学习及更新方法专利的具体信息内容。
1.一种垃圾短信中的关键词自动学习及更新方法,其特征在于包括如下步骤: 1)在线过滤系统根据黑白名单和短信特征进行过滤; 2)离线系统对一定周期内的实时短信进行短信文本预处理,并将其转化为短语向量; 3)采用支持向量机对短信向量进行高准确率的离线分类; 4)针对分类结果,对特征进行统计分析,选择关键词并计算概率信息; 5)通过接口将结果反馈给垃圾短信在线过滤系统,实现关键词的更新。
2. 根据权利要求1所述的一种垃圾短信中的关键词自动学习及更新方法, 其特征在于所述的在线过滤系统根据黑白名单和短信特征进行过滤:短信首先 进入白名单模块,若属白名单则直接放行;否则,进入黑名单模块,若属黑名 单则拒绝该主叫号码,若不属黑名单,则根据短信特征判断是否是垃圾短信。
3. 根据权利要求1所述的一种垃圾短信中的关键词自动学习及更新方法, 其特征在于所述的对实时短信进行短信文本预处理,并将其转化为短语向量: 对短信进行短信清洗、去除停用词、自动分词、词性标注、特征项提取、特征 项权重计算和生成短信向量预处理,以剔除短信文本,即由字、词、数字、标 点符号构成的文字串中所有与分类任务无关的内容,并将文本转化为由其包含 的基本语义单位组成的短语向量。
4. 根据权利要求1所述的一种垃圾短信中的关键词自动学习及更新方法, 其特征在于所述的采用支持向量机对短信进行高准确率的离线分类:利用 LibSVM工具包中的训练程序对训练样本进行训练,得到一个支持向量机模型, 然后利用LibSVM工具包中的预测程序和训练得到的模型对短信进行分类。
5. 根据权利要求1所述的一种垃圾短信中的关键词自动学习及更新方法, 其特征在于所述的针对分类结果,对特征进行统计分析,选择关键词并计算概率 信息:在分类结果中,对所有特征计算其信息增益,选择计算值较大的一些词 作为关键词,并对选择的关键词分别计算在正常短信和垃圾短信中的概率信息。
6. 根据权利要求1所述的一种垃圾短信中的关键词自动学习及更新方法, 其特征在于所述的通过接口将结果反馈给垃圾短信实时过滤系统:通过配置文件定义关键词的信息格式,离线系统通过配置文件把分析结果及时反馈给在线过滤系统。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种电商产品竞争分析方法及系统 | 2020-05-14 | 221 |
一种面向金融事件的混合型因果关系发现方法 | 2020-05-11 | 513 |
一种融合多类事理与实体知识的领域事件图谱构建方法和装置 | 2020-05-13 | 766 |
一种使用重叠拆分规则的文本序列标注算法 | 2020-05-14 | 365 |
一种视频文本摘要生成方法及装置 | 2020-05-08 | 687 |
基于物理距离和语义距离的双向LSTM模型的构建方法 | 2020-05-08 | 713 |
基于弱监督技术主动学习的智能标注方法、装置及平台 | 2020-05-13 | 61 |
基于XML的领域要素提取配置语言系统 | 2020-05-08 | 55 |
一种公司形象提升系统的社交网络数据提取方法及系统 | 2020-05-11 | 985 |
留学文书智能自动创作系统 | 2020-05-12 | 673 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。