专利汇可以提供专业词抽取和词性标注方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种专业词 抽取 和 词性标注 方法,其包括如下步骤:S1:建立关键词标签 数据库 、保存关键词与行业特征词的对应关系;S2:从查询指令中提取关键词;S3:基于S1所得关键词标签数据库、匹 配对 应于S2所得关键词的行业特征词;S4:基于S3所得行业特征词对视频文件进行筛选;S5:对筛选所得视频文件中的行业特征词进行标注。本发明能够从视频文件中提取行业特征词,并获取与关键词对应的通用行业特征词所关联的文本信息。大幅提升检索的精确性、减少工作量,提升工作效率。,下面是专业词抽取和词性标注方法专利的具体信息内容。
1.一种专业词抽取和词性标注方法,其特征在于,包括如下步骤:
S1:建立关键词标签数据库、保存关键词与行业特征词的对应关系;
S2:从查询指令中提取关键词;
S3:基于S1所得关键词标签数据库、匹配对应于S2所得关键词的行业特征词;
S4:基于S3所得行业特征词对视频文件进行筛选;
S5:对筛选所得视频文件中的行业特征词进行标注显示。
2.如权利要求1所述专业词抽取和词性标注方法,其特征在于还包括步骤S6,所述步骤S6包括:对S4所得视频文件上添加检索标签、并依据时间顺序进行排序。
3.如权利要求1所述专业词抽取和词性标注方法,其特征在于:所述步骤S1包括如下步骤:
S11:根据行业安全规程和操作手册,收集行业特征词;
S12:将行业特征词输入关键词标签数据库中并进行统一格式化;
S13:对各个行业特征词打上对应的关键词标签;
S14:基于行业特征词的出现频率、对各个行业特征词打上对应的权重值标签,并将各行业特征词依据其权重值标签进行排序。
4.如权利要求1所述专业词抽取和词性标注方法,其特征在于,所述步骤S4包括如下步骤:
S41:截取视频文件中的音轨文件;
S42:将S21所得音轨文件转化为文本描述文件;
S43:对所述文本描述文件进行分词处理、将该文本描述文件拆分为若干个分词;
S44:将所述分词中包含行业特征词的文本描述文件对应的视频文件筛选出来。
5.如权利要求1所述专业词抽取和词性标注方法,其特征在于:步骤S43所述分词处理基于分布式爬虫平台实现。
6.如权利要求1所述专业词抽取和词性标注方法,其特征在于,步骤S5所述标注显示采用调色显示和/或调亮显示。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于机器学习的从半结构化文档中提取问答对的方法 | 2020-05-08 | 518 |
一种网络社交媒体中地震信息的可视化方法和系统 | 2020-05-13 | 715 |
一种电力营销知识体系平台及应用方法 | 2020-05-14 | 979 |
一种基于词向量的多平台控件对应方法 | 2020-05-08 | 56 |
一种用于提供视频节目内容总结的方法及其系统 | 2020-05-08 | 725 |
一种基于多任务联合学习的论辩挖掘系统及其工作方法 | 2020-05-13 | 806 |
基于XML的领域要素提取配置语言系统 | 2020-05-08 | 55 |
用于增强已标注样本的方法和设备 | 2020-05-11 | 934 |
一种用于智能质检服务禁语的识别方法及系统 | 2020-05-08 | 805 |
业务问题提取方法及装置 | 2020-05-14 | 730 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。