专利汇可以提供用于在文档中识别中文物种名称的方法与系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种用于在文档中识别中文物种名称的方法及其系统。所述方法包括接收包含中文物种名称的文档;识别所述文档中的中文物种名称字段;识别非物种名称字段;基于所识别的中文物种名称字段和非物种名称字段合并以得到所述中文物种名称。本发明的具体实施方式可以有效地从科技文献中识别中文物种名称。,下面是用于在文档中识别中文物种名称的方法与系统专利的具体信息内容。
1.一种在文档中识别中文生物物种名称的方法,其特征在于该方法包括:接收包含中文物种名称的文档,识别所述文档中的中文物种名称字段,识别所述文档中的非物种名称字段,基于所识别的中文物种名称字段向两端扩展、合并以得到所述完整的中文物种名称步骤。
2.如权利要求1所述的一种在文档中识别中文物种名称的方法,其特征在于其中所述非物种名称字段在基于所识别的中文物种名称字段向两端扩展以得到所述完整中文物种名称中作为终止符。
3.如权利要求1所述的一种在文档中识别中文物种名称的方法,其特征在于其中所述识别所述文档中的中文物种名称字段步骤包括:对所述文档进行分句,基于物种名称字典匹配所述文档的分句中出现的所有中文物种名称,记录所述中文物种名称字段的位置信息。
4.如权利要求3所述的一种在文档中识别中文生物物种名称的方法,其特征在于在识别所述文档中的中文物种名称字段步骤中,当同一分句中出现一个以上物种名称片段时,检查物种名称片段位置信息之间是否存在包含关系,响应于多个物种名称片段存在包含关系,保留最长的物种名称片段及位置信息。
5.如权利要求1所述的一种在文档中识别中文生物物种名称的方法,其特征在于其中所述识别所述文档中的非中文物种名称字段步骤包括:对所述文档进行分词,检查每个分词是否在非中文物种名称字段字典中,响应于所述分词在非中文物种名称字段字典中,确定所述分词为非中文物种名称字段,记录所述非物种名称字段的位置信息。
6.如权利要求1所述的一种在文档中识别中文物种名称的方法,其特征在于其中所述基于所识别的中文物种名称字段向两端扩展以得到所述完整中文物种名称步骤包括:从所述中文物种名称字段位置向前后两端扩展直至遇到非物种名称片段为止,以获得所述生物物种名称。
7.如权利要求3或5所述的一种在文档中识别物种名称的方法,其特征在于,所述位置信息由所述任一物种名称片段或非物种名称片段在所述文档中的起始位置和结束位置组成。
8.如权利要求3所述的一种在文档中识别中文生物物种名称的方法,其特征在于,该方法还包括以下步骤至少之一:
从已有的中文物种名称生成中文物种名称片段字典,包括物种中文学名、俗名、栽培驯化后的品种名称;或者,基于非生物领域的中文文档,收集出现频率较高的词,形成非物种名称片段字典。
9.一种在文档中识别中文物种名称的系统,包括:
接收装置,用于接收包括中文物种名称的文档;
识别装置一,用于识别所述文档中的中文物种名称字段;
识别装置二,用于识别所述文档中的非物种名称片段;
合并装置,用于基于所识别的中文物种名称字段向两端扩展、合并以得到所述完整的中文物种名称。
10.权利要求1或9所述的一种在文档中识别中文物种名称的方法或系统在从科技文献中识别中文物种名称中的应用。
技术领域:
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
网络名称显示方法和装置 | 2020-05-12 | 723 |
一种视频专辑名称的生成方法及装置 | 2020-05-12 | 550 |
一种翻译方法及系统 | 2020-05-11 | 772 |
一种地址纠错方法及终端 | 2020-05-11 | 173 |
栏目信息提取方法和装置 | 2020-05-13 | 639 |
兴趣点名称的显示方法和装置、导航系统 | 2020-05-12 | 394 |
网络拓扑隐藏方法和设备 | 2020-05-12 | 721 |
应用程序名称修改方法、装置、电子设备及存储介质 | 2020-05-13 | 403 |
中文企业名称的识别方法 | 2020-05-12 | 707 |
用于在中文文档中识别化学名称的方法及系统 | 2020-05-11 | 78 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。