专利汇可以提供摘要提取方法以及摘要提取模块专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 摘要 提取方法,该方法包括:在文档中以设定步长滑动窗口的过程中,从文档中提取与当前窗口对应的当前窗口内容,根据关键词计算当前窗口内容的权重,并保存当前窗口内容及对应的权重;在滑动结束后,根据所保存的窗口内容及对应的权重,取出与较高权重对应的一个或多个窗口内容作为摘要。本发明还公开了一种摘要提取模 块 ,该模块包括存储单元、滑动单元、计算单元以及摘要形成单元。由于本发明在窗口滑动过程中根据关键词计算窗口内容的权重,最后取出与较高权重对应的一个或多个窗口内容作为摘要,从而取出能够最佳反应与关键词关系的摘要内容,将与用户输入的关键词最贴近的内容作为摘要提供给用户。,下面是摘要提取方法以及摘要提取模块专利的具体信息内容。
1、一种摘要提取方法,其特征在于,该方法包括:
在文档中以设定步长滑动窗口的过程中,从文档中提取与当前窗口对应 的当前窗口内容,根据关键词计算当前窗口内容的权重,并保存当前窗口 内容及对应的权重;
在滑动结束后,根据所保存的窗口内容及对应的权重,取出与较高权重 对应的一个或多个窗口内容作为摘要。
2、根据权利要求1所述的方法,其特征在于,所述设定步长为文档内 容中的最小单位。
3、根据权利要求1所述的方法,其特征在于,在根据关键词计算当前 窗口内容的权重之前进一步包括判断当前窗口内容中是否包含关键词的步 骤,并在是的情况下计算当前窗口内容的权重。
4、根据权利要求1所述的方法,其特征在于,所述根据关键词计算当 前窗口内容的权重的步骤包括:对每个关键词的权重求和作为当前窗口内容 的权重。
5、根据权利要求4所述的方法,其特征在于,该方法进一步包括:
根据各关键词的重要性,为各关键词的权重分别乘以一个系数,其中所 述系数随重要性的增加而增大;和/或,
为当前窗口内容的权重乘以或加上一个系数,该系数在当前窗口内容中 关键词出现的次序与输入的关键词的次序越接近时和/或在当前窗口内容中 关键词之间的距离越短时越大。
6、根据权利要求1所述的方法,其特征在于,在保存当前窗口内容及 对应的权重之前进一步包括判断当前窗口内容的权重是否大于与当前窗口 重叠的窗口内容的权重,并在是的情况下保存当前窗口内容及对应的权重。
7、根据权利要求1所述的方法,其特征在于,所述取出与较高权重对 应的一个或多个窗口内容作为摘要的步骤包括:
根据权重对对应的窗口内容排序;
根据摘要的大小,按照权重从大到小的顺序取出一个或多个窗口内容作 为摘要。
8、一种摘要提取模块,其特征在于,该摘要提取模块包括存储单元、 滑动单元、计算单元以及摘要形成单元,其中:
所述存储单元用于存储文档、窗口内容及对应的权重;
所述滑动单元用于在文档中以设定步长滑动窗口,并在滑动的过程中, 从文档中提取与当前窗口对应的当前窗口内容提供给计算单元;
所述计算单元用于根据关键词计算当前窗口内容的权重,并在存储单元 中保存当前窗口内容及对应的权重;
所述摘要形成单元用于在滑动结束后从所述存储单元取出与较高权重 对应的一个或多个窗口内容作为摘要。
9、根据权利要求8所述的摘要提取模块,其特征在于,该摘要提取模 块进一步包括:
设置单元,用于为滑动单元设置窗口大小和滑动步长;和/或,
排序模块,用于根据权重对存储单元中对应的窗口内容排序,以便所述 摘要生成单元顺序取出与较高权重对应的一个或多个窗口内容作为摘要。
10、根据权利要求8所述的摘要提取模块,其特征在于,所述计算单元 进一步用于判断当前窗口内容中是否包含关键词,并在是的情况下计算当前 窗口内容的权重;和/或,进一步用于判断当前窗口内容的权重是否大于与当前窗口重叠的窗口 内容的权重,并在是的情况下保存当前窗口内容及对应的权重。
本发明涉及根据关键词从文档中提取摘要的技术领域,特别是摘要提取 方法和摘要提取模块。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
摘要生成方法及装置 | 2020-05-11 | 33 |
摘要翻译器 | 2020-05-11 | 661 |
摘要生成装置和摘要生成方法 | 2020-05-11 | 371 |
摘要提取方法以及摘要提取模块 | 2020-05-11 | 595 |
摘要提取方法以及摘要提取模块 | 2020-05-11 | 722 |
处理消息摘要指令 | 2020-05-12 | 661 |
摘要生成方法和装置 | 2020-05-12 | 335 |
中文文件自动摘要方法 | 2020-05-13 | 566 |
会议摘要 | 2020-05-11 | 938 |
多功能摘要书籍 | 2020-05-11 | 632 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。