首页 / 专利库 / 专利权 / 检索本 / 检索相关超文本文件的超文本文件检索装置

检索相关超文本文件的超文本文件检索装置

阅读:724发布:2020-05-11

专利汇可以提供检索相关超文本文件的超文本文件检索装置专利检索,专利查询,专利分析的服务。并且对每个相互有参照关系的超文本文件,用超文本文件标识符作为文件信息登录一个超文本文件和该文件母文件的固定语句,用户可按起母文件作用的另一超文本文件的固定语句参照一个超文本文件。同时把超文本文件和母文件的一个字的出现 位置 作为每个字的字信息来登录。输入关键字后,按字信息限定多个特定超文本文件和特定母文件,并把它们统一成统一超文本文件,按文件信息计算每个统一超文本文件中关键字出现频度,按出现频度计算统一超文本文件的重要度,并按重要度确定特定超文本文件的排位。,下面是检索相关超文本文件的超文本文件检索装置专利的具体信息内容。

1.一种超文本文件检索装置,用于从一组相互有参照关系的超文本文件中 检索多个可能符合用户检索要求的特定超文本文件,其中,一个超文本文件的一 个固定语句起到另一超文本文件的母文件的作用,而所述另一超文本文件起着参 照文件的作用,在用户选择了对应于该参照文件的一个母文件的一个固定语句 后,用户就参照一个参照文件,其特征在于所述检索装置包括:
超文本文件表制备装置,用于制备超文本文件信息,其中对每个超文本文件 登录了标识一个超文本文件的超文本文件标识符、超文本文件正文、标识对应于 作为一个参照文件的超文本文件母文件的母文件标识符以及母文件的固定语 句,并用于对超文本文件制备超文本文件信息的超文本文件表;
检索标引制备装置,用于按超文本文件表制备装置制备的超文本文件表识别 在每个超文本文件和母文件里出现的多个字,按超文本文件表识别这些字在每个 超文本文件和母文件里的多个出现位置,对每个字制备字信息,包括一个或多个 出现文件标识符,标识出现一个字的一个或多个超文本文件,该字在超文本文件 里的出现位置以及对应于该超文本文件的一个或多个母文件的一个或多个固定 语句,并对这些字制备几段字信息的检索标引;
关键字接收装置,用于接收指明用户检索要求的关键字;
检索装置,用于从检索标引制备装置制备的检索标引里检索对应于关键字接 收装置接收的关键字的特定字信息,并用于检索多个特定出现文件标识符,标识 多个出现该关键字的特定超文本文件,该关键字在特定超文本文件里的多个特定 出现位置,以及从特定字信息里检索一个或多个对应于特定超文本文件的特定母 文件的一个或多个特定固定语句;
文件排序确定装置,用于限定由检索装置检索到的特定出现文件标识符所标 识的特定超文本文件,从超文本文件表制备装置制备的超文本文件表里对特定超 文本文件检索几段特定超文本文件信息,对每个特定超文本文件把一个特定超文 本文件和一个或多个对应于该特定超文本文件的特定母文件统一成统一的超文 本文件,对每个统一的超文本文件计算该关键字在一个统一超文本文件里的出现 频度,根据该统一超文本文件的出现频度确定统一超文本文件的多个重要度,对 每个统一超文本文件设定一个统一超文本文件的一个重要度并作为对应于该统 一超文本文件的一个特定超文本文件的重要度,根据诸特定超文本文件的的重要 度确定诸特定超文本文件的排序;以及
检索结果显示装置,用于以对应于文件排序确定装置确定的特定超文本文件 排位的排序,把多个特定超文本文件标引作为检索结果显示出来。
2.如权利要求1所述的超文本文件检索装置,其特征在于,对于每个特定 超文本文件,对应于一个特定超文本文件的一个特定母文件的标引由检索结果显 示装置显示为该特定超文本文件的标引。
3.如权利要求1所述的超文本文件检索装置,其特征在于,把对应于同一 个特定母文件的多个特定超文本文件重定为同一排位,作为文件排序确定装置对 这些特定超文本文件所确定的排位中最高的排位,而定为同一排位的诸特定超文 本文件由检索结果显示装置以成组方式显示特定母文件。
4.如权利要求1所述的超文本文件检索装置,其特征在于,根据诸特定超 文本文件的重要度之和,由文件排序确定装置把对应于同一特定母文件的多个特 定超文本文件重定为同一排位,并由检索结果显示装置以成组方式用该特定母文 件显示定为同一排位的特定超文本文件。
5.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置通过把对应于一个特定超文本文件的一个或多个特定母文件的一个或多个 固定语句同该特定超文本文件统一起来,形成每个统一的超文本文件。
6.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置从每个特定超文本文件里提取包括关键字的特定语句或短语,而且对每个特 定超文本文件,用该特定超文本文件的标引显示连续写到该特定超文本文件顶端 语句或短语的一个特定超文本文件的一个特定语句或短语的摘要
7.如权利要求1所述的超文本文件检索装置,其特征在于,对于每个对应 于超文本文件的母文件,文件排序确定装置通过计算关键字在一个超文本文件里 的出现频度与该关键字在对应于该超文本文件的一个母文件里的出现频度之 和,来确定每个统一超文本文件的重要度,在母文件之和当中选出最大和值,限 定对应于该最大和值的一个特定母文件,根据该最大和值确定该超文本文件与特 定母文件组合的一个重要度,并把该重要度视作对应于该超文本文件的一个统一 超文本文件的一个重要度。
8.如权利要求1所述的超文本文件检索装置,其特征在于,通过加倍计算 出现在对应于统一超文本文件的一个或多个特定母文件的一个或多个固定语句 中的关键字,文件排序确定装置计算该关键字在每个统一超文本文件里的出现频 度。
9.如权利要求1所述的超文本文件检索装置,其特征在于,关键字在作为 由一个或多个固定语句组成的连接页的一个超文本文件里的出现频度,被排序确 定装置定为零。
10.如权利要求1所述的超文本文件检索装置,其特征在于,其内容对应于 由参照标签分别标识的多个含义的一个超文本文件,被超文本文件表制备装置分 成多个字区,并在每个字区顶端包括一个参照标签,而且超文本文件表制备装置 对超文本文件的每个字区制备一个超文本文件信息。
11.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置从诸特定超文本文件当中选出预定数量的高排位特定超文本文件,从高排位 特定超文本文件里提取出现在这些高排位特定超文本文件里的多个相关字,根据 诸相关字在高排位特定超文本文件里的多个出现频度计算这些相关字的多个重 要度,根据相关字的这些重要度从编排的相关字里选出预定数量的高排位相关 字,检索结果显示装置以特定超文本文件的标引显示出高排位相关字的多个选择 钮。
12.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置从特定超文本文件当中选出预定数量的高排位特定超文本文件,从高排位特 定超文本文件里提取在这些高排位特定超文本文件和对于这些高排位特定超文 本文件的多个特定母文件中出现的多个相关字,根据这些相关字在高排位特定超 文本文件与特定母文件中的多个出现频度计算相关字的多个重要度,再根据相关 字的重要度从被排位的相关字里选出预定数量的高排位相关字,而检索结果显示 装置以特定超文本文件的标引显示出高排位相关字的多个选择钮。
13.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置从特定超文本文件当中选出预定数量的高排位特定超文本文件,从这些高排 位特定超文本文件里提取出现在高排位特定超文本文件里的多个相关字,若相关 字的出现位置靠近关键字的出现位置,则在加倍计算出现在一个高排位特定超文 本文件里的该相关字的条件下,计算每个相关字在高排位特定超文本文件中的出 现频度,根据相关字的出现频度计算相关字的多个重要度,再根据相关字的重要 度从被排位相关字中选出预定数量的高排位相关字,而检索结果显示装置以特定 超文本文件的标引显示出高排位相关字的多个选择钮。
14.如权利要求1所述的超文本文件检索装置,其特征在于,文件排序确定 装置从特定超文本文件当中选出预定数量的高排位特定超文本文件,从这些高排 位特定超文本文件里提取出现在高排位特定超文本文件和对应于这些高排位特 定超文本文件的多个特定母文件里的多个相关字,若相关字的出现位置靠近关键 字的出现位置,则在加倍计算出现在一个高排位特定超文本文件里或一个特定母 文件里的相关字的条件下,计算每个相关字在高排位特定超文本文件中的出现频 度,根据相关字的出现频度计算相关字的多个重要度,再根据相关字的重要度从 被排位的相关字中选出预定数量的高排位相关字,而检索结果显示装置以特定超 文本文件的标引显示出高排位相关字的多个选择钮。
15.如权利要求1所述的超文本文件检索装置,其特征在于,关键字接收装 置接收多个关键字;文件排序确定装置对每个关键字和每个统一的超文本文件计 算一个关键字在一个统一超文本文件里的出现频度TF,对每个关键字计算倒数 文件频度IDF,它定义为其中出现一个关键字的特定超文本文件数的倒数值,计 算一个出现频度TF和一个倒数文件频度IDF的乘积TF×IDF,把关键字的多 个乘积相加而得出作为每个统一特定超文本文件的估算值的相加乘积,并按这些 估算值确定统一超文本文件的重要度。
16.如权利要求15所述的超文本文件检索装置,其特征在于,在两个或多个 关键字出现在统一特定超文本文件中或者两个关键字在统一特定超文本文件里 的距离保持在预定数量的字范围内的情况下,就增大一个统一特定超文本文件的 一个估算值,以提高该特定超文本文件的排位。

说明书全文

发明一般涉及一种超文本文件检索装置,特别涉及从大量超文本文件里检 索出多个可能符合用户检索要求的超文本文件并提供给用户的超文本文件检索 装置。

作为一种已知的常规装置,在图1的文件检索装置200中,从大量文件中检 索出一个或多个可能符合用户检索要求的文件并提供给用户。在该装置200中, 预先在检索标引检索标引检索标引生成单元202中分析贮存于文件管理单元201 里的大量文件,并检查登录在检索标引检索标引生成单元202字典中的多个字的 每个字在每个文件中出现多少次。即,对贮存在文件管理单元201中的每个文件 计算每个字在一个文件中的出现频度,把一个字在全部文件中的偏差度IDF计算 为该字的校正系数,对每个文件计算每个字的归一化出现频度(称TF值),对每个 字计算每个文件的估算值(表示为TF×IDF),即把偏差度与归一化出现频度乘起 来,并在检索标引生成单元202中生成某个检索标引。在检索标引中,对每个字 登录一个集合,而该集合包括一个字、指明出现该字的一个或多个文件的标识数 据和该字的一个估算值。

之后,当在关键字输入单元203中收到用户207输入的多个关键字时,就把 这些关键字发送给检索单元204。在检索单元204中,从贮存在检索标引检索标 引检索标引生成单元202中的检索标引里找出符合输入关键字的多个检索字,为 每个检索字从检索标引检索标引生成单元202中取出特定的集合(一个检索字、指 明出现该检索字的一个或多个检索文件的标识数据和该检索字的一个估算值),并 把相应于这些关键字的特定集合发送给文件排序确定单元205。

在文件排序确定单元205中,按检索文件的估算值的递减次序编排多个指示 检索文件的标识题,以便确定检索文件的排序,并在检索结果显示单元206中把 按检索文件排序编排的标识题作为检索结果显示出来。此后,当用户选择显示单 元206上以编排次序陆续显示的标识题时,每次选择一个标识题,就把由被选标 识题指示的检索文件从文件管理单元201读出给显示单元206,而每次选择一个 标识题,就在检索结果显示单元206上显示出该检索文件。

因此,由于符合用户检索要求的关键字是用户输入的,所以能按估算值TF ×IDF的次序提供多个可能符合用户检索要求的文件。

估算值TF×IDF的算法已有多种。例如有一种算法规定偏差度IDF(=1- logNw/N)是1减去比率的对数值(logNw/N),这里的Nw指出现附注字的文件数, 而N指贮存在文件管理单元201中的文件数。同时规定,归一化出现频度TF(= Fo/Nwd)是将附注字在附注文件中的出现频度F。除以出现在该附注文件中的字 数Nwd。此时,估算值TF×IDF即是把偏差度与归一化出现频度乘起来。

在Salton,Gerard著的论文“现代信息检索导论”(McGraw-Hill,Computer Science Series,1983)中,详细揭示了估算值TF×IDF和使用该估算值的普通文 件检索装置。

然而,若应用常规文件检索装置从大量超文本文件中检索可能符合用户检索 要求的一个或多个特定的超文本文件,由于超文本文件通常不相互独立而是往往 具有参照关系,所以其不足之处是无法合理地确定可能符合用户检索要求的特定 超文本文件的排序。即,由于具有相互参照关系的多个特定超文本文件的内容通 常与某个一致的含义有关,所以仅读一个特定超文本文件就无法理解这些特定超 文本文件的内容,只有阅读全部的特定超文本文件才能理解内容。因此,若应用 常规文件检索装置检索可能符合用户检索要求的一个或多个特定超文本文件,会 错误地估算每个特定超文本文件的重要度,所以其不足之处是无法合理地确定这 些特定超文本文件的排序。同样地,即使显示出按其估算值排序的特定超文本文 件,由于确定的特定超文本文件排序不合理,所以另一个不足之处是用户无法按 某种合适的重要度次序顺利地选择特定超文本文件。

具体地说,由于在万维网(World wide web)中以超文本标记语言(HTML)编写 的多个超文本文件相互具有参照关系的概率相当高,所以无法合理地确定特定超 文本文件的排序,尽管显示出按其估算值编排的特定超文本文件,用户仍无法顺 利地选择每个特定超文本文件。

考虑到此类常规文件检索装置的诸多不足,本发明的一个目的是提供一种超 文本文件检索装置,其中,从大量超文本文件中检索出可能符合用户检索要求的 一个或多个超文本文件,并按其重要度作合理排序,因而即使超文本文件在万维 网中以超文本标记语言编写,也能顺利地选出每一个文件。

为实现本发明的这个目的,在超文本文件检索装置中,从一组具有相互参照 关系的超文本文件中检索可能符合用户检索要求的多个特定的超文本文件,其 中,具有某个固定语句的一个超文本文件作为另一个起参照文件作用的超文本文 件的母文件,而用户在选出相应于参照文件的一个母文件的一个固定语句后查阅 该参照文件。

具体地说,在超文本文件表制备装置中,对每个超文本文件制备了超文本文 件信息,其中登录了一个超文本文件标识符(标识一个超文本文件)、超文本文件 的正文、标识母文件(对应于起到一个参照文件作用的超文本文件)的母文件标识 符和该母文件的一个固定语句;并且对所有超文本文件预先制备了一张超文本文 件信息的超文本文件表。

之后,在检索标引制备装置中,根据超文本文件表制备装置制备的超文本文 件表识别多个出现在每个超文本文件和每个文件中的字,根据超文本文件表识别 每个超文本文件和母文件中多个字的出现位置,对每个字制备字信息(包括一个或 多个标识其中出现一个字的一个或多个超文本文件的出现文件标识符、该字在超 文本文件中的出现位置以及相应于超文本文件的一个或多个母文件的一个或多 个固定语句),并预先对这些字制备几段字信息的检索标引。

之后,当关键字接收装置收到指明用户检索要求的关键字时,检索装置就从 检索标引制备装置制备的检索标引里检出相应于该关键字的特定字信息。同样 地,再根据该特定字信息检索出多个特定出现文件标识符(标识多个其中出现该关 键字的特定超文本文件)、关键字在特定超文本文件中多个特定的出现位置以及相 应于特定超文本文件的一个或多个特定母文件的一个或多个特定固定语句。

之后,在文件排序确定装置中,限定由特定出现文件标识符标记的特定超文 本文件,从超文本文件表制备装置制备的超文本文件表中为特定超文本文件检出 几段特定超文本文件信息,把一个特定超文本文件和一个或多个对应于该特定超 文本文件的特定母文件统一成每个特定超文本文件的统一的超文本文件,对每个 统一的超文本文件计算该关键字在一个统一的超文本文件里的出现频度,根据统 一超文本文件的出现频度确定多个统一超文本文件的重要度,而对于每个统一超 文本文件则把一个统一超文本文件的一个重要度定为对应于该统一超文本文件 的一个特定超文本文件的重要度,并且根据该统一超文本文件的重要度确定该特 定超文本文件的排序。

之后,检索结果显示装置以对应于该特定超文本文件排序的编排方式,把多 个特定超文本文件的标引作为检索结果显示出来。

由于对每个特定超文本文件是通过把一个特定超文本文件和一个或多个对 应于该特定超文本文件的特定母文件统一起来制备一个统一的超文本文件的,而 对每个统一的超文本文件计算的一个统一的超文本文件的一个重要度作为对应 于该统一的超文本文件的一个特定超文本文件的一个重要度,所以可通过研究同 特定超文本文件有参照关系的特定母文件来确定该特定超文本文件的排序。因 此,即使相互具有参照关系的多个特定超文本文件的内容同一一致的意义有关, 也能从大量超文本文件里正确地检出可能符合用户检索要求的特定超文本文 件,并按其重要度合理编排,这样即使用万维网的超文本标记语言编写这类特定 超文本文件,用户也可按合适的重要度次序顺序地选择特定的超文本文件。

通过以下结合附图所作的描述,本发明的目的、特征和优点将变得明显起 来。附图中:

图1是常规文件检索装置的方框图

图2表示Internet万维网中分散管理的多个超文本文件之间的参照关系;

图3为本发明第一实施例的超文本检索装置的方框图;

图4表示用图3中母文件清单制备单元在超文本文件表中制备的几段超文本 文件信息的超文本文件表;

图5表示在图3中检索标引制备单元中制备的几段字信息的检索标引;

图6是本发明第二实施例的超文本检索装置的方框图;

图7为一例检索结果,其中用图6中检索结果显示单元示出了一个特定超文 本文件的标引,对每个特定超文本文件都有一个第一级特定母文件标引和一个第 二级特定母文件标引;

图8是本发明第三实施例的超文本检索装置的方框图;

图9为一例检索结果,其中用图8中检索结果显示单元示出多个特定超文本 文件的标引,包括第一级特定母文件标引和第二级特定母文件标引;

图10是本发明第四实施例的超文本检索装置的方框图;

图11是本发明第五实施例的超文本检索装置的方框图;

图12是一例检索结果,其中用图11中检索结果显示单元示出了一特定超文 本文件的标引,对每个特定超文本文件都显示出该特定超文本文件的概要、第一 级特定母文件标引和第二级特定母文件标引;

图13是本发明第六实施例的超文本检索装置的方框图;

图14是本发明第七实施例的超文本检索装置的方框图;

图15是本发明第八实施例的超文本检索装置的方框图;

图16是本发明第九实施例的超文本检索装置的方框图;

图17表示用一个或多个参照标记划分一长篇超文本文件的状况;

图18是本发明第十实施例的超文本检索装置的方框图;

图19为一例检索结果,其中根据第十实施例示出了超文本文件的标引及对 应于多个高排序相关字的按钮;

图20是本发明第十一实施例的超文本检索装置的方框图;以及

图21为一例检索结果,其中根据第十一实施例示出了超文本文件的标引及 对应于多个高排序相关字的按钮。

在超文本文件检索装置的较佳实施例中,从Internet的万维网中分散管理的 大量超文本文件里检索一个或多个可能符合用户检索要求的特定超文本文件的 情况,将参照根据本发明原理的附图进行描述。

图2表示在Internet万维网中分散管理的多个超文本文件之间的参照关系。

如图2所示,在Internet万维网中分散管理的多个超文本文件D80~D86, 相互有某种参照关系。即,把固定语句S800置于超文本文件D80,固定语句S801 置于超文本文件D81,固定语句S802置于超文本文件D82,多个固定语句S803~ S805置于超文本文件D83,固定语句S806置于超文本文件D84。在每个固定语 句中,不是隐藏了某个标识符(标识用户可作参照的文件)就是隐藏了某个文件位 置(用户可作参照)。

在这一技术规范中,把用户当作参照的文件称为参照文件,而把含有一固定 语句(指明一个或多个参照文件)的文件称为母文件。而且,每个固定语句包括一 个句子或多个句子。

因此,当用户阅读浏览文件选择装置(称浏览器)显示器示出的母文件D81并 用所谓的指点器件指出母文件D81的固定语句S801的位置时,可调显参照文件 D83,使用户能有效地利用分散的超文本文件D80~D86。

用超文本标记语言编写一组超文本文件D80~D86,把每个超文本文件称 为一页,且在每个超文本文件中写入字符串、图像或程序。例如,在把母文件 D81贮存在名为“farmer.html”的文件中,把参照文件D83贮存在名为 “ apple.html”的文件中,而把指示参照该参照文件D83的指示器(或文件贮存位 置)隐藏于字符串“apple producing farmer”(用母文件D81编写以便配合固定语 句S801)的情况下,把固定语句S801表述为“apple producing farmer<1a>”。此时,因为在参照文件D83中不写任何语句,所以就 有一种情况是在远离另一台计算机的一台计算机中制备文件D82,其中,在制备 文件D81前先贮存已制备的文件D83,而文件D82就起着参照文件D83的母文 件的作用。 第一实施例

图3是本发明第一实施例的超文本检索装置的方框图。

如图3所示的超文本检索装置1,用于从贮藏在超文本文件管理单元8中的 大量超文本文件里检索可能符合用户检索要求的一个或多个超文本文件,其中, 在万维网内广泛分布的大量计算机中制备的超文本文件,是在这些超文本文件具 有相互参照关系的条件下分散管理的,而该超文本检索装置1包括:

带母文件清单的超文本文件表制备单元7,用于分析由超文本文件管理单元 8管理并具有参照关系的超文本文件;对每个超文本文件制备超文本文件信息, 其中把标识一个或多个母文件的一个或多个母文件标识符和母文件的固定语句 同标识一个超文本文件的一个超文本文件标识符与该超文本文件的文件贮存位 置表列在一起;对超文本文件管理单元8管理的所有超文本文件制备该超文本文 件信息的超文本文件表;具有字典的检索标引制备单元6根据带母文件清单的超 文本文件表制备单元7制备的超文本文件表,对超文本文件管理单元8管理的每 个超文本文件预先分析一个超文本文件的正文、该文件的标题以及对应于该文件 的一个或多个母文件的一个或多个固定语句的字符串,以便识别出现在该超文本 文件中的多个字;对其中用一个出现文件标识符标识一个超文本文件的一个字制 备一段字信息,其中,对每个超文本文件列出登录在字典里出现的这个字、指明 该字在超文本文件的标题中出现位置的定位信息、超文本文件正文以及对应于该 超文本文件的母文件的固定语句;以及对贮存在字典里的字制备几段字信息的检 索标引;

一关键字输入单元2,用于接收用户9输入的多个关键字;

一检索单元3,用于检索多段对应于多个特定字的特定字信息,特定字与关 键字输入单元2从检索标引接收到的关键字相符,而检索标引在检索标引制备单 元6里制备,并且用于检索标识特定超文本文件的特定出现文件标识符,其中, 一个特定字与出现的一个关键字相符,而特定定位信息根据每个特定字的特定字 信息指明一个特定字在特定超文本文件和对应于该特定超文本文件的多个特定 母文件中的特定出现位置;

一文件排序确定单元4,用于对检索单元3获得的每个特定超文本文件,根 据带母文件清单的超文本文件表制备单元7制备的超文本文件表的文件信息,把 一个特定超文本文件与对应于该特定文件的一个或多个特定母文件统一成一种 统一的特定超文本文件;对每个特定字和每个统一的特定超文本文件计算一个特 定字在一个统一的特定超文本文件中的出现频度TF;对每个特定字计算倒数文 件频度IDF,并被规定为其中出现一个特定字的特定超文本文件数的倒数;计算 一个出现频度TF与一个倒数文件频度IDF的乘积TF×IDF;把所有特定字的 多个乘积相加以得出一相加的积,作为每个统一的特定超文本文件的估算值;根 据估算值确定该统一的特定超文本文件的多个重要度;根据该统一的特定超文本 文件的重要度确定特定超文本文件的排序;并对每个特定超文本文件制备一个特 定超文本文件的标引;以及

一检索结果显示单元5,把以文件排序确定单元4确定的次序编排的特定超 文本文件的标引作为检索结果来显示。

在上述结构中,描述超文本检索装置1的操作状况。在万维网中广为分布的 大量计算机中制备相互有参照关系的多个超文本文件。在超文本文件管理单元8 中,分散管理这些超文本文件。带母文件制备单元7的参照文件表具有相关的文 件汇总功能(通常称作网络自动机)。因此,当对带母文件制备单元7的参照文件 表给出多个超文本文件的多个文件贮存位置地址(通常称作多个通用资源定位器) 时,通用资源定位器陆续把多个超文本文件指示为多个母文件,分析写入每个母 文件里的一个或多个固定语句,并为每个母文件收集一个或多个参照文件。之 后,以收集次序把相互不重迭的多个超文本文件标识符配给收集的参照文件,以 便识别收集的参照文件。在此情况下,若不在每个收集的参照文件里写入任何图 像或程序,而是写入字符串,则可节省收集时间。同时,列出收集的参照文件的 多个文件贮存位置地址,以防再次收集已列出的一个已收集参照文件。因此,如 图2所示,不仅母文件D83按照固定语句S803同参照文件D84相关,而且母文 件D84按照固定语句S806也同参照文件D83相关,这就防止了超文本文件D83 和D84被收集二次。

之后,按下述步骤在带母文件清单的超文本文件表制备单元7中制备几段超 文本文件信息的超文本文件表(参照图4),其中,对每个超文本文件列出了一个 或多个母文件的标识符和诸母文件的固定语句。制备其编号等于被收集参照文件 数的多个文件信息输入空间DS1~DS3。在每个文件信息输入空间中,将标识 一个被收集参照文件的超文本文件标识符的编号和被收集参照文件的一个文件 贮存位置地址写入文件信息输入空间。之后,通过检查写入被收集参照文件的多 个字符串,从被收集参照文件里提取其标题。在本实施例中,例如从字符串 “apple that I grew<title>”里提取标题“apple that I grew”,并把它写入 文件信息输入空间。之后,从被收集参照文件正文中原有的多个字符串中移去分 别表示置于“<”与“>”之间某一字符串的超文本标记语言标签的一个或多个字 符串,以形成文本正文并把它写入文件信息输入空间。之后,检查与一个或多个 母文件中原有的一个参照文件相关的一个或多个固定语句是否与该参照文件相 关。若母文件里原有的一个固定语句与一个参照文件相关,就把标识母文件的母 文件标识符与母文件的固定语句的集合写入文件信息输入空间,以对每个超文本 文件信息形成母文件清单。同时,把文本正文中使用的多个字、标题和固定语句 都写入文件信息输入空间,以对每个超文本文件信息形成字清单。</p><p>因此,如图3所示,在带母文件的参照文件表制备单元7中,对超文本文件 管理单元8管理的每个超文本文件都准备了文件信息输入空间,在此空间中写入 超文本文件标识符、文件贮存位置、标题、文本正文、母文件清单和字清单,以 制备一张超文本文件表。</p><p>在本例中,是在分析了写入每个母文件的一个或多个固定语句以收集参照文 件以后制备超文本文件表的。所以,固定语句被分析或检查了二次,以确定收集 的参照文件并制备超文本文件表。然而,若在分析固定语句以收集参照文件的同 时制备超文本文件,就能有效地制备该表。</p><p>之后,在具有字典的检索标引制备单元6中,预先对超文本文件表的每个超 文本文件分析超文本文件的正文、标题和一个或多个固定语句的字符串,对贮存 在字典中的每个字制备一段字信息,包括字、一个或多个出现文件标识符(用于标 识出现该字的超文本文件)以及定位信息(指出该字在超文本文件中的出现位 置),并对多个字制备几段字信息的检索标引,如图5所示。</p><p>具体地说,检索标引制备单元6在字典中登录了成千上万计的字,并制备了 多个字信息输入空间WS1~WS3(其编号等于字典中登录的字数),在字信息输入 空间WS~WS3之一内写入每个字。之后,把登录在超文本文件表一个文件信息 输入空间的字清单里的字作为特定字来检测,把对应于该文件信息输入空间的特 定超文本文件的超文本标识符作为出现超文本文件标识符来检测,把特定超文本 文件中特定字的一个或多个位置作为定位信息来检测,而在对应于该特定字的特 定字信息输入空间里写入作为字信息的出现超文本文件标识符与定位信息组成 的集合。对于登录在超文本文件表所有文件信息输入空间的字清单中的每一个字 都这样处理,从而制备与超文本文件中使用的多个字相对应的几段字信息的检索 标引。</p><p>图5示出一段检索标引的字信息,它被写入字信息输入空间WS1,对应于 字“apple”。“(Title,1)”表示字“apple”出现在超文本文件D83标题的第一 字位置,“(Body,4,33,43)”表示字“apple”出现在超文本文件D83正文的第4、 第33和第43字位置,“(000081,1)”表示字“apple”出现在起到母文件作用的 超文本文件D81的固定语句S801的第一字位置,而“(000082,4)”表示字“apple” 出现在起到母文件作用的超文本文件D82的固定语句S802的第四字位置。</p><p>同样地,预先在检索标引制备单元6中计算出现某一字的出现文件数的倒数 值(常称作倒数文件频度IDF)和该字在每个出现文件中的出现频度(常称作文本频 度TF),并把它们写入每个字所对应的字信息输入空间,也是合适的。这样,可 缩短检索所需的处理时间。</p><p>因此,在检索标引制备单元6中,分析超文本文件正文中出现的每个字、超 文本文件的标题以及同该超文本文件相关的母文件的固定语句,并对每个字制备 出现文件清单(包括一个或多个出现文件标识符和定位信息)。从而可制备出检索 标引,其中,对每个字指出在每个超文本文件中的字出现位置。</p><p>关键字输入单元2具有文本盒的作用,其检索起动按钮用于返回文本盒的内 容,HTML文件按超文本标记语言编写,其诸如“retrieval page”之类的标题供 关键字输入单元2使用。即,用户9在万维网浏览器(诸如在其委托的计算机中操 作的Mosaic或Netscape)中调用HTML文件,把单个关键字输入到文本盒或把多 个空间分隔的关键字输入到文本盒,并按下检索起动按钮,这样就输入了单个或 多个关键字。</p><p>因此,关键字输入单元2收到了用户9输入的多个关键字并把它们发送给检 索单元3。在本例中,用户通过按压<a href='/zhuanli/list-14596-1.html' target='_blank'><a href='/zhuanli/list-14647-1.html' target='_blank'>键盘</a></a>上的多个键,输入每个关键字。然而, 在通过按钮选择某个关键字的每个候选字的情况下,即便是不熟练入员操作关键 字输入单元2,也能方便地用指点器件执行关键字输入操作而无须应用键盘。</p><p>在检索单元3中,从贮存在检索标引制备单元6中的检索标引里取出对应于 多个特定字的几段特定字信息(同关键字输入单元2输入的关键字相符),并从每 个特定字的一段字信息里获得一个或多个出现文件标识符(用于标识其中一个特 定字与出现的一个关键字相符的一个或多个特定超文本文件)和定位信息(用于指 明该特定字在特定超文本文件中的位置)。包含出现文件标识符和定位信息的多个 集合被发送给文件排序确定单元4。</p><p>在排序确定单元4中,从超文本文件表中取出对应于由出现文件标识符标识 的特定超文本文件的几段超文本文件信息,并把由一个或多个母文件标识符(由对 应于特定超文本文件的一段超文本文件信息列出)标识的一个特定超文本文件与 一个或多个母文件统一成一种统一的特定超文本文件。对用检索单元3发出的出 现文件标识符进行标识的每个特定超文本文件,都形成这种统一的特定超文本文 件。之后,根据出现文件标识符与定位信息的多个集合,对每个特定字计算出被 定义为统一特定超文本文件(其中一个特定字与出现的一个关键字相符)数之倒数 值的倒数文件频度IDF以及一个特定字在每个统一特定超文本文件中的出现频度 TF。倒数文件频度IDF表示每个特定字的校正系数。</p><p>之后,在只输入一个关键字的情况下,把用作一个特定字的倒数文件频度IDF 与出现频度TF相乘得到的估算值作每个统一特定超文本文件的重要度。同时, 在用户输入的关键字量为二个或更多的情况下,对每个关键字和每个统一特定超 文本文件计算出一个出现频度TF与一个倒数文件频度IDF的乘积TF×IDF, 把所有关键字算出的乘积之和作为每个统一特定超文本文件的估算值,并根据估 算值确定每个统一特定超文本文件的重要度。把每个统一特定超文本文件的重要 度定为对应于该文件的一个特定超文本文件的重要度。之后,根据该特定超文本 文件的重要度确定包括母文件在内的特定超文本文件的排序。</p><p>在关键字数量为二个或更多的情况下,当N个特定字与特定超文本文件中出 现的N个关键字相符时,可把一个特定超文本文件的估算值定为某一值的N倍(N 为2或更大),像所有关键字算出的乘积TF×IDF之和那么大。此时,由于N个 关键字之间的相关性反映在每个特定超文本文件的重要度上,所以还能满足用户 的检索要求。</p><p>同样地,在一个特定超文本文件中使用与两个关键字相符的两个特定字(相 互接近在20个字符以内)的情况下,可以把统一特定超文本文件的估算值增大一 倍。此时,由于相互接近的两个关键字之间的相关性反映在每个特定超文本文件 的重要度上,所以也能满足用户的检索要求。</p><p>之后,在文件排序确定单元4中,制备一个HTML文件,其中按排序列出特 定超文本文件的多个标引,并把该文件发送给检索结果显示单元5。此时,一个 特定超文本文件的标引就是该特定超文本文件的标题或者写入一个母文件的固 定语句字符串,在该特定超文本文件的标引中隐藏着表示该文件在超文本文件管 理单元8中位置的文件贮存位置地址,而标引起着固定语句的作用。即,当用户 选择一个特定超文本文件的一个标引时,就按文件贮存位置地址从超文本文件管 理单元8调出该特定超文本文件。</p><p>所以,在文件排序确定单元4中,从带母文件的参照文件表制备单元7对每 个特定超文本文件所制备的超文本文件表中,取出一个或多个与一个特定超文本 文件有参照关系的母文件,把一个特定超文本文件和一个或多个同其有参照关系 的母文件统一成每个特定超文本文件的统一特定超文本文件,根据每个特定超文 本文件的估算值TF×IDFN确定包括母文件在内的特定超文本文件的重要度, 根据这些重要度编排这些特定超文本文件,并以排序列出这些特定超文本文件。</p><p>在本例中,由于出现频度TF未被一个统一的特定超文本文件的大小所划分, 所以字的出现频度TF未作归一化。然而,在通过把出现频度TF除以一个统一的 特定超文本文件大小而将字的TF归一化的情况下,必须把每个超文本文件的大 小写入超文本文件表中。</p><p>在诸如以其委托的计算机中操作的Mosaic或Netscape一类的万维网浏览器 体现了检索结果显示单元5。在委托计算机的显示器上示出在文件排序确定单元 4中制备的HTML文件。之后,当用户利用指点器件选择HTML文件中表列的一 个特定超文本文件的一个标引时,根据该特定超文本文件标引中隐藏的文件贮存 位置地址确定用户所选特定超文本文件的位置,并从超文本文件管理单元8调出 该超文本文件。</p><p>因此,在检索结果显示单元5中,显示出HTML文件列出的特定超文本文件 的标引,用户选择一个特定超文本文件的一个标引,就从超文本文件管理单元8 中调出用户选择的特定超文本文件。</p><p>这样,由于带母文件的参照文件表制备单元7制备的超文本文件表中列出了 一个或多个同每个参照文件有参照关系的母文件,所以可通过从该超文本文件表 里取出对应于该参照文件的文件信息,限定对应于一个参照文件的母文件。所 以,由于不要求向超文本文件管理单元8打听对应于参照文件的一个或多个母文 件,故能迅速地确定对应于每个参照文件的一个或多个母文件。</p><p>而且,由于在文件排序确定单元4中把一个特定超文本文件和同该文件有参 照关系的一个或多个母文件统一成统一的特定超文本文件,所以可确定每个统一 特定超文本文件的重要度。因此,考虑到对应于每个特定超文本文件的母文件, 可按重要度确定其一个特定字与一个出现的关键字相符的诸特定超文本文件的 排序。这样,在可靠地满足了以关键字表达的用户的检索要求的条件下,检索结 果显示单元5可按特定超文本文件的排序显示出这些文件的标引,而用户能以排 序选择这些文件。</p><p>同样地,由于带母文件清单的参照文件表制备单元7制备的超文本文件表的 的每段文件信息列出了一个超文本文件和一个或多个母文件(与该超文本文件具 有参照关系)的一个或多个固定语句,所以很容易在检索标引制备单元6中制备该 检索标引的每段字信息,表示某个字出现在一个超文本文件和一个或多个母文件 (与该超文本文件有参照关系)的一个或多个固定语句中。此外,由于在带母文件 清单的参照文件表制备单元7所制备的超文本文件表中列出了一个或多个母文件 (与每个参照文件有参照关系),所以在检索标引制备单元6中制备检索标引时, 就不要求向管理单元8打听一个或多个对应于该参照文件的一个或多个母文件。 因此,能迅速地制备检索标引。 第二实施例</p><p>图6是本发明第二实施例的超文本检索装置的方框图。</p><p>如图6所示,用于从贮存在超文本文件管理单元8的大量超文本文件中检索 一个或多个可能符合用户检索要求的超文本文件的超文本检索装置11包括:带 母文件清单的超文本文件表制备单元7;检索标引制备单元6;关键字输入单元 2;检索单元3;文件排序确定单元12,用于根据带母文件清单的超文本文件表 制备单元7对检索单元3获得的每个特定超文本文件制备的超文本文件表的文件 信息,把一个特定超文本文件和对应于该文件的一个或多个特定母文件统一成统 一的特定超文本文件,根据检索标引制备单元6得到的检索标引的特定字信息计 算该统一的文件的估算值,根据估算值确定该统一的文件的多个重要度,根据该 统一的文件的重要度确定这些特定超文本文件的排序,并对每个特定超文本文件 制备对应于该特定超文本文件的带特定母文件标引的一个特定超文本文件的标 引;以及</p><p>检索结果显示单元13,以文件排序确定单元12确定的排序对每个统一的特 定超文本文件显示带特定母文件标引的该特定超文本文件的标引作为检索结 果。</p><p>在上述结构中,在像第一实施例同样的方式根据文件排序确定单元12中的重 要度确定了特定超文本文件的排序后,对每个特定超文本文件不仅制备了一个 特定超文本文件的标引,而且也制备了对应于该特定超文本文件的特定母文件的 标引。在多个母文件对应于原有的特定超文本文件的情况下,把其文件贮存位置 最接近于母文件中该特定超文本文件贮存位置的一个母文件选作特定母文件。选 择是这样进行的,即把指示每个母文件之文件贮存位置的字符串部分同指示该特 定超文本文件之文件贮存位置的字符串部分作一比较。同时,在本例中,把该特 定母文件(即第一级特定母文件)视作第二级参照文件,限定与第二级参照文件有 参照关系的第二级特定母文件,并制备第二级特定母文件的标引。之后,用检索 结果显示单元13以每个特定超文本文件的第一级特定母文件标引和第二级特定 母文件标引显示一个特定超文本文件的标引。</p><p>图7示例是用检索结果显示单元13以每个特定超文本文件的第一级特定母文 件标引与第二级特定母文件标引显示一个特定超文本文件的标引。</p><p>如图7所示,若规定超文本文件D83为第四排位,超文本文件D85为第18 排位,超文本文件D86为第19排位,则用第一级特定母文件D81的标引和第二 级特定母文件D80的标引作为第四排位组来显示特定超文本文件D83的标引,用 第一级特定母文件D83的标引和第二级特定母文件D81的标引作为第18排位组 来显示特定超文本文件D85的标引,并用第一级特定母文件D83的标引和第二级 特定母文件D81的标引作为第19排位组来显示特定超文本文件D86的标引。</p><p>这样,即使把未具有固定语句的超文本文件D86选作为一个特定超文本文 件,也能方便地从超文本文件管理单元8里选择和调用与超文本文件D86有密切 相关性的超文本文件D83或D81,并不依赖于任何固定语句。即,由于多个超文 本文件相互间有密切相关的参照关系,所以显示出第一级和第二级特定母文件的 标引极有利于用户。 第三实施例</p><p>在前二例中,在调读第四排位的超文本文件D83的情况下,通过选择固定语 句S804的位置来调读文件D85,而排位低于第四位的多个超文本文件被逐一调 读,这样由于用户忘了通过早已被读过的超文本文件D85,读取超文本文件D85, 可能会错误地重新调读第18排位的超文本文件D85。同时,尽管已调读过第19 排位的超文本文件D86,但由于在调读第四排位的超文本文件D83后已过了很长 时间,故用户可能无法理解同超文本文件D83上下文密切相关的超文本文件D86 的来龙去脉。因此,为克服第三实施例的上述缺点,对多个相关密切的超文本文 件的排位被定为同一排位。</p><p>图8是本发明第三实施例的超文本检索装置的方框图。</p><p>如图8所示,用户从贮存在超文本文件管理单元8的大量超文本文件中检索 可能符合用户检索要求的一个或多个超文本文件的超文本检索装置21包括:带 母文件清单的超文本文件表制备单元7;检索标引制备单元6;关键字输入单元 2;检索单元3;文件排序确定单元22,根据带母文件清单的超文本文件表制备 单元7对检索单元3获得的每个特定超文本文件制备的超文本文件表的文件信 息,把一个特定超文本文件和对应于该文件的一个或多个特定母文件统一成统一 的特定超文本文件,根据检索标引制备单元6得到的检索标引的特定字信息计算 该统一的特定超文本文件的估算值,根据这些估算值确定统一的特定超文本文件 的多个重要度,在规定给两个或多个相互密切相关的特定超文本文件的排位定为 同一排位的条件下,根据统一的特定超文本文件的重要度确定特定超文本文件的 排序,并为每个特定超文本文件制备一个特定超文本文件的标引;以及</p><p>检索结果显示单元23,在用对应于一组公共特定超文本文件任一文件的一个 或多个特定母文件显示两个或多个同样排位的特定超文本文件的条件下,以文件 排序确定单元22确定的编排次序把特定超文本文件的标引显示成检索结果。</p><p>在上述结构中,在以与第一实施例同样的方式计算出特定超文本文件的重要 度并在文件排序确定22中按重要度确定出特定超文本文件的排序以后,取出对 应于一个特定超文本文件的超文本文件表的一段文件信息所列出的一个或多个 母文件标识符,并对每个特定超文本文件限定由母文件标识符标识的一个或多个 母文件。之后,判断每个母文件是否与一个特定超文本文件相符。若对应于排位 A的第一特定超文本文件的一个母文件与排位B的第二特定超文本文件相符,就 判定第一与第二特定超文本文件相互密切相关,并把第一与第二特定超文本文件 在排位A与B之间重新定到更高的排位。之后,用检索结果显示单元23以此排 序显示特定超文本文件的标引。</p><p>例如,因为对应于第18排位的超文本文件D85的母文件D83与第四排位的 文件D83相符,所以就把超文本文件D85重新定为第四排位。同样地,因为对应 于第19排位的超文本文件D86的母文件D83与第4排位的超文本文件D83相符, 所以把文件D86重新定为第四排位。</p><p>所以,由于把相互密切相关的多个特定超文本文件定为同样的排位并被显示 得相互靠近,用户能顺利阅读相互密切相关的特定超文本文件,因而用户能方便 地实现特定超文本文件的上下文联系。这样,防止了再次误读同一个特定超文本 文件,用户能有效地阅读一组相互密切相关的特定超文本文件。</p><p>在本例中,在规定给多个特定超文本文件的排位中间,把相互密切相关的多 个特定超文本文件定为最高排位。然而,第三实施例并不限于这一思路。即,当 确定了相互密切相关的多个特定超文本文件后,可计算出特定超文本文件的重要 度之和,并根据相加的重要度把特定超文本文件重新定到同一更高的排位。</p><p>同时,最好把第二和第三实施例的原理结合起来。例如像图7所示,在把第 一组的特定超文本文件D83和母文件D80与D81定为第四排位时,把第二组的 特定超文本文件D85和母文件D81与D83定为第18排位,并根据第二实施例把 第三组的特定超文本文件D86和母文件D81与D83定为第19排位,则第二组文 件D81、D83和D85从第18排位重新定为第四排位,第三组文件D81、D83 和D86由第19排位改定为第四排位,如图9那样显示出重定为第四排位的组合 起来的特定超文本文件D83、D85和D86及母文件D80与D81。 第四实施例</p><p>一般而言,表示某参照文件特征的专用字在对应于该参照文件的一个或多个 母文件的一个或多个固定语句中出现多次。所以,在考虑该专用字出现在母文件 固定语句中的情况而计算参照文件的估算值并根据该估算值编排该参照文件 时,可提高检索多个可能符合用户检索要求的超文本文件的可靠性。</p><p>图10是本发明第四实施例的超文本检索装置的方框图。</p><p>如图10所示,用于从贮存在超文本文件管理单元8里的大量超文本文件中检 索一个或多个可能符合用户检索要求的超文本文件的超文本检索装置31包括: 带母文件清单的超文本文件表制备单元7;检索标引制备单元6;关键字输入单 元2;检索单元3;文件排序确定单元32,计算每个特定字在一个特定超文本 文件和对应于该特定超文本文件的一个或多个特定母文件的一个或多个固定语 句中的出现频度,根据检索标引制备单元6得到的检索标引的特定字信息把该出 现频度当作每个特定超文本文件中该特定超文本文件的修订出现频度TF,根据 修订出现频度TF和倒数文件频度IDF计算特定超文本文件的估算值,根据估算 值确定特定超文本文件的多个重要度,根据重要度确定特定超文本文件的排位, 并制备特定超文本文件的标引;以及</p><p>检索结果显示单元33,用以显示以文件排序确定单元22确定的排序的特定 超文本文件标引作为检索结果。</p><p>在上述结构中,在用户输入关键字“apple”的情况下,如图4所示,该特 定字“apple”在超文本文件D83的标题和正文中出现4次。而且,特定字 “apple”还出现于母文件D81的固定语句S801和母文件D82的固定语句S802 中。因此,因为特定字“apple”在超文本文件D83和母文件D81与D82的固定 语句S801与S802中的出现频度之和为6,所以把特定超文本文件D83的修订出 现频度定为6,并在文件排序确定单元32中用修订出现频度TF计算特定超文本 文件D83的估算值。这样,把特定超文本文件D83排到更高的排位,所以提高了 文件D83的检索可靠性。 第五实施例</p><p>在前四例中,在显示出特定超文本文件的标引后,若用户希望知道一个特定 超文本文件的大体内容,就要求从超文本文件管理单元8调出该文件。因此,若 用户希望阅读许多特定超文本文件的内容,用户就要麻烦地调出这些文件。</p><p>图11是本发明第五实施例的超文本检索装置的方框图。</p><p>如图11所示,用于从贮存在超文本文件管理单元8里的大量超文本文件中检 索可能符合用户检索要求的一个或多个文件的超文本检索装置41包括:带母文 件清单的超文本文件表制备单元7;检索标引制备单元6;关键字输入单元2; 检索单元3;文件排序确定单元42,根据带母文件清单的超文本文件表制备单 元7对检索单元3获得的每个特定超文本文件制备的超文本文件表的文件信息, 把一个特定超文本文件和对应于该文件的一个或多个特定母文件统一成一种统 一的特定超文本文件,根据标引制备单元6获得的检索标引的特定字信息对每个 特定字计算统一的特定超文本文件的估算值,根据每个特定字的估算值确定统一 的特定超文本文件的多个重要度,根据每个特定字的统一的特定超文本文件的重 要度确定特定超文本文件的排位,对每个特定超文本文件制备一个特定超文本文 件的标引,并对每个特定字制备特定超文本文件的多个<a href='/zhuanli/list-18294-1.html' target='_blank'><a href='/zhuanli/list-18373-1.html' target='_blank'><a href='/zhuanli/list-18402-1.html' target='_blank'>摘要</a></a></a>;以及</p><p>检索结果显示单元43,对每个特定字以文件排序确定单元42确定的排序显 示一组特定超文本文件的标引及特定超文本文件的摘要作为检索结果。</p><p>在上述结构中,在排序确定单元42中制备了特定超文本文件的标引后,根据 检索标引制备单元6制备的检索标引字信息的定位信息,从一个特定超文本文件 里取出包括一个特定字的特定语句或特定短语,并对每个特定字和每个特定超文 本文件制备一个摘要,其中把特定语句或短语连续写到特定超文本文件的顶端语 句或短语里。在一个特定超文本文件中存在包括一个特定字的多个特定语句或多 个特定短语的情况下,制备一个摘要,其中把以原来次序编排的特定语句或短语 连续写到特定超文本文件的顶端语句或短语里。之后,用检索结果显示单元43 以文件排序确定单元42确定的排序对每个特定字显示该特定超文本文件的标引 与摘要。</p><p>这样,由于对每个特定超文本文件示出了一个特定超文本文件的摘要,因此 用户能通过阅读每个特定超文本文件的摘要了解每个文件的大体内容,不必从超 文本文件管理单元8调看每个文件,能方便地选择一个或多个符合用户检索要求 的特定超文本文件。</p><p>在本例中,即使包括一个特定字的特定语句或短语在一个特定超文本文件中 出现多次,仍可从该特定超文本文件取出包括特定字的所有特定语句或短语,并 制备出摘要。然而,若通过把特定超文本文件的一系列特定语句或短语同该特定 超文本文件的顶端语句或短语连起来获得一个特定超文本文件的摘要,则显得太 长,用户难以迅速地阅读长的摘要。因此,可行的办法是:若用户输入的关键字 数量为5或更少,可把特定超文本文件的三个特定语句或三个特定短语同该文件 的顶端语句或短语连起来,对每个特定字制备一个摘要;若用户输入的关键字数 量为10个或更少,就把两个特定语句或短语同该文件的顶端语句或短语连起来, 对每个特定字制备一个摘要;若用户输入的关键字数量为11个或更多,则把一 个特定语句或短语同该文件的顶端语句或短语连起来,对每个特定字制备一个摘 要。这样就防止了摘要过长,用户能有效地阅读检索结果显示单元43显示的若 干摘要。</p><p>同样地,最好把第二和第五实施例的原理结合起来。例如,如图12所示,若 按第二实施例的原理把第一组特定超文本文件D83和母文件D80与D81定为第 四排位,第二组特定超文本文件D85和母文件D81与D83定为第18排位,而第 三组特定超文本文件D86和母文件D81与D83定为第19排位,就把文件D83的 摘要加到第一组,把文件D85的摘要加到第二组,而把文件D86的摘要加到第三 组。 第六实施例</p><p>在万维网中,把一个作品或一篇文章分成几部分,而每一部分写在一个超文 本文件里。因此就会有这样一种情况,即写入一个超文本文件的一部分文章不能 完全表达该文章的上下文关系。例如,尽管文章里叙述了苹果生长在Aomori, 但是指明苹果产地的字“Aomori”不是写在超文本文件D83里,而是写在母文 件D81里。</p><p>因此,若表示文章上下文关系的多个关键字被分开用在超文本文件里和多个 与该文件有参照关系的母文件里,在原有技术中就把该文件不合理地排在较低的 等级。然而,在第六实施例中,对每个母文件制备了一个组合超文本文件,它是 通过把检索超文本文件(或特定超文本文件)和一个与该文件有参照关系的母文件 组合起来而形成的,相互比较一下组合文件的重要度,选出其重要度最大的一个 组合超文本文件,并把该最大重要度用作该检索超文本文件的重要度。</p><p>图13是本发明第六实施例的超文本检索装置的方框图。</p><p>如图13所示,用于从贮存在超文本文件管理单元8的大量超文本文件中检索 一个或多个可能符合用户检索要求的超文本文件的超文本检索装置51包括:带 母文件清单的超文本文件制备单元7;检索标引制备单元6;关键字输入单元2; 检索单元3;文件排序确定单元52,用于根据带母文件清单的超文本文件表制 备单元7对检索单元3获得的每个对应于特定超文本文件的特定母文件和每个特 定超文本文件制备的超文本文件表的文件信息,把一个特定超文本文件和一个对 应于该文件的特定母文件组合成一个组合特定超文本文件,根据检索标引制备单 元6对每个特定超文本文件获得的检索标引的特定字信息计算该组合文件的估算 值,根据每个特定超文本文件的估算值确定组合文件的多个重要度,对每个特定 超文本文件比较组合文件相互的重要度,对每个特定超文本文件选择同一个特定 超文本文件相关的组合文件重要度中的最大重要度,对每个特定超文本文件把最 大重要度规定给该特定超文本文件的重要度,根据这些重要度确定诸特定超文本 文件的排序,并对每个特定超文本文件制备一个特定超文本文件的标引;以及检 索结果显示单元53,用于以文件排序确定单元52对每个特定字确定的排序把一 组特定超文本文件的标引及该文件的摘要显示为检索结果。</p><p>在上述结构中,在字“apple”出现在超文本文件D83而字“Aomori”(指 示苹果产区)不出现在超文本文件D83或D82而出现在超文本文件D81的条件 下,用户输入了关键字“apple”和另一个关键字“Aomori”,由于同关键字 “apple”相符的特定字“apple”出现在文件D83里,就在检索单元3中把文 件D83定为特定超文本文件。</p><p>之后,在文件排序确定单元52中,把特定超文本文件D83和特定母文件D81 组合成第一组合特定超文本文件,把特定超文本文件D83和特定母文件D82组合 成第二组合特定超文本文件,对每个特定字计算组合特定超文本文件的估算值, 再计算特定字的第一组合特定超文本文件的第一估算值之和以及特定字的第二 组合特定超文本文件的第二估算值之和。此时,由于特定字“Aomori”并不出 现在超文本文件D82里而是出现在文件D81里,所以第一组合特定超文本文件的 第一估算值之和要大于第二组合特定超文本文件的第二估算值之和。所以,选择 了第一组合特定超文本文件,对于关键字“apple”和“Aomori”而言,把第一 组合特定超文本文件的第一估算值之和规定为文件D83的估算值,并根据文件 D83的估算值算出文件D83的重要度。其它文件的重要度以同样方法计算,并按 重要度确定诸特定超文本文件的排序。</p><p>这样,即使把多个表示文章上下文关系的关键字分开应用于某个超文本文件 和同该文件有参照关系的多个母文件,由于通过把一个特定超文本文件和一个特 定母文件组合起来而对每个特定母文件形成了组合文件,并且把组合文件中间一 个组合文件的最大估算值定为该文件的估算值,所以不可能把该文件不合理地排 到较低的等级。 第七实施例</p><p>超文本文件的标题部分通常只是指明该文件的特征,所以为了刻意估算某个 特定字出现在超文本文件的标题部分,就得把同该文件标题部分的一个关键字相 符的该特定字的出现频度加倍。以标题部分为例,本例研究了超文本文件的标题 或同该文件有参照关系的母文件的固定语句。</p><p>图14是本发明第七实施例的超文本检索装置的方框图。</p><p>如图14所示,用于从贮存在超文本文件管理单元8的大量超文本文件里检索 一个或多个可能符合用户检索要求的文件的超文本检索装置61包括:带母文件 清单的文件表制备单元7;检索标引制备单元6;关键字输入单元2;检索单元 3;文件排序确定单元62,根据文件表制备单元7对检索单元3获得的每个文件 制备的文件表的文件信息,把一个特定超文本文件和一个或多个对应于该文件的 特定母文件统一成一种统一的特定超文本文件,在对出现在统一超文本文件标题 部分的特定字的出现频度加倍的条件下,对每个特定字和每个统一超文本文件计 算一个特定字在一个统一超文本文件中的出现频度TF,对每个特定字计算定为 其中出现一个特定字的特定超文本文件数之倒数值的倒数文件频度IDF,计算一 个出现频度TF与一个倒数文件频度IDF的乘积TF×IDF,把所有特定字的多 个乘积相加产生作为每个文件估算值的求总乘积,按估算值确定统一超文本文件 的多个重要度,按统一超文本文件的重要度确定诸文件的排位,对每个特定超文 本文件制备一个文件的标引,而检索结果显示单元63以文件排序确定单元62确 定的排序把诸文件的标引作为检索结果予以显示。</p><p>在上述结构中,每个统一超文本文件的标题部分包括一个对应于该统一超文 本文件的特定超文本文件的标题和同该文件有参照关系的特定母文件的一个或 多个固定语句。例如,在特定字在统一的特定超文本文件的标题部分出现三次的 条件下,若同一个关键字相符的特定字在一个统一超文本文件里出现六次,则出 现在统一超文本文件标题部分的特定字每次出现时作加倍计数,从而使该特定字 在统一超文本文件中的出现频度TF等于9。</p><p>之后,按出现频度TF=9编排对应于统一的特定超文本文件的一个特定超 文本文件。</p><p>这样,由于超文本文件的标题部分通常只表示文件的某个特征,而且出现在 统一的特定超文本文件标题部分的特定字要加倍计数,所以可进一步提高特定超 文本文件排序的可靠性。</p><p>在用超文本标记语言编写的HTML超文本文件中,用框有“<hl>”与”</hl>” 的字符串表示小标引,所以可行的办法是让小标引包括在HTML文件的标题部分 内。</p><p>本例中,出现在统一的特定超文本文件标题部分内的特定字的出现频度作了 加倍。然而,可行的办法是把特定字的出现频度提高到3倍或更多倍。 第八实施例</p><p>在万维网的超文本文件中,有一种专用的超文本文件,其中有几个固定语句 而没有其它任何语句。这种专用文件通常称为连接页,即使检索并显示了连接 页,但在连接页中并不存在符合用户检索愿望的任何有用信息。所以在本例中, 把特定字在连接页中的出现次数减为零。</p><p>图15是本发明第八实施例的超文本检索装置的方框图。</p><p>如图15所示,从贮存在超文本文件管理单元8的大量超文本文件中检索一个 或多个可能符合用户检索要求的文件的超文本检索装置71包括:带母文件清单 的文件表制备单元7,检索标引制备单元6;关键字输入单元2;检索单元3; 文件排序确定单元72,用于根据由文件表制备单元7对检索单元3获得的每个 特定超文本文件制备的文件表的文件信息,把一个特定超文本文件和对应于该文 件的一个或多个特定母文件统一成一种统一的特定超文本文件,从这些文件中限 定连接页,在作为统一超文本文件的一个特定母文件的连接页中每次出现特定字 时把特定字在连接页中的出现频度减1的条件下,对每个特定字和每个统一超文 本文件计算一个特定字在一个统一超文本文件中的出现频度TF,对每个特定字 计算定义为其中出现一个特定字的特定超文本文件数之倒数值的倒数文件频度 IDF,计算一个出现频度TF与一个倒数文件频度IDF的乘积TF×IDF,把所有 特定字的多个乘积相加而对每个特定超文本文件产生作为估算值的相加乘积,按 估算值确定统一的特定超文本文件的多个重要度,按统一超文本文件的重要度确 定诸文件的排序,对每个特定超文本文件制备一个特定超文本文件的标引,而检 索结果显示单元73以文件排序确定单元62确定的排序把诸文件的标引作为检索 结果来显示。</p><p>在上述结构中,超文本文件D82例如是一个与特定字“apple”相关的连接 页,由10个固定语句组成。所以,就存在着分别与超文本文件D82有参照关系 的10个参照文件。当计算出特定字“apple”在统一的特定超文本文件(包括被 当作一个特定超文本文件的一个参照文件和当作一个特定母文件的超文本文件 D82)中的出现频度后,在特定母文件D82中每发现一次特定字“apple”,就把 该特定字“apple”在文件D82(当作一个特定超文本文件)中的出现频度减1。这 一减少操作对所有当作特定超文本文件的参照文件都要执行。</p><p>这样,即使特定字“apple”在超文本文件D82中出现多次,特定字“apple” 在文件D82中的出现频度必然减至零,并把文件D82排到最低等级。</p><p>因此,起一个连接页作用的任何一个特定超文本文件总能被排到最低等级。 第九实施例</p><p>有一个长的超文本文件,它由多个分别对应于某一含义的字区组成,并在该 长文件每一字区顶部安置了一个参照标签。在本例中,把长文件分成多个字区, 并制备了对应于长文件每个字区的文件表。</p><p>图16是本发明第九实施例的超文本检索装置的方框图。</p><p>如图16所示,从贮存在超文本文件管理单元8的大量超文本文件中检索一个 或多个可能符合用户检索要求的超文本文件的超文本检索装置76包括:带母文 件清单的文件表制备单元77,用于分析其参照关系由管理单元8管理的诸超文 本文件,限定由多个分别对应于某一含义的字区组成的长文件,把该长文件的每 一字区规定为对应于一个含义的一个超文本文件,对每个超文本文件制备超文本 文件信息,其中,用一个文件标识符(用于标识一个文件和该文件的文件贮存位置) 列出了一个或多个标识一个或多个母文件的母文件标识符和母文件的固定语 句,并对所有由管理单元8管理的文件制备文件信息的文件表;检索标引制备单 元6;关键字输入单元2;检索单元3;文件排序确定单元4以及检索结果显示 单元73。</p><p>在上述结构中,如图17所示,在由多个分别对应于某一含义的字区组成的长 超文本文件D873存在于由超文本文件管理单元8管理的超文本文件中的情况 下,由带母文件清单的文件表制备单元77限定长文件D87,并找出分别安置在 长文件D87一个字区顶端的一个或多个参照标签。之后,把长文件D87分成多个 字区,而把每个字区定为一个超文本文件D87、D88或D89。此时,当用户读 取一个文件某一固定语句的字符串“ABC”或“xyz”时,用户可立即参照诸 如另一文件的“#ABC”或“#xyz”之类的参照标签。之后,以与第一实施例 同样的方式对所有文件制备超文本文件信息的超文本文件表。</p><p>这样,即使在文件中存在由分别对应于某一含义的多个字区组成的长超文本 文件,由于把长文件分成若干字区,而每个字区被定为一个超文本文件并对每个 长文件字区制备超文本文件信息,所以能编排分别与一个含义相关的超文本文 件,使用户方便地检索一组可能符合其要求的超文本文件。</p><p>本例中,在长超文本文件中使用围以“<hl>”与“</hl>”的字符串表示小标 引的情况下,可行的办法是在每个字区顶端安置一个参照标签或一个小标引的条 件下,把该长文件划分为多个字区。 第十实施例</p><p>在用户通过把原始关键字改为另一个关键字(与按原始关键字显示的多个特 定超文本文件相关)想再次检索多个超文本文件的情况下,用户总想肯定一个或多 个频繁出现在该文件中的字。因此在本例中,显示出经常出现在特定超文本文件 中的一个或多个字。</p><p>图18是本发明第十实施例的超文本检索装置的方框图。</p><p>如图18所示,用于从贮存在超文本文件管理单元8的大量超文本文件中检索 可能符合用户检索要求的一个或多个超文本文件的超文本检索装置91包括:带 母文件清单的文件表制备单元7;检索标引制备单元6;关键字输入单元2;检 索单元3;文件排序确定单元92,用于根据文件表制备单元7对检索单元3获得 的每个特定超文本文件制备的文件表的文件信息,把一个特定超文本文件和对应 于该文件的一个或多特定母文件统一成一种统一的特定超文本文件,对每个特定 字和每个统一超文本文件计算一个特定字在一个统一超文本文件中的出现频度 TF,对每个特定字计算倒数文件频度IDF(定义为其中出现一个特定字的特定超 文本文件数的倒数值),计算一个出现频度TF和一个倒数文件频度IDF的乘积TF ×IDF,把所有特定字的多个乘积相加得出的相加乘积作为每个文件的估算值, 按估算值确定诸统一超文本文件的多个重要度,按统一超文本文件的重要度确定 诸文件的排序,对每个文件制备一个文件的标引,从诸文件中选出多个高排位文 件,在对应于高排位文件的文件表的几段文件信息多个字清单中提取多个相关 字,对每个相关字和每个高排位文件计算一个相关字在一个高排位文件中的出现 频度TF,对每个相关字计算倒数文件频度IDF(定义为其中出现一个相关字的高 排位文件数的倒数值),对所有高排位文件计算多个乘积TF×IDF之和并把由此 产生的相加乘积作为每个相关字的重要度,把相关字的重要度互相比较,选出多 个高排位相关字(其重要度大于其它相关字的重要度),并制备超文本标记语言 (HTML)文件,其中以高排位相关字重要度的递减次序编排对应于高排位相关字 的多个关键字选择按钮,以便通过按一个关键字选择钮来选择一个高排位相关 字;以及检索结果显示单元93,用于在结果显示窗口W1上以文件排序确定92 确定的排序把特定超文本文件的标引作为检索结果显示出来,并在高排位相关字 选择窗口W2上显示由文件排序确定单元92制备的HTML文件。</p><p>在上述结构中,在把第十和第三实施例相结合的情况下,如图19所示,当把 关键字“apple”输入关键字输入单元2时,就以第三实施例同样的方式在结果 显示窗口W1上显示出诸如文件D83、D85和D86的多个标引以及诸如文件D80 与D81等母文件的多个标引。之后,在文件排序确定92中,从特定超文本文件 中选出10个高排位的文件,从对应于这些高排位文件的文件表几段文件信息的 多个字清单中取出多个相关字,对每个相关字计算所有高排位文件的多个乘积TF ×IDF之和,并确定相关字的重要度。之后,从诸相关字中选出10个高排位相 关字“Shinshu”、“farmer”、“Product”、“Aomori”、“manure”、 “farm”、“festival”、“Nebuta”、“Nagano”与“Olympics”,制备 HTML文件,其中对应于高排位相关字的10个关键字选择钮按高排位相关字的 重要度的递减次序排列,并在选择窗口W2上显示出HTML文件。</p><p>所以,当用户按下对应于高排位相关字“Shinshu”的关键字钮时,就把表 示苹果产区的该字“Shinshu”作为关键字送入关键字输入单元2,确定对应于 关键字“Shinshu”的多个特定超文本文件的重要度,并以第一例同样的方式在 显示窗口W1上显示出以重要度的递减次序排列的诸文件。</p><p>这样,即使用户最初无法想起合适的关键字,但用户仍能选择较接近于其检 索意图的一个或多个关键字。同时,用户能参照高排位相关字而改变其检索意 图,即可显示出对应于用户按其新的检索意图选择的新关键字的多个特定超文本 文件。</p><p>在这种情况下,用户可用指点器件而不用键盘来按下关键字选择钮。而且, 关键字选择钮的具体应用是操作一种在其中把高排位相关字加到文本盒的JAVA 手写体,“清除”钮用来操作JAVA手写体,其中把加到文本盒里的一个高排位 相关字清除掉,“初始条件”钮用来操作JAVA手写体,其中把加到文本盒里的 高排位相关字返回诸如“apple”一类的初始组关键字,而“再检索”钮用来操 作JAVA手写体,其中利用被作为一个或多个关键字被加到文本盒里的一个或多 个字再次操作检索运行。</p><p>本例中,从诸特定超文本文件中选出高排位文件。然而,从特定超文本文件 和母文件中选择高排位文件也是可行的。此时,可从相互有参照关系的多个文件 中广泛收集多个相关字。 第十一实施例</p><p>在第十实施例中,确定相关字的重要度同用户最初输入的关键字毫无关系。 然而,若用户希望选择同关键字密切相关的相关字,最好把同某一关键字密切相 关的相关字选为高排位的相关字。因此在本例中,把同某关键字密切相关的相关 字的出现频度增大一倍,以加强该相关字的重要度。</p><p>图20是本发明第十一实施例的超文本检索装置的方框图。</p><p>如图20所示,用于从贮存在超文本文件管理单元8的大量超文本文件中检索 可能符合用户检索要求的一个或多个超文本文件的超文本检索装置101包括:带 母文件清单的文件表制备单元7;检索标引制备单元6;关键字输入单元2;检 索单元3;文件排序确定单元102,用于根据文件表制备单元7对检索单元3获 得的每个特定超文本文件制备的文件表的文件信息,把一个特定超文本文件和对 应于该文件的一个或多个特定母文件统一成一种统一的特定超文本文件,对每个 特定字和每个统一超文本文件计算一个特定字在一个统一超文本文件中的出现 频度TF,对每个特定字计算倒数文件频度IDF(定义为其中出现一个特定字的特 定超文本文件数的倒数值),计算一个出现频度TF与一个倒数文件频度IDF的乘 积TF×IDF,把所有特定字的多个乘积相加以产生相加的乘积作为每个文件的 估算值,按估算值确定统一超文本文件的多个重要度,按统一超文本文件的重要 度确定诸文件的排位,对每个文件制备一个文件的标引,从诸文件中选出多个高 排位的文件,在对应于高排位文件的文件表文件信息段的多个字清单中提取多个 相关字,在相关字置于距离一个关键字40个字母范围内时加倍计算相关字的条 件下,对每个相关字和每个高排位文件计算一个相关字在一个高排位文件中的出 现频度TF,对每个相关字计算倒数文件频度IDF(定义为其中出现一个相关字的 高排位文件数的倒数值,计算所有高排位文件多个乘积TF×IDF之和并由此产 生的相加乘积作为每个相关字的重要度,比较相关字相互的重要度,选择多个其 重要度大于其它相关字重要度的高排位相关字,制备超文本标记语言(HTML)文 件,其中以高排位相关字的重要度的递减次序安置对应于高排位相关字的多个关 键字选择钮,以便按一个关键字选择钮就选出一个高排位相关字;以及检索结果 显示单元103,用于在显示窗口W1上以排序确定单元92确定的排序把诸文件的 标引作为检索结果显示出来,并在高排位相关字选择窗口W2上显示由排序确定 单元102制备的HTML文件。</p><p>在上述结构中,在以第十实施例同样的方法提取了相关字后,对每个相关字 和每个高排位文件计算一个相关字在一个高排位文件中的出现频度TF。此时, 当把该相关字置于距离一个关键字“apple”40个字母范围内时,就加倍计算该 相关字。所以,由于指示某个苹果产区的相关字“Shinshu”或相关字“farmer” 通常出现在距离一个关键字“apple”40个字母范围内,且由于指示苹果产区的 相关字“Nagano”或指示1998在Nagano举行喜庆活动的相关字“Olympics” 难以出现在距离一个关键字“apple”40个字母的范围内,如图21所示,所以 在高排位相关字选择窗口W2的前头部分可靠地显示出相关字“Shinshu”和 “farmer”,而在窗口W2的后面部分显示出相关字“Nagano”和“Olympics”, 尽管相关字“Nagano”和“Olympics”频繁地出现在该特定超文本文件里。</p><p>这样,同该关键字具有密切关系的一个或多个相关字能显示在高排位位置 上,而对应于用户不同于原先检索愿望的检索愿望的一个或多个相关字可以显示 在低排位位置上。</p><p>这里以较佳实施例对本发明原理作了示例和描述,这对本领域的熟炼人员显 得很明显,在不背离该原理的情况下可对本发明的结构与细节作出更改,我们认 为所有这些更改都包括在所附的<a href='/zhuanli/list-18298-1.html' target='_blank'><a href='/zhuanli/list-18345-1.html' target='_blank'><a href='/zhuanli/list-18377-1.html' target='_blank'><a href='/zhuanli/list-18406-1.html' target='_blank'>权利要求</a></a></a></a>范围内。</p></div> </div> <div> <ul class="layui-category-list"> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=文本文件" alt="文本文件" target="_blank">文本文件</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=文件" alt="文件" target="_blank">文件</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=文本" alt="文本" target="_blank">文本</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=检索" alt="检索" target="_blank">检索</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=特定" alt="特定" target="_blank">特定</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=排位" alt="排位" target="_blank">排位</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=超文本" alt="超文本" target="_blank">超文本</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=d83" alt="d83" target="_blank">d83</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=关键字" alt="关键字" target="_blank">关键字</a> </li> <li> <a class="layui-btn layui-btn-normal layui-btn-xs" href="/s?q=频度" alt="频度" target="_blank">频度</a> </li> </ul> </div> </div> </div> <div class="layui-col-xs12 layui-col-sm12 layui-col-md12"> <fieldset class="layui-elem-field layui-field-title site-title"> <legend><a name="onchange">相关专利内容</a></legend> </fieldset> <table class="layui-table" lay-size="sm"> <thead> <tr> <th width="60%">标题</th> <th>发布/更新时间</th> <th>阅读量</th> </tr> </thead> <tbody> <tr> <td><a href="/zhuanli/patent-18362-CN103106199B-6708b9a7f343c595e7c010bbff8d4cf5.html" target="_blank" alt="文本检索方法和装置">文本检索方法和装置</a></td> <td>2020-05-11</td> <td>772</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN104679871A-a54ae30f5190fa4c16c77e9a8d6e5ffe.html" target="_blank" alt="一种汉语文本检索方法及汉语文本检索装置">一种汉语文本检索方法及汉语文本检索装置</a></td> <td>2020-05-11</td> <td>444</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN103150371A-7405520b2b8a6478d808cdc5fd02aba7.html" target="_blank" alt="正反向训练去混淆文本检索方法">正反向训练去混淆文本检索方法</a></td> <td>2020-05-13</td> <td>6</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN102968429A-6e9a773448b3e38e05837c9bb0c4972a.html" target="_blank" alt="文本检索装置以及文本检索方法">文本检索装置以及文本检索方法</a></td> <td>2020-05-11</td> <td>971</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN101799835A-789597cdcc63c408e8783bf3868da84b.html" target="_blank" alt="一种本体驱动地理信息检索系统和检索方法">一种本体驱动地理信息检索系统和检索方法</a></td> <td>2020-05-12</td> <td>434</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN1109982C-d874fba071f5ffac298c1fc2eca67f6b.html" target="_blank" alt="检索相关超文本文件的超文本文件检索装置">检索相关超文本文件的超文本文件检索装置</a></td> <td>2020-05-11</td> <td>80</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN101021851B-efe90b144f056806d845cd7ce92fb922.html" target="_blank" alt="文本检索装置和文本检索方法">文本检索装置和文本检索方法</a></td> <td>2020-05-11</td> <td>715</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN103257995A-39e4a1753f99648225aa4fcc3b905cde.html" target="_blank" alt="文本检索装置以及文本检索方法">文本检索装置以及文本检索方法</a></td> <td>2020-05-11</td> <td>600</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN107330127A-c9d7f81b78a516fd9d58ad25edca7d41.html" target="_blank" alt="一种基于文本图片检索的相似文本检测方法">一种基于文本图片检索的相似文本检测方法</a></td> <td>2020-05-12</td> <td>276</td> </tr> <tr> <td><a href="/zhuanli/patent-18362-CN101329689B-f68a668658d0d077e793ba4bc2f63b75.html" target="_blank" alt="文本图像检索设备">文本图像检索设备</a></td> <td>2020-05-11</td> <td>201</td> </tr> </tbody> </table> </div> </div> </div> <div class="layui-col-xs12 layui-col-sm3 layui-col-md3"> <div class="lay-row layui-col-space10"> <div class="layui-col-xs12 layui-col-sm12 layui-col-md12"> <blockquote class="site-text layui-elem-quote"> <div style="font-size: 16px;font-weight: bold;text-align: center;">高效检索全球专利</div> <p class="lineH25">专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。</p> <p class="lineH25">我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。</p> <p class="lineH25"><a class="layui-btn layui-btn-xs layui-btn-normal" href="https://www.patenthub.cn/vip/try">申请试用</a></p> </blockquote> </div> <div class="layui-col-xs12 layui-col-sm12 layui-col-md12"> <div class="layui-card"> <div class="layui-card-header">分析报告</div> <div class="layui-card-body"> <p class="lineH25">专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。</p> <p class="lineH25"><a class="layui-btn layui-btn-xs layui-btn-normal" href="https://www.patenthub.cn/report/">申请试用</a></p> </div> </div> </div> <div class="layui-col-xs12 layui-col-sm12 layui-col-md12"> <div class="layui-card"> <div class="layui-card-header">检索本热门专利</div> <div class="layui-card-body"> <ul class="rank"> <li> <div> <em class="rank_index" style="background-color: orangered;">1</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN101206662B-6e469cb39314b17eee67cb30ab3b52f7.html" target="_blank" alt="文档检索设备和文档检索方法">文档检索设备和文档检索方法</a></span> </div> </li> <li> <div> <em class="rank_index" style="background-color: darkorange;">2</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN102081499A-3010e0c96e889b9d153644763d05c97a.html" target="_blank" alt="电子辞书装置以及电子辞书装置中的检索方法">电子辞书装置以及电子辞书装置中的检索方法</a></span> </div> </li> <li> <div> <em class="rank_index" style="background-color: orange;">3</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN110222054A-7e26b51d3c8ed76e2361872c30e8ed70.html" target="_blank" alt="一种提高检索速度的方法、装置、终端设备和存储介质">一种提高检索速度的方法、装置、终端设备和存储介质</a></span> </div> </li> <li> <div> <em class="rank_index" >4</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN106294613A-bf446eba95caa5e97ac95bac79ae4d02.html" target="_blank" alt="专利数据的检索方法和装置">专利数据的检索方法和装置</a></span> </div> </li> <li> <div> <em class="rank_index" >5</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN102799661A-6a29bd55ff0375cf3f52273b90d5e81f.html" target="_blank" alt="一种对电子文件进行语义检索的方法和系统">一种对电子文件进行语义检索的方法和系统</a></span> </div> </li> <li> <div> <em class="rank_index" >6</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN101894160A-36ac49b635327f07be8affd83eea7656.html" target="_blank" alt="一种智能检索方法">一种智能检索方法</a></span> </div> </li> <li> <div> <em class="rank_index" >7</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN108509487A-e62eedaea3e74d8251d6d92f4fb61488.html" target="_blank" alt="基于脉冲发放皮层模型的图像检索方法、设备及存储介质">基于脉冲发放皮层模型的图像检索方法、设备及存储介质</a></span> </div> </li> <li> <div> <em class="rank_index" >8</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN103577450B-6b8132b192d6ad636cc96e0b52ffb7c5.html" target="_blank" alt="提高检索速度的方法、系统及数字音视频点播方法、系统">提高检索速度的方法、系统及数字音视频点播方法、系统</a></span> </div> </li> <li> <div> <em class="rank_index" >9</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN108171692A-ae6e15d8a6601dbd111f0028a5e979f5.html" target="_blank" alt="一种肺部影像检索方法及装置">一种肺部影像检索方法及装置</a></span> </div> </li> <li> <div> <em class="rank_index" >10</em> <span class="rank_title"><a href="/zhuanli/patent-18362-CN107330360A-82898e4201957652cfb1ff0251d1d4bf.html" target="_blank" alt="一种行人衣着颜色识别、行人检索方法和装置">一种行人衣着颜色识别、行人检索方法和装置</a></span> </div> </li> </ul> </div> </div> </div> <div class="layui-col-xs12 layui-col-sm12 layui-col-md12"> <div class="layui-card"> <div class="layui-card-header">热门分类</div> <div class="layui-card-body"> <ul class="layui-category-list"> <li> <a href="/zhuanli/list-12058-1.html" target="_blank" alt="IT治理">IT治理</a> </li> <li> <a href="/zhuanli/list-12039-1.html" target="_blank" alt="比特币钱包">比特币钱包</a> </li> <li> <a href="/zhuanli/list-12089-1.html" target="_blank" alt="上市时间">上市时间</a> </li> <li> <a href="/zhuanli/list-12067-1.html" target="_blank" alt="框图">框图</a> </li> <li> <a href="/zhuanli/list-11994-1.html" target="_blank" alt="自动柜员机">自动柜员机</a> </li> <li> <a href="/zhuanli/list-12043-1.html" target="_blank" alt="区块链交易">区块链交易</a> </li> <li> <a href="/zhuanli/list-12006-1.html" target="_blank" alt="市场指令">市场指令</a> </li> <li> <a href="/zhuanli/list-12045-1.html" target="_blank" alt="临时别名">临时别名</a> </li> <li> <a href="/zhuanli/list-12031-1.html" target="_blank" alt="区块链">区块链</a> </li> <li> <a href="/zhuanli/list-12046-1.html" target="_blank" alt="账户身份服务系统">账户身份服务系统</a> </li> <li> <a href="/zhuanli/list-12090-1.html" target="_blank" alt="硬币接受器">硬币接受器</a> </li> <li> <a href="/zhuanli/list-12075-1.html" target="_blank" alt="购物车">购物车</a> </li> <li> <a href="/zhuanli/list-12007-1.html" target="_blank" alt="无现金支付">无现金支付</a> </li> <li> <a href="/zhuanli/list-12080-1.html" target="_blank" alt="货币化">货币化</a> </li> <li> <a href="/zhuanli/list-12005-1.html" target="_blank" alt="无限价指令">无限价指令</a> </li> <li> <a href="/zhuanli/list-12063-1.html" target="_blank" alt="复杂事件处理">复杂事件处理</a> </li> <li> <a href="/zhuanli/list-12065-1.html" target="_blank" alt="物品级存货单">物品级存货单</a> </li> <li> <a href="/zhuanli/list-11990-1.html" target="_blank" alt="电子商务">电子商务</a> </li> <li> <a href="/zhuanli/list-12028-1.html" target="_blank" alt="区块链账本">区块链账本</a> </li> <li> <a href="/zhuanli/list-12014-1.html" target="_blank" alt="加密货币">加密货币</a> </li> </ul> <div style="clear: both;"></div> </div> </div> </div> </div> </div> </div> <div style="clear: both;"></div> </div> <div class="fixed_utils" style="bottom: 100px;"> <a href="http://qm.qq.com/cgi-bin/qm/qr?_wv=1027&k=VwxlyAnwq7-Hi90YEOdNHtMakdc1y1ui&authKey=%2Bwyv3nvPBWe09DPuYDwI2%2F6MtPuUeJdgGiHBz5lvoNhKkOsiliuGHjItuZlOnDek&noverify=0&group_code=924368187" target="_blank" ><div class="qr_btn" >QQ群二维码</div></a> <div id="feedback" href="javascript:;" title="意见反馈">意见反馈</div> <div id="scrollUpBtn" href="javascript:;" title="回到顶部" style="display: none;"></div> <img class="qr_img" src="/images/qqqun.png" style="display: none; width: 320px;height: 390px;left:-350px;max-width: 350px;"> </div> <div class="small ui modal feedback-modal"> <i class="close icon"></i> <div class="header">意见反馈</div> <div class="content"> <form class="ui form" action="/user/feedback" method="POST" style="width: 500px;margin: auto"> <div class="ui error message" style="display: none;margin-left: 57px;width: 80%;"></div> <div class="inline field"> <label>反馈内容</label> <textarea name="content" style="width: 400px;"></textarea> </div> <div class="inline field"> <label>联系方式</label> <input style="width: 200px" type="text" name="contactWay" placeholder="联系方式"> </div> <div style="margin-left: 57px;margin-top: 20px;"> <a class="ui positive button submit-btn">提交反馈</a> </div> </form> </div> </div> <script> $(function () { $("#feedback").on("click", function () { $(".feedback-modal").modal("setting", "closable", false).modal('show'); }); $(".feedback-modal").on("click", ".submit-btn", function () { var $form = $(this).closest("form"); jQuery.ajax({ url: $form.attr("action"), type: $form.attr("method"), data: $form.serialize(), dataType: "JSON", success: function (result) { if (result.success) { alert("感谢您的反馈,我们会尽快处理您反馈的内容!"); $(".feedback-modal").modal('hide'); $form.find("input[name=content]").val(""); $form.find("input[name=contactWay]").val(""); } else { $(".feedback-modal .error").css("display", "block"); $(".feedback-modal .error").text(result.message); } } }); }); }); </script> <div id="remote-html"> </div> <div class="small ui modal vip-modal" style="height: 350px;"> <i class="close icon"></i> <div class="header">使用该功能遇到问题</div> <div class="content" style="padding: 50px 100px"> <h3 style="margin-top: 10px">该功能需要<span class="zyb">专业版</span><span class="zxb">企业版</span>VIP权限,您可以:</h3> <div style="margin-left: 100px;margin-top: 30px"> <a href="/vip/index.html" class="ui tiny green basic button" style="font-size: 14px">购买VIP</a> <a href="/vip/try.html" class="ui tiny orange basic button" style="margin-left: 40px;font-size: 14px">申请VIP试用</a> </div> <div style="margin-top: 30px"> <div style="margin-left: 50px;margin-top: 10px;font-size: 14px"> <div> 您也可以联系官方QQ: 2157717237     电话: 13264338900</div> </div> </div> </div> </div> <div class="ui divider footer-menu-divider" style="margin-top: 20px;"></div> <div class="footer-menu-wrapper" style="background-color: white;"> <div class="ui container"> <div class="ui grid"> <div class="three wide computer three wide tablet sixteen wide mobile column"> <div class="ui vertical text menu"> <div class="header item" style="font-size: 14px;">关于PatentHub</div> <a class="item" href="/%e5%85%b3%e4%ba%8e%e6%88%91%e4%bb%ac" target="_blank">关于我们</a> <a class="item" href="/%e4%bd%bf%e5%91%bd%e5%ae%97%e6%97%a8" target="_blank">使命宗旨</a> <a class="item" href="/%e5%8a%a0%e5%85%a5%e6%88%91%e4%bb%ac" target="_blank">加入我们</a> <a class="item" href="/%e8%81%94%e7%b3%bb%e6%88%91%e4%bb%ac" target="_blank">联系我们</a> <a class="item" href="/help/index.html" target="_blank">帮助中心</a> </div> </div> <div class="three wide computer three wide tablet eight wide mobile column"> <div class="ui vertical text menu"> <div class="header item" style="font-size: 14px;">PatentHub产品</div> <a class="item" href="/baike/index.html" target="_blank" title="专利百科">专利百科</a> <a class="item" href="/trade.html" target="_blank" title="专利交易转让运营">专利交易</a> <a href="http://business.patenthub.cn" class="item" target="_blank">业务平台</a> <a class="item" href="/trade.html" target="_blank" title="专利交易大厅">专利交易大厅</a> <a class="item" href="/trade/demand.html" target="_blank" title="专利需求大厅">专利需求大厅</a> </div> </div> <div class="three wide computer three wide tablet eight wide mobile column"> <div class="ui vertical text menu"> <div class="header item" style="font-size: 14px;"> </div> <a class="item" href="/api/interface.html" target="_blank" title="专利商标版权API接口">API接口</a> <a class="item" href="/data/service.html" title="数据定制" target="_blank">数据定制</a> <a class="item" href="/24xs" target="_blank" title="专利资讯新闻">专利资讯</a> <a class="item" href="/content/cnpatent.html" target="_blank" title="最新中国发明专利查询检索">最新中国发明专利</a> <a class="item" href="/content/uspatent.html" target="_blank" title="最新美国发明专利查询检索">最新美国发明专利</a> <a href="/help/video?vid=1" class="item" target="_blank" title="看视频学检索">看视频学检索</a> <a class="item" href="/tags-1.html" target="_blank" title="技术领域">技术领域</a> <a class="item" href="/zhuanli/index.html" target="_blank" title="专利库">专利库</a> <a class="item" href="/zhuanlifenlei/index.html" target="_blank" title="专利分类库">专利分类库</a> <a class="item" href="/cpc/index.html" target="_blank" title="国际专利分类库">国际专利分类库</a> </div> </div> <div class="three wide computer three wide tablet eight wide mobile column"> <div class="ui vertical text menu"> <div class="header item"> </div> <a class="item" href="http://www.mangdian.cc/exam/list-0-1.html" target="_blank" title="历年真题">历年真题</a> <a class="item" href="http://www.mangdian.cc/exam/start" target="_blank" title="模拟考试">模拟考试</a> <a class="item" href="http://www.mangdian.cc/data/list-1.html" target="_blank" title="专利资料库">资料库</a> <a class="item" href="http://www.mangdian.cc/question/list-0-1.html" target="_blank" title="问答专区">问答专区</a> <a class="item" href="http://www.mangdian.cc/category/list-original-0.html" target="_blank" title="专栏文章">专栏文章</a> <a href="http://www.mangdian.cc/category/list-2-%E4%B8%93%E5%88%A9%E6%B3%95.html" class="item" target="_blank" title="知识分享">知识分享</a> <a class="item" href="http://www.mangdian.cc/job" target="_blank" title="求职">求职</a> <a class="item" href="http://www.mangdian.cc/resume" target="_blank" title="招聘">招聘</a> <a class="item" href="http://www.mangdian.cc/agency/agency/total" target="_blank" title="代理所排行榜">代理所排行榜</a> <a class="item" href="http://www.mangdian.cc/agency/agent/total" target="_blank" title="代理人排行榜">代理人排行榜</a> <a class="item" href="http://www.mangdian.cc/agency/geographical/total" target="_blank" title="代理所地域排行榜">代理所地域排行榜</a> <a class="item" href="http://www.mangdian.cc/agency/s?type=agency&p=1&q=" target="_blank" title="找代理所排行榜">找代理所</a> <a class="item" href="http://www.mangdian.cc/agency/s?type=agent&p=1&q=" target="_blank" title="找代理人">找代理人</a> </div> </div> <div class="three wide computer three wide tablet sixteen wide mobile column"> <div class="ui vertical text menu" style="width: 20rem"> <div class="header item" style="font-size: 14px;">PatentHub联系方式</div> <a class="item" target="_blank"><span>官方Q群:924368187</span></a> <a class="item" target="_blank"><span>官方Q群:931673531</span></a> <a class="item" target="_blank"><span>官方Q群:529775260</span></a> <a class="item">商务QQ:<span>2157717237</span></a> <a class="item">运营QQ:<span>3307693423</span></a> <a class="item">电话:<span>13264338900</span></a> </div> </div> </div> </div> </div> <script> $(function () { $('.sina').hover( function () { $(".sina_img").show(); $(".wx_img").hide(); }, function () { $(".sina_img").hide(); $(".wx_img").show(); } ); }); function showLink() { alert("本次活动咨询或签约事宜请联系我司会员管家曹旭东\n" + "QQ:2157717237 电话:13264338900(微信)") } </script> <div class="ui divider"></div> <footer class="full wide" style="margin-bottom: 40px;"> <div class="ui content footer"> <div class="ui description"> <span>Copyright © 2018 北京南冥科技有限公司 <span class="footer-divider"></span>备案号:<a href="https://beian.miit.gov.cn">京ICP备16030233号-1</a></span><br> </div> </div> </footer> </div> <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> <script> /*$(document).on("click", "a", function(e) { var $a = $(this); var t = $("meta[name=_t]").attr("content");// 获取t, 可以先写到html>head>meta里 alert(t); if(t!=''){ if (!$a.data("_t")) { var href = $a.href; if (href.indexOf("?") == -1) { href = href + "?_t=" + t; } else { href = href + "&_t=" + t; } $a.data("_t", t); } } })*/ </script> <div style="display: none;"> <script type="text/javascript"> var _czc = _czc || []; _czc.push(["_setAccount", "1259408509"]); _czc.push(["_setCustomVar", "uc", "20240528213400JtnutTGCDCvcPQFCRo"]); _czc.push(["_setCustomVar", "source", "b64:ZGlyZWN0CW51bGwJL2NvbnRlbnQvQ04xMDQzNDc4MzRBCTMuMTQxLjE3MC4yMA=="]); _czc.push(["_setCustomVar", "module", "/zhuanli"]); _czc.push(["_setCustomVar", "ip", "3.141.170.20"]); _czc.push(["_setCustomVar", "level", "0"]); var cnzz_protocol = (("https:" == document.location.protocol) ? " https://" : " http://");document.write(unescape("%3Cspan id='cnzz_stat_icon_1259408509'%3E%3C/span%3E%3Cscript src='" + cnzz_protocol + "s11.cnzz.com/z_stat.php%3Fid%3D1259408509' type='text/javascript'%3E%3C/script%3E"));</script> </div> </body> </html>