首页 / 专利库 / 专利权 / 专利合作条约 / 第II章 / 根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置

根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置

阅读:107发布:2020-05-18

专利汇可以提供根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置专利检索,专利查询,专利分析的服务。并且本文所述系统生成与来自不同出版商的多个印刷出版物相关的搜索索引和超级链接 数据库 。搜索索引包括来自印刷出版物的多个词和/或短语。搜索索引最好根据从相关出版商收到的印刷数据。超级链接数据库从逻辑上使出版物命中规范与网络地址相关。出版物命中规范标识印刷数据的一部分。例如,出版物命中规范可以是通过国际标准图书编号(ISBN)标识书的数据记录,按页码识别的书中的一页或多页,以及按词的文本识别的书中一个或多个词。网络地址最好指向网页。超级链接数据库根据从出版商授权的管理员(例如由内容创作者和/或 版权 所有者提供了口令的人)收到的网络地址。随后,系统能够通过使用搜索索引和超级链接数据库使从客户机设备收到的搜索查询与网络地址相关,从而将客户机设备引导到特定网页,以响应于收到的查询。,下面是根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置专利的具体信息内容。

1.一种为客户机设备提供网页的方法,所述方法包括以下步骤:
从第一出版商接收第一印刷数据,所述第一印刷数据表示第一 印刷出版物;
从第二出版商接收第二印刷数据,所述第二印刷数据表示第二 印刷出版物,所述第一印刷数据不同于所述第二印刷数据,所述第 一出版商不同于所述第二出版商;
从所述第一印刷数据和所述第二印刷数据生成搜索索引,所述 搜索索引便利了所述第一印刷数据和所述第二印刷数据的全文搜 索;
从所述第一出版商授权的第一链接管理员那里接收第一多个出 版物链接,所述第一多个出版物链接中的每一个将第一多个出版物 命中规范中的每一个与第一多个网络地址中的每一个关联,所述第 一多个出版物命中规范中的每一个标识所述第一印刷数据的一部 分;
从所述第二出版商授权的第二链接管理员那里接收第二多个出 版物链接,所述第二多个出版物链接中的每一个将第二多个出版物 命中规范中的每一个与第二多个网络地址中的每一个关联,所述第 二多个出版物命中规范中的每一个标识所述第二印刷数据的一部 分;
所述第一多个出版物链接不同于所述第二多个出版物链接,所 述第一链接管理员没有提交将所述第二多个出版物命中规范的出版 物命中规范与任何网络地址关联的出版物链接的授权,所述第二链 接管理员没有提交将所述第一多个出版物命中规范的出版物命中规 范与任何网络地址关联的出版物链接的授权;
经网络从所述客户机设备接收搜索查询;
根据所述搜索索引,使所述查询与包含在所述第一多个出版物 命中规范以及所述第二多个出版物命中规范中的至少一个出版物命 中规范相关;
确定包含在所述第一多个网络地址中的目标网络地址,所述目 标网络地址通过所述第一多个出版物链接与所述至少一个出版物命 中规范关联;以及
将与所述目标网络地址相关的数据经所述网络发送到所述客户 机设备。
2.如权利要求1所述的方法,其特征在于接收第一多个出版物 链接的所述步骤包括接收页链接的步骤,所述页链接包括表示所述 第一印刷出版物中的单个页的出版物命中规范,所述页链接使所述 单个页与第一网络地址相关。
3.如权利要求2所述的方法,其特征在于接收第一多个出版物 链接的所述步骤包括接收章链接的步骤,所述章链接包括表示与所 述第一印刷出版物中的章相关的一组页的出版物命中规范,所述章 链接将所述页的组与第二网络地址关联,所述第二网络地址不同于 所述第一网络地址,所述章链接具有比所述页链接低的优先次序。
4.如权利要求1所述的方法,其特征在于从所述客户机设备接 收搜索查询的所述步骤包括接收搜索参数的步骤,所述搜索参数表 示限制到所述搜索索引的搜索。
5.如权利要求1所述的方法,其特征在于还包括使用所述搜索 查询搜索网页索引的步骤。
6.如权利要求4所述的方法,其特征在于从所述客户机设备接 收搜索查询的所述步骤包括接收数字图像的步骤。
7.如权利要求4所述的方法,其特征在于从所述客户机设备接 收搜索查询的所述步骤包括接收从数字图像得到的文本的步骤。
8.如权利要求4所述的方法,其特征在于从所述客户机设备接 收搜索查询的所述步骤包括接收出版物标识符的步骤。
9.如权利要求1所述的方法,其特征在于发送与所述目标网络 地址有关的数据的所述步骤包括发送重定向消息的步骤。
10.如权利要求1所述的方法,其特征在于发送与所述目标网 络地址有关的数据的所述步骤包括发送网页数据的步骤。
11.如权利要求1所述的方法,其特征在于发送与所述目标网 络地址有关的数据的所述步骤包括发送超级链接数据的步骤。
12.如权利要求1所述的方法,其特征在于还包括存储与所述 搜索查询有关的人口统计信息的步骤。
13.一种根据印刷出版物为客户机设备提供网页的方法,所述 方法包括以下步骤:
从印刷数据生成搜索索引,所述印刷数据表示所述印刷出版物, 所述搜索索引使所述印刷出版物中的多个词与所述多个词在所述印 刷出版物中出现的多个页码相关;
从授权出版商接收多个页码链接,各个页码链接使所述印刷出 版物中的特定页与一个网络地址相关;
经网络从所述客户机设备接收出版物查询;所述出版物查询包 括出版物标识符和搜索项;
根据所述搜索索引使所述出版物查询与所述印刷出版物的目标 页码相关;
根据所述目标页码从所述多个页码链接检索目标网络地址;以 及
经所述网络将与所述目标网络地址相关的数据发送到所述客户 机设备。
14.如权利要求13所述的方法,其特征在于从印刷数据生成搜 索索引的所述步骤包括在与所述印刷出版物相关的印刷过程期间, 从所述印刷数据生成所述搜索索引的步骤。
15.如权利要求13所述的方法,其特征在于从印刷数据生成搜 索索引的所述步骤包括以下步骤:
光扫描所述印刷出版物,以产生多个数字化页;以及
在所述数字化页上执行字符识别过程。
16.如权利要求13所述的方法,其特征在于从印刷数据生成搜 索索引的所述步骤包括根据与某个词相关的可见指示符选择词,以 包括在所述多个词中的步骤。
17.如权利要求16所述的方法,其特征在于选择词以包括在所 述多个词中的所述步骤包括根据与所述词相关的字体、字形以及字 号中的至少一个选择所述词的步骤。
18.如权利要求16所述的方法,其特征在于选择词以包括在所 述多个词中的所述步骤包括根据与所述词相关的图形指示符选择所 述词的步骤。
19.如权利要求18所述的方法,其特征在于根据与所述词相关 的图形指示符选择所述词的所述步骤包括根据与所述词相关的图标 和边框中的至少一个选择所述词的步骤。
20.如权利要求13所述的方法,其特征在于存储多个页码链接 的所述步骤包括存储章链接的步骤,所述章链接表示通过所述印刷 出版物中的章相关的一组页。
21.如权利要求20所述的方法,其特征在于存储章链接的所述 步骤包括以低于定位所述章中的页的特定页码链接的优先次序存储 所述章链接的步骤。
22.如权利要求21所述的方法,其特征在于存储多个页码链接 的所述步骤包括存储出版物标题链接的步骤,所述出版物标题链接 表示所述印刷出版物中的所有页,所述出版物标题链接以低于所述 章链接的优先次序进行存储。
23.如权利要求22所述的方法,其特征在于存储多个页码链接 的所述步骤包括存储出版商链接的步骤,所述出版商链接表示所述 印刷出版物中的所有页以及第二印刷出版物中的所有页,所述出版 商链接以低于所述出版物标题链接的优先次序存储。
24.如权利要求13所述的方法,其特征在于存储多个页码链接 的所述步骤包括使所述印刷出版物中的所述特定页与因特网地址相 关的步骤。
25.如权利要求13所述的方法,其特征在于从所述客户机设备 接收出版物查询的所述步骤包括接收出版物标题、页码、注册短语 以及外语指示符中的至少一个的步骤。
26.如权利要求13所述的方法,其特征在于从所述客户机设备 接收出版物查询的所述步骤包括接收在所述客户机设备输入的声音 输入的步骤。
27.如权利要求13所述的方法,其特征在于经网络从所述客户 机设备接收出版物查询的所述步骤包括经所述因特网从所述客户机 设备接收所述出版物查询的步骤。
28.如权利要求13所述的方法,其特征在于发送与所述目标网 络地址相关的数据的所述步骤包括发送重定向消息、网页数据以及 超级链接数据中的至少一个的步骤。
29.如权利要求13所述的方法,其特征在于发送与所述目标网 络地址相关的数据的所述步骤包括发送第二印刷出版物的数字版本 的步骤。
30.如权利要求13所述的方法,其特征在于还包括存储与所述 出版物查询相关的人口统计信息的步骤。
31.一种用于根据印刷出版物为客户机设备提供网页的装置, 所述装置包括:
存储设备,它存储(i)在与所述印刷出版物相关的印刷过程期 间所用的印刷数据生成的搜索索引,所述印刷数据表示所述印刷出 版物,以及(ii)多个链接,各个链接使来自所述搜索索引的索引项 与网络地址相关;
网络接收器,它被配置为经网络从所述客户机设备接收查询;
网络发送器,它被配置为经所述网络将与目标网络地址相关的 数据发送到所述客户机设备;以及
控制器,它在工作时耦合到所述存储设备、所述网络接收器以 及所述网络发送器,所述控制器被配置为根据所述搜索索引和所述 多个链接,使所述查询与所述目标网络地址相关,所述控制器被配 置为所述网络发送器经所述网络将与所述网络地址有关的数据发送 到所述客户机设备,以响应于所述查询。
32.如权利要求31所述的装置,其特征在于还包括光扫描仪, 它被配置为将所述印刷出版物转换为位图;以及光学字符识别系统, 它被配置为将所述位图转换为所述印刷数据。
33.如权利要求31所述的装置,其特征在于所述控制器被配置 为检测与所述印刷数据中的词相关的预定义可见指示符,所述控制 器还被配置为将与所述预定义可见指示符相关的所述词存储在所述 存储设备中,作为所述搜索索引的一部分。
34.如权利要求33所述的装置,其特征在于所述控制器还被配 置为检测预定义字体、预定义字形、预定义字号、预定义图标以及 预定义边框中的至少一种。
35.如权利要求31所述的装置,其特征在于存储在所述存储设 备中的所述搜索索引包括多个页码链接,各个页码链接使所述印刷 出版物中的特定页与特定网络地址相关。
36.如权利要求35所述的装置,其特征在于存储在所述存储设 备中的所述搜索索引包括章链接,所述章链接表示按所述印刷出版 物中的章相关的一组页,以比定位所述章中的页的特定页码链接低 的优先次序存储所述章链接。
37.如权利要求31所述的装置,其特征在于与所述网络地址相 关的所述数据包括重定向消息、网页以及超级链接中的至少一个。
38.如权利要求31所述的装置,其特征在于与所述网络地址相 关的所述数据包括第二印刷出版物的数字版本。
39.一种用于经网络为客户机设备提供与印刷出版物相关的网 页的装置,所述装置包括:
印刷机系统;
索引生成模,它在工作时耦合到所述印刷机系统,所述索引 生成模块被配置为从所述印刷机系统接收印刷数据,所述印刷数据 表示所述印刷出版物,所述索引生成模块被配置为使用所述印刷数 据生成搜索索引,所述搜索索引使所述印刷出版物中的多个词与所 述多个词在所述印刷出版物中出现的多个页码相关;
链接数据库,所述链接数据库保存多个页码链接,各个页码链 接使所述印刷出版物中的特定页与网络地址相关;
网络接收器,它在工作时耦合到所述网络,所述网络接收器被 配置为接收出版物查询;
相关单元,它在工作时耦合到所述网络接收器和所述链接数据 库,所述相关单元被配置为根据所述搜索索引以及所述出版物查询 确定所述印刷出版物的目标页码,所述相关单元被配置为根据所述 目标页码从所述链接数据库中检索目标网络地址;以及
网络发送器,它在工作时耦合到所述网络以及所述相关单元, 所述网络发送器被配置为经所述网络将与所述目标网络地址相关的 数据发送到所述客户机设备。
40.如权利要求39所述的装置,其特征在于所述索引生成系统 还被配置为根据与所述多个词相关的标记确定所述多个词,所述标 记包括在从所述印刷机系统收到的所述印刷数据中。

说明书全文

技术领域

发明一般涉及搜索因特网上可得到的数据。具体地说,涉及 用于根据印刷出版物向客户机设备提供网页的方法和装置。

背景

阅读诸如书或杂志文章等印刷出版物的人可能想要有关某个主 题的更多信息。一般来说,想要在因特网上寻找信息的人们使用搜 索引擎。搜索引擎允许用户对包含感兴趣信息的网页进行关键词搜 索。但是,这种搜索经常是失败的。在搜索引擎搜集了可能网站的 长列表之后,搜索人必须手动地在各页之间搜索信息。此过程是耗 时的。另外,传统的万维网搜索并不包括印刷出版物的搜索。

经常将阅读印刷出版物的人们引导到特定网页,在那里可以找 到特别按作者或出版商选择的更多信息。达到这个目的的一种方法 是在印刷出版物中印刷统一资源定位器(URL)(如 www.publisher.com/booktitle/moreinfo)。将读者引导到网页的另一种 机制是在印刷出版物上印刷条形码。然后,读者扫描这种条形码, 同时相关软件将连接计算机引导到适当的网页。但是,在印刷出版 物中放置大量的URL和/或条形码将分散读者的注意,另外浪费了 印刷出版物中为内容保留的空间。另外,键入长的URL是很麻烦的, 并且许多人没有连接到他们的计算机的条形码阅读器

发明概述

根据本发明的一个方面,提供了一种向客户机设备提供网页的 方法。该方法包括从第一出版商接收第一印刷数据以及从第二出版 商接收第二印刷数据的步骤。第一印刷数据表示第一印刷出版物, 而第二印刷数据表示第二印刷出版物。第一印刷数据不同于第二印 刷数据,并且第一出版商不同于第二出版商。该方法还包括从第一 印刷数据和第二印刷数据生成搜索索引的步骤。搜索索引便利了第 一印刷数据和第二印刷数据的全文搜索。更进一步,该方法还包括 从第一出版商授权的第一链接管理员那里接收第一多个出版物链接 的步骤。第一多个出版物链接中的每一个将第一多个出版物命中规 范中的每一个与第一多个网络地址中的每一个关联。第一多个出版 物命中规范中的每一个标识第一印刷数据的一部分。类似的,该方 法包括从第二出版商授权的第二链接管理员那里接收第二多个出版 物链接的步骤。第二多个出版物链接中的每一个将第二多个出版物 命中规范中的每一个与第二多个网络地址中的每一个关联。第二多 个出版物命中规范中的每一个标识第二印刷数据的一部分。第一多 个出版物链接不同于第二多个出版物链接。第一链接管理员最好没 有提交将第二多个出版物命中规范的出版物命中规范与任何网络地 址相关联的出版物链接的授权。类似的,第二链接管理员最好没有 提交将第一多个出版物命中规范的出版物命中规范与任何网络地址 相关联的出版物链接的授权。该方法还包括经网络从客户机设备接 收搜索查询,并根据搜索索引,使该查询与包括在第一多个出版物 命中规范和第二多个出版物命中规范中的至少一个出版物命中规范 相关的步骤。更进一步,该方法包括确定第一多个网络地址中包括 的目标网络地址的步骤。通过第一多个出版物链接,目标网络地址 与至少一个出版物命中规范相关联。另外,该方法包括经网络将与 目标网络地址相关的数据发送到客户机设备的步骤。

在一个实施例中,从客户机设备接收搜索查询的步骤包括接收 数字图像的步骤。在一些实施例中,从客户机设备接收搜索查询的 步骤包括接收从数字图像得到文字的步骤。

根据本发明的另一方面,提供了一种根据印刷出版物向客户机 设备提供网页的方法。该方法包括从印刷数据生成搜索索引的步骤。 印刷数据最好表示印刷出版物,而搜索索引最好从逻辑上将印刷出 版物中的多个词和/或短语中的每一个与每个这样的词或短语在印刷 出版物中出现的一个或多个页码关联。该方法还包括从授权出版商 接收多个页码链接的步骤。每个页码链接最好从逻辑上将印刷出版 物中的特定页与网络地址关联。更进一步,该方法包括经网络从客 户机设备接收出版物查询的步骤。出版物查询可包括出版物标识符 以及搜索项。更进一步,该方法包括根据搜索索引,使出版物查询 与印刷出版物的目标页码相关的步骤。该方法还包括根据目标页码 从多个页码链接检索目标网络地址,以及经网络将与目标网络地址 有关的数据发送到客户机设备的步骤。

在一个实施例中,从印刷数据生成搜索索引的步骤包括在与印 刷出版物相关的印刷过程中,从印刷数据生成搜索索引的步骤。在 另一实施例中,从印刷数据生成搜索索引的步骤包括光扫描印刷出 版物以产生多个数字化页面,以及在数字化页面上进行字符识别过 程的步骤。在一个实施例中,从印刷数据生成搜索索引的步骤包括 根据与某个词相关的可视指示符,选择该词以包括在多个词中的步 骤。在这种情况下,选择词以包括在多个词中的步骤可包括根据至 少字体、字形、字号、图形指示符、图标以及与该词相关的边框来 选择词的步骤。

在另一实施例中,存储多个页码链接的步骤包括存储章链接的 步骤。在这种情况下,章链接最好从逻辑上将印刷出版物中的一组 连续页与网络地址关联。章链接最好以比特定页码链接低的优先次 序存储。类似的,存储多个页码链接的步骤可包括存储出版物标题 链接的步骤。在这种情况下,出版物标题链接最好从逻辑上将印刷 出版物中的所有页与网络地址关联。出版物标题链接最好以比任何 章链接低的优先次序存储。更进一步,存储多个页码链接的步骤可 包括存储出版商链接的步骤。在这种情况下,出版商链接最好从逻 辑上将第一印刷出版物中的所有页和第二印刷出版物中的所有页与 网络地址关联。出版商链接最好以比任何出版物标题链接低的优先 次序存储。

在一个实施例中,从客户机设备接收出版物查询的步骤包括接 收出版物标题、页码、注册短语以及外语指示符中的至少一个的步 骤。在一个实施例中,发送与目标网络地址有关的数据的步骤包括 发送重定向消息、网页数据、超级链接数据以及第二印刷出版物的 数字版本中至少一个的步骤。

另外根据本发明的另一方面,提供了一种根据印刷出版物向客 户机设备提供网页的装置。该装置包括存储设备,它存储在从印刷 出版物相关的印刷过程期间使用的印刷数据生成的搜索索引。印刷 数据最好表示印刷出版物。存储设备还存储多个链接。每个链接最 好从逻辑上将来自搜索索引的索引项与网络地址关联。该装置还包 括网络

接收器,它被配置为经网络从客户机设备接收查询;以及网络 发送器,它被配置为经网络将与目标网络地址相关的数据发送到客 户机设备。更进一步,该装置包括控制器,它在工作时耦合到存储 设备、网络接收器以及网络发送器。控制器最好被配置为根据搜索 索引以及多个链接使查询与目标网络地址相关。控制器最好还被配 置为使网络发送器经网络将与目标网络地址相关的数据发送到客户 机设备,以响应于查询。

在一个实施例中,该装置还包括光扫描仪,它被配置为将印刷 出版物转换为位图;以及光学字符识别系统,它被配置为将位图转 换为印刷数据。

附图概述

对于本领域的普通技术人员来说,所公开系统的特性和优点将 在参考附图的例示实施例的详细描述中显而易见,下面提供了附图 的概述。

图1是说明用于本发明的例示环境的通信系统的高级框图

图2是图1所示的客户机设备之一的更详细框图。

图3是示意图1所示的出版物链接服务器的一个实施例的更详 细框图。

图4是示意图1所示的出版物链接服务器的另一实施例的更详 细框图。

图5是程序的流程图,该程序被配置为使嵌入在图1的出版物 链接服务器中的微处理器创建搜索索引和链接数据库

图6是另一程序的流程图,该程序被配置为使其能够使嵌入在 图1的出版物链接服务器中的微处理器根据印刷出版物,将客户机 设备引导到网页。

图7是说明两个例示出版物链接的表,其中包括出版物命中规 范以及相关网络地址。

优选实施例详述

一般来说,本文中描述的系统生成与来自不同出版商的多个印 刷出版物相关的搜索索引和超级链接数据库。搜索索引包括来自印 刷出版物的多个词和/或短语。搜索索引最好根据从相关出版商收到 的印刷数据。超级链接数据库从逻辑上将出版物命中规范与网络地 址关联。出版物命中规范标识印刷数据的一部分。例如,出版物命 中规范可以是数据记录,它按国际标准图书编号(ISBN)对书进行 识别,按页码识别书中的一页或多页,按词的文本识别书中的一个 或多个词。网络地址最好指向网页。超级链接数据库根据从出版商 授权的管理员那里收到的网络地址(如由内容创作者和/或版权所有 者提供了口令的人)。随后,系统能够通过利用搜索索引以及超级 链接数据库使收到的查询与网络地址相关,将客户机设备引导到特 定网页,以响应于从客户机设备收到的搜索查询。

图1中示意了能够采用本发明的内容的例示通信系统100的高 级框图。一般来说,系统100包括一个或多个客户机设备102、一个 或多个出版物链接服务器104、一个或多个网页服务器106、一个或 多个出版商服务器107以及索引器120。这些设备中的每一个可以经 因特网或某种其它广域网108的连接互相进行通信。

一般来说,出版物链接服务器104存储由客户机设备120使用 的多个文件、程序和/或网页。一个出版物链接服务器104可处理来 自大量客户机102的信息。因此,出版物链接服务器104一般是具 有大存储容量、一个或多个快速微处理器以及一个或多个高速网络 连接的高端计算机。相反地,相对与典型的服务器104,各个客户机 设备102一般包括较低存储容量、单个微处理器以及单个网络连接。

一个或多个SQL(结构化查询语言)服务器110最好与出版物 链接服务器104进行通信。SQL服务器110最好至少包括搜索索引 110a、链接数据库110b以及人口统计数据库110c。搜索索引110a 包括来自印刷出版物的多个词和/或短语。如本文所使用的,术语“印 刷出版物”指的是任何类型的印刷出版物,比如书、杂志、论文集、 小册子等。索引词或和短语最好从逻辑上与这些词和/或短语在印刷 出版物中出现的一个或多个页码关联。搜索索引110a最好由索引器 120从印刷数据112中生成。印刷数据112是表示印刷出版物的数据。 例如,印刷数据112可以是在与出版物相关的印刷过程114期间使 用的数据。以这种方式,在印刷过程114期间,可以自动生成一些 或所有的搜索索引110a。但是,本领域的普通技术人员将容易地理 解,可以在使用印刷数据112生成印刷出版物之前和/或之后生成搜 索索引110a。类似的,可以使用任何类型的计算机可读媒体和/或网 络以将印刷数据112发送到索引器120,其中可以有或没有相关印刷 过程114。或者,通过光扫描仪116可以使现有出版物数字化,并且 可由光学字符识别过程118以众所周知的方法进行处理。这个备选 方法对于绝版的出版物特别有用。

可以根据任何已知的索引标准来选择从印刷数据112提取的词 和短语。例如,可以选择某些预定关键词。每个出版物中的所有词 最好全部是带索引的。但是,可以从索引中去掉某些诸如“is(是)”、 “and(和)”、“but(但是)”、“or(或)”、“the(该)”、 “a(一个)”等高频率出现的词。在一个实施例中,由一个或多个 标记表示印刷数据112中的关键短语。标记可以在印刷出版物印刷 时使可视表示与短语相关。另外,标记可被用于标记词或短语,从 而表示该词或短语应该被包括在搜索索引110a中。例如,可以为搜 索索引110a中的每个短语或词建立一个或多个属性(如字体属性、 图形属性和/或不可见属性)。字体属性包括但不限于,字体(如Arial、 Courier、Times等)、字形(如斜体字、反向斜体字、带下划线的粗 体等)和/或字号(如10号、12号等)。图形属性包括但不限于, 图标、符号、图片和/或边框。例如,可以将短语放在边框中或图标 旁边。不可见属性可以是诸如元标记的任何类型的已知嵌入码。如 下所述,通过使用诸如字体属性和图形属性等可见属性,可以可见 地通知出版物的读者,加亮短语可能被用作“出版物链接”。在一 个实施例中,标记包括超文本标记语言(HTML)标记。例如,可移 植文档格式(PDF)文件可能明确地包括超级链接。

链接数据库110b最好包括多个出版物链接(见图7)。每个出 版物链接从逻辑上将一个或多个出版物命中规范与诸如因特网地址 (如URL)的网络地址关联。出版物命中规范标识印刷数据的一部 分。例如,出版物命中规范可以是数据记录,它通过国际标准图书 编号(ISBN)识别书、通过页码识别书中的一页或多页、以及通过 词中的文本识别书中的一个或多个词。当然,本领域的普通技术人 员将容易地理解,可以在出版物命中规范中使用标识任何出版物的 任何部分的任何数据。例如,可以使用出版物类型、出版物标题、 出版物日期等。网络地址可以是诸如因特网协议(IP)地址的任何类 型的网络地址。网络地址最好指向位于网页服务器106上的网页。 除词和页之外,印刷出版物的其它方面可以具有相关网络地址。例 如,书的一章或多章、整本书和/或书的出版商可以具有相关的网络 地址。

如果一个以上的网络地址从逻辑上与同一词或页关联,则建立 优先次序。单独的页最好具有比章更高的优先级,而章具有比书更 高的优先级,书又具有比出版商更高的优先级。例如,假设书A从 逻辑上与地址A关联,书A的第一章从逻辑上与地址B关联,第一 章的第一页从逻辑上与地址C关联,并且第一章的第二页没有单独 与一个地址关联。第一页上的“命中”(下面进行详细描述)将用 户引导到地址C,但是第二页上的命中将用户引导到地址B。类似的, 如果书A中的某一页没有单独与一个地址关联,并且该页的章没有 从逻辑上与一个地址关联,则将地址A(该地址从逻辑上与整本书 关联)用作那页的命中。以这种方式,出版商能够为印刷出版物的 每一页建立链接,并没有建立大量单个链接的负担。另一方面,如 果需要,出版商能够创建页特有的链接。

图2中示意了客户机设备102的更详细框图。为了简化描述, 在本描述中,个人计算机被用作例示客户机设备102。但是,本领域 的普通技术人员将容易地理解,任何通信设备可被用作客户机102。 例如,无线电话或个人数字助理(PDA)可以是客户机设备102。在 一个实施例中,无线电话或PDA包括数字照相机。在本实施例中, 搜索查询可以是页的数字图像。

客户机102包括控制器202,控制器202最好包括中央处理单元 (CPU)204,CPU 204通过地址/数据总线206电耦合到存储设备208 以及一个或多个接口电路210。CPU 204可以是诸如Intel PentiumTM 处理器的任何类型的已知CPU。存储设备208最好包括易失性存储 器和非易失性存储器。如下所述,存储设备208最好存储软件程序, 它与出版物链接服务器104交互作用。该程序208可以由CPU 204 以众所周知的方式执行。存储设备208还可以存储数字数据,这些 数字数据表示从出版物链接服务器104检索的、和/或从网页服务器 106检索的、和/或经输入设备212载入的文档、文件、程序、网页 等。

可以使用任何类型的已知接口标准实现接口电路210,比如以太 网和/或通用串行总线(USB)。可以将一个或多个输入设备212连 接到一个或多个接口电路210,用于将数据和命令输入控制器202中。 例如,输入设备212可以是键盘、数字照相机、鼠标触摸屏、轨 迹板、轨迹球、isopoint(同位点)和/或语音识别系统。

也可以经一个或多个接口电路210将一个或多个显示器、打印 机和/或其它输出设备214连接到控制器202。显示器214可以是阴 极射线管(CRT)、液晶显示器(LCD)或任何其它类型的显示器。 显示器214生成在客户机102的操作期间生成的数据的可见显示。 显示器214一般用于显示从出版物链接服务器104和/或网页服务器 106收到的网页。可见显示可包括用于操作员输入、运行时间统计、 计算值、检验数据等的提示。

客户机102还可以经与网络108的连接与其它设备交换数据。 网络连接可以是任何类型的任何连接形式的修改,比如以太网连接、 数字用户线(DSL)、电话线、同轴电缆、无线连接等。可以要求系 统100的用户向出版物链接服务器104注册。在这种情况下,各用 户可选择用户标识符以及激活业务可能需要的口令。可以使用嵌入 在用户浏览器中的加密经因特网108传递用户标识符和口令。或者, 可以由出版物链接服务器104分配用户标识符和/或口令。

图3示意了出版物链接服务器104的更详细框图。与客户机设 备102类似,出版物链接服务器104中的控制器302最好包括中央 处理单元(CPU)304,CPU 304通过地址/数据总线306电耦合到存 储设备308和网络接口电路310。但是,服务器控制器302一般比客 户机控制器更强大。另外,CPU 304可以是诸如Intel PentiumTM处理 器的任何类型的已知CPU,并且存储设备308最好包括易失性存储 器和非易失性存储器。存储设备308最好存储实现全部或部分以下 所述的方法的软件程序。可以由CPU 304以众所周知的方式执行该 程序。但是,可以手动或不使用出版物链接服务器104而执行下述 在方法中所述的一些步骤。存储设备308和/或SQL服务器110也存 储文件、程序、网页以及客户机设备102使用的其它数据。

出版物链接服务器104可以经到网络108的连接与其它设备交 换数据。可以使用诸如以太网收发信机的任何数据收发信机实现网 络接口电路310。网络108可以是诸如局域网(LAN)、广域网(WAN) 和/或因特网的任何类型的网络。

图4中示意了出版物链接服务器104的另一实施例的更详细框 图。在本实施例中,出版物链接服务器104包括多个互连模402- 410。模块中的一些可以由执行软件指令的微处理器和/或常规电子电 路来实现。另外,本领域的普通技术人员将容易地理解,可以根据 常规的设计约束条件组合或划分某些模块。

为了接收网页请求、购买请求、出版物连接、出版物命中规范、 网络地址、网页链接、用户名称、口令、一般搜索查询、出版物特 定查询(其中每一个最好包括出版物标识符和搜索项)以及其它数 据,出版物链接服务器104包括网络接收器402。网络接收器402在 工作时以众所周知的方式耦合到网络108。例如,网络接收器402可 以是以太网接口电路,该电路经以太网电缆电耦合到因特网。

为了发送与“目标”网络地址相关的数据(即响应查询而最后 选择的网络地址),出版物链接服务器104包括网络发送器404。发 送数据可包括一个或多个网页、超级链接、重定向消息、数字出版 物和/或其它数据。网络发送器404在工作时以众所周知的方式耦合 到网络108。例如,网络发送器404还可以是以太网接口电路,该电 路经以太网电缆电耦合到因特网。

为了从印刷机系统412(或印刷数据112的任何其它源)接收印 刷数据112并根据印刷数据112生成搜索索引,出版物链接服务器104 包括索引生成模块406。索引生成模块406在工作时耦合到印刷机系 统412。印刷数据112最好表示由印刷机系统412生成的印刷出版物。 搜索索引便利了印刷数据112的搜索。当然,本领域的普通技术人 员将容易地理解,索引生成模块406可以是另一计算设备而不是出 版物链接服务器104的一部分。

可以以一般用于生成常规印刷书索引的众所周知的方式,完成 由索引生成模块406执行的索引过程。例如,特定印刷出版物中的 每个词可以与该词出现的每个页码相关。另外,可以在索引中保存 词的次序,以便利短语搜索。或者,多个预选词和/或短语中的每一 个可以从逻辑上与预选词和/或短语出现的每个页码相关。预选词和/ 或短语可以包括在公共数据字典中,和/或预选词和/或短语可以用电 子方式指定为印刷数据112中的一个或多个标记。如果需要,不需 要在印刷出版物中印刷一些或所有标记(即一个或多个标记可以是 读者“看不见”的)。在任何情况下,标记向索引生成模块406表 示特定词或短语应该被包括在搜索索引中。另外,如果标记是可见 的,或者在印刷出版物中形成可见效果,则标记向读者表示可见的 加亮词或短语被包括在搜索索引中。

为了存储搜索索引和出版物链接(包括出版物命中规范以及网 络地址),出版物链接服务器104包括SQL服务器110以及数据库 接口模块408。数据库接口模块408在工作时耦合到索引生成模块406 以及网络接收器402。数据库接口模块408从索引生成模块406接收 搜索索引,并将搜索索引存储在SQL服务器110中。类似的,数据 库接口模块408从网络接收器402接收出版物链接,并将出版物链 接存储在SQL服务器110中。

出版商服务器107最好将出版物链接发送到出版物链接服务器 104(在印刷出版物之前、之中和/或之后)。只有出版商授权的链接 管理员才能访问与该出版商相关的链接。例如,可能需要特定用户 名称和口令以提交出版物链接,它将特定出版商的出版物命中规范 与网络地址关联。每个出版物链接可以将词、页、章、标题、出版 商和/或任何其它识别数据的书与网络地址关联。

章链接从逻辑上使一组页与单个网络地址相关,其中该组页按印 刷出版物中的章相关。最好将章链接以比页码链接低的优先次序存 储。换句话说,可以在指定某页的一个链接和指定该页所在章的另 一链接中定位该页。特定页链接的优先级最好高于章链接。以这种 方式,出版商可以将印刷出版物中的所有页快速分配给某一链接, 并且接着返回并通过分配特定页链接而将某些页处理为特殊。类似 的,出版物标题链接从逻辑上将一组页与单个网络地址关联,其中 该组页按出版物相关。最好以比章链接低的优先次序存储出版物标 题链接。出版商链接从逻辑上将一组页与一个网络地址关联,其中 该组页按出版商相关。最好以比出版商标题链接低的优先次序存储 出版商链接。

为了确定目标网络地址,出版物链接服务器104包括相关单元 410。相关单元410在工作时耦合到网络接收器402、SQL服务器110 以及网络发送器404。相关单元410经网络接收器402从客户机设备 102接收查询。查询最好包括一个或多个搜索项。每个搜索项可以是 单个词或排序短语(如“salt water”以及“fishing for dummies”)。 或者,出版物查询可以包括出版物标识符(例如书名=“The Ultimate Salt Water Fishing Guide”)以及搜索项(例如“Big Eye Tuna”)。 此外,出版物查询可以包括出版商、页码、外语指示符、限制对出 版物链接和/或其它数据的搜索的搜索参数。如果包括在出版物查询 中,则外语指示符指定在出版物查询中使用的语言。以这种方式, 可以通过语言翻译步骤以众所周知的方式预处理(即在使用查询识 别一个或多个页码之前)出版物查询。

随后,相关单元410使用SQL服务器的搜索索引部分以及收到 的查询对一个或多个出版物命中规范进行识别。例如,搜索索引可 以表示在“The Ultimate Salt Water Fishing Guide”中第23页出现的 短语“Big Eye Tuna”。然后,相关单元410通过在链接数据库110b 中查找所示页码来确定目标网络地址。例如,可以将“The U1timate Salt Water Fishing Guide”第23页链接到 www.SportFishWorld.com/Tuna。

一旦相关单元410确定目标网络地址,网络发送器404就经网 络108将与目标网络地址相关的数据发送到客户机设备102。发送的 数据可以是超级链接、网页数据、重定向消息、印刷出版物的数字 版本和/或其它数据。对于超级链接的情况,客户机设备102可以这 样一种形式接收目标地址本身:用户可以通过选择超级链接(例如 “点击这里检索 www.SportFishWorld.com/Tuna”)来请求位于网络 108的目标地址上的内容。对于网页数据的情况,出版物链接服务器 104从位于目标地址的网页服务器106检索内容,并将检索到的内容 发送到客户机设备102(例如将位于 www.SportFishWorld.com/Tuna 的网页数据发送到客户机)。对于重定向消息的情况,出版物链接 服务器104将目标地址连同到客户机的命令一起发送到客户机设备 102,从而自动从位于目标地址上的网页服务器106检索内容(例如, 命令:无需用户干涉,到 www.SportFishWorld.com/Tuna)。对于 印刷出版物的数字版本的情况,可以使用以上任何方法(例如可向 客户机设备发送到印刷出版物的数字版本的超级链接,和/或可向客 户机设备发送到印刷出版物的数字版本的重定向消息)。或者,可 以在本地将数字出版物和/或其它内容存储在SQL服务器110中。在 这种情况下,出版物链接服务器104最好检索数字出版物,并且经 网络108以众所周知的方法将数字出版物发送到客户机102。

图5示意了用于创建搜索索引以及链接数据库的过程500的流 程图。最好将过程500嵌入在软件程序中,其中该软件程序存储在 出版物链接服务器存储器308中并由服务器CPU 304以众所周知的 方式执行。但是,可以手动和/或由另一设备执行过程500的一些或 所有步骤。尽管参考图5示意的流程图对过程500进行描述,但是 本领域的普通技术人员将容易地理解,可以使用执行与过程500相 关的动作的许多其它方法。例如,可以改变许多步骤的次序,并不 背离本发明的范围或精神。另外,以下所述的许多步骤是可选的。

一般来说,过程500使得出版物链接服务器304生成并存储搜 索索引和链接服务器。搜索索引最好根据从出版商107、印刷过程 412、存储印刷数据112的存储器和/或光学字符识别过程118收到的 印刷数据112。链接数据库最好根据从适当的出版商授权的管理员那 里收到的出版物命中规范和相关网络地址。

当框502接收表示印刷出版物的印刷数据112时,过程500开 始。印刷数据112最好包括诸如ASCII字符的编码文本。一旦收到 印刷数据112,框504将印刷数据112分析为关键词和/或关键短语。 可以根据任何已知的索引标准确定关键词和关键短语。最好印刷数 据112中所有或几乎所有的词都是带索引的。但是,可以选择或忽 略在数据字典中列出的某些预定关键词的出现。类似的,可以选择 或忽略频繁出现的词和/或短语。另外,框506可以在印刷数据112 中搜索与预定属性相关的词和/或短语,比如可见指示符和/或嵌入标 记。例如,可以使用预定字体(如Arial、Courier、Times等)、字 形(如斜体字、反向斜体字、带下划线的粗体等)和/或字号(如10 号、12号等)来表示相关短语应该包括在搜索索引中。

然后,框508通过存储从逻辑上与各个词/短语出现的页码(和/ 或其它的书标识符)相关的各个词/短语来创建至少部分搜索索引。 接着,当框510存储从逻辑上与各个出版物命中规范相关网络地址 时,就创建了链接数据库。最好经网络108从出版商服务器107接 收网络地址和相关出版物命中规范。一旦创建了搜索索引和链接数 据库,出版物链接服务器104可以开始根据印刷出版物,将客户机102 引导到网页。

图6示意了根据印刷出版物,将客户机102引导到网页的过程600 的流程图。最好将过程600嵌入在软件程序中,其中该软件程序存 储在出版物链接服务器存储器308中,并且由服务器CPU 304以众 所周知的方式执行。但是,可以手动和/或通过另一设备执行过程600 的一些或所有步骤。尽管参考图6所示的流程图对过程600进行了 描述,但是本领域的普通技术人员将容易地理解,可以使用执行与 过程600相关的动作的许多其它方法。例如,可以改变许多步骤的 次序,并不背离本发明的范围或精神。另外,以下所述的许多步骤 是可选的。

一般来说,过程600使得出版物链接服务器304根据客户机查 询、搜索索引以及链接数据库确定目标网络地址。然后,利用目标 地址发送客户机数据。当框602从客户机设备102接收查询时,过 程600开始。在一个实施例中,这种查询是基于文本的查询,比如 通过键盘输入的词“Big Eye Tuna”。在另一实施例中,这种查询是 基于图形的查询,比如数字相机拍摄的数字图像。在这种实施例中, 最好通过字符识别过程来分析图形,以确定一个或多个词。这种分 析可以由客户机102和/或服务器104、106执行。

接着,框604使用搜索索引使查询与一个或多个出版物命中规 范相关。例如,搜索索引可以表示短语“Big Eye Tuna”出现在“The Ultimate Salt Water Fishing Guide”的第23页。然后框606通过在链 接数据库110b中查找所示出版物命中规范来确定目标网络地址。例 如,可以将“The Ultimate Salt Water Fishing Guide”的第23页链接 到 www.SportFishWorld.com/Tuna。

一旦框606确定目标网络地址,框608就经网络发送器404和 网络108将与目标网络地址相关的数据发送到客户机设备102。如上 所述,发送数据可以是超级链接、网页数据、重定向消息、印刷出 版物的数字版本和/或如上文详细描述的其它数据。之后,框610可 以存储与该处理相关的人口统计数据。例如,如果用户的身份是已 知的(例如经cookie或登录过程),出版物链接服务器104可以将 与表示用户身份的数据相结合的目标地址存储在人口统计数据库 110c中。随后,诸如出版商的授权用户可以检索存储在人口统计数 据库110c中的数据。

总的来说,本领域的普通技术人员将容易地理解,已经提供了 一种用于根据印刷出版物为客户机设备提供网页的方法和装置。实 现本发明内容的系统的用户在因特网上搜索与印刷信息有关的更多 信息时可以获得精确的搜索结果。

之前的描述是用于说明并描述本发明。它并无意于穷举或将本 发明限制在公开的精确形式内。根据以上内容,许多修改和变型都是 可能的。本发明的范围不由本文的详细描述限制,而且由本文所附 的权利要求书进行限制。

相关申请

本申请要求2000年5月1日提交的美国临时申请序列号 60/201570的优先权。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈