带有跨语言阅读向导的计算机辅助阅读系统和方法专利检索-候选译文人工智能专利检索查询-专利查询网

带有跨语言阅读向导的计算机辅助阅读系统和方法

阅读：113发布：2020-07-31

专利汇可以提供带有跨语言阅读向导的计算机辅助阅读系统和方法专利检索，专利查询，专利分析的服务。并且某个用户正在以非母语进行阅读，当他需要帮助时，计算机辅助阅读系统为他提供帮助，而无需该用户从文本上转移注意力。在一个实施例中，阅读系统的实现形式为浏览程序的阅读向导。这种阅读向导通过某个图形用户界面 (UI)而显现，该用户界面允许用户在非母语的文本中选择某个单词、短语、语句或者单词的其它组合，并查看选定文本在该用户自己母语中的译文。该译文在选定文本附近的窗口或弹出框中出现，以便使分心最小。，下面是带有跨语言阅读向导的计算机辅助阅读系统和方法专利的具体信息内容。

权利要求

1.一种阅读系统，包括：一种用户界面，配置为允许用户选择非母语的文本并查看选定文本在母语中的译文；以及一种跨语言的阅读向导，包括：一种分析器，把选定的文本分解为各个翻译单位，一种单词译文选择器，对若干翻译单位选择候选单词译文，以及一种译文生成器，把候选单词译文转换为母语中对应的单词和短语，它们可以通过用户界面呈现给用户。
2.根据权利要求1的阅读系统，其特征在于，该分析器包括一种词态学分析器，从词态学的角度处理各个单词，以获得每个单词的词态学词根。
3.根据权利要求1的阅读系统，其特征在于，该分析器包括一种语句部分/基本名词短语标识模块，用于给各个单词加上标签标识。
4.根据权利要求3的阅读系统，其特征在于，该语句部分/基本名词短语标识模块包括一种统计模型。
5.根据权利要求1的阅读系统，其特征在于，该分析器包括一种短语扩展模块，对各个单词应用短语扩展规则。
6.根据权利要求1的阅读系统，其特征在于，该译文生成器包括一种词典模块，把候选单词译文转换为对应的单词和短语。
7.根据权利要求6的阅读系统，其特征在于，该词典模块包括一种单词词典。
8.根据权利要求6的阅读系统，其特征在于，该词典模块包括一种短语词典。
9.根据权利要求6的阅读系统，其特征在于，该词典模块包括一种不规则词形词典。
10.根据权利要求1的阅读系统，其特征在于，该译文生成器包括一种模板模块，它包括一个或多个模板，用于把候选单词译文转换为对应的单词和短语。
11.根据权利要求1的阅读系统，其特征在于，该译文生成器包括一种规则模块，它包含多个规则，用于把非母语单词翻译为母语单词。
12.根据权利要求1的阅读系统，其特征在于，该译文生成器包括一个或多个统计模型。
13.根据权利要求1的阅读系统，实施为一个浏览器。
14.一种阅读系统，包括：一种用户界面，配置为允许用户选择英语的文本并查看选定文本的汉语译文；以及一种跨语言的阅读向导，包括：一种分析器，把选定的文本分解为各个翻译单位，一种单词译文选择器，对若干翻译单位选择候选单词译文，以及一种译文生成器，把候选单词译文转换为汉语中对应的短语，它们可以通过用户界面呈现给用户。
15.根据权利要求14的阅读系统，实施为一个浏览器。
16.一种阅读系统，包括：一种用户界面，配置为允许用户选择非母语的文本并查看选定文本的母语译文，该用户界面包括弹出式窗口，用户可在其中查看母语文本；以及一种跨语言的阅读向导，配置为：接收用户已经选定的非母语文本，以及自动地把非母语文本翻译成母语文本。
17.根据权利要求16的阅读系统，其特征在于，该弹出式窗口显示在用户已经选定的文本附近。
18.根据权利要求16的阅读系统，其特征在于，该弹出式窗口是可滚动的，以显示多种译文，并显示在用户已经选定的文本附近。
19.根据权利要求16的阅读系统，实现为一个浏览器。
20.一种计算机辅助阅读方法，包括：通过用户界面向用户呈现非母语文本；接收用户选定的文本；处理用户选定的文本，以提供已经从非母语翻译成母语的文本；以及通过用户界面向用户呈现翻译后的文本。
21.根据权利要求20的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；以及对于一个或多个翻译单位，获得词态学词根。
22.根据权利要求20的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；以及使用语句部分标签和基本名词短语标识，按特征划分翻译单位。
23.根据权利要求20的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；使用语句部分标签和基本名词短语标识，按特征划分翻译单位；以及对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配，以提供树列表。
24.根据权利要求23的计算机辅助阅读方法，其特征在于，所述处理进一步包括根据树列表产生母语的候选单词译文。
25.根据权利要求24的计算机辅助阅读方法，其特征在于，所述处理进一步包括把候选单词译文转换为母语中对应的单词和/或短语。
26.一种或多种计算机可读的介质，其中具有计算机可读的指令，当某个处理器执行这些指令时，它们指示计算机实现权利要求20的方法。
27.根据权利要求20的计算机辅助阅读方法，其特征在于，所列举的动作由某个浏览器来实现。
28.一种阅读系统，包括：一种或多种计算机可读的介质；以及记录在该介质上的代码，配置为实现某个浏览器，该浏览器配置为：通过用户界面向用户呈现英语文本；接收用户选定的文本；处理用户选定的文本，以提供已经从英语翻译成汉语的文本；以及通过用户界面向用户呈现翻译后的文本。
29.根据权利要求28的阅读系统，其特征在于，该浏览器配置为向用户呈现同一英语文本的多种译文。
30.根据权利要求28的阅读系统，其特征在于，该浏览器配置为在用户选定的英语文本附近的译文窗口中呈现翻译后的文本。
31.根据权利要求28的阅读系统，其特征在于，该浏览器配置为在用户选定的英语文本附近的译文窗口中呈现同一英语文本的多种译文，该译文窗口具有下拉的特性，以显示多种译文的至少某一些。
32.一种计算机辅助阅读方法，包括：通过用户界面向用户呈现英语文本；接收用户选定的文本；处理用户选定的文本，以提供已经从英语翻译成汉语的文本；以及通过用户界面向用户呈现翻译后的文本。
33.根据权利要求32的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；以及对于一个或多个翻译单位，获得词态学词根。
34.根据权利要求32的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；以及使用语句部分标签和基本名词短语标识，按特征划分翻译单位。
35.根据权利要求32的计算机辅助阅读方法，其特征在于，所述处理包括：把文本分解为翻译单位；使用语句部分标签和基本名词短语标识，按特征划分翻译单位；以及对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配，以提供树列表。
36.根据权利要求35的计算机辅助阅读方法，其特征在于，所述处理进一步包括根据树列表产生汉语的候选单词译文。
37.根据权利要求36的计算机辅助阅读方法，其特征在于，所述处理进一步包括把候选单词译文转换为汉语中对应的单词和/或短语。
38.一种或多种计算机可读的介质，其中具有计算机可读的指令，当某个处理器执行这些指令时，它们指示计算机实现权利要求32的方法。
39.一种计算机辅助阅读方法，包括：通过用户界面向用户呈现非母语文本，使得用户能够选取至少一个单词；自动确定是否有对应的短语与选定的一个单词相关联；以及以母语呈现至少选定单词的一种或多种译文，或者如果有对应的短语与选定的单词相关联，以母语呈现对应短语的至少一种译文。
40.根据权利要求39的计算机辅助阅读方法，其特征在于，所述呈现包括在译文窗口中呈现译文，该窗口邻近对应的、选定的至少一个单词。
41.根据权利要求40的计算机辅助阅读方法，其特征在于，所述译文窗口是可滚动的，以便呈现多种不同的译文。
42.根据权利要求39的计算机辅助阅读方法，其特征在于，所述呈现包括呈现多种最可能的译文。
43.根据权利要求42的计算机辅助阅读方法，其特征在于，所述呈现进一步包括根据上下文分选最可能的译文。
44.根据权利要求39的计算机辅助阅读方法，进一步包括：接收用户输入，该输入表示用户仅仅需要翻译组成短语一部分的、某个选定的单词；以及仅仅呈现选定单词的一种或多种译文。
45.一种或多种计算机可读的介质，其中具有计算机可读的指令，当某个处理器执行这些指令时，它们指示计算机实现权利要求39的方法。
46.一种阅读系统，包括：一种或多种计算机可读的介质；以及记录在该介质上的代码，配置为实现某个浏览器，该浏览器配置为：使得用户能够选取通过用户界面呈现的至少一个英语单词；自动确定是否有对应的短语与选定的至少一个英语单词相关联；以及以汉语呈现选定的至少一个英语单词的一种或多种译文，或者如果有对应的短语与选定的至少一个英语单词相关联，以汉语呈现对应短语的至少一种译文。
47.一种跨语言的用户界面，包括：第一区域，配置为显示非母语文本；以及第二区域，配置为以母语显示文本中至少一部分的译文。
48.根据权利要求47的跨语言用户界面，其特征在于，第二区域安排在用户选定来翻译的至少某些文本附近。
49.根据权利要求47的跨语言用户界面，其特征在于，非母语包括英语，母语包括汉语。
50.根据权利要求47的跨语言用户界面，其特征在于，第二区域包括弹出式窗口。
51.根据权利要求50的跨语言用户界面，其特征在于，弹出式窗口包括下拉特性，以显示另外的译文。
52.根据权利要求47的跨语言用户界面，其特征在于，第二区域显示同一文本的多种不同的译文。
53.一种跨语言的用户界面，包括：第一区域，其中可以显示文本以便用户选择，该文本以第一语言显示；以及第二区域，邻近用户选定的文本，该第二区域配置为显示已经翻译成第二语言的文本，翻译后的文本对应于用户已经选定的文本。
54.根据权利要求53的跨语言用户界面，其特征在于，第一语言包括英语，第二语言包括汉语。
55.根据权利要求53的跨语言用户界面，其特征在于，第二区域包括弹出式窗口。
56.根据权利要求53的跨语言用户界面，其特征在于，第二区域包括弹出式窗口，它具有下拉特性，以显示多种译文。
57.根据权利要求53的跨语言用户界面，其特征在于，第二区域显示同一文本的多种不同的译文。
58.一种阅读系统，包括：一种跨语言的阅读向导，包括：一种分析器，把选定的文本分解为各个翻译单位，该分析器包括包括一种语句部分/基本名词短语标识模块，用于给各个举词加上标签标识，一种单词译文选择器，对若干翻译单位选择候选单词译文，以及一种译文生成器，把候选单词译文转换为母语中对应的单词或短语，它们可以通过用户界面呈现给用户。
59.根据权利要求58的阅读系统，其特征在于，该分析器包括一种词态学分析器，从词态学的角度处理各个单词，以获得每个单词的词态学词根。
60.根据权利要求58的阅读系统，其特征在于，该分析器包括一种短语扩展模块，对各个单词应用短语扩展规则。
61.一种或多种计算机可读的介质，其中具有计算机可读的指令，当一个或多个处理器执行这些指令时，使这一个或多个处理器实现一种跨语言的阅读向导，包括：一种分析器，把选定的文本分解为各个翻译单位，该分析器包括包括一种语句部分/基本名词短语标识模块，用于给各个单词加上标签标识，一种单词译文选择器，对若干翻译单位选择候选单词译文，以及一种译文生成器，把候选单词译文转换为母语中对应的单词或短语，它们可以通过用户界面呈现给用户。
62.一种或多种计算机可读的介质，其中具有计算机可读的指令，当一个或多个处理器执行这些指令时，使这一个或多个处理器：通过用户界面向用户呈现非母语文本；接收用户选定的文本；处理选定的文本，步骤包括：把选定的文本分解为翻译单位，使用语句部分标签和基本名词短语标识，按照特征划分翻译单位，对按特征划分的翻译单位应用基于规则的短语扩展和模式匹配，以提供树列表，根据树列表产生母语的候选单词译文，把候选单词译文转换为母语中对应的单词和/或短语，以提供已经从非母语翻译成母语的文本；以及通过用户界面向用户呈现翻译后的文本。

说明书全文

带有跨语言阅读向导的计算机辅助阅读系统和方法

相关申请本申请源于2000年4月24日提交的、序列号为60/199,288的美国临时申请，并要求其优先权，其公开内容在此特别引用作为参考。本申请也涉及2000年4月24日提交的、序列号为09/556,229的美国专利申请，其公开内容在此引用作为参考。

技术领域

本发明涉及机器辅助阅读系统和方法，更具体地说，本发明涉及有助于用户阅读非母语的一种用户界面和基础体系结构。

背景技术

随着因特网的快速发展，遍布全世界的计算机用户正在越来越多地面对非母语写成的文字材料。许多用户对非母语完全不懂。即使用户进行了一些非母语培训，该用户也往往难以阅读和理解非母语。
考虑某个中国用户访问以英语写成的网页或其它电子文档的情况。这个中国用户在校期间可能接受过某些正规的英语培训，但是这种培训往往不足以使他完全地阅读和理解以英语写成的、特定的单词、短语或者语句。这种汉语-英语的情况仅仅是用于说明这一点的一个例子而已。这个问题在跨越其它语言边界时也是存在的。
所以，本发明起源于提供机器辅助阅读系统和方法有关的问题，这些系统和方法帮助计算机用户阅读和理解非母语表达的文字材料。

发明内容

某个用户正在以非母语进行阅读，当他需要帮助时，计算机辅助阅读系统为他提供帮助，而无需该用户从文本上转移注意力。
在一个实施例中，阅读系统的实现形式为浏览程序的阅读向导。这种阅读向导通过某个图形用户界面(UI)而显现，该用户界面允许用户在非母语的文本中选择某个单词、短语、语句或者单词的其它组合，并查看选定文本在该用户自己母语中的译文。该译文在选定文本附近的窗口或弹出框中出现，以便使分心最小。
一方面，阅读向导的核心包括浅层分析器、统计单词译文选择器和译文生成器。浅层分析器把用户选定的非母语文本中的短语或语句分解成单独的翻译单位(例如短语、单词)。在一个实施例中，浅层分析器将选定文本中的单词划分成片段，并从词态学的角度对其进行分析，以获得每个单词的词态学词根。为了进一步选择译文，浅层分析器采用语句部分(POS)标签和基本名词短语(baseNP)标识，按照特征划分单词和短语。例如，POS标签和baseNP标识可以由某个统计模型来实现。浅层分析器对这些单词应用基于规则的短语扩展和模式匹配，以产生树列表。
对于从非母语文本剖析中得出的翻译单位，统计单词译文选择器选择最优的候选单词译文。单词译文选择器产生所有可能的译文模式，并使用统计翻译和语言模型对该翻译单位进行翻译。输出的是最优的候选译文。
译文生成器将候选单词译文转换成母语中对应的短语。译文生成器部分地使用母语模型，以帮助确定适当的译文。然后，母语单词和短语就通过邻近选定文本的UI显示出来。
附图简要说明图1是一个计算机系统的框图，它实现了带有跨语言阅读向导的阅读系统。
图2是一个实施例中示范浅层分析器的框图。
图3是一张示意图，用于理解一个实施例中进行的处理。
图4是一张示意图，用于理解图3中的示意图。
图5是一张流程图，介绍一个实施例中方法的步骤。
图6是一张示意图，用于理解一个实施例中进行的处理。
图7是一张流程图，介绍一个实施例中方法的步骤。
图8是一个实施例中示范译文生成器的框图。
图9至图13显示了一个实施例中多种示范用户界面。

具体实施方式

概述计算机辅助阅读系统帮助用户阅读非母语。为了进行讨论，在一般的浏览程序范围内介绍计算机辅助阅读系统，该程序在通用计算机上运行。不过，计算机辅助阅读系统也可以在许多不同的非浏览环境中实现(例如电子邮件系统、字处理等)，并且可以在许多各式各样类型的设备上实行。
下面介绍的实施例，允许更乐于使用母语交流的用户快捷方便地广泛阅读非母语的电子文档，而且其方式促进了集中精力和快速消化有关内容。在要翻译文本的近旁提供带有译文窗口的用户界面，可以增加用户的便利。译文窗口中包含着文本翻译后的译文。将译文窗口放在要翻译文本的近旁，用户的双眼不必移动很远即可确定要翻译的文本。这又减少了用户可察觉的分心，举例来说，假若为了查看要翻译的文本，用户的目光需要扫视一段距离，这种分心就很难避免。
在某些实施例中，光标翻译处理的优点使得用户交互进一步增强。利用鼠标移动来选择文本的位置，用户能够进行快速选择，系统据此自动执行翻译并将翻译后的文本向用户显示。
示范系统体系结构图1显示了示范计算机系统100，它具有中央处理器(CPU)102、存储器104和输入/输出(I/O)接口106。CPU102与存储器104和I/O接口106通信。存储器104既代表易失性存储器(例如RAM)，又代表非易失性存储器(例如ROM、硬盘等)。程序和数据文件可以存放在存储器104中，并在CUP102上执行。
计算机系统100通过I/O接口106连接着一台或多台外围设备。示范外围设备包括鼠标110、键盘112(例如字母数字QWERTY键盘、电话键盘等)、显示监视器114、打印机116、外部存储设备118和话筒120。例如，该计算机系统可以作为通用计算机。所以，计算机系统100执行一种计算机操作系统(未显示)，该操作系统在存储器104中存放，在CUP102上执行。该操作系统最好是一种支持窗口环境的多任务操作系统。适宜的操作系统的一个实例是微软公司的Windows品牌操作系统。
应当注意，也可以使用其它计算机系统配置，比如手持设备、多处理器系统、基于微处理器的或者可编程的消费电子产品、网络PC、小型计算机、大型计算机等等。此外，尽管图1中展示的是一种独立的计算机，语言输入系统也可以在分布式计算环境中实现，通过通信网络(例如LAN、因特网等)连接的远程处理设备完成其中的任务。在分布式计算环境中，程序模块既可以位于本机的存储设备中，也可以位于远程存储设备中。
示范阅读系统计算机系统100实现了阅读系统130，它帮助用户阅读非母语。该阅读系统可以在单词、短语或者语句的级别提供帮助。在图1中实现的阅读系统是作为浏览程序132，它在存储器104中存放，在CUP102上执行。应当重视和理解，下面介绍的阅读系统也可以在浏览器范围以外的氛围中实现。
阅读系统130具有用户界面134和跨语言阅读向导136。UI134展现跨语言阅读向导136。除了阅读系统之外，浏览器程序132还可以包括其它组件，但是这类组件对于浏览器程序被视为标准的，因此将不进行详细显示和介绍。
阅读向导136包括浅层分析器140、统计单词译文选择器142和译文生成器144。
示范浅层分析器浅层分析器140把选定的非母语文本中的短语或语句分解成单独的翻译单位(例如短语、单词)。
图2稍微详细地显示了一个实施例中的浅层分析器。在任何适当的硬件、软件、固件或者它们的组合中，都可以实现该浅层分析器。在这个展示和介绍的实施例中，浅层分析器是在软件中实现的。
如图所示，浅层分析器140包括单词片段模块200、词态学分析器202、语句部分(POS)标签/基本名词短语标识模块204、短语扩展模块206和模式或模板匹配模块208。虽然这些组件显示为独立的组件，但是应当重视和理解，这些组件也可以互相结合或者与其它组件结合。
依据所介绍的实施例，浅层分析器140把用户已经选定的文本中的单词划分为片段。它使用单词片段模块来做到这一点。然后浅层分析器使用词态学分析器202从词态学的观点处理单词，以获得每个单词的词态学词根。为了发现每个单词的词态学词根，词态学分析器能够对单词应用多种词态学规则。词态学分析器202使用的规则可以由熟练于被分析的具体语言的人制定。例如，英语中的一个规则为，以“ed”结尾的单词，或者通过去除“d”或者通过去除“ed”来形成其词态学词根。
为了进一步选择译文，浅层分析器140采用语句部分(POS)标签/基本名词短语(baseNP)标识模块204，按照特征划分单词和短语。例如，POS标签和baseNP标识可以由某个统计模型来实现，下面紧接着的标题为“POS标签和baseNP标识”的一节介绍了它的一个实例。浅层分析器140使用短语扩展模块206，对POS标签/基本名词短语标识模块204按照特征划分的这些单词，应用基于规则的短语扩展。短语扩展模块的一个目标，是把一个基本名词短语扩展到一个更复杂的名词短语。例如，“baseNP的baseNP”是“baseNP”短语的更复杂的名词短语。浅层分析器140也使用模式或模板匹配模块208来产生树列表。模式或模板匹配模块用于翻译，并认识某些短语翻译是取决于模式的，而不是直接与短语中的单词有关。例如，短语“对baseNP感兴趣”包含一种模式(即“baseNP”)，它用于形成一个更复杂的翻译单位，用于翻译。单词“感兴趣”并不直接涉及用于形成更复杂翻译单位的这种模式。
POS标签和baseNP标识以下的讨论介绍了用于自动识别英语的baseNP(名词短语)的一种统计模型，并构成了处理选定的文本以产生树列表的方式之一。所介绍的方法使用两个步骤：N个最佳语句部分(POS)标签和给予N个最佳POS序列的baseNP标识。所介绍的模型也集成了词法的信息。最后，应用Viterbi 算法在整个序列中进行全局搜索，它使得在整个过程中能够获得线性的复杂度。
发现简单的和非递归的基本名词短语(baseNP)，是许多自然语言处理应用程序(比如部分剖析、信息检索和机器翻译)的一个重要的子任务。baseNP是简单的名词短语，并不递归地包含其它的名词短语。例如，在以下实例中[…]之内的元素是baseNP，其中NNS、IN、VBG等为语句部分(POS)标签。Marcus et al.，Building a LargeAnnotated Corpus of English：the Penn Treebamk，ComputationalLinguistics，19(2)：313-330，1993中介绍了POS标签，使其为世人所知。[Measures/NNS] of/IN[manufacturing/VBG activity/NN]fell/VBD more/RBR than/IN[the/DT overall/JJ measures/NNS]./.
统计方法在本节中介绍两步法统计模型、参数训练和Viterbi算法，用于搜索POS标签和baseNP标识最佳序列。在介绍该算法之前，引入贯穿讨论的某些记号。
让我们把输入语句E分别表示为下列单词序列和POS序列：E＝w1w2…wn-1wnT＝t1t2…tn-1tn其中n为语句中的单词数目，ti为单词wi的POS标签。
给定E后，假设baseNP标识的结果是一个序列，其中某些单词组合成baseNP如下…wi-1[wiwi+1…wj]wj+1…对应的标签序列如下：(a)B＝…ti-1[titi+1…tj]tj+1…＝…ti-1bi，jtj+1…＝n1n2…nm其中bi，j对应于某个baseNP的标签序列：[titi+1…tj]。bi，j也可以被认为是一种baseNP规则。所以，序列B既包含POS标签，又包含baseNP规则。因此1≤m≤n，ni∈(POS标签集∪baseNP规则集)。这是某个语句带有baseNP记号的第一表达式。有时我们也使用以下等效形式：(b)Q＝…(ti-1，bmi-1)(ti，bmi)(ti+1，bmi+1)…(tj，bmj)(tj+1，bmj+1)…＝q1q2…qn其中每个POS标签ti与其相对于baseNP的位置信息bmi相关联。位置信息为{F，I，E，O，S}之一。F、E和I分别表示该单词在某个baseNP的左边界、右边界，或者某个baseNP内部的另一个位置。O表示该单词在某个baseNP之外。S标注某个单一单词的baseNP。
例如，上面给定实例的两种表达式如下：(a)B＝[NNS]IN[VBG NN]VBD RBR IN[DT JJ NNS](b)Q＝(NNS S)(IN O)(VBG F)(NN E)(VBD O)(RBR O)(IN O)(JJ I)(NNS E)(.O)
集成的’两步法过程所介绍方法的原理如下。最可能的baseNP序列B*可以一般地表示如下：B*=argmaxB(p(B|E))]]>我们把整个过程分成两步，也就是：B*≈argmaxB(P(T|E)×P(B|T,E))--(1)]]>为了减少搜索空间和计算复杂度，我们仅仅考虑N个最佳POS标签，也就是T(N-best)=argmaxT=T1,...,TN(P(T|E))--(2)]]>所以，我们有：B*≈argmaxB,T=T1,...,TN(P(T|E)×P(B|T,E))--(3)]]>相应地，算法也由两步组成：使用(2)式确定N个最佳POS标签，然后使用(3)式从这些POS序列确定最佳baseNP序列。这两步集成在一起，而不是像在其它方法中那样分开。现在让我们更密切地查看这两步。
确定N个最佳POS序列在第一步中算法的目标是在搜索空间(POS网格)之内搜索N个最佳POS序列。根据贝叶斯法则，我们有P(T|E)=P(E|T)×P(T)P(E)]]>由于P(E)不影响P(T|E)的最小化过程，(2)式变为T(N-best)=argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(P(E|T))×P(T))--(4)]]>我们现在假设，E中的单词是独立的。因此P(E|T)≈Πi=1nP(wi|ti)--(5)]]>然后我们使用三字模型作为P(T)的一种近似，也就是：P(T)≈Πi=1nP(ti|ti-2,ti-1)--(6)]]>最后我们有(N-bset)argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(Πi=1nP(wi|ti)×P(ti|ti-2,ti-1))--(7)]]>在搜索N个最佳的Viterbi算法中，P(wi|ti)被称为词法生成(或输出)概率，P(ti|ti-2，ti-1)被称为隐藏马尔可夫模型中的跃进概率。Viterbi，Error Bounds for Convolution Codes and Asymptotically OptimumDecoding Algorithm，IEEE Transactions on Information TheoryIT-13(2)：pp.260-269，April，1967中介绍了Viterbi算法。
确定baseNP如上所述，给定N个最佳POS序列后，第二步的目标是搜索最佳baseNP序列。
把E、T和B视为随机变量，根据贝叶斯法则，我们有P(B|T,E)=P(B|T)×P(E|B,T)P(E|T)]]>由于P(B|T)=P(T|B)×P(B)P(T)]]>，我们有，P(B|T,E)=P(E|B,T)×P(T|B)×P(B)P(E|T)×P(T)--(8)]]>因为我们对给定语句E中每个可能的POS序列搜索最佳baseNP序列，P(E|T)×P(T)＝P(E∩T)＝常数。不仅如此，从B的定义，在每个搜索过程期间，我们有P(T|B)=Πi=1nP(ti,...,tj|bi,j)=1.]]>所以，(3)式变为B*=argmaxB,T=T1,...,TN(P(T|E)×P(B|T,E))]]>=argmaxB,T=T1,...,TN(P(T|E)×P(E|B,T)×P(B))---(9)]]>使用独立假设，我们有P(E|B,T)≈Πi=1nP(wi|ti,bmi).--(10)]]>
利用P(B)的三字近似，我们有：P(B)≈Πi=1mP(ni|ni-2,ni-1)--(11)]]>最后，我们得到B*=argmaxB,T=T1,...,TN(P(T|E)×Πi=1nP(wi|bmi,ti)×Πi=1,mP(ni|ni-2,ni-1))--(12)]]>总而言之，在第一步中，在POS标签过程中应用搜索N个最佳的Viterbi算法，对于计算的每个POS序列确定路径概率ft如下：ft=Πi=1,np(wi|ti)×p(ti|ti-2,ti-1).]]>在第二步中，对于每个可能的POS标签结果，再一次应用Viterbi算法搜索最佳baseNP序列。在这一步所找到的每个baseNP序列还与路径概率fb=Πi=1np(wi|ti,bmi)×Πi=1,mp(ni|ni-2,ni-1)]]>相关。某个baseNP序列的总概率由fta×fb确定，其中α为均衡系数(在我们的实验中α＝2.4)。对于给定的语句E，当我们确定最佳baseNP序列时，我们也确定了E的最佳POS序列，它对应于E的最佳baseNP。
作为这个过程如何起作用的一个实例，考虑以下文本：“stockwas down 9.1 points yesterday morning.”在第一步中，该句的N个最佳POS标签结果之一是：T＝NN VBD RB CD NNS NN NN。
对于这个POS序列，第二步将试图确定baseNP，如图3所示。虚线中路径的细节在图4中给出。在第二步中计算出它的概率如下(Φ为虚变量)：P(B|T，E)＝p(stock|NN，S)×p(was|VBD，O)×p(down|RB，O)×p(NU-MBER|CD，B)×p(points|NNS，E)×p(yesterday|NN，B)×p(morning|NN，E)×p(.|.，O)×p([NN]|Φ，Φ)×p(VBD|Φ，[NN])×p(RB|[NN]，VBD)×p([CD NNS]|VBD，RB)×p([NN NN]|RB，[CD NNS])×P(.|[CD NNS]，[NN NN])
统计参数训练在这项工作中，训练和试验的数据是取自Penn Treebank的25个部分。我们把整个Penn Treebank数据分成两部分，一部分用于训练，另一部分用于试验。
在我们的统计模型中，我们计算以下四种概率：(1)P(ti|ti-2，ti-1)，(2)P(wi|ti)，(3)P(ni|ni-2ni-1)和(4)P(wi|ti，bmi)。第一种和第三种参数分别是T和B的三字概率。第二种和第四种是词法生成概率。利用下列公式可以从有POS标签的数据计算概率(1)和(2)：(ti|ti-2,ti-1)count(ti-2ti-2ti)Σjcount(ti-2ti-1tj)(13)]]>p(wi|ti)=count(wiwith tag ti)count(ti)--(14)]]>由于训练集中的每个语句既有POS标签，又有baseNP边界标签，它可以转换为两个序列，如上节中介绍的B(a)和Q(b)。使用这些序列，利用分别类似于(13)和(14)式的计算公式，可以计算出参数(3)和(4)。
在训练三字模型(3)之前，应当从训练全集提取所有可能的baseNP规则。例如，提取的baseNP规则包括以下三个序列。
(1)DT CD CD CD NNPS(2)RB JJ NNS NNS(3)NN NN POS NN……在Penn Treebank中有超过6000种baseNP规则。训练三字模型(3)时，我们以两种方式对待这些baseNP规则。首先，给每个baseNP规则分配一个唯一标识(UID)。这表明，该算法考虑了每个baseNP规则对应的结构。其次，给所有这些规则分配相同标识(SID)。在这种情况下，这些规则组合成同一类。然而，baseNP规则的标识仍然与分配给POS标签的标识不同。
为了使参数平滑，使用了Katz，Estimation of Probabilities fromsparse Data for Languguage Model Component of Speech Recognize，IEEE Transaction on Acoustics，Speech，and Signal Processing，Volume ASSP-35，pp.400-401，March 1987中介绍的一种方法。为了预测参数(1)和(3)的概率，建立了一个三字模型。在识别baseNP期间遇到未知单词的情况下，以下列方式计算参数(2)和(4)：p(wi|bmi,ti)=count(bmi,ti)maxj(count(bmj,ti))2--(15)]]>p(wi|ti)=count(ti)maxj(count(tj))2--(16)]]>这里，bmi表示附着在ti上所有可能的baseNP标号，tj是为未知单词wi猜测的一个POS标签。
图5是一张流程图，介绍一个实施例中方法的步骤。这些步骤可以在任何适当的硬件、软件、固件或者它们的组合中实现。在展示的实例中，这些步骤是在软件中实现的。在上述跨语言的阅读向导136——它形成了浏览器程序132的一部分(见图1)——中，可以发现这种软件的一个具体实施例。更确切地说，将要介绍的方法可以由某个浅层分析器来实现，比如图2中显示和介绍的分析器。
步骤500接收选定的文本。实现这个步骤与某个用户选择文本中要翻译的一个部分有关。通常，用户通过使用一种输入设备比如鼠标等来选择文本。步骤502把选定文本中的单词划分成片段。将会受到本领域的技术人员重视的任何适当的划分处理都可以使用。步骤504获得每个单词的词态学词根。在展示和介绍的实施例中，这一步是由词态学分析器实现的，比如图2中显示的词态学分析器。在展示的实例中，词态学分析器配置为处理以英语写成的单词。不过应当重视和理解，任何适当的语言都可以提供一个基础，在其上可以建立一个词态学分析器。
步骤506使用语句部分(POS)标签和基本名词短语标识来划分单词的特征。任何适当的技术都可以使用。在上面的“POS标签和baseNP标识”一节中，详细介绍了一种示范技术。步骤508对按照特征划分的单词应用基于规则的短语扩展和模式匹配，以产生树列表。在上面的实例中，这一步是使用短语扩展模块206和模式或模板匹配模块208来实现的。步骤510输出树列表，以便进一步处理。
作为树列表的一个实例，考虑图6。其中已经以上面介绍的方法，处理了语句“The Natural Language Computing Group at MicrosoftResearch China is exploring research in advanced natural languagetechnologies”。确切地说，树列表展示了语句中已经使用上面介绍的POS标签和baseNP技术，经过分段、词态学处理和特征划分的各个单词。例如，考虑元素600。其中，单词“Natural”已经从语句中和从父元素“natural language”中划分出来。元素600也已经按特征划分为带有POS标签“JJ”。树上的其它元素也经过类似的处理。
示范单词译文选择器单词译文选择器142接收树列表并产生所有可能的译文模式。选择器142使用统计翻译和语言模型对剖析后的翻译单位进行翻译，得出母语文本中最优的候选单词译文。输出的是最优的候选译文。
图7是一张流程图，介绍一个实施例中方法的步骤。该方法可以在任何适当的硬件、软件、固件或者它们的组合中实现。在展示和介绍的实施例中，该方法是在软件中实现的。这种软件的一个实施例可以包括单词译文选择器142(见图1)。
按照上面介绍的处理产生的树列表在步骤700接收。步骤702从树列表产生译文模式。在一个实施例中，产生所有可能的译文模式。例如，对于英语到汉语的翻译，英语名词短语“NP1 of NP2”可能有两种可能的译文：(1)T(NP1)+T(NP2)和(2)T(NP2)+T(NP1)。在短语译文中，翻译的短语是一棵句法树，在一个实施例中，所有可能的译文顺序都受到考虑。步骤704使用翻译模型和语言模型来翻译剖析后的翻译单位。翻译单位可以包括单词和短语。然后步骤706输出最优的N个候选单词译文。可以使用统计模型来选择最优的N个候选单词译文。
示范译文生成器译文生成器144把最优的N个候选单词译文转换为母语中对应的短语。然后母语的单词和短语通过UI出现在选定的文本附近。
图8稍微详细地显示了一个实施例中的译文生成器144。为了翻译最优的候选单词，译文生成器可以利用许多不同的资源。例如，译文生成器可以包括它在翻译过程中使用的词典模块800。词典模块800可以包括单词词典、短语词典、不规则词形词典或者通常在自然语言翻译处理中使用的任何其它词典，这对本领域的技术人员是显而易见的。本领域的技术人员将会理解这类词典的操作和功能，为简便起见此处不再更详细地介绍。
译文生成器144可以包括模板模块802，它包含用于翻译处理中的多个模板。任何适当的模板都可以使用。例如，可以使用所谓的大短语模板来协助翻译过程。在自然语言翻译中使用的模板，其操作已知，此处不再更详细地介绍。
译文生成器144可以包括规则模块804，它包含用于使翻译过程便利的多个规则。规则可以是手工制定的规则，制定它们的人员熟悉被翻译的特定语言。可以制定规则来涉及属于翻译、剖析、翻译模式中的统计错误。本领域的技术人员将会理解基于规则翻译的原理。
译文生成器144可以包括用于翻译过程中的一个或多个统计模型806。这些可以使用的统计模型可以变化范围很广，尤其是对与所需翻译有关的、给定数目的可能的非母语和母语。这些统计模型可以基于上面介绍的POS和baseNP统计参数。在需要从英语翻译成汉语的一个特定实施例中，可以使用以下模型：汉语三字语言模型和汉语交互信息模型。当然，也可以使用其它模型。
上面介绍的模块和模型可以分别使用，也可以按多种相互组合使用。
在处理过程中，至此用户已经选择了非母语文本的一部分，要翻译成母语。选定的文本已经按照上面的介绍进行了处理。在下面紧接着的讨论中，要介绍的方法和系统以对用户方便和高效的方式把翻译后的文本呈现给用户。
阅读向导的用户界面剩余的讨论是针对阅读向导中用户界面134的特性。具体地说，阅读向导的用户界面134允许用户选择不能确定如何阅读和解释的、以非母语写成的文本。选定的内容可以是各个单词、短语或者语句。
图9至图13显示了阅读向导的若干示范用户界面，以图形UI(GUI)实现，作为浏览器程序或者其它计算机辅助阅读系统的一部分呈现给用户。展示的实例显示了设计为帮助中国用户阅读英语文本的阅读系统。英语文本显示在窗口中。用户可以选择英语文本的某些部分。为了响应用户的选择，阅读向导把选定的内容翻译成汉语文本，并把汉语文本呈现在弹出式译文窗口或滚动框中。
图9显示了用户界面900，它包括“非母语”文本中已经突出显示的一部分。突出显示的文本显示在用户界面的第一区域中。用户界面的第二区域的形式为译文窗口902，配置为以母语显示至少某些文本内容翻译后的部分。在这个实例中，突出显示的文本包括短语“research in advanced natural language technologies”。在这个实例中，用户已经突出显示了单词“advanced”，阅读系统已经自动确定该单词组成被突出显示短语的一部分。然后阅读系统在译文窗口902中自动显示被突出显示短语的最佳译文。通过自动确定包含用户选定单词的短语然后提供该短语的至少一种译文，不仅向读者提供了该单词的译文，而且提供了该单词在其中使用的、翻译后的上下文。这样做的优点在于，它给予读者更多翻译后的信息，这又有助于他们理解正在阅读的材料。
注意，译文窗口902位于突出显示文本的至少一个部分的附近。以这种方式定位译文窗口，为了看见翻译后的文本，用户就不必使其注意力从突出显示的文本转移很远。这样做的优点在于，它不会令用户的阅读过程减慢到不期望的程度。也要注意，译文窗口包含一个下拉箭头904，它可以用于显示选定文本的其它翻译结果。作为一个实例，考虑图10。其中译文窗口902已经下拉，以显示突出显示短语的所有译文。
图11显示了用户界面1100，它带有译文窗口1102。注意，阅读系统自动探测出单词“generated”不在某个短语中，并且只翻译单词“generated”。阅读系统也能够在译文窗口1102中提供多种最可能的译文。例如，显示了三种可能的示范译文。在展示的实例中，显示的译文是与上下文有关的，并按照上下文来排序。所以，在这个实例中，阅读系统仅仅可以显示该单词最佳的n个译文，而不是该单词所有可能的译文。图12显示了用户界面1100，其中单词“generated”的所有可能的译文都在译文窗口1102中呈现给用户。
图13显示了用户界面1300，它带有译文窗口1302，展示了所介绍实施例的一种特性。具体地说，可以给用户一种选择，他们是需要翻译包含选定单词的整个短语，还是只需要翻译选定的单词。在这个实例中，用户已经使其鼠标放置在选择单词“advanced”进行翻译的位置。由于单词“advanced”组成某个较长短语的一部分，阅读系统会自动翻译包含着选定单词的短语，然后向用户呈现各种选择，如上所述。不过在这种情况下，用户已经指示阅读系统，他们仅仅需要翻译选定的单词。他们能够以任何适当的方式做到这一点，比如举例来说，当选定单词时按下“Ctrl”键。
结论上面介绍的若干实施例帮助用户阅读非母语，并能够允许更乐于使用母语交流的用户快捷方便地广泛阅读非母语的电子文档，而且其方式促进了集中精力和快速消化有关内容。提供的用户界面在要翻译文本的近旁具有译文窗口，包含着文本翻译后的译文，可以增加用户的便利。将译文窗口放在要翻译文本的近旁，用户的双眼不必移动很远即可确定要翻译的文本。这又减少了用户可察觉的分心，举例来说，假若为了查看要翻译的文本，用户的目光需要扫视一段距离，这种分心就很难避免。在某些实施例中，光标翻译处理的优点使得用户交互进一步增强。利用鼠标移动来选择文本的位置，用户能够进行快速选择，系统据此自动执行翻译并将翻译后的文本向用户显示。
尽管是以结构特性和/或词态学步骤的特定语言来介绍了本发明，还是应当理解，在附带的权利要求书中规定的本发明不必局限于所介绍的特定特性或步骤。相反，公开这些特定的特性和步骤，是作为实现要求权利的本发明的优选形式。

标题	发布/更新时间	阅读量
一种面向大数据的跨语言检索方法	2020-05-12	589
基于统计的机器翻译方法、装置及电子设备	2020-05-17	107
一种基于多特征的跨语言剽窃检测方法	2020-05-23	308
面向计算机辅助翻译的输入方法与装置	2020-05-25	657
一种固定搭配型短语优先的两段式机器翻译方法	2020-05-19	279
具有领域定制功能的术语译文挖掘系统及方法	2020-05-22	942
基于双语片段的交互式机器翻译方法	2020-05-23	270
一种机器翻译译文的翻译方法、装置及存储介质	2020-05-13	360
一种机器翻译方法、装置、服务器及存储介质	2020-05-16	384
用于机器翻译的完整句识别方法与系统	2020-05-19	787

带有跨语言阅读向导的计算机辅助阅读系统和方法

带有跨语言阅读向导的 计算机辅助阅读系统和方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：

带有跨语言阅读向导的计算机辅助阅读系统和方法