用于机器翻译的方法、装置和系统

申请号 CN200710146966.6 申请日 2007-09-03 公开(公告)号 CN101154219A 公开(公告)日 2008-04-02
申请人 株式会社东芝; 发明人 釜谷聪史; 知野哲朗; 降幡建太郎;
摘要 一种 机器翻译 装置,包括:翻译单元,用于将 源语言 文档翻译为以 目标语言 描述的翻译后的文档,并且创建多义性部分,该多义性部分是具有在翻译期间出现的多义性的词或句子;存储单元,用于存储所述翻译后的文档以及所述多义性部分;语音接收单元,用于接收源语言的语音;识别单元,用于识别所接收的语音,并且创建源语言语音句子作为识别结果;翻译更新单元,用于当所述源语言文档包括多义性部分时,通过重新翻译所述源语言语音句子中的、与所述多义性部分对应的一部分语音内容来更新翻译后语言文档;以及显示控制单元,用于将更新后的翻译后的文档显示在显示单元上。
权利要求

1.一种机器翻译装置,包括:
文档接收单元,用于接收以源语言描述的源语言文档的输入;
翻译单元,用于将所述源语言文档翻译为以目标语言描述的翻译 后的文档,并且创建多义性部分,该多义性部分是在翻译期间出现多 义性的词或句子;
存储单元,用于存储所述翻译后的文档以及所述多义性部分;
语音接收单元,用于接收所述源语言的语音;
识别单元,用于识别由所述语音接收单元接收的语音,并且创建 源语言语音句子作为识别结果;
翻译更新单元,用于当所述源语言文档包括多义性部分时,通过 重新翻译所述源语言语音句子中的、与所述多义性部分对应的一部分 语音内容,来更新存储在所述存储单元中的翻译后语言文档;以及
显示控制单元,用于将由所述翻译更新单元更新的翻译后的文档 显示在显示单元上。
2.根据权利要求1所述的装置,其中,所述翻译更新单元包括
提取单元,用于从所述源语言文档提取与所述源语言语音句子有 关的源语言句子;以及
选择单元,用于当由所述提取单元提取的所述源语言句子包括多 义性部分时,选择与所述多义性部分对应的一部分语音内容的翻译结 果,作为所述多义性部分的翻译结果。
3.根据权利要求2所述的装置,其中,所述提取单元将所述源 语言文档分割为特定范围的多个部分,所述多个部分分别包括至少一 个句子,计算所述特定范围的多个部分中的每一个中包含的每一个句 子与所述源语言语音句子之间的相似度,取得所述特定范围的多个部 分中的、包括与所述源语言语音句子具有最大相似度的句子的一个部 分,并且从所述特定范围的多个部分中的、所取得的一个部分提取所 述源语言句子。
4.根据权利要求3所述的装置,其中,所述提取单元计算所述 特定范围的多个部分中包含的每一个句子中包含的词与所述源语言 语音句子中包含的词之间的相似度,并且提取包含与所述源语言语音 句子中包含的词具有最大相似度的词的一个源语言句子。
5.根据权利要求2所述的装置,其中,所述提取单元从所述源 语言语音句子取得关于所述源语言文档中的、至少包含一页、一章、 一句或一段的特定范围的部分的信息,并且从所述源语言文档的所述 特定范围的部分提取所述源语言句子。
6.根据权利要求5所述的装置,其中,所述提取单元计算所述 特定范围的部分中包含的每一个句子中包含的词与所述源语言语音 句子中包含的词之间的相似度,并且提取包含与所述源语言语音句子 中包含的词具有最大相似度的词的一个句子。
7.根据权利要求2所述的装置,其中,
所述翻译单元创建在翻译后的词的选择期间出现多义性的多义 性部分,以及
当所述源语言句子包含在选择翻译后的词时出现多义性的多义 性部分时,所述选择单元根据与所述多义性部分对应的一部分语音内 容选择翻译后的词,作为所述多义性部分的译文。
8.根据权利要求2所述的装置,其中,
所述翻译单元创建在词的依赖关系的选择期间出现多义性的多 义性部分,以及
当所述源语言句子包含在依赖关系的选择期间出现多义性的多 义性部分时,所述选择单元选择与所述多义性部分对应的一部分语音 内容中的依赖关系,作为所述多义性部分中的依赖关系。
9.根据权利要求1所述的装置,其中,
所述存储单元存储所述翻译后的文档以及所述源语言文档中的 词或句子中的、出现多义性的多义性部分,以及
所述显示控制单元对应地显示所述翻译后的文档以及用于指示 出现多义性的部分的信息。
10.根据权利要求9所述的装置,其中,
所述存储单元存储所述翻译后的文档、所述多义性部分以及多义 性的类型,以及
所述显示控制单元还对应地显示所述翻译后的文档以及关于所 述翻译后的文档的多义性部分的多义性的类型。
11.一种机器翻译系统,包括:
显示装置,用于显示以源语言描述的源语言文档;以及
机器翻译装置,用于将所述源语言文档翻译为以目标语言描述的 翻译后的文档,作为翻译结果,并且所述机器翻译装置经由网络连接 到所述显示装置,其中
所述机器翻译装置包括:
文档接收单元,用于接收所述源语言文档的输入;
翻译单元,用于将所述源语言文档翻译为所述翻译后的文档,并 且创建多义性部分,所述多义性部分是具有在翻译期间出现的多义性 的词或句子;
存储单元,用于存储所述翻译后的文档以及所述多义性部分;
语音接收单元,用于接收所述源语言的语音;
识别单元,用于识别由所述语音接收单元接收的语音,并且创建 源语言语音句子作为识别结果;
翻译更新单元,用于当所述源语言文档包含所述多义性部分时, 通过重新翻译所述源语言语音句子中的、与所述多义性部分对应的一 部分语音内容,来更新存储在所述存储单元中的翻译后语言文档;
第一显示控制单元,用于将由所述翻译更新单元更新的翻译后的 文档显示在第一显示单元上;以及
发送单元,用于将存储在所述存储单元中的所述多义性部分发送 给所述显示装置,以及
所述显示装置包括:
接收单元,用于从所述机器翻译装置接收所述多义性部分;以及
第二显示控制单元,用于在第二显示单元上显示所述源语言文 档,所述源语言文档包括基于由所述接收单元接收的所述多义性部分 的、用于指示存在出现多义性的多义性部分的信息。
12.一种机器翻译方法,包括:
接收以源语言描述的源语言文档的输入;
将所述源语言文档翻译为以目标语言描述的翻译后的文档,并且 创建多义性部分,所述多义性部分是具有在翻译期间出现的多义性的 词或句子;
将所述翻译后的文档以及所述多义性部分存储在存储单元中;
接收所述源语言的语音;
识别所述语音,并且创建源语言语音句子作为识别结果;
当所述源语言文档包括多义性部分时,通过重新翻译所述源语言 语音句子中的、与所述多义性部分对应的一部分语音内容,来更新存 储在所述存储单元中的翻译后语言文档;以及
将在更新中更新的所述翻译后的文档显示在显示单元上。

说明书全文

技术领域

发明涉及用于对例如会议资料或演讲资料这样的文档进行机 器翻译的方法、装置和系统。

背景技术

近来,信息技术(IT)普遍用于会议或演讲时的演示。例如,电子 资料被分发给参加者或通过使用投影仪显示在屏幕上。同样,随着全 球化的发展,频繁地进行使用不同的语言的人之间的国际交流。此外, 随着例如电视电话和网际协议(IP)网络这样的各种通信网络的发展, 可以预料,未来使用电子资料在使用不同语言的人之间沟通的国际交 流将不断增多。
另一方面,随着自然语言处理技术的发展,已经实现了将以第一 语言书写的文本翻译为第二语言的机器翻译装置的实际使用。因此, 在会议中,即使用说话者的本国语言书写会议资料,说话者也可以通 过使用机器翻译装置来提供被译成听者的本国语言的会议资料。
此外,随着语音处理技术的发展,已经实现了语音合成器和语音 输入设备的实际使用,所述语音合成器将作为电子数据的自然语言字 符串转换为语音输出,所述语音输入设备将来自用户的语音输入转换 为字符串并且输出表示语音的自然语言字符串。
此外,利用自然语言处理技术和语音处理技术的集成,正在改进 解释通信支持装置的实际使用,其用于支持使用不同语言的人之间的 交流。具体来讲,解释通信支持装置不仅可以翻译会议资料,并且可 以将非本国的陈述语音翻译为听者的本国语言。因此,解释通信支持 装置可以用于克服使用不同本国语言的人之间的语言障碍。
如上所述,在例如国际会议或演讲这样的国际交流中,那些翻译 技术对于使用不同本国语言的人之间的相互了解是非常有用的。
然而,大多数会议资料或演讲资料仅包含最少量的信息,因为所 述资料是根据陈述语音和参加者的背景知识而创建的。因此,即使在 翻译资料的过程中出现解释的多义性,也难以从资料获取充足的信息 来消除多义性。即,机器翻译装置在翻译这种会议资料或演讲资料时 仍然有困难,特别是在翻译最近几年中的演示中频繁使用的幻灯片 时。此外,因为在其中存在自然语言所有的多义性,所以用机器翻译 资料的困难是固有的。
为了解决该问题,JP-A 2002-222189(KOKAI)公开了一种技术, 其中,与在利用会议资料的情况中一样,英文报纸中的文章的大标题 具有很少的上下文,通过参照文章的内容,它们被精确地译成目标语 言。
然而,甚至在上述文档所公开的技术中,也很难提供高度精确的 翻译,因为考虑到讲述了详细信息的口头陈述以及参加者的背景知 识,会议资料的说明是概括性的。

发明内容

根据本发明的一个方面,一种机器翻译装置,包括:文档接收单 元,用于接收以源语言描述的源语言文档的输入;翻译单元,用于将 所述源语言文档翻译为以目标语言描述的翻译后的文档,并且创建多 义性部分,该多义性部分是在翻译期间出现多义性的词或句子;存储 单元,用于存储所述翻译后的文档以及所述多义性部分;语音接收单 元,用于接收源语言的语音;识别单元,用于识别由所述语音接收单 元接收的语音,并且创建源语言语音句子作为识别结果;翻译更新单 元,用于当所述源语言文档包含所述多义性部分时,通过重新翻译所 述源语言语音句子中的、与所述多义性部分对应的一部分语音内容来 更新存储在所述存储单元中的翻译后语言文档;以及显示控制单元, 用于将由所述翻译更新单元更新的翻译后的文档显示在显示单元上。
根据本发明的另一个方面,一种机器翻译系统,包括:显示装置, 用于显示以源语言描述的源语言文档;以及机器翻译装置,用于将所 述源语言文档翻译为以目标语言描述的翻译后的文档,作为翻译结 果,并且所述机器翻译装置经由网络连接到所述显示装置,其中,所 述机器翻译装置包含:文档接收单元,用于接收所述源语言文档的输 入;翻译单元,用于将所述源语言文档翻译为所述翻译后的文档,并 且创建多义性部分,所述多义性部分是具有在翻译期间出现的多义性 的词或句子;存储单元,用于存储所述翻译后的文档以及所述多义性 部分;语音接收单元,用于接收源语言的语音;识别单元,用于识别 由所述语音接收单元接收的语音,并且创建源语言语音句子作为识别 结果;翻译更新单元,用于当所述源语言文档包含所述多义性部分时, 通过重新翻译所述源语言语音句子中的、与所述多义性部分对应的一 部分语音内容来更新存储在所述存储单元中的翻译后语言文档;第一 显示控制单元,用于将由所述翻译更新单元更新的翻译后的文档显示 在第一显示单元上;以及发送单元,用于将存储在所述存储单元中的 所述多义性部分发送给所述显示装置,并且所述显示装置包括:接收 单元,用于从所述机器翻译装置接收所述多义性部分;以及第二显示 控制单元,用于在第二显示单元上显示所述源语言文档,所述源语言 文档包括基于由所述接收单元接收的所述多义性部分的、用于指示存 在出现多义性的多义性部分的信息。
根据本发明的另一个方面,一种机器翻译方法,包括:接收以源 语言描述的源语言文档的输入;将所述源语言文档翻译为以目标语言 描述的翻译后的文档,并且创建多义性部分,所述多义性部分是具有 在翻译期间出现的多义性的词或句子;将所述翻译后的文档以及所述 多义性部分存储在存储单元中;接收源语言的语音;识别所述语音并 且创建源语言语音句子作为识别结果;当所述源语言文档包括多义性 部分时,通过重新翻译所述源语言语音句子中的、与所述多义性部分 对应的一部分语音内容来更新存储在所述存储单元中的翻译后语言 文档;以及将在更新中更新的所述翻译后的文档显示在显示单元上。
附图说明
图1是根据本发明第一实施例的机器翻译装置的框图
图2是显示翻译结果表的例子的说明性的示图;
图3是显示多义性表的例子的说明性的示图;
图4是显示用于说明解释依赖多义性的例子的说明性的示图;
图5是用于说明图1所示的翻译更新单元的框图;
图6是由根据第一实施例的机器翻译装置执行的机器翻译处理 的流程图
图7是由根据第一实施例的机器翻译装置执行的静态翻译处理 的流程图;
图8是由根据第一实施例的机器翻译装置执行的动态翻译处理 的流程图;
图9是显示源语言句子和源语言语音句子之间的对应的例子的 说明性的示图;
图10是显示源语言句子和源语言语音句子之间的对应的另一个 例子的说明性的示图;
图11是由根据第一实施例的机器翻译装置执行的翻译后文档显 示处理的流程图;
图12是显示显示在翻译后文档显示屏幕上的翻译后的文档的例 子的说明性的示图;
图13是根据本发明第二实施例的机器翻译系统的框图;
图14是显示多义性管理表的例子的说明性的示图;
图15是由根据第二实施例的机器翻译装置执行的静态翻译处理 的流程图;
图16是由根据第二实施例的机器翻译装置执行的动态翻译处理 的流程图;
图17是由根据第二实施例的机器翻译系统执行的源语言文档显 示处理的流程图;
图18是显示显示在源语言文档显示屏幕上的源语言文档的例子 的说明性的示图;
图19是显示显示在源语言文档显示屏幕上的源语言文档的另一 个例子的说明性的示图;
图20是显示多义性表的例子的说明性的示图;
图21是显示显示在翻译后文档显示屏幕上的翻译后的文档的例 子的说明性的示图;
图22是显示多义性表的例子的说明性的示图;
图23是显示显示在翻译后文档显示屏幕上的翻译后的文档的另 一个例子的说明性的示图;
图24是显示用于说明依赖结构的例子的说明性的示图;
图25是显示显示在翻译后文档显示屏幕上的翻译后的文档的另 一个例子的说明性的示图;
图26是显示翻译后的文档的显示内容的例子的说明性的示图;
图27是显示多义性管理表的例子的说明性的示图;
图28是显示源语言文档的显示内容的例子的说明性的示图;
图29是显示源语言文档的显示内容的另一个例子的说明性的示 图;以及
图30是用于说明根据第一或第二实施例的机器翻译装置的硬件 结构的框图。

具体实施方式

以下参照附图详细地说明本发明的示例性的实施例。虽然在实施 例中将日语-英语翻译以及英语-日语翻译作为例子进行说明,但是本 发明可以被用于所有语言,包括但不局限于日语和英语作为翻译目标 语言。
根据第一实施例的机器翻译装置100通过参考用于说明会议资 料、演示资料等等的语音内容,可以消除在翻译例如会议资料这样的 文档时的多义性。
由例如句号、问号或感叹号而分开的字符串单位被称为句子,包 括至少一个句子的、其中表达了一个主题或题目的字符串的单位称为 文档。
如图1所示,机器翻译装置100包括存储单元120、文档接收单 元101、翻译单元102、语音接收单元103、语音识别单元104、翻译 更新单元105、显示控制单元106以及语音输出控制单元107。
存储单元120是例如硬盘驱动器(HDD)、光盘、存储卡或随机存 取存储器(RAM)这样的存储介质,并且在其中存储翻译结果表121和 多义性表122。
翻译结果表121在其中存储包含在文档(即,资料)中的句子的翻 译结果。如图2所示,被分配给每一个句子以唯一标识句子的句子标 识符(ID)和翻译结果相对应地存储在翻译结果表121中。另外,在该 例子中,用英语写的资料被译成日语。
根据本实施例,假设文档中的每个单独的行包括一个句子,因此 顺序地分配给每一行的行号称为句子ID。然而,如果假定每一行包 括两个或更多句子,则句子ID被分配给每一个句子,以使得可以唯 一地标识句子。
多义性表122在其中存储关于在翻译过程中出现的多义性的信 息。具体来讲,如图3所示,句子ID以及多义性信息被相应地存储 在多义性表122中,所述多义性信息包括多义性的类型以及出现多义 性的部分的位置信息。
能够指定影响翻译结果的多义性的类型。多义性的类型包括,例 如,“译文选择”,其指示当选择包含在句子中的词的译文时出现的多 义性,以及“依赖”(dependency),其指示当识别到包含在句子中的 词之间的依赖性时出现的多义性。
其中出现多义性的部分的位置信息由“(k,l),(m,n)”指示,其中, “k”和“l”分别表示源语言句子中的、在翻译过程中出现多义性的 部分的开始词位置和结束词位置。例如,如果(k,l)是(2,5),那么当源 语言句子中的从第二个词到第五个词的部分被译成目标语言时,出现 多义性。类似地,“m”和“n”分别表示翻译后的句子中的、在译文 过程中出现多义性的部分的开始词位置和结束词位置。
文档接收单元101接收文本格式的文档的输入,例如演示资料或 会议资料。任何常规方法都可以用于将文档输入到文档接收单元101。 例如,文档接收单元101可以经由计算机可读记录介质接收电子文档 的输入,所述计算机可读记录介质例如磁带、磁盘和光盘,或者可以 经由例如因特网这样的网络来下载电子文档。此外,如果文档是不能 由文档接收单元101接收的格式,例如纸质文档,那么通过光字符阅 读机(OCR)等等将该文档转换为电子格式,从而文档接收单元101可 以接收该文档的输入。
以下,由文档接收单元101接收的文档称为源语言文档,并且包 含在源语言文档中的每一个句子称为源语言句子。
翻译单元102将由文档接收单元101接收的源语言文档翻译为目 标语言的翻译后的文档。然后,翻译单元102将翻译后的文档作为翻 译结果存储在翻译结果表121中,并且将关于在翻译过程中出现的多 义性的多义性信息存储在多义性表122中。
具体来讲,翻译单元102从源语言文档取得每一个源语言句子, 并且顺次地将所取得的源语言句子翻译为目标语言,然后存储翻译后 的句子作为翻译结果,并且将关于在句子的翻译处理中出现的多义性 的多义性信息存储在多义性表122中。如上所述,多义性信息包括在 翻译处理中出现的多义性的类型,源语言句子中出现多义性的部分的 位置以及翻译后的句子中的出现多义性的部分的位置。
例如,当英语句子“Difficulties of processing SL”被译成日语时, 假设词“SL”的翻译是表示“source language”、“spoken-language”、 “salvage loss”、“sea level”以及“symbolic language”的五个日语词 中的任何一个。在这种情况下,翻译单元102输出“source language” 的日语翻译,它是作为默认值的第一个引用的词。
然后,由于词“SL”的日语翻译的多个选择出现多义性,因此, 翻译单元102指定“译文选择”为多义性的类型,并且输出“(译文 选择,(4,4),(1,1))”作为多义性信息,其指示词“SL”的开始位置和 结束位置都是英语句子中的第四个词,并且表示词“SL”的日语译 文的开始位置和结束位置也都是翻译后的句子中的第一个词。
在英语句子“It requires special mechanisms for a recognizer.”被译 成日语的情况中,假设两个模式的解释依赖多义性出现在翻译处理中 (参见图4)。
在解释401中,如箭头所指,其被解释为“a recognizer”依赖于 “special mechanism”。另外,词语之间的依赖关系由箭头指示,如图 4所示。
在解释402中,如箭头所指,其被解释为“a recognizer”依赖于 “requires”。
在这种情况下,翻译单元102选择解释401,它是作为默认值的 第一个引用的解释,并且指定“依赖”为多义性的类型,并且输出“(依 赖,(1,7),(1,8))”作为多义性信息,其指示在英语句子中出现多义性 的部分的开始位置和结束位置分别是第一个词和第七个词,并且对应 于所述部分的日语译文的开始位置和结束位置分别是翻译后的句子 中的第一个词和第八个词。
任何在机器翻译系统中使用的方法都可以被用于由翻译单元102 执行的翻译处理。例如,转换法、基于例子的方法、基于统计的方法 以及中间语言方法都可用于翻译处理。此外,为了检测多义性,能够 使用一般的方法,例如,使用A*算法的形态分析,例如Earley分析 方法的语法分析,图表分析方法以及通用LR分析方法,或者上下文 分析以及话语分析,它们基于Shank的脚本或话语表示理论。
语音接收单元103经由话筒(未显示)从用户接收语音输入,并且 采样输入语音的模拟信号,将所采样的模拟信号转换为立体声数字信 号,然后输出该立体声数字信号。例如,传统的模拟到数字(A/D)转 换技术可以被用于由语音接收单元103执行的上述处理。
语音识别单元104对于由语音接收单元103接收的语音执行语音 识别处理,并且输出文本格式的语音。另外,语音识别单元104可以 使用例如线性预测编码(LPC)分析或隐尔可夫模型(HMM),通过通 用的语音识别方法来执行语音识别处理。以下,由语音识别单元104 输出的文本称为源语言语音句子。
在该实施例中,通过语音接收单元103和语音识别单元104将语 音转换为文本格式。或者,经由键盘鼠标,语音的内容(源语言语 音句子)可以被直接输入到机器翻译装置,或者还能够按照与文档接 收单元101相同的方式将语音的内容转换源语言语音句子,并且将转 换后的源语言语音句子输入到机器翻译装置。
翻译更新单元105将源语言语音句子翻译为以目标语言写的翻 译后的句子,并且参照翻译后的句子和存储在多义性表122中的多义 性信息消除在将源语言语音句子翻译为翻译后的文档的过程中出现 的多义性,然后利用其中消除了多义性的翻译后的文档更新翻译结果 表121。
具体来讲,翻译更新单元105翻译由语音接收单元103接收的源 语言语音句子,并且通过将源语言语音句子与由文档接收单元101接 收的源语言文档中的源语言句子相对应来消除翻译过程中出现的多 义性。然后,翻译更新单元105将所消除的多义性反映到由翻译单元 102输出的翻译后的文档,并且更新多义性表122。
如图5所示,翻译更新单元105包括提取单元501和翻译结果选 择单元502。
提取单元501从由文档接收单元101接收的源语言文档中提取源 语言句子中的、与由语音接收单元103接收的源语言语音句子最类似 的源语言句子。
具体来讲,提取单元501执行第一定位处理,其估计源语言文档 的哪个范围对应于所接收的源语言语音句子。在幻灯片作为演示资料 的情况中,范围的单位例如是每一个幻灯片,在包括多章的会议资料 的情况中,范围的单位例如是每一个章或每一个子句。
提取单位501将用于检测源语言句子的范围缩小到当前由说话 者说明的语音内容的部分的范围,作为提取单元501的最终输出,其 与源语言语音句子最类似。因此,提取单元501可以高速地和高精度 地将源语言句子与源语言语音句子相对应。
在第一定位处理中,当将幻灯片或主题移动到下一个时使用的短 语被预先存储在存储单元(未显示)中作为关键字,例如,“next”、“well” 以及“next showing”,因此,通过所存储的短语与包含在说话者的语 音中的短语之间的关键字匹配,可以容易地检测到到下一个幻灯片或 主题的移动。同样,传统的对应技术可以被用于第一定位处理。例如, 计算语音和文本之间的相似性,从而通过使用动态规划等可以动态地 检测具有最高相似度的对应关系。此外,还能够将在输入说话者的语 音时所显示的幻灯片或位置设置为对应位置。
此外,通过添加例如页码这样的位置信息以及通过从语音检测指 示位置的关键字,例如,“I′ll talk about section 3 in chapter 3.”,可以 改进第一定位处理的精度,其中,所述页码由说话者的语音或指针(未 显示)指示给听者。
具体来讲,提取单元501通过与预先存储在存储单元(未显示)中 的关键字匹配的关键字,从源语言语音句子中检测表示关于文档的范 围的信息的关键字,例如页、章节、子句以及段落,并且指定对应于 所检测的关键字的源语言文档的范围。然后,提取单元501从所指定 的范围中提取源语言句子。
接下来,提取单元501执行第二定位处理,其中,源语言语音句 子对应于包含在第一定位处理所估计的范围中的源语言句子中的、与 所述源语言语音句子最类似的一个源语言句子。
在本实施例中,相对于包含在第一定位处理所估计的范围中的每 一个源语言句子,通过下列等式(1)计算包含在每一个源语言句子中 的词与包含在源语言语音句子中的词之间的所有相似度,并且输出具 有最高句子相似度SIMs的一个源语言句子。
SIMs ( M , N ) = Σ i m arg max j ( SIMw ( w i , w j ) ) - - - ( 1 )
然而,如果句子相似度SIMs低于阈值,那么确定不存在对应于 源语言语音句子的源语言句子。因此,以失败结束第二定位处理。
另外,在等式(1)中,参考符号“M”表示源语言语音句子,“N” 表示包含在第一定位处理所估计的范围中的源语言句子,“wi”表示 包含在M中的第i个短语,“wj”表示包含在N中的第j个短语,并 且“m”表示包含在M中的短语的数量。参考符号“SIMw(wi,wj)” 表示用于计算词之间的相似度的函数。可以通过任何计算词语之间的 相似度的常规方法来获得词语之间的相似度,例如,计算按类属词典 排列的概念之间的距离的方法。
通过上述处理,源语言语音句子对应于包含所接收的源语言文档 中的源语言句子中的、与所述源语言语音句子最类似的一个源语言句 子,并且根据包含在源语言句子中的词与包含在源语言语音句子中的 词之间的相似度来获得源语言句子和源语言语音句子之间的对应关 系。
翻译结果选择单元502根据由提取单元501获得的定位结果重新 选择翻译结果,从而消除存储在多义性表122中的多义性。例如,当 多义性的类型是“译文选择”时,翻译结果选择单元502根据由提取 单元501获得的定位结果优先地重选择包含在与源语言句子对应的 源语言语音句子中的词的译文。另一方面,当多义性的类型是“依赖” 时,翻译结果选择单元优先考虑在源语言语音句子的分析中使用的依 赖关系,并且选择源语言句子的分析结果。
显示控制单元106在显示屏幕(未显示)上显示源语言文档的翻译 结果,同时参考源语言句子的翻译后的句子以及存储在存储单元120 中的多义性表122,指出出现翻译多义性的部分。具体来讲,显示控 制单元106通过将其中出现多义性的部分包含在括号“<”和“>” 中,从而指示所述部分。
语音输出控制单元107将作为源语言语音句子的翻译结果的翻 译后的语音句子合成为语音,并且输出合成的语音。语音输出控制单 元107可以通过使用任何常规方法来执行语音合成处理,例如,通过 语音段的汇编的语音合成,基于共振峰的语音合成,基于全集的语音 合成以及文本到语音的合成。
语音输出控制单元107可以与任何传统的输出方法相结合来进 行输出,例如,将被译成目标语言的文本输出到显示单元(例如显示 屏幕)的方法,以及通过文本打印将被译成目标语言的句子输出到打 印机等等的方法。这些输出方法可以用于代替语音输出控制单元107。
以下参考图6描述由根据第一实施例的机器翻译装置100执行的 机器翻译处理。
首先,执行静态翻译处理以翻译所接收的文本格式的源语言文档 (步骤S601)。然后,执行动态翻译处理,以参考用于说明源语言文档 的源语言语音句子来消除静态翻译处理中出现的多义性(步骤S602)。 以下详细地描述静态翻译处理和动态翻译处理。
以下参考图7详细地描述由机器翻译装置100执行的静态翻译处 理。
文档接收单元101接收源语言文档Ds的输入(步骤S701)。翻译 单元102从源语言文档Ds取得一行信息Ws(步骤S702)。也就是说, 翻译单元102在步骤S702取得一源语言句子,这是因为在本实施例 中,假设文档中的每一行仅包括一个句子。
翻译单元102翻译所述一行信息Ws,并且输出所述一行信息 Ws的多义性信息Wa以及翻译后的句子Wt(步骤S703)。如果在步骤 S703的翻译的过程中没有出现多义性,那么不输出多义性信息Wa。
翻译单元102将所述翻译后的句子Wt反映到翻译后的文档 Dt(步骤S704)。也就是说,翻译后的文档Dt中的翻译后的句子Wt 被输出作为对应于一行信息Ws的部分。
翻译单元102确定是否输出了多义性信息Wa(步骤S705)。如果 未输出多义性信息Wa(步骤S705:否),那么翻译单元102取得下一 行的一行信息Ws(步骤S702),并且系统控制进行到步骤S703。
如果输出了多义性信息Wa(步骤S705:是),那么翻译单元102 将所述多义性信息Wa存储在多义性表122中(步骤S706)。
翻译单元102确定是否处理了源语言文档Ds中的所有行(步骤 S707)。如果还未处理所有行(步骤S707:否),那么翻译单元102从 源语言文档Ds取得下一行的一行信息Ws(步骤S702)。系统控制进 行到步骤S703。
如果所有行都处理了(步骤S707:是),那么显示控制单元106执 行翻译后文档显示处理,即,将翻译后的文档Dt显示在显示单元(未 显示)上(步骤S708)。然后,结束静态翻译处理。
以下参考图8详细地描述由机器翻译装置100执行的动态翻译处 理。
翻译更新单元105从翻译结果表121取得翻译后的文档Dt(步骤 S801)。语音接收单元103接收源语言语音句子Ss的输入(步骤S802)。
翻译更新单元105输出翻译后的语音句子Ts,作为源语言语音 句子Ss的翻译结果(步骤S803)。提取单元501执行第一定位处理, 其估计源语言文档Ds的哪个范围对应于源语言语音句子(步骤 S804)。
提取单元501执行第二定位处理,其从在第一定位处理中估计的 范围中提取对应于翻译后的语音句子Ts的源语言句子Sa(步骤S805)。 具体来讲,提取单元501从在第一定位处理中通过利用等式(1)进行 计算而估计的范围中提取最类似于翻译后的语音句子Ts的源语言句 子Sa。通过所述处理,确定了包含在源语言句子Sa中的词与包含在 源语言语音句子Ss中的词之间的对应关系。
例如,如图9所示,作为源语言句子Sa的“Difficulties of processing SL”对应于作为源语言语音句子Ss的“Today,I′ll talked about Difficulties ofprocessing spoken-language”。通过实线指示包含在源语 言句子Sa中的词与包含在源语言语音句子Ss中的词之间的对应。在 这种情况下,包含在源语言句子Sa中的、出现多义性的词901(“SL”) 对应于包含在源语言语音句子Ss中的词902,如实线903所指。
如图10所示,作为源语言句子Sa的“It requires special mechanisms for a recognizer.”对应于作为源语言语音句子Ss的“So,It requires arecognizer with special mechanisms.”。
翻译更新单元105确定是否提取了源语言句子Sa(步骤S806)。 如上所述,如果句子相似度SIMs低于阈值,则不可以提取源语言句 子Sa。
如果提取了源语言句子Sa(步骤S806:是),则翻译更新单元105 确定是否在多义性表122中存储了任何记录(以下,与源语言句子Sa 有关的“多义性记录”被存储在多义性表122中)(步骤S807)。具体 来讲,翻译更新单元105确定在多义性表122中是否存储有一多义性 记录,其具有对应于源语言句子Sa的句子ID(行号)的句子ID。
如果有任何与源语言句子Sa有关的多义性记录存储在多义性表 122中(步骤S807:是),则翻译结果选择单元502参考源语言语音句 子Ss的翻译结果重新翻译源语言句子Sa,并且输出翻译后的句子 Ta(步骤S808)。
例如,假设在翻译源语言句子Sa中包含的词“SL”时出现多义 性,并且词“SL”的五个翻译候选存储在多义性表122中。当根据 源语言语音句子Ss的译文确定“SL”是“spoken-language”的缩写 时,翻译结果选择单元502执行重译处理并且选择“spoken-language” 作为词“SL”的译文。
如果在源语言文档Ds的多个部分中出现相同的多义性,那么当 出现在一个部分中的多义性被消除时,也可以自动地同样消除其它部 分中出现的多义性。
翻译更新单元105从多义性表122中删除对应于所消除的多义性 的多义性记录(步骤S809)。然后,翻译更新单元105用翻译后的句子 Ta替换源语言句子Sa的翻译后的句子,并且更新翻译结果表121(步 骤S810)。
显示控制单元106执行翻译后文档显示处理,即,在显示单元(未 显示)上显示更新后的翻译后的文档(步骤S811)。
如果在步骤S806确定未提取源语言句子Sa(步骤S806:否),或 者如果在步骤S807确定没有与源语言句子Sa有关的多义性记录存储 在多义性表122中(步骤S807:否),或者在显示控制单元106在显示 单元上显示了翻译后的文档Dt之后(步骤S811),语音输出控制单元 107向例如扬声器这样的语音输出单元(未显示)输出翻译后的语音句 子Ts的合成的语音(步骤S812)。
翻译更新单元105确定源语言语音句子Ss是否结束,即,例如 幻灯片这样的资料的说明是否完成(步骤S813)。如果源语言语音句子 Ss未结束(步骤S813:否),则系统控制进行到步骤S802。如果源语 言语音句子Ss结束(步骤S813:是),则结束动态翻译处理。
以下参考图11详细地描述步骤S708和S811中的翻译后文档显 示处理。
显示控制单元106从翻译结果表121取得翻译后的文档Dt(步骤 S1101)。然后,显示控制单元106从多义性表122取得一个多义性记 录(步骤S1102)。
显示控制单元106根据所取得的多义性记录编辑翻译后的句子, 以指示存在多义性,并且显示在翻译后文档显示屏幕上(步骤S1103)。 具体来讲,显示控制单元106参考包含在多义性记录中的、其中出现 多义性的部分的位置信息,将翻译后的句子的、其中出现多义性的部 分包括在角括号“<”和“>”中,并且显示在翻译后文档显示屏幕上, 如图12所示。
在图12所示的日语的翻译后的文档中,多义性出现在角括号“<” 和“>”所包含的日语词1201的部分。同样,依赖多义性出现在角括 号“<”和“>”所包含的日语句子1202的部分。
通过这种方式,通过使用标记可以指示在翻译过程中出现多义性 的部分。因此,能够引起听者的注意。另外,标记不局限于角括号“<” 和“>”。替换地,可以通过其它的标记、下划线或者改变字体颜色来 指示所述部分。
此外,还能够根据多义性的类型使用不同的标记。此外,能够向 通过使用标记指示的部分添加关于多义性的详细信息,例如,多义性 的内容或者其它的翻译候选。
在翻译后的句子被显示在翻译后文档显示屏幕上之后(步骤 S1103),显示控制单元106确定是否处理了所有的多义性记录(步骤 S1104)。如果还未处理所有的多义性记录(步骤S1104:否),则系统 控制进行到步骤S1102。
如上所述,根据第一实施例的机器翻译装置100通过参考用于说 明会议资料、演示资料等等的语音内容,可以消除在翻译例如会议资 料时出现的多义性。因此,即使会议资料包括最少量的内容,机器翻 译装置100也可以以高精度来翻译会议资料。
此外,机器翻译装置100可以根据语音的进程动态地将语音内容 对应到包含在资料中的内容,并且与动态对应同步地更新翻译后的内 容。因此,机器翻译装置100可以获取最新的翻译结果,因此可以支 持听者正确地理解说话者的意图。
通常,说话者仅仅将会议资料分发给参加者,并且很少将他的语 音翻译为所有听者(即,参加者)的本国语言。在大多数情况下,参加 者分别准备翻译装置以独立地翻译会议资料。因此,说话者通常不认 识会议资料的翻译结果。即使当说话者向听者提供了会议资料的翻译 时,也不能总是保证翻译的质量,因为说话者可能不具有听者的本国 语言的充足的知识。因此,难以纠正或填充说话者的意图与听者的理 解或资料的翻译之间的差异缺口。
在JP-A 2002-222189(KOKAI)中公开的机器翻译装置中,说话者 不能认识被译成听者的本国语言的资料的翻译结果,因此,说话者不 能提供用于填充听者的知识的缺口的适当的说明。因此,根据传统技 术的机器翻译装置不能实现说话者和听者之间的相互了解。
根据第二实施例的机器翻译系统可以显示在翻译会议资料等等 的处理中出现多义性的部分,因此说话者可以认识到存在多义性。因 此,说话者可以提供用于填充说话者的意图的差异缺口的适当的说 明。
如图13所示,根据第二实施例的机器翻译系统包括机器翻译装 置1300和显示装置200。仅仅一个机器翻译装置1300包含在图13 所示的机器翻译系统中,但是多个机器翻译装置可以被连接到显示装 置200。
由用户,即说话者使用显示装置200,并且在其上显示源语言文 档本身而不是源语言文档的翻译结果,以向说话者显示源语言文档。 包括显示单元的普通的计算机,例如个人电脑,可以用作显示装置 200。
如图13所示,显示装置200包括存储单元220、文档接收单元 201、显示控制单元202以及接收单元203。
存储单元220是例如HDD、光盘、存储卡或RAM这样的存储 介质,并且在其中存储相对于连接到显示装置200的每一个机器翻译 装置的多义性管理表222。
多义性管理表222包括关于在翻译过程中出现的多义性的多义 性信息。如图14所示,唯一标识连接到显示装置200的每一个机器 翻译装置的终端ID、句子ID以及多义性信息被对应地存储在多义性 管理表222中。
也就是说,多义性管理表222在其中存储多个记录(以下称为“多 义性管理记录”),在所述记录中对应地存储终端ID以及存储在多义 性表122中的每一个多义性记录,所述多义性表122包含在机器翻译 装置1300中。
即使当多个听者的终端(机器翻译装置)连接到显示装置200时, 也可以按照多义性的类型来管理多义性管理记录,这是因为终端ID 以及多义性记录被对应地存储在多义性管理表222中。即,如果消除 了在一个听者的终端中出现的多义性,并且如果未消除出现在其它的 听者的终端中的相同的多义性,那么可以在不删除信息的情况下适当 地管理关于多义性的信息,以防错误地确定消除了多义性。
文档接收单元201接收关于文本格式的文档的信息,例如演示资 料或会议资料。文档接收单元201与包含在机器翻译装置1300中的 文档接收单元101具有相同的功能。
显示控制单元202参考由文档接收单元201接收的源语言文档以 及存储在存储单元220中的多义性管理表222,在其上显示指示了出 现翻译多义性的部分的源语言文档。显示控制单元202按照与根据第 一实施例的显示控制单元106相同的方式,通过将其中出现翻译多义 性的部分包含在角括号“<”和“>”中来指示所述部分。
接收单元203接收从机器翻译装置1300中的发送单元1308发送 的多义性记录。接收单元203和发送单元1308之间的通信可以通过 任何种类的通信方法来进行,例如:有线局域网(LAN),无线wireless LAN或因特网。
当接收到多义性记录时,接收单元203将多义性记录和终端ID 存储在多义性管理表222中,所述终端ID唯一属于作为发送源的机 器翻译装置1300。另外,终端ID被从机器翻译装置1300发送到接 收单元203。
机器翻译装置1300包括存储单元120、文档接收单元101、翻译 单元102、语音接收单元103、语音识别单元104、翻译更新单元105、 显示控制单元106、语音输出控制单元107以及发送单元1308。
机器翻译装置1300与机器翻译装置100之间的区别在于机器翻 译装置1300还包括发送单元1308。利用相同的参考标记表示与图1 中相同的部分,并且省略那些部分的说明。
当源语言文档被译成翻译后的文档时,发送单元1308将存储在 多义性表122中的多义性记录发送到显示装置200中的接收单元203。
以下描述由机器翻译装置1300执行的机器翻译处理。另外,由 机器翻译装置1300执行的整个机器翻译处理与由如图6所示的机器 翻译装置100执行的相同,因此省略其说明。
以下参考图15详细地描述由机器翻译装置1300执行的静态翻译 处理。
步骤S1501到S1507的部分与图7所示的步骤S701到S707的 部分相同,省略对这些部分的说明。
如果确定所有行都已处理(步骤S1507:是),则发送单元1308将 存储在多义性表122中的多义性记录发送到源语言说话者的显示装 置200(步骤S1508)。
显示控制单元106执行翻译后文档显示处理,即,在显示单元(未 显示)上显示翻译后的文档Dt(步骤S1509),然后结束静态翻译处理。
以下参考图16详细地描述由机器翻译装置1300执行的动态翻译 处理。
步骤S1601到S1610的部分与图8所示的步骤S801到S810的 部分相同,省略对这些部分的说明。
在翻译更新单元105替换了翻译后的句子之后(步骤S1610),发 送单元1308将存储在多义性表122中的多义性记录发送到源语言说 话者的显示装置200(步骤S1611)。
步骤S1612到S1614的部分与图8所示的步骤S811到S813的 部分相同,省略对这些部分的说明。
在第二实施例中,如上所述,无论何时执行翻译处理以及在动态 翻译处理中更新多义性表122,都将存储在多义性表122中的多义性 记录发送到显示装置200。因此,能够通知显示装置200存在多义性。 因此,显示装置200可以参考通知内容自动地编辑显示内容。
以下参考图17描述由显示装置200执行的源语言文档显示处理。 在源语言文档显示处理中,显示装置200在其上显示源语言文档,其 中,参考存储在多义性管理表222中的多义性信息编辑了显示内容。
接收单元203从机器翻译装置1300接收终端ID和多义性表 122(步骤S1701)。文档接收单元201接收源语言文档Ds的输入(步骤 S1702)。
显示控制单元202从多义性管理表222中删除不必要的多义性管 理记录(步骤S1703)。具体来讲,显示控制单元202从多义性管理表 222中删除与所接收的终端ID具有相同的终端ID、并且具有不对应 于多义性表122中所存储的内容的内容的多义性管理记录。
如果作为发送源的机器翻译装置1300消除了多义性,则从多义 性表122删除对应于所述多义性的多义性记录。然后,多义性表122 被发送给显示装置200。在这种情况下,对应于所删除的多义性记录 的多义性管理记录仍然存储在显示装置200中的多义性管理表222 中,因此通过获取多义性记录和多义性管理记录之间的区别检测到多 义性管理记录,然后从多义性管理表222删除所检测到的多义性管理 记录。
显示控制单元202从多义性表122中删除已经存储在多义性管理 表222中的多义性记录(步骤S1704)。因此,能够防止多义性管理表 222存储重叠的多义性记录。具体来讲,显示控制单元202从多义性 管理表222删除具有相同的终端ID和相同的多义性信息的多义性记 录。
显示控制单元202在多义性管理表222中对应地存储多义性记录 和终端ID(步骤S1705)。
通过这种方式,可以创建多义性管理表222,在其中存储反映了 所接收的多义性记录的最新的多义性信息。
显示控制单元202从多义性管理表222中取得一个多义性管理记 录(步骤S1706)。然后,显示控制单元202确定是否已经编辑了对应 于包含在所取得的多义性管理记录中的、关于出现多义性的位置的位 置信息的部分(步骤S1707)。
如果还未编辑所述部分(步骤S1707:否),则显示控制单元202 编辑包含在源语言文档Ds中的、对应于所述部分的源语言句子,以 指示存在多义性,然后在源语言文档显示屏幕上显示编辑后的源语言 文档Ds(步骤S1708)。具体来讲,显示控制单元202参考多义性管理 记录中的对应于所述部分的位置信息,将所述部分包含在角括号“<” 和“>”中,并且在源语言文档显示屏幕上显示编辑后的源语言文档 Ds,如图18所示。
在图18所示的源语言文档Ds的情况中,在翻译角括号“<”和 “>”所包含的英语词1801时出现多义性,并且依赖多义性出现在角 括号“<”和“>”所包含的英语句子1802中。
因此,不仅听者,而且作为源语言说话者的说话者也可以认出在 翻译过程中出现多义性的部分。因此,说话者可以说明该部分以消除 多义性。因此。能够减少引起说话者的意图和听者的理解之间的差异 的可能性。
如果确定对应于位置信息的部分已经编辑(步骤S1707:是),或 者在编辑后的源语言文档Ds显示在源语言文档显示屏幕上之后(步 骤S1708),显示控制单元202确定是否处理了所有的多义性管理记录 (步骤S1709)。
如果还未处理所有的多义性管理记录(步骤S1709:否),则系统 控制进行到步骤S1706。如果处理了所有的多义性管理记录(步骤 S1709:是),则结束源语言文档显示处理。
以下参考图19到29详细地描述由机器翻译装置1300执行的动 态翻译处理。
假设作为会议资料的幻灯片被以电子方式分给参加者。此外,假 设说话者是英语说话者并且使用分配了作为终端ID的“Eng 001”的 说话者终端(显示装置200),并且听者是日语说话者并且使用分配了 作为终端ID的“Jpn 001”的听者终端(机器翻译装置1300)。
当如图19所示的幻灯片被输入听者的终端Jpn 001时,执行静态 翻译处理(步骤S601)。也就是说,幻灯片被静态地译成由终端Jpn 001 的用户(听者)设置的预定语言,即,在这种情况下被译成日语。
在静态翻译处理中,处理作为源语言文档Ds的所输入的幻灯片 (步骤S1501)。关于源语言文档Ds的第一行的信息“Difficulties of processing SL”被读出作为源语言文档Ds的一行信息Ws(步骤 S1502)。
作为翻译一行信息Ws的结果,翻译单元102输出作为多义性信 息的“(译文选择,(4,4),(1,1))”,以及作为翻译后的句子Wt的表示 “Difficulties of processing a source language”的日语译文(步骤 S1503)。
翻译单元102将所述翻译后的句子Wt的内容反映到翻译后的文 档Dt(步骤S1504)。多义性出现在翻译过程中(步骤S1505:是),因 此,翻译单元102将关于行号的信息以及多义性信息Wa对应地存储 在多义性表122,所述关于行号的信息指定包含在源语言文档Ds中 的、出现多义性的句子(步骤S1506)。图20是显示执行上述处理之后 的多义性表122的例子的说明性的示图。
然后,翻译单元102读取关于源语言文档Ds的第二行的信息 “Differ with WL in vocabularies”,作为一行信息Ws(步骤S1502)。
作为一行信息Ws的翻译结果,假设翻译单元102输出表示 “Differ with a written language in vocabularies”的日语译文,作为翻 译后的句子Wt(步骤S1503)。在这种情况下,翻译单元102不输出多 义性信息,因为在翻译第二行时未出现多义性。
翻译单元102将翻译后句子Wt的内容反映到翻译后的文档 Dt(步骤S1504),因为在翻译过程中未出现多义性(步骤S1505:否), 系统控制进行到步骤S1502。
通过这种方式,系统控制反复地进行那些步骤直到由翻译单元 102翻译关于源语言文档Ds的最后一行的信息“It requires special mechanisms for a recognizer”。在执行上述处理之后,多义性表122在 例如如图3所示的状态。
当源语言文档Ds的翻译处理结束时,多义性表122被发送到说 话者的终端,其中完全存储了关于在翻译过程中出现的多义性的多义 性信息(步骤S1508)。这时的状态称为中间状态1。
显示控制单元106执行翻译后文档显示处理(步骤S1509)。显示 控制单元106从翻译结果表121取得在静态翻译处理中创建的翻译后 的文档Dt(步骤S1101)。然后,显示控制单元106从图3所示的多义 性表122取得第一个多义性记录。即,显示控制单元106从多义性表 122取得第一多义性记录:“句子ID=1,多义性信息=(译文选择, (4,4),(1,1))”(步骤S1102)。
根据第一多义性记录,多义性出现在源语言文档Ds的首行中, 并且多义性影响翻译后的句子的第一个词。因此,显示控制单元106 将其中出现多义性的部分包含在角括号“<”和“>”中(步骤S1103)。 图21是显示在执行上述处理之后的翻译后的文档Dt的显示内容的例 子的说明性的示图。
用与第一多义性记录同样的方法处理多义性表122中包含的其 它的多义性记录。在处理了包含在多义性表122中的所有多义性记录 之后,显示翻译后的文档Dt,例如如图12所示。
根据本实施例的机器翻译系统可以向听者指示在翻译过程中出 现多义性的部分,例如,图12所示的表示“”的日 语词1201或者表示“” 的日语词1202。因此,能够引起听者的注意。
在结束静态翻译处理之后,执行动态翻译处理(步骤S602)。
从翻译结果表121取得由翻译单元102输出的翻译后的文档 Dt(步骤S1601)。假设语音接收单元103接收“Today,I′ll talk about difficulties ofprocessing spoken-language.”作为源语言语音句子Ss(步 骤S1602)。此外,假设翻译更新单元105将源语言语音句子Ss翻译 为日语并且输出表示“Today,I′ll talk about difficulties of processing spoken-language.”的日语翻译作为翻译后的语音句子Ts。
然后,提取单元501执行定位处理,以将源语言语音句子Ss对 应到包含在源语言文档Ds中的源语言句子(步骤S1604和S1605)。假 设作为图19所示的源语言文档的首行的句子的“Difficulties of processing SL”被提取作为对应的源语言句子Sa。图9描述了这时的 定位结果的例子。
因为源语言句子Sa被获得(步骤S1606:是),所以确定定位处理 成功,因此系统控制进行到步骤S1607。作为定位目标的所获得的源 语言句子Sa包含在源语言文档Ds的首行中,此外,与源语言句子 Sa对应的关于多义性的第一个多义性记录存储在图3所示的多义性 表122中(步骤S1607:是)。因此,系统控制进行到步骤S1608。
在这种情况下,作为图9所示的定位结果,包含在源语言句子 Sa中的词901“SL”对应于包含在源语言语音句子Ss中的词902 “spoken-language”。出现在源语言句子Sa中的多义性的类型是“SL” 的译文选择。假设表示“source language”、“spoken-language”、“salvage loss”、“sea level”以及“symbolic language”的五个日语译文被获得 作为词“SL”的译文候选。
假设唯一确定了通过定位处理对应于“SL”的“spoken-language”, 因此翻译结果选择单元502从译文候选中唯一选择表示 “spoken-language”的日语译文,因此彼此对应的两个词可以被译成 相同的译文。
因此,能够消除在翻译源语言句子Sa的过程中出现的译文选择 中的多义性,还可以获取反映了唯一选择的译文的新的翻译后的句子 Ta(步骤S1608)。
当如上所述消除了多义性时,从多义性表122删除对应于所消除 的多义性的第一多义性记录(参见图3)(步骤S1609)。同时,将新获得 的翻译后的句子Ta反映到翻译后的文档Dt(步骤S1610)。图22是显 示更新后的多义性表122的例子的说明性的示图。
更新后的多义性表122被发送到说话者的终端(步骤S1611)。这 时的状态称为中间状态2。
执行翻译后文档显示处理。图23是显示在翻译后文档显示处理 中的翻译后文档显示屏幕的显示内容的例子的说明性的示图。
在静态翻译处理执行之后的翻译后文档显示屏幕上,指示了多义 性出现在词1201(参见图12)。另一方面,如图23所示,具有正确的 表示“spoken-language”的日语译文的、对应于词1201的词2301显 示在翻译后文档显示屏幕上。即,说话者的意图正确地反映到日语译 文,并且还指示在听者的终端侧消除了在翻译过程中出现的多义性。
如上所述,根据本实施例的机器翻译系统可以正确地消除在翻译 过程中出现的多义性,并且还可以消除说话者的意图与听者的理解之 间的差异。
在执行翻译后文档显示处理之后,语音输出控制单元107输出翻 译后的语音句子Ts的合成的语音(步骤S1613),然后系统控制进行到 步骤S1614。
假设还输入一语音到语音接收单元103(步骤S1614),并且语音 接收单元103接收“Of course,as you know,there are several difficulties.”作为源语言语音句子Ss(步骤S1602)。
假设翻译更新单元105将源语言语音句子Ss翻译为日语并且输 出表示“Of course,as you know,there are several difficulties.”的日语 翻译作为翻译后的语音句子Ts(步骤S1603)。
然后,提取单元501执行定位处理,以将源语言语音句子Ss对 应到包含在源语言文档Ds中的源语言句子(步骤S1604和S1605)。如 果未从源语言文档Ds获得对应的源语言句子,那么假设不存在源语 言句子Sa。因此,确定定位处理失败(步骤S1606:否),并且执行语 音合成输出处理(步骤S1613)。
如上所述,即使当获得新的语音时,如果该语音的输入对消除多 义性没有帮助,就不执行消除多义性的处理。因此,能够防止翻译后 的文档Dt被错误的更新。
假设还输入一语音到语音接收单元103(步骤S1614:否),并且 语音接收单元103接收“It requires a recognizer with special mechanisms.”作为源语言语音句子Ss(步骤S1602)。
假设翻译更新单元105将源语言语音句子Ss翻译为日语并且输 出表示“It requires a recognizer with special mechanisms.”的日语翻译 作为翻译后的语音句子Ts(步骤S1603)。
然后,提取单元501执行定位处理,以将源语言语音句子Ss对 应到包含在源语言文档Ds中的源语言句子(步骤S1604和S1605)。假 设作为图19所示的源语言文档的第十行的句子的“It requires special mechanisms for a recognizer”被提取作为对应的源语言句子Sa。这时, 定位结果如图10所示。
因为源语言句子Sa被获得(步骤S1606:是),所以确定定位处理 成功,因此系统控制进行到步骤S1607。作为定位目标的所获得的源 语言句子Sa包含在源语言文档Ds的第十行中,此外,与源语言句子 Sa对应的关于多义性的多义性记录存储在图22所示的多义性表122 中(步骤S1607:是)。因此,系统控制进行到步骤S1608。
根据图22所示的多义性记录,在翻译过程中,依赖多义性出现 在源语言句子Sa中。假设多义性可以被解释为两种方式,如图4所 示的解释401和402所指示的。
在解释401中,“a recognizer”被解释为依赖于“special mechanism”。在解释402中,“a recognizer”解释为依赖于“requires”。 在静态翻译处理中,选择解释401。
另一方面,假设当翻译更新单元105将源语言语音句子Ss翻译 为日语时,依赖结构被唯一地确定。图24是显示唯一确定的依赖结 构的例子的说明性的示图。该例子指示解释402将被优先选择。因此, 确定源语言句子Sa被优先地像解释402一样进行解释。
因此,能够消除在翻译过程中出现的依赖解释中的多义性,还可 以获取反映了唯一确定的依赖解释的新的翻译后的句子Ta(步骤 S1608)。
如上所述消除了多义性,因此从多义性表122删除关于所消除的 多义性的多义性记录(参见图22)(步骤S1609)。同时,将新获得的翻 译后的句子Ta反映到翻译后的文档Dt(步骤S1610)。这时,消除了 所有在静态翻译处理中出现在源语言文档Ds中的多义性,因此存储 在听者的终端的多义性表122的状态返回空集。
其状态返回空集的多义性表122被发送给说话者终端(步骤 S1611)。这时的状态称为中间状态3。
执行翻译后文档显示处理。图25是显示在翻译后文档显示处理 中,显示在翻译后文档显示屏幕上的显示内容的例子的说明性的示 图。
在图23所示的显示内容的情况下,指示了其中出现多义性的句 子2302。另一方面,在图25所示的显示内容的例子中,指示了其中 依赖关系被正确地解释的句子2501。也就是说,说话者的意图被正 确地反映到句子2501。同样,听者可以知道消除了在翻译过程中出 现的多义性。
以下利用有形的例子描述翻译后文档显示处理。无论何时从听者 的终端发送了多义性表122,都执行翻译后文档显示处理。
首先,描述一处理,其中,在中间状态1,图3所示的多义性表 122被从听者的终端发送到说话者的终端。然而,假设存储在说话者 的终端中的多义性管理表222的状态始终是空集,直到说话者的终端 接收到如图3所示的多义性表122。
说话者的终端首先接收作为发送源的终端ID的“Jpn 001”以及 如图3所示的多义性表122(步骤S1701)。然后,说话者的终端接收 源语言文档Ds的输入(步骤S1702)。
这时,没有多义性管理记录存储在多义性管理表222中,因此, 包含在所接收的多义性表122中的所有的多义性记录与对应的终端 ID一起被存储在多义性管理表222中(步骤S1703到S1705)。
如图14所示,多义性管理表222在其中存储两个多义性管理记 录。因此,从多义性管理表222取得第一个多义性管理记录:“终端 ID=Jpn 001,句子ID=1,多义性信息=(译文选择,(4,4),(1,1))”。
第一多义性管理记录指示多义性出现在源语言文档Ds的首行 中,并且多义性影响源语言句子的第四个词。因此,显示控制单元 106将其中出现多义性的部分包含在角括号“<”和“>”中。图26 是显示在执行上述处理之后的翻译后的文档Dt的显示内容的例子的 说明性的示图。
用与第一多义性管理记录同样的方法处理其它的多义性管理记 录。在处理了包含在多义性管理表222中的所有多义性管理记录之 后,显示翻译后的文档Dt,例如如图18所示。
如上所述,根据本实施例的机器翻译系统可以向说话者指示在翻 译过程中出现多义性的部分。例如,说话者可以知道多义性出现在图 18所示的词1801“”和句子1802“”中。因此,能够引起说话者的注意。
描述一处理,其中,在中间状态2,图22所示的多义性表122 被从听者的终端发送到说话者的终端。假设多义性管理表222在其中 存储如图14所示的多义性管理记录。
说话者的终端首先接收作为发送源的听者的终端的终端ID“Jpn 001”以及如图22所示的多义性表122(步骤S1701)。然后,说话者 的终端接收源语言文档Ds的输入(步骤S1702)。
从在图14所示的多义性管理表222中存储的具有终端ID“Jpn 001”的多义性管理记录中删除第一个多义性管理记录,这是因为第 一个多义性管理记录不对应于所接收的多义性表122中的任何多义 性记录(步骤S1703)。
然后,从多义性表122删除图22所示的多义性记录,其对应于 存储在多义性管理表222中的多义性管理记录(步骤S1704)。因此, 所接收的多义性表122的状态返回空集,因此,没有将添加到多义性 管理表222中的多义性记录(步骤S1705)。图27是显示多义性管理表 222的例子的说明性的示图。
反复执行上述处理,结果如图28所示,显示指示了出现多义性 的部分的源语言文档Ds。
在图18所示的显示内容的例子中,指示多义性出现在词1801 “”中。另一方面,在图28所示的显示内容的例子中,从词1801 “”除去了角括号“<”和“>”。即,词1801“”被动态 地更新为词2801“SL”。因此,说话者可以动态地知道在翻译过程中 出现在听者的终端的多义性。因此,说话者可以通过说明其中出现多 义性的部分从而平滑地消除多义性。
在中间状态3中,说话者的终端接收其状态是空集的多义性表 122,因此,多义性管理表222的状态同样返回空集(步骤S1703到 S1705)。因此,不必编辑包含在源语言文档Ds中的源语言句子以指 示多义性的存在。其中未出现多义性的源语言文档Ds被显示在说话 者的终端的显示屏幕上。
图29是显示源语言文档Ds的显示内容的例子的说明性的示图。 在中间状态3,如图29所示,显示了没有任何指示存在多义性的标 记的源语言文档Ds。
在图28所示的显示内容的例子中,多义性出现在句子2802“”,如角括号“<”和“>” 所指示的。另一方面,在图29所示的显示内容的例子中,从句子2802 除去了角括号“<”和“>”。即,句子2802被动态地更新为句子2901 “It requires special mechanisms for a recognizer.”。因此,说话者可以 动态地知道在翻译过程中出现在听者的终端的多义性被说话者的语 音消除。
如上所述,当翻译多义性出现在会议资料中时,根据第二实施例 的机器翻译装置1300可以指示其中出现多义性的部分,从而说话者 可以知道将说明的部分。因此,说话者可以分享在听者所参考的翻译 后的资料中出现的解释问题,因此说话者可以说明该部分以消除多义 性。此外,当由说话者的语音消除了多义性时,关于语音的信息可以 动态地更新,因此,能够消除说话者的意图和听者的理解之间的差异。
在第一和第二实施例中,源语言文档或者翻译后的文档被显示在 机器翻译装置的显示屏幕上。或者,机器翻译装置可以将源语言文档 或者翻译后的文档转换为合成的语音并且输出该合成的语音。在这种 情况下,通过改变语音属性来输出出现多义性的部分,例如通过改变 为不同的音调或音量,从而用户可以知道多义性出现在该部分。
以下参考图30描述根据第一或第二实施例的机器翻译装置的硬 件结构。
如图30所示,机器翻译装置包括作为控制设备的中央处理单元 (CPU)51,作为存储设备的只读存储器(ROM)52和随机存取存储器 (RAM)53,通信接口(I/F)54和总线61。CPU 51、ROM 52、RAM 53 和通信I/F54连接到总线61。通信I/F54还连接到网络并且通过网络 通信。
由机器翻译装置执行的机器翻译程序将预先存储在例如ROM 52 上。
或者,机器翻译程序可以以可安装或可执行的格式记录在计算机 可读记录介质上,例如光盘只读存储器(CD-ROM),软磁盘(FD),可 记录光盘(CD-R)以及数字多用途盘(DVD)。
还能够将机器翻译程序存储在连接到网络(例如因特网)的计算 机中,并且经由网络下载该机器翻译程序。能够经由网络提供或分发 机器翻译程序。
机器翻译程序被构造为包括文档接收单元、翻译控制单元、翻译 单元、更新单元、语音识别单元、语音接收单元、显示控制单元、语 音输出控制单元,它们构成模组件。在实际的硬件中,CPU 51从 ROM 52读出机器翻译程序并且执行机器翻译程序,然后将每一个上 述单元加载到主存储设备上。
对于本领域技术人员来讲,其他的优点和变形是显而易见的。因 此,本发明不局限于在这里显示和描述的具体细节以及代表性实施 例。因此,在不脱离由附加的权利要求以及它们的等价物所定义的一 般的发明构思的精神或范围的情况下,可以作出各种变形。
QQ群二维码
意见反馈