首页 / 专利库 / 人工智能 / 词性标注 / 开放式全息全选全程模板式人机互补语言翻译方法

开放式全息全选全程模板式人机互补语言翻译方法

阅读:964发布:2021-10-22

专利汇可以提供开放式全息全选全程模板式人机互补语言翻译方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种开放式全息全选全程模板式人机互补语言翻译方法,包括建立一个开放的以句子为对象的自然语言翻译多语通用人机对话全息模板,模板中包含有多语翻译人机对话所需的全部备用信息项;根据人机对话求解各自然语言符号实际携带的所有信息项;系统自动转换生成以句子为单元的译文自然语言表达形式,并同时提供用译文符号标注的原文符号信息项求解清单,供译文用户在需要时进行查询。具有人机互补、多语通用、传递语义信息准确的特点,适于在 计算机网络 中作多语种交流。,下面是开放式全息全选全程模板式人机互补语言翻译方法专利的具体信息内容。

1.一种开放式全息全选全程模板式人机互补语言翻译方法,其特征在于包括 下述步骤:
a.建立一个开放的以句子为对象的多语通用的自然语言翻译人机对话模板;
b.由自然语言翻译人机对话模板提供与原文自然语言符号项对应的多语通用 的全部备选信息项及供用户扩展的空白信息项;
c.由原文用户对自然语言翻译人机对话模板中的计算机优选信息项进行选 项、补充、确认;
d.由翻译系统将人机互补确定的信息项转换生成译文符号,译文用户采用译 文符号对原文自然语言符号项的全部备选信息项及扩展的空白信息项的求解结 果进行查询。
2.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述的开放式全息全选全程模板式人机对话语言翻译方法还包 括:通过程序设计对由用户扩展的信息项进行使用频率统计,并根据使用频率统 计结果确定新增通用基础概念,在翻译系统的所有语种的自然语言翻译人机对话 模板中同步增添自然语言符号项及对应的信息项。
3.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述的步骤b中,当与原文自然语言符号项对应的同语种某备 选信息项中出现有空白时,用户可调用已被系统收入过的自然语言符号对其进行 描述。
4.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述的全部备选信息项按类包括自然语言符号项的概念定义、 时态信息、语态信息、句法信息、上位“格”信息、词性信息、单复数信息和阴 阳性信息,以及由系统提供的供人工设计的除上述信息以外的其它信息。
5.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述的原文自然语言符号信息项是符号代码,包括原文文字和 用图标或用数码表示的形式代码;原文自然语言符号包括单字、词、词组、短语 和各种固定搭配的句子。
6根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述步骤d中的转换求解结果过程是用人工标注图标、数码的 方式来实现的。
7.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述步骤b中,所述的自然语言符号及其全部备选信息项是对 各种自然语言常用符号语义信息项基础概念的并集。
8.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方 法,其特征在于:所述步骤b中的多语通用备选信息项,是根据语种差异和译文 精度要求差异,由系统对用户进行有选择的开放。

说明书全文

发明涉及一种计算机翻译方法,更确切地说是涉及一种在计算机网络中适 于各网络终端以不同自然语言进行信息传递交流的机器翻译方法。

申请人于1998年4月6日向中国专利局提出名称为《全息全选全程模板式 人机对话语言翻译方法》、申请号为98101156.x的发明专利,该方法的实现步骤 是:a.建立一个以句子为对象的包括各种自然语言必要信息要素的自然语言翻译 人机对话模板;b.由对话模板提供对不同自然语言进行统一通约受限后的所有备 选信息项;c.先由翻译系统对统一通约受限后的所有备选信息项进行自动优选, 再由用户在全息对话模板上对优选结果进行人工调整和确认;d.由翻译系统根据 确定信息项进行译出目标语转换生成,将源语输入方的选项结果随译文提供给用 户查询。

全息全选全程模板式人机对话语言翻译方法作为不同自然语言语义信息传 递的一种通用方式,与其它计算机自然语言翻译技术相比,在语义信息传递准 确、适于多语通用方面是具有明显优势的。但是,由于人机交互信息项是经统一 通约受限过的,用户进行人机交互的方法不够多样、灵活,并且由于对系统未收 入的符号不能进行处理,因此不能满足自然语言不断发展变化的客观要求。

本发明的目的是设计一种开放式全息全选全程模板式人机互补语言翻译方 法,作为对在先申请的98101156.x《全息全选全程模板式人机对话语言翻译方 法》技术方案的补充,从而将全息全选全程模板式人机对话语言翻译方法扩展成 为一个人机交互方式更为灵活多样、表达内容不受限制、生成译文更为自然流畅 的人机对话多语翻译方法。

本发明的目的是这样实现的:一种开放式全息全选全程模板式人机互补语言 翻译方法,其特征在于包括下述步骤:

a.建立一个开放的以句子为对象的多语通用的自然语言翻译人机对话模板;

b.由自然语言翻译人机对话模板提供与原文自然语言符号项对应的多语通用 的全部备选信息项及供用户扩展的空白信息项;

c.由原文用户对自然语言翻译人机对话模板中的计算机优选信息项进行选 项、补充、确认;

d.由翻译系统将人机互补确定的信息项转换生成译文符号,译文用户采用译 文符号对原文自然语言符号项的全部备选信息项及扩展的空白信息项的求解结 果进行查询。

所述的开放式全息全选全程模板式人机对话语言翻译方法还包括:通过程序 设计对由用户扩展的信息项进行使用频率统计,并根据使用频率统计结果确定新 增通用基础概念,在翻译系统的所有语种的自然语言翻译人机对话模板中同步增 添自然语言符号项及对应的信息项。

所述的步骤b中,当与原文自然语言符号项对应的同语种某备选信息项中出 现有空白时,用户可调用已被系统收入过的自然语言符号对其进行描述。

所述的全部备选信息项按类包括自然语言符号项的概念定义、时态信息、语 态信息、句法信息、上位“格”信息、词性信息、单复数信息和阴阳性信息,以 及由系统提供的供人工设计的除上述信息以外的其它信息。

所述的原文自然语言符号信息项是符号代码,包括原文文字和用图标或用数 码表示的形式代码;原文自然语言符号包括单字、词、词组、短语和各种固定搭 配的句子。

所述步骤d中的转换求解结果过程是用人工标注图标、数码的方式来实现 的。

所述步骤b中,所述的自然语言符号及其全部备选信息项是对各种自然语言 常用符号语义信息项基础概念的并集。

所述步骤b中的多语通用备选信息项,是根据语种差异和译文精度要求差 异,由系统对用户进行有选择的开放。

本发明开放式全息全选全程模板式人机对话语言翻译方法的技术特点是:由 于自然语言翻译的根本目的是传递原文自然语言符号实际携带的语义信息,本发 明方案通过建立开放的自然语言全息模板,为各语种中的各个自然语言符号可能 携带的所有语义信息均提供了具有灵活开放特征的人机交互求解的渠道,实现全 息翻译;建立必要的自然语言表达规范是完成多义符号语义信息项求解任务、保 证语言自动翻译质量的重要条件,本发明用全息模板向用户提供可控制的备选信 息项,从而建立起面向用户的多语种通用自然语言表达规范,通过在全息模板内 进行人机交互选项,来全面求解自然语言符号串实际携带的语义信息,实现全选 翻译;即使已对原文自然语言符号的语义信息项进行了全面求解,在转换成了译 文符号串后,仍可能新增岐义,为了保证翻译系统的原文语义信息的传递质量, 本发明可根据用户需要将原文全息清单的任意信息项人机交互的最终求解结 果,包括中间代码,转换成译文符号形式,以供译文用户查询,实现全程翻译。

本发明的开放式全息全选全程模板式人机对话语言翻译方法,在网络信息交 流领域具有普遍应用的价值,在打开网络在线服务、机器翻译服务方面将会有广 阔的国际市场。

下面结合一个将英文句子“I saw a boy with a telescope near the bank”,翻译 成中文的开放式全息全选全程模板式人机对话语言翻译过程进一步说明本发明 的技术。

图1是全息全选全程模板式人机对话语言翻译人机交互信息处理的基本过程 框图

图2是以英文原句为对象的自然语言全息模板结构示意图。

图3是图2所示模板结构的中文对照图。

图4是查询自然语言符号“with a telescope”实际携带句法信息项的过程示 意图。

图5是用图标、数字或不同形状、颜色线条、框格作代码进行自动或人工标 注的过程示意图。

图6是在某种语言的信息项符号空缺时对其进行语义描述的过程示意图

参见图1,图中流程说明了全息全选全程模板式人机对话语言翻译人机交互 信息处理的基本过程,其中中间列框11至17是翻译系统计算机的主流程,左边 列框21至16示出用户的参与过程,右边列框31至35示出人机交互过程及与内 部数据库、规则库间的关系,单向箭头表示人机交互流向,双向箭头表示在语言 翻译过程中对数据及规则的调用过程,所标的N表示系统信息处理需要人机交 互,所标的Y表示自动进入系统流程的下一个操作步骤,##----##表示 此翻译系统与因特网系统的信息处理接口。其上方表示原文用户端,其下方表示 译文用户端。

处理过程开始,执行步骤11,由原文用户顺序输入待翻译的自然语言符号。

结合参见图2并对照图3,在模板的序位1至10中依次填入本例中的十个自 然语言符号I saw a boy with a telescope near the bank;系统主程序 的步骤12在可扩展的多语对应的语义信息项符号库31中,对各自然语言符号进 行备用(语义)信息项搜索,当搜索不到时可通过步骤21由原文用户在模板上 用系统已收入的语义符号对语义进行描述,上述过程最终生成模板中的由概念定 义项、特殊属性项、时态项、语态项等构成的语义备用信息项,如果在某自然语 言符号下出现概念定义信息项空白,如bank处出现?,则系统用户可采用系统 中已提供有信息项的词汇符号对其进行语义描述,即模板中概念定义项 “institution for keeping or lending money”;系统主程序的步骤13,根据语义信 息项概率性优选规则库32中的规则,如模板中用黑体指定的信息项,由计算 机对列入模板中的各自然语言符号的多个语义备用信息项进行自动优选,可通过 步骤22由原文用户对未获得确定优选的语义信息项进行选择确认;系统主程序 的步骤14,通过调用句法成份信息项自动标注模型库33,对列入模板中的各自 然语言符号的句法信息项进行自动标注,上述过程最终生成模板中的句法成份 项、词性项、上位“格”项、场景项;系统主程序的步骤15,调用句法成份信 息项自动优选规则库34,对各自然语言符号的句法成份信息项进行自动优选, 其间可通过步骤24调用句法信息项三维结构模型库23,由原文用户在模板上对 未获得唯一优选结果的句法信息项进行选择确认,如模板中用黑体字指定的信息 项;系统主程序至此就可以以自定的编码形式在网络上传递所确定的上述信息 项。

模板中的全部信息项已扩展为自然语言符号所能携带的所有信息项,其全部 备用信息项不仅包括自然语言符号的概念定义、时态信息、语态信息、句法信息、 上位“格”信息、词性信息、单复数信息、阴阳性信息、而且可在开放式的模板 下部扩展人工设计和标注的其它信息。

结合参见图4,译文用户端系统主程序的步骤16,调用译文自动转换生成规 则库35,根据多语符号与序位转换规则,将经原文用户确认的信息项求解结果 自动转换成译文用户要求的自然语言译文,如图4中所示的中文转换生成结果“在 行附近我看见一男孩带望远镜”;系统主程序在步骤17将会询问用户译文是 否已经无岐义,如果有岐义,译文用户可在步骤26通过人机交互过程确定相关 信息项的查询范围,基间可调用多语对应信息项符号库25,如译文用户为了求 解“带望远镜”到底是修饰主语还是修饰宾语,如图4中?所示,就可直接查询 该符号实际携带的句法信息项,从而确定是修饰宾语。至此翻译过程结束。

模板中的所有备选信息项均可利用图标或数字或不同颜色的线条和框格作 为代码进行人工或自动标注,如图5中所示的用数字标注,用1标注“我”,用~ 1标注“在银行附近”(句法信息),用2标注“看见”、“看见一个”(句法 信息),用3标注“男孩”,用~3标注“带望远镜的”(句法信息)等。

结合参见图6,图中示出以自然语言符号“笑”为例,并集各种自然语言常 用符号语义信息项形成基础概念的过程。图中仅列出其英语、汉语的基础概念并 集结果,俄语、日语、法语、德语、西班牙语及其它语种可按相同方法进行语义 描述。图中所示的三个主要过程是:如某种语言基础信息项符号出现空缺时,用 该种语言的其它常用语义信息项符号进行语义描述,形成基础信息项,如“笑” 与“laugh”;当某种语言非基础信息项空缺时,则与基础信息项符号建立模糊 对应关系,形成非基础信息项,如“大笑、微笑、笑逐颜开、笑哈哈”与“burst、 smile”;当某种语言其它近义信息项空缺时,则用该语言常用语义信息项符号 进行语义描述,形成其它近义项,如“傻笑、咧嘴笑”与“snicker、grin”。 表中的统一编码就是图1中的自定的编码形式,用于在网络上传递信息。

原文用户在图1步骤21中利用语义描述方法求解原文符号时,系统程序还要 自动进行其使用频率的统计,在使用频率达到一定平时,即在翻译系统收入的 所有语种的自然语言符号库中同步增添新增的自然语言符号或新增信息项。如人 工描述求解bank的使用频率达到一定水平时,系统即在法语的自然语言符号库 中添加新增的符号“banque”和利用系统已收入的相应法语符号进行语义描述, 并给出其它相关备选信息项。其它语言的扩展方法与其相同。

实施时,模板中的各自然语言符号顶可以是单字,如“我”,也可以是词, 如“银行”(或词组“国家银行”),短语,如“带望远镜的”,和各种固定搭 配,如“在…附近”,当然也可以是句子(如“瞎子点灯白费蜡”)。

此外,如果用户只要求翻译基本语义,则系统开放的供人机交互的选项类则 可相应减少;反之,当用户要求译文的流畅性高时,则供人机交互选项的类要相 应增多。

本发明的方法以人机互补、多语通用、语义信息传递准确为特色,尤其适用 于只懂母语的用户在计算机网络上进行广泛的多语交流。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈