首页 / 专利库 / 人工智能 / 计算机辅助翻译 / 一种云翻译输入法及系统

一种翻译输入法及系统

阅读:328发布:2020-05-18

专利汇可以提供一种翻译输入法及系统专利检索,专利查询,专利分析的服务。并且一种 云 翻译输入法及系统,涉及云计算、 机器翻译 、 计算机辅助翻译 、概率词典和输入法等领域。所述云翻译输入法通过获取原文信息,根据概率词典,利用支持交互式翻译的 机器翻译引擎 提供的带概率的翻译结果,扩充、重排候选词,提高了翻译用户输入译文的效率,且支持任何语言的输入。所述云翻译输入系统采用基于云服务的架构实现,设有客户端和 服务器 端;客户端设有控 制模 块 和 用户界面 模块,用户界面模块的输入端与用户连接,用户界面模块与 控制模块 连接;服务器端设有通信 接口 模块、解码模块、术语识别模块和机器翻译模块;所述 通信接口 模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。,下面是一种翻译输入法及系统专利的具体信息内容。

1.一种翻译输入法,其特征在于包括以下步骤:
S1,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;
S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行输入码解码,将解码得到的词语及其概率放入候选词表;
S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;
S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;
S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;
S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;
S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;
S8,向用户界面返回候选词表,并支持用户自造词。
2.如权利要求1所述一种云翻译输入法,其特征在于在步骤S2中,所述输入码解码的过程中支持模糊码规则,不仅支持双向模糊码,而且支持单向模糊码。
3.云翻译输入系统,其特征在于设有客户端和服务器端;客户端设有控制模和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。

说明书全文

一种翻译输入法及系统

技术领域

[0001] 本发明涉及云计算、机器翻译计算机辅助翻译、概率词典和输入法等领域,尤其是涉及一种云翻译输入法及系统。

背景技术

[0002] 目前,涉及翻译输入法的中国专利申请有:公开(公告)号为CN102662490A,申请人为北京语智云帆科技有限公司的“一种具有辅助翻译功能的输入方法”;公开(公告)号为CN101034407,申请人为传神联合(北京)信息技术有限公司的“一种翻译过程中基于场景词库的快速输入法”。这类输入法利用用户当前正在翻译的原文信息,对候选词表进行扩充和调序,从而提高用户译文输入的效率,可简称为“翻译输入法”。
[0003] 以上的翻译输入法都是采用基于词典的方法,通过选取原文中出现的词语并在机读词典中查询对应的翻译,将这些翻译加入候选词表并对其进行调序。这种基于词典的方法仅考虑了词语级别的翻译,未考虑词语所在上下文对词义的影响,难以解决自然语言中大量存在的歧义现象。此外,现有的翻译辅助输入法都是采用本地输入法的方式实现,未引入云服务架构,导致不能采用更大规模的多语言的语料、词典、术语表等数据资源,不能引入支持强制解码的机器翻译等对计算机运算能要求较高的先进解码技术,也不能实现跨平台特性。

发明内容

[0004] 本发明的目的在于解决现有技术中存在的上述问题,提供基于机器翻译引擎并适用于任何语言、任何输入码编码规则的跨平台,可有效提高翻译用户输入译文效率的一种云翻译输入法及系统。
[0005] 云翻译输入法,包括以下步骤:
[0006] S1,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;
[0007] S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行输入码解码,将解码得到的词语及其概率放入候选词表;
[0008] S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;
[0009] S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;
[0010] S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;
[0011] S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;
[0012] S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;
[0013] S8,向用户界面返回候选词表,并支持用户自造词。
[0014] 在步骤S2中,所述输入码解码的过程中支持模糊码规则,不仅支持双向模糊码(即一对模糊码中,二者可以任意互换使用),而且支持单向模糊码(即一对模糊码中,前者可以代表后者,但后者不能代表前者)。
[0015] 本发明具有充分的通用性,只要提供概率词典、从特定源语言到目标语言的机器翻译引擎、相应的术语识别模,所述云翻译输入法可适用于任何语言的任何输入码编码规则。
[0016] 云翻译输入系统采用云服务的方式为用户提供云翻译输入法的功能。
[0017] 云翻译输入系统设有客户端和服务器端;客户端设有控制模块和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。
[0018] 客户端程序执行步骤S1,并将用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的输入码发送至服务器端;接收到服务器端返回的候选词表后,执行步骤S8。
[0019] 服务器端程序接收客户端发送的内容,执行步骤S2~S7,并将候选词表返回客户端。
[0020] 翻译输入系统支持用户自定义模糊码规则,具体为:
[0021] 翻译输入系统采用基于云服务的架构实现,支持用户自定义的个性化模糊码规则。
[0022] 所述翻译输入系统提供了用户自定义模糊码的界面,用户可以自行定义从任意输入码串到任意输入码串的单向或双向模糊码规则。客户端程序每次向服务器端发送请求时,会同时发送当前生效的模糊码规则。服务器端程序在执行权利要求1所述的步骤S2时能自动根据这些模糊码规则进行输入码的解码。
[0023] 本发明通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,支持单向和双向模糊码,适用于任何语言的任何输入码编码规则,
[0024] 本发明与现有的翻译输入法相比,具有以下有益效果:
[0025] 1、通过引入机器翻译引擎和强制解码技术,有效预测译文内容,使候选词表及其排序更为准确科学,从而提高了译文输入的效率;
[0026] 2、该翻译输入法是一套独立的输入法,不依赖于任何现有的输入法,能够独立为用户提供自定义模糊码规则、用户词典等提高用户输入效率的功能;
[0027] 3、同时支持双向和单向模糊码,更利于在某些特定语言(如:汉语、藏语)的音码输入法中对某些特定方言(如:汉语的南方口音,藏语的拉萨口音、安多口音等)进行兼容性支持;
[0028] 4、该输入法的设计与语言和编码规则无关,具有充分的通用性,对于任意一对特定的源语言和目标语言,仅需提供该目标语言的概率词典、从该源语言到该目标语言的机器翻译引擎和相应的术语识别模块,即可在该输入法中实现翻译辅助功能;
[0029] 5、采用基于云服务的系统架构,有利于访问更大规模的语言资源,有利于支持机器翻译引擎及输入法解码过程在服务器端的高效运行,避免了对用户客户端资源的过度占用;
[0030] 6、采用基于云服务的系统架构,有利于化解输入法依赖特定平台的问题,确保了输入法的跨平台特性;
[0031] 7、采用基于云服务的系统架构,有利于用户词典等用户相关信息和用户设置在多个平台间的同步。附图说明
[0032] 图1是本发明实施例1中所述云翻译输入法的流程图
[0033] 图2是本发明实施例2中所述翻译输入系统的结构示意图。

具体实施方式

[0034] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅用以解释本发明,并不用于限定本发明。
[0035] 实施例1
[0036] 参照图1,本实施例中所述云翻译辅助输入法,该输入法包括以下步骤:
[0037] S1,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;
[0038] S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行解码,将解码得到的词语及其概率放入候选词表;
[0039] S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;
[0040] S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;
[0041] S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;
[0042] S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;
[0043] S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;
[0044] S8,向用户界面返回候选词表,并支持用户自造词。
[0045] 本实施例中,步骤S2的输入码解码过程中支持模糊码规则,不仅支持双向模糊码(即一对模糊码中,二者可以任意互换使用),而且支持单向模糊码(即一对模糊码中,前者可以代表后者,但后者不能代表前者)。
[0046] 例如,在中文拼音输入法中,考虑到拼音发音不准确的情况,可设定双向模糊码规则en=eng。依据该规则,无论用户输入“nen”或“neng”,输入法均返回相同的候选词,既包括拼音为“nen”的字词,也包括拼音为“neng”的字词。
[0047] 又如,在藏文拉丁转写输入法中,考虑到安多方言的使用习惯,可设定单向模糊码xx→sh。依据该规则,当用户输入“xx”时,输入法返回的候选词既包括拉丁转写为“xx”的字词,也包括拉丁转写为“sh”的字词;但当用户输入“sh”时,输入法返回的候选词仅包括拉丁转写为“sh”的字词,不包括拉丁转写为“xx”的字词。
[0048] 本实施例中,步骤S1~S8具有充分的通用性,只要提供概率词典、从特定源语言到目标语言的机器翻译引擎、相应的术语识别模块,所述云翻译辅助输入法可适用于任何语言的任何输入码编码规则。这种通用性具体体现在:
[0049] (1)步骤S1和S8中的用户界面及文本内容均严格采用UNICODE编码,避免了编码混乱带来的乱码等问题;
[0050] (2)步骤S2中,同时支持单向和双向模糊码,适应不同语言的需要;
[0051] (3)步骤S2中,输入法的解码过程采用了通用的算法,与具体语言、具体编码规则无关。
[0052] 实施例2
[0053] 参照图2,本实施例中所述云翻译输入系统,采用基于云服务的系统架构实现。该输入系统分为客户端和服务器端两个部分,客户端包括用户界面模块和控制模块,服务器端包括通信接口模块、解码模块、机器翻译模块和术语识别模块。
[0054] 所述客户端用户界面模块,包括原文提交界面、译文输入界面、输入法界面和用户偏好设置界面。其中,原文提交界面提供文本框粘贴和文本文件上传两种原文提交方式;译文输入界面包含一个用于译文输入的文本框(可称为译文输入框);输入法界面包含状态栏和候选词框;用户偏好设置界面中提供了自定义模糊码设置功能。
[0055] 所述客户端控制模块,通过监听译文输入框的键盘事件,获取用户当前输入的输入码,将当前的输入语言、原文句子、部分译文、输入码及模糊码规则发送到服务器端,待服务器端做出响应后,将服务器端返回的候选词表显示到用户界面的候选词框中;此外,若用户选择输入的词语不包括在候选词表中,则将该新词提交到服务器端。
[0056] 所述服务器端通信接口模块,用于完成与客户端的通信,接收来自客户端发送的请求(包含相关参数);对于获取候选词表的请求,调用解码模块,将生成的候选词表返回给客户端;对于提交用户组词的请求,将接收的新词添加到当前用户的用户词典中。
[0057] 所述服务器端解码模块,根据当前的源语言、目标语言、领域和原文,调用术语识别模块,获得术语表;根据当前的源语言、目标语言、领域、原文和部分译文,调用机器翻译模块,获得剩余译文的概率词对齐表;根据概率词典、用户词典、术语表、概率词对齐表、输入码编码规则和模糊码规则,将当前的输入码解码为对应的文字、词语或短语,得到依概率排序的候选词表。
[0058] 所述服务器端机器翻译模块,根据当前的源语言、目标语言、领域,通过调用机器翻译引擎,对给定的原文句子和部分译文进行强制解码,自动翻译出原文句子剩余部分的译文,返回概率词对齐表。
[0059] 所述服务器端术语识别模块,根据当前的源语言、目标语言、领域,在给定原文句子中自动识别术语,返回术语表。
[0060] 优选地,客户端可采用基于浏览器的方式实现,从而进一步提高客户端的跨平台通用性。
[0061] 本发明是一种云翻译输入法及系统,涉及云计算、机器翻译、计算机辅助翻译、概率词典和输入法等领域。所述云翻译输入法通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,提高了翻译用户输入译文的效率,且支持任何语言的输入。所述翻译输入系统采用基于云服务的架构实现,分为客户端和服务器端两部分,支持用户自定义模糊码规则,支持单向和双向模糊码。本发明适用于任何语言的任何输入码编码规则,具有充分的通用性,且系统基于云服务的实现方式避免了对用户客户端资源的过度占用,并具有跨平台特性,支持用户相关数据在多个平台间同步。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈