首页 / 专利库 / 人工智能 / 翻译管理系统 / 翻译记忆 / 一种包含人工智能的人机结合译文批量处理翻译方法

一种包含人工智能的人机结合译文批量处理翻译方法

阅读:162发布:2020-05-11

专利汇可以提供一种包含人工智能的人机结合译文批量处理翻译方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种包含 人工智能 的人机结合译文批量处理翻译方法,包括如下步骤:第1步,创建一个翻译项目;第2步,上传待翻译文件;第3步,系统将文件进行断句解析及提取并定义高频词、术语;第4步,将原文重复的句子进行 锁 定;第5步,系统根据 翻译记忆 语料,自动模糊翻译相匹配的原文;第6步,系统再根据翻译方向、专业,调用 机器翻译 对剩余的原文进行翻译;第7步,对模糊翻译、机器翻译的译文进行质检;第8步,由人工在线对模糊翻译及机器翻译译文进行检查及 修改 ;第9步,对人工翻译的结果进行质检;第10步,对人工编辑修改幅度、字数等相关参数进行统计并生成 质量 评定模型报告。本发明提高了翻译效率,确保翻译质量,降低翻译成本。,下面是一种包含人工智能的人机结合译文批量处理翻译方法专利的具体信息内容。

1.一种包含人工智能的人机结合译文批量处理翻译方法,其特征在于,包括如下步骤:
第1步,创建一个翻译项目,设定翻译方向、行业以及其他项目信息,选择翻译记忆语料及机器翻译
第2步,上传待翻译文件;
第3步,系统将文件进行断句解析及提取并定义高频词、术语;
第4步,将原文重复的句子进行定,锁定后重复的句子只需翻译第一句,其余句子将自动进行翻译;
第5步,系统根据翻译记忆语料,自动模糊翻译相匹配的原文;
第6步,系统再根据翻译方向、专业,调用机器翻译对剩余的原文进行翻译;
第7步,对模糊翻译、机器翻译的译文进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示;
第8步,由人工在线对模糊翻译及机器翻译译文进行检查及修改,此步骤可操作多文档多人编辑,即把多个文件合并在同一编辑器界面进行编辑,可确保同个项目术语及表达的统一;
第9步,对人工翻译的结果进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示;
第10步,对人工编辑修改幅度、字数等相关参数进行统计并生成质量评定模型报告。
2.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,所述断句解析的含义为对上传的文件先进行解析,再按语言分句符号以及分段换行等规则对文件原文进行符合语言逻辑的断句处理。
3.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,所述高频词、术语的提取及定义:通过专项技术对解析后的原文进行高频词、术语的提取,按照各专业领域已上传词库与原文词汇进行匹配提取并定义术语。
4.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,所述语料匹配的含义为系统根据翻译记忆语料及原文进行对比匹配,匹配出与原文相似度较高的译文自动翻译。
5.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,机器翻译的含义为按翻译文件所属的专业,调用不同专业领域的机器翻译引擎进行翻译生成译文。
6.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,根据翻译需要调用相应符合需要的翻译引擎接口
7.根据权利要求1所述的包含人工智能的人机结合译文批量处理翻译方法,其特征在于,质检包含单语质检、双语质检,语境质量预警等,通过一定的技术手段检查出译文错误部分,质检后显示译文错误位置及错误类别并且建议翻译译文提示。

说明书全文

一种包含人工智能的人机结合译文批量处理翻译方法

技术领域

[0001] 本发明涉及文件处理、语言处理等技术领域,特别涉及一种包含人工智能的人机结合译文批量处理翻译方法。

背景技术

[0002] 译后编辑作为人工智能翻译在内的机器翻译的必要补充,对于提高译文质量、效率及压缩翻译成本有着重要作用。常见的译后编辑方式为:方式1:直接通过机器翻译得到的译文,由人工对机器翻译得出的结果进行检错及修改
[0003] 方式2:先通过翻译记忆语料进行模糊匹配翻译,再进行机器翻译,最后由人工对翻译记忆语料以及机器翻译进行检错、修改。
[0004] 上述2种译后编辑的方式,在一定程度上减少了翻译工作量。但机器翻译的译文,完全由人工对其进行检错及修改,耗费工作量大,且不能保证译文的质量。
[0005] 机器翻译技术还存在一定的缺陷,例如:语法不通顺,歪曲译文等错误。如全部使用人工对其译文进行检查及修改需耗费大量的时间,常常比全文使用人工翻译的耗费的时间还要长,并且容易产生遗漏。

发明内容

[0006] 本发明的目的在于提供一种包含人工智能的人机结合译文批量处理翻译方法,本发明通过文件解析断句、原文翻译\原文规范写作、翻译重复句定、多文档多人同时编辑等技术,实现同类批量操作处理翻译译文,以提高翻译效率;结合翻译记忆语料、机器翻译技术、人工翻译,在保证质量的基础上,极大地提高译文的翻译效率;通过质检技术对机器翻译、人工翻译进行深入分析,检测出机器翻译以及人工翻译译文存在的问题,在减少翻译工作量的同时确保翻译质量,降低翻译成本,提高效率,以解决上述背景技术中提出的问题。
[0007] 为实现上述目的,本发明提供如下技术方案:一种包含人工智能的人机结合译文批量处理翻译方法,包括如下步骤:
第1步,创建一个翻译项目,设定翻译方向、行业以及其他项目信息,选择翻译记忆语料及机器翻译;
第2步,上传待翻译文件;
第3步,系统将文件进行断句解析及提取并定义高频词、术语;
第4步,将原文重复的句子进行锁定,锁定后重复的句子只需翻译第一句,其余句子将自动进行翻译;
第5步,系统根据翻译记忆语料,自动模糊翻译相匹配的原文;
第6步,系统再根据翻译方向、专业,调用机器翻译对剩余的原文进行翻译;
第7步,对模糊翻译、机器翻译的译文进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示;
第8步,由人工在线对模糊翻译及机器翻译译文进行检查及修改,此步骤可操作多文档多人编辑,即把多个文件合并在同一编辑器界面进行编辑,可确保同个项目术语及表达的统一;
第9步,对人工翻译的结果进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示;
第10步,对人工编辑修改幅度、字数等相关参数进行统计并生成质量评定模型报告。
[0008] 进一步地,所述断句解析的含义为对上传的文件先进行解析,再按语言分句符号以及分段换行等规则对文件原文进行符合语言逻辑的断句处理。
[0009] 进一步地,所述高频词、术语的提取及定义:通过专项技术对解析后的原文进行高频词、术语的提取,按照各专业领域已上传词库与原文词汇进行匹配提取并定义术语。
[0010] 进一步地,所述重复句锁定的含义为通过对项目所有文件的句子进行匹配,跨文件锁定重复句子,对锁定后重复的句子只需翻译第一句,其余句子将自动进行翻译。
[0011] 进一步地,所述语料匹配的含义为系统根据翻译记忆语料及原文进行对比匹配,匹配出与原文相似度较高的译文自动翻译。
[0012] 进一步地,机器翻译的含义为按翻译文件所属的专业,调用不同专业领域的机器翻译引擎进行翻译生成译文。
[0013] 进一步地,机器翻译引擎通过调用接口的形式实现。
[0014] 进一步地,质检包含单语质检、双语质检,语境质量预警,通过一定的技术手段检查出译文错误部分,质检后显示译文错误位置及错误类别并且建议翻译译文提示。
[0015] 与现有技术相比,本发明的有益效果是:本发明通过文件解析断句、原文翻译\原文规范写作、翻译重复句锁定、多文档多人同时编辑等技术,实现同类批量操作处理翻译译文,以提高翻译效率;结合翻译记忆语料、机器翻译技术、人工翻译,在保证质量的基础上,极大地提高译文的翻译速度;通过质检技术对机器翻译、人工翻译进行深入分析,检测出机器翻译以及人工翻译译文存在问题,在减少翻译工作量的同时确保翻译质量,降低翻译成本,提高效率。附图说明
[0016] 图1为本发明的包含人工智能的人机结合译文批量处理翻译方法流程图

具体实施方式

[0017] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0018] 一种包含人工智能的人机结合译文批量处理翻译方法,流程如图1,包括如下步骤:第1步,创建一个翻译项目,设定翻译方向、行业以及其他项目信息,选择翻译记忆语料及机器翻译;
第2步,上传待翻译文件;
第3步,系统将文件进行断句解析及提取并定义高频词、术语;
断句解析:对上传的文件先进行解析(可保留文件原格式),再按语言分句符号以及分段换行等规则对文件原文进行断句处理。
[0019] 高频词、术语的提取及定义:通过专项技术对解析后的原文进行高频词、术语的提取,按照各专业领域已上传词库与原文词汇进行匹配提取并定义术语。高频词:原文中出现频率大于或等于2次的词汇;术语:与上传的专业词库匹配的词汇、经该专业人工判断定义的专有词。
[0020] 第4步,重复句锁定:通过对项目所有文件的句子进行匹配,跨文件锁定重复句子,对(重复句子除第一句无需锁定,其他重复的句子均锁定),锁定后重复的句子只需翻译第一句,其余句子将自动进行翻译。
[0021] 第5步,系统根据翻译记忆语料,自动模糊翻译相匹配的原文;语料匹配:系统根据翻译记忆语料及原文进行对比匹配,匹配出与原文相似度较高的译文自动翻译。
[0022] 第6步,系统再根据翻译方向、专业,调用机器翻译对剩余的原文进行翻译。
[0023] 机器翻译:按翻译文件所属的专业,调用不同专业领域的机器翻译引擎进行翻译生成译文。
[0024] 第7步,对模糊翻译、机器翻译的译文进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示;第8步,由人工在线对模糊翻译及机器翻译译文进行检查及修改,此步骤可操作多文档多人编辑,即把多个文件合并在同一编辑器界面进行编辑,可确保同个项目术语及表达的统一;
第9步,对人工翻译的结果进行质检,质检后显示译文错误位置及错误类别并且建议翻译译文提示。质检:包含单语质检、双语质检,语境质量预警。通过一定的技术手段检查出译文错误部分,质检后显示译文错误位置及错误类别并且建议翻译译文提示。
[0025] (1)单语质检:语法错误、拼写错误、标点错误、中文错别字等其他错误通过调用接口实现;“未用术语”通过译文句子与目标术语库,检查译文是否应用目标术语库;“重复字词”通过检查译文是否有重复的字符;(2)双语质检:通过原文及译文的匹配,并按照一定的规则,检查出漏译句子、数字错误、链接错误、标签不匹配、译文相同等错误。
[0026] (3)语境质量预警:根据上下文语境判断译文质量预警,进行人工干预。
[0027] 多文档编辑:通过将多个文件句子合并在同一编辑器,并对其进行编辑、同类批量操作。
[0028] 第10步,对人工编辑修改幅度、字数等相关参数进行统计并生成质量评定模型报告。
[0029] (1)人工编辑修改幅度:人工针对机器翻译后的结果所做的修正、编辑后得出的与机器翻译后的结果对比产生的有差异的部分所占到的比例。
[0030] (2)质量评定模型:使用相关技术对译后编辑当中的工作建立质量评定模型,以表示在译后编辑当中的工作质量是否符合国家或行业、客户的相关标准。
[0031] 本发明的相关技术术语的名词解释如下表:与现代技术相比,本发明具有以下优点:
1、本发明通过通过对项目所有文件的句子进行匹配,跨文件锁定重复句子,对锁定后重复的句子只需翻译第一句,其余句子将自动进行翻译,减少了翻译量。
[0032] 2、本发明采用机器翻译,通过不同翻译专业,调用不同领域的机器翻译引擎,提高译文质量。
[0033] 3、本发明通过语言质检技术,对机器翻译后的不合格部分译文,由人工译后编辑分类处理,并把翻译质检技术应用到人工翻译场景中。减少人为翻译错误,即充分发挥机器翻译技术带来的效率,又充分发挥人工翻译的质量,满足了语言服务市场快速发展的需求。
[0034] 4、本发明通过多文件多人同时在线编辑的方式,便于人工翻译对译文进行资源同步共享、同类批量操作,实现译文统一性,极大提高了翻译效率以及翻译质量。
[0035] 本发明提出通过质检技术,先对机器翻译后的译文进行质量检测,在一定程度上检查出机器翻译的部分翻译问题。并把质检技术应用到人工翻译场景中,减少人为翻译错误、提高译文质量。充分发挥机器翻译技术带来的效率提升效果,又充分发挥人工翻译的质量保证效果,满足了语言服务市场快速发展的需求。
[0036] 本发明通过对人工修正机器翻译结果及智能翻译的结果进行符合国家或行业标准建模,以评定人工及智能翻译的工作质量。以排除人为因素对人工工作结果及智能翻译结果评价的主观影响,做到公平公正公开。并且快速的量化评价工作质量,帮助对人工工作及智能翻译的不足的改进,提高了人工工作的质量和效率。
[0037] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈