首页 / 专利库 / 人工智能 / 计算机辅助翻译 / 计算机辅助翻译系统

计算机辅助翻译系统

阅读:773发布:2020-05-08

专利汇可以提供计算机辅助翻译系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 计算机辅助翻译 系统,包括:用于进行待翻译数据的录入的待翻译数据录入模 块 ;基于CCIPCA 算法 中计算待翻译数据的特征数据的数据特征提取模块;基于最近邻分类器根据特征数据实现待翻译数据句型识别的数据类型识别模块;根据识别结果调用对应的数据分割模型将待翻译数据分割成由单词、短语组成的几个模块,然后将分割所得的单词、短语填入对应的预制的latex 模版 ,实现数据格式的标准化的数据格式标准化模块;基于神经网络翻译模型实现翻译的数据翻译模块。本发明实现了待翻译数据的自动识别、格式处理以及自动翻译,从而无需人为进行特殊术语翻译结果的替换,工作效率高,且翻译的准确度较高。,下面是计算机辅助翻译系统专利的具体信息内容。

1.计算机辅助翻译系统,其特征在于:包括:
待翻译数据录入模,用于进行待翻译数据的录入;
数据特征提取模块,用于将待翻译数据输入到CCIPCA算法中计算所述待翻译数据的特征数据;
数据类型识别模块,用于基于最近邻分类器根据所述特征数据实现待翻译数据句型的识别;
数据格式标准化模块,根据识别结果调用对应的数据分割模型将待翻译数据分割成由单词、短语组成的几个模块,然后将分割所得的单词、短语填入对应的预制的latex模版,实现数据格式的标准化;
数据翻译模块,用于根据所述特征数据以及目标翻译语种调用对应的神经网络翻译模型,然后将完成数据格式标准化的待翻译数据输入所述神经网络翻译模型中,输出对应的翻译结果。
2.如权利要求1所述的计算机辅助翻译系统,其特征在于:所述待翻译数据录入模块包括文本数据输入模块、音频数据输入模块和图像数据输入模块,其中,音频数据输入模块和图像数据输入模块均连接有一数据校正模块,用于将音频数据/图像数据转换成对应的文本数据,并将转换结果经显示屏进行显示,客户核对修订后,点击“确认”键,数据特征提取模块启动。
3.如权利要求1所述的计算机辅助翻译系统,其特征在于:所述神经网络翻译模型储存在数据库内,每一个神经网络翻译模型均设有独立的逻辑编号。
4.如权利要求2所述的计算机辅助翻译系统,其特征在于:所述文本数据输入模块和数据校正模块内均配置单词/词组/句子播放模块,用户点击“播放”按钮后,选中对应的单词/词组/句子,即可实现当前选中数据对应的音频数据的播放。
5.如权利要求1所述的计算机辅助翻译系统,其特征在于:还包括:
网络爬虫模块,用于在最近邻分类器的分类时的相似度低于预设的限时启动,借助网络翻译网站进行对应翻译结果的获取,将翻译结果经显示屏进行显示。
6.如权利要求1所述的计算机辅助翻译系统,其特征在于:在遇到特殊术语时,数据格式标准化模块自动将待翻译数据分割成特殊术语+不含特殊术语的待翻译数据,调用对应的神经网络翻译模型分别单独翻译,然后按照待翻译数据中特殊数据原本在的位置完成翻译结果的拼接,然后输出最终的翻译结果。
7.如权利要求1所述的计算机辅助翻译系统,其特征在于:还包括:翻译文本输出路径选择模块,用于实现翻译文本输出路径的选择,输出路径至少包括经显示屏显示、发送到对应的移动终端、发送到对应的邮箱以及经播放器播放。

说明书全文

计算机辅助翻译系统

技术领域

[0001] 本发明涉及翻译系统领域,具体涉及一种计算机辅助翻译系统。

背景技术

[0002] 现阶段翻译技术可以分为三种:人工翻译、计算机辅助翻译以及机器翻译。人工翻译准确度较高,但是速度较慢,并且准确度取决于译员自身的能平;机器翻译速度快,然而大部分机器翻译的结果并不能直接拿来使用,因为通常会存在明显的错翻以及语法错误,还是需要通过人工翻译进行进一步校正;计算机辅助翻译则是介于二者之间的一种翻译方法,其基本思路是由计算机对待译语料进行初步翻译,初步翻译结果中,待译语料中的绝大部分都能准确翻译,只有少部分特殊术语、或者由于待译语料领域特殊导致的普通术语的含义特殊化或者其他原因等导致的部分子集的翻译结果不甚准确,需要进行二次人工检查并替换为准确的术语对应翻译。
[0003] 为了实现二次人工检查并将初步翻译结果中的不准确部分替换为准确术语,目前译员会根据实际情况,例如待译语料的领域、上下文特点等,事前配置一个待译语料的特殊术语库。在得到计算机的初步翻译结果后,再将其中的不准确部分查找出来进行替换,工作效率较为低下。

发明内容

[0004] 为解决上述问题,本发明提供了一种计算机辅助翻译系统,实现了待翻译数据的自动识别、格式处理以及自动翻译,从而无需人为进行特殊术语翻译结果的替换,工作效率高,且翻译的准确度较高。
[0005] 为实现上述目的,本发明采取的技术方案为:计算机辅助翻译系统,包括:
待翻译数据录入模,用于进行待翻译数据的录入;
数据特征提取模块,用于将待翻译数据输入到CCIPCA算法中计算所述待翻译数据的特征数据;
数据类型识别模块,用于基于最近邻分类器根据所述特征数据实现待翻译数据句型的识别;
数据格式标准化模块,根据识别结果调用对应的数据分割模型将待翻译数据分割成由单词、短语组成的几个模块,然后将分割所得的单词、短语填入对应的预制的latex模版,实现数据格式的标准化;
数据翻译模块,用于根据所述特征数据以及目标翻译语种调用对应的神经网络翻译模型,然后将完成数据格式标准化的待翻译数据输入所述神经网络翻译模型中,输出对应的翻译结果。
[0006] 进一步地,所述待翻译数据录入模块包括文本数据输入模块、音频数据输入模块和图像数据输入模块,其中,音频数据输入模块和图像数据输入模块均连接有一数据校正模块,用于将音频数据/图像数据转换成对应的文本数据,并将转换结果经显示屏进行显示,客户核对修订后,点击“确认”键,数据特征提取模块启动。
[0007] 进一步地,所述神经网络翻译模型储存在数据库内,每一个神经网络翻译模型均设有独立的逻辑编号。
[0008] 进一步地,所述文本数据输入模块和数据校正模块内均配置单词/词组/句子播放模块,用户点击“播放”按钮后,选中对应的单词/词组/句子,即可实现当前选中数据对应的音频数据的播放。
[0009] 进一步地,还包括:网络爬虫模块,用于在最近邻分类器的分类时的相似度低于预设的限时启动,借助网络翻译网站进行对应翻译结果的获取,将翻译结果经显示屏进行显示。
[0010] 进一步地,在遇到特殊术语时,数据格式标准化模块自动将待翻译数据分割成特殊术语+不含特殊术语的待翻译数据,调用对应的神经网络翻译模型分别单独翻译,然后按照待翻译数据中特殊数据原本在的位置完成翻译结果的拼接,然后输出最终的翻译结果。进一步地,还包括:翻译文本输出路径选择模块,用于实现翻译文本输出路径的选择,输出路径至少包括经显示屏显示、发送到对应的移动终端、发送到对应的邮箱以及经播放器播放。
[0011] 本发明具有以下有益效果:实现了待翻译数据的自动识别,从而可以实现特殊术语的自动提取,然后采用单独翻译+自动拼接的方式实现最终翻译结果的输出,从而无需人为进行特殊术语翻译结果的替换,工作效率高。
[0012] 基于CCIPCA算法进行特征数据的采集,基于最近邻分类器实现数据分类,每一种句型采用不同的latex模版和神经网络翻译模型,大大提高了翻译结果的准确度。附图说明
[0013] 图1为本发明实施例计算机辅助翻译系统的系统框图

具体实施方式

[0014] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
[0015] 如图1所示,本发明实施例提供了一种计算机辅助翻译系统,包括:待翻译数据录入模块,用于进行待翻译数据的录入;
数据特征提取模块,用于将待翻译数据输入到CCIPCA算法中计算所述待翻译数据的特征数据;
数据类型识别模块,用于基于最近邻分类器根据所述特征数据实现待翻译数据句型的识别;
数据格式标准化模块,根据识别结果调用对应的数据分割模型将待翻译数据分割成由单词、短语组成的几个模块,然后将分割所得的单词、短语填入对应的预制的latex模版,实现数据格式的标准化;
数据翻译模块,用于根据所述特征数据以及目标翻译语种调用对应的神经网络翻译模型,然后将完成数据格式标准化的待翻译数据输入所述神经网络翻译模型中,输出对应的翻译结果;
网络爬虫模块,用于在最近邻分类器的分类时的相似度低于预设的门限时启动,借助网络翻译网站进行对应翻译结果的获取,将翻译结果经显示屏进行显示;
翻译文本输出路径选择模块,用于实现翻译文本输出路径的选择,输出路径至少包括经显示屏显示、发送到对应的移动终端、发送到对应的邮箱以及经播放器播放。
[0016] 本实施例中,所述待翻译数据录入模块包括文本数据输入模块、音频数据输入模块和图像数据输入模块,其中,音频数据输入模块和图像数据输入模块均连接有一数据校正模块,用于将音频数据/图像数据转换成对应的文本数据,并将转换结果经显示屏进行显示,客户核对修订后,点击“确认”键,数据特征提取模块启动。所述文本数据输入模块和数据校正模块内均配置单词/词组/句子播放模块,用户点击“播放”按钮后,选中对应的单词/词组/句子,即可实现当前选中数据对应的音频数据的播放。
[0017] 本实施例中,所述神经网络翻译模型储存在数据库内,每一个神经网络翻译模型均设有独立的逻辑编号。
[0018] 本实施例中,在遇到特殊术语时,数据格式标准化模块自动将待翻译数据分割成特殊术语+不含特殊术语的待翻译数据,调用对应的神经网络翻译模型分别单独翻译,然后按照待翻译数据中特殊数据原本在的位置完成翻译结果的拼接,然后输出最终的翻译结果。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈