首页 / 专利库 / 人工智能 / 机器翻译引擎 / 一种多语化网站生成方法、系统以及计算机可读存储介质

一种多语化网站生成方法、系统以及计算机可读存储介质

阅读:836发布:2020-05-24

专利汇可以提供一种多语化网站生成方法、系统以及计算机可读存储介质专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种生成多语化Web 网站 的方法和系统以及计算机可读存储介质。所述系统包括 基础 可扩展文件包生成模 块 、基础语言包生成模块、网页基础扩展包生成模块、多语语言包更新模块、多语化模块、显示模块;所述方法包括可扩展数据标记步骤、基础语言包和多语语言包生成步骤、多语语言包更新步骤、多语可扩展文件包生成步骤以及多语化步骤和显示步骤。本发明采用的技术方案,可以在开发时只采用一种语言开发,在需要多语化的地方打上标记,然后在发布的时候使用编译工具将需要多语化的文本提取出来,生成基础语言包,并以此基础语言包生成其它系语言包,再以其它系语言包生成对应语系的一套代码文件。,下面是一种多语化网站生成方法、系统以及计算机可读存储介质专利的具体信息内容。

1.一种多语化网站生成系统,其特征在于,所述系统包括如下装置:
基础可扩展文件包生成装置,采用第一语言开发网页基础文件,基于所述网页基础文件,形成基础可扩展文件包;
基础语言包生成装置,在所述网页基础文件发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;
网页基础扩展包生成装置,基于所述基础语言包生成装置生成的基础语言包,生成多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
多语语言包更新装置,用于更新所述可扩展数据,然后添加到多语语言包中;
多语化装置,用于复制所述基础可扩展文件包,生成对应的多语可扩展文件包,完成多语化网页源数据的生成。
2.如权利要求1所述的系统,其中,基础可扩展文件包生成装置,采用第一语言开发网页基础文件,基于所述网页基础文件,形成基础可扩展文件包,具体包括:
采用第一语言开发网页基础文件,在所述网页基础文件中,查找可以进行多语化的可扩展数据,标记这些可扩展数据,形成基础可扩展文件包。
3.如权利要求1或2所述的系统,其中,多语语言包更新装置,用于更新所述可扩展数据,然后添加到多语语言包中,具体包括:
查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中。
4.如权利要求3所述的系统,其中,多语化装置,用于复制所述基础可扩展文件包,生成对应的多语可扩展文件包,完成多语化网页源数据的生成;具体包括:
复制所述基础可扩展文件包,生成对应的多语可扩展文件包,然后以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,从而生成多语化版本的网站数据。
5.如权利要求1或2或4任一项所述的系统,进一步包括:显示模,用于将多语化装置生成的网站源数据渲染成网页显示给用户。
6.一种多语化网站生成方法,其特征于,包括如下步骤:
可扩展数据标记步骤:在网页基础文件中,查找可以进行多语化的可扩展数据,标记所述可扩展数据,形成基础可扩展文件包;
基础语言包和多语语言包生成步骤:所述网页基础文件在发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;并以此基础语言包生成多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
多语语言包更新步骤:查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中;
多语可扩展文件包生成步骤:复制所述基础可扩展文件包,生成对应的多语可扩展文件包;
多语化步骤:以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,完成多语化。
7.如权利要求6所述的方法,其中,所述网页基础文件采用第一语言开发,该第一语言和所述多语语言包中的语言不同。
8.如权利要求6或7所述的方法,其中,所述网页基础文件在发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包之前,还包括:判断所述基础语言包是否存在,如果不存在,则创建基础语言包文件。
9.一种计算机可读存储介质,其上存储有计算机可执行指令,通过存储器和处理器执行所述指令,用于实现权利要求6-8任一项所述的方法。

说明书全文

一种多语化网站生成方法、系统以及计算机可读存储介质

技术领域

[0001] 本发明属于信息技术领域,特别的,涉及一种生成多语化Web网站的方法和系统以及计算机可读存储介质。

背景技术

[0002] 随着电子商务技术的发展,越来越多的企业开始通过在线网站的形式推介和销售自己的产品;而伴随着全球化进程加速,其产品的销售范围和对象也从单一的国内市场开始走向全球不同国家和地区,其网站的受众也从单一的国内消费中变为不同国家和地区的用户。这就要求企业的网站能够提供多语化版本,使得产品和地区能够在不同国家和地区以当地母语的形式在网站上现实和推广。
[0003] 针对这一问题,目前存在两种解决思路。一种是采用程序渲染不同语言版本的模板,从而得到不同语言版本的网站;另一种是通过配置多语言源文件,实现网页上不同语言版本的显示。对于前者,其最大的问题在于对于同一种逻辑问题,需要维护多套模板,才能得到多个不同语言版本的网站,同一逻辑任务,多次重复工作;对于后者,虽然其在实现时可以通过单一模板来实现不同语言网页显示,但是为了使得单一模板能够适应不同语言版本的要求,其设计难度很大,特别是在语言文化、文字书写等相差较大的语言之间,意图想要通过一套模板来完成不同语言网站的渲染生成和现实,通常会出现错误,因此,目前在实际设计时很少使用该方法。此外,虽然可以采用单一模板,但是不同语言版本网站实际显示时,仍然需要通过许多重复性的调整工作,降低了工作效率。

发明内容

[0004] 为解决上述问题,本发明提供了一种生成多语化Web网站的方法和系统以及计算机可读存储介质,可以基于编译的方式快速生成多语化的网站。
[0005] 在第一个方面,本发明提供了一种多语化网站生成方法,用于开发多语化网站。
[0006] 具体开发时,首先采用第一语言开发网页基础文件,在所述网页基础文件中,查找可以进行多语化的可扩展数据,标记这些可扩展数据,形成基础可扩展文件包;其次,所述网页基础文件在发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;并以此基础语言包生成其它系语言包,即多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
接下来,查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中;
最后,复制所述基础可扩展文件包,生成对应的多语可扩展文件包,然后以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,从而完成多语化。
[0007] 在第二个方面,本发明提供了一种多语化网站生成系统,所述系统包括计算机存储器和处理器,所述存储器和处理器执行计算机可执行的指令,从而实现多语化网站的自动生成。
[0008] 具体来说,可以通过计算机系统硬件和/或软件形式或者其组合来实现所述方法。例如,所述计算机系统可以包括如下装置:基础可扩展文件包生成装置,采用第一语言开发网页基础文件,在所述网页基础文件中,查找可以进行多语化的可扩展数据,标记这些可扩展数据,形成基础可扩展文件包;
基础语言包生成装置,在所述网页基础文件发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;
网页基础扩展包生成装置,基于所述语言包生成装置生成的基础语言包,生成其它系语言包,即多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
多语语言包更新装置,用于查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中;
多语化装置,用于复制所述基础可扩展文件包,生成对应的多语可扩展文件包,然后以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,从而生成多语化版本的网站数据;
显示模,用于将多语化装置生成的网站数据渲染成网页显示给用户。
[0009] 在本发明的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机执行指令,例如,可执行的计算机程序。通过存储器和处理器,计算机可以执行所述指令,从而实现所述多语化网站生成方法。
[0010] 概括来说,使用本发明,可以在开发时只采用一种语言开发,比如说中文,在需要多语化的地方打上标记,然后在发布的时候使用编译工具将需要多语化的文本提取出来,生成基础语言包,并以此基础语言包生成其它系语言包,再以其它系语言包生成对应语系的一套代码文件。其中“以基础语言包生成其它系语言包”后,只需将其它系语言包翻译成对应语系文本即可。
[0011] 和现有技术相比,本发明至少存在如下有益效果:(1)避免了的重复开发工作。使用本发明给出的方法,在生成不同版本的网站时,只需要提取可以进行多语化的可扩展数据,即所述需要多语化的文本,而对于同一逻辑下的其他数据则无需重覆操作;
(2)采用基础语言包形式装载多语化文本并存储,对于后期有新增的功能,新的文本在基础语言包中存在的则跳过,不存在的则添加;避免了简单的单一模板套用或者多重模板变更操作;
(3)采用多语语言包生成对应语系的网页基础扩展包,在需要多语化时,然后以多语语言包为依据,遍历多语语言包,替换多语语言包中需要多语化的可扩展数据,从而生成多语化版本的网站数据,不需要人工手动查找。
[0012] 本发明的另一亮点在于在后续的更新上,当网站后期又添加了新的内容时,采用本发明的方式会自动将新增的需多语化的内容提取出来放到语言包中,而不需要手动的去一个一个查找,从而让网站的多语化实现和维护更简单了,节约了人成本。
[0013] 特别需要强调的是,本发明抛弃了现有技术的模板生成或者模板套用的思想,采用的是可扩展数据的数据包形式进行更新,大大减轻了工作量,提高了工作效率。附图说明
[0014] 图1是本发明的一种多语化网站生成系统框架图图2是本发明的一种多语化网站生成方法流程图
图3是本发明所述多语化网站生成方法的一个具体实现的计算机流程图。

具体实施方式

[0015] 参照图1,本发明的一种多语化网站生成系统可以采用计算机硬件形式的功能模块实现,具体包括基础可扩展文件包生成模块、基础语言包生成模块、网页基础扩展包生成模块、多语语言包更新模块、多语化模块、显示模块;其中,各个模块的主要功能如下:
基础可扩展文件包生成模块,采用第一语言开发网页基础文件,在所述网页基础文件中,查找可以进行多语化的可扩展数据,标记这些可扩展数据,形成基础可扩展文件包;
基础语言包生成模块,在所述网页基础文件发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;
网页基础扩展包生成模块,基于所述语言包生成模块生成的基础语言包,生成其它系语言包,即多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
多语语言包更新模块,用于查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中;
多语化模块,用于复制所述基础可扩展文件包,生成对应的多语可扩展文件包,然后以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,从而生成多语化版本的网站数据;
显示模块,用于将多语化模块生成的网站数据渲染成网页显示给用户。
[0016] 参照图2,本发明的一种多语化网站生成方法,主要包括如下步骤:(1)可扩展数据标记步骤:采用第一语言开发网页基础文件,在所述网页基础文件中,查找可以进行多语化的可扩展数据,标记这些可扩展数据,形成基础可扩展文件包;
(2)基础语言包和多语语言包生成步骤:所述网页基础文件在发布时,使用编译工具将可以进行多语化的可扩展数据提取出来生成基础语言包;并以此基础语言包生成其它系语言包,即多语语言包,再以多语语言包生成对应语系的网页基础扩展包;
(3)多语语言包更新步骤:查找基础语言包中的每一项可扩展数据,若在多语语言包中存在则跳过,若不存在则采用机器翻译引擎或者通过人工标注将该可扩展数据翻译成对应语系的可扩展数据,然后添加到多语语言包中;
(4)多语可扩展文件包生成步骤:复制所述基础可扩展文件包,生成对应的多语可扩展文件包;
(5)多语化步骤:以多语语言包为依据,遍历多语语言包,替换多语可扩展文件包中需要多语化的可扩展数据,完成多语化。
[0017] 图3详细给出了本发明的所述方法的一个具体实现流程,其主要步骤可以概括如下:1.开发时对于需多语化的文本直接采用母语表示即可,只需在文本上打上标记即可,这一套作为基础可扩展文件包;
2.网页基础文件在发布时,使用编译工具将需要多语化的文本提取出来生成基础可扩展文件包,比如存储为key-value形式的json格式,对于后期有新增的功能,新的文本在基础语言包中存在的则跳过,不存在的则添加,以中文为例,比如新增一项“’你好’:’你好’”;
3.以基础语言包生成其它语系的多语语言包,以英文为例,查找基础语言包中的每一项,若在多语语言包中存在则跳过,若不存在则采用机翻引擎将value翻译成对应的语系,然后添加到多语语言包中,比如将“’你好’:’你好’”翻译为“’你好’:’hello’”填充到英文语言包中;
4. 复制基础可扩展文件包,生成对应的多语可扩展文件包,然后以多语语言包为依据,遍历多语语言包里面的key,使用key对应的value替换多语可扩展文件包中需要多语化的文本,如此,多语化完毕;
5.机翻引擎就是在平时采用爬虫去爬取多语网站的平行语料,比如同一网站的中文版和英文版,将爬下来的平行语料利用机器翻译去不断的训练,生成自己的平行语料库,机翻引擎就依赖于这个平行语料库来实现翻译。
[0018] 由上述流程可以看出,本发明采用的技术方案,可以在开发时只采用一种语言开发,比如说中文,在需要多语化的地方打上标记,然后在发布的时候使用编译工具将需要多语化的文本提取出来,生成基础语言包,并以此基础语言包生成其它系语言包,再以其它系语言包生成对应语系的一套代码文件。其中“以基础语言包生成其它系语言包”后,只需将其它系语言包翻译成对应语系文本即可。
[0019] 本发明另一亮点是在后续的更新上,当网站后期又添加了新的内容时,采用本发明的方式会自动将新增的需多语化的内容提取出来放到语言包中,而不需要手动的去一个一个查找。因此,采用本发明,可以让网站的多语化实现和维护更简单了,节约了人力成本。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈