专利汇可以提供通用翻译专利检索,专利查询,专利分析的服务。并且能够通过基于诸如媒体项中的词汇和由媒体项作者获知的语言等固有或外在的因素尝试对媒体项进行初始语言识别而识别媒体项的可 能源 语言。该初始识别能够利用对应的可能性因素生成最可能 源语言 的列表。然后,能够执行假定最可能源语言中的每种的翻译。能够对多种输出语言执行翻译。产生的每个译本均能够接收基于多种因素的对应分数。能够对具有共同源语言的分数进行组合。这些组合的分数能够用于对媒体项的源语言的之前识别的可能性因素进行加权。,下面是通用翻译专利的具体信息内容。
1.一种用于识别片段的最可能源语言的方法,包括:
接收所述片段的指示;
确定所述片段的两种以上可能源语言;
生成所述片段的两个以上译本,每个译本均具有指定的译本源语言,
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;
生成所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,生成每种已选择的可能源语言的所述置信因数;并且
选择与最高置信因数相关联的所述片段的所述可能源语言作为所述最可能源语言。
2.根据权利要求1所述的方法,
其中,所述片段的所述两个以上译本中的至少一个包括多个译本,每个译本具有共同的指定的译本源语言;
其中,计算准确度分数包括计算所述多个译本的组合准确度分数,每个译本具有共同的指定的译本源语言,其中,通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数进行组合而计算每个组合准确度分数;并且
其中,基于各自具有共同的指定的译本源语言的所述多个译本的所述组合准确度分数产生所述共同的指定的译本源语言的所述置信因数。
3.根据权利要求2所述的方法,进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度;并且
其中,产生所述可能源语言中的已选择的至少一种的所述置信因数包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数,对所述可能源语言中的已选择的一种的所述初始置信值进行更新。
4.根据权利要求2所述的方法,
其中,所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数。
5.根据权利要求1所述的方法,进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度。
6.根据权利要求5所述的方法,
其中,基于所述两种以上可能源语言中的第一种的所述对应的初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
7.根据权利要求5所述的方法,
其中,执行所述片段的所述初始源语言识别包括对所述片段的上下文的分析。
8.根据权利要求7所述的方法,其中,所述片段的上下文的分析使用下列一种或多种:
已知所述片段的作者易做到的语言;
与被识别为所述片段的作者的朋友的用户相关联的语言;
创建所述片段的时间;
关于张贴所述片段的虚拟位置的信息;或
上述项的任何组合。
9.根据权利要求1所述的方法,进一步包括:
从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段的最可能源语言的语言的译本作为所述片段的译本。
10.根据权利要求1所述的方法,进一步包括:
接收所述片段的观看用户的指示;并且
确定与所述片段的观看用户相关联的输出语言;
其中,所述片段的已生成的所述两个以上译本各自为与和所述片段的观看用户相关联的输出语言相匹配的输出语言。
11.根据权利要求1所述的方法,
其中,通过译本打分模型执行对所述准确度分数的计算,所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据以生成译本分数。
12.根据权利要求1所述的方法,
其中,响应于要求所述片段的译本的请求而执行所述方法。
13.根据权利要求1所述的方法,
其中,响应于所述片段的创建或所述片段到社交媒体网站的张贴而执行所述方法。
14.一种计算机可读存储介质,存储指令,当由计算系统运行所述指令时,使所述计算系统执行用于识别片段源语言的置信因数的操作,所述操作包括:
接收片段的指示;
接收所述片段的观看者的指示;
确定与所述片段的观看者相关联的输出语言;
生成两个以上译本的所述片段的所述两个以上译本,所述两个以上译本各自具有指定的译本源语言,并且所述两个以上译本中的每个为与和所述片段的观看者相关联的输出语言相匹配的输出语言;
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;并且产生所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,产生每种已选择的可能源语言的所述置信因数。
15.根据权利要求14所述的计算机可读存储介质,其中,所述操作进一步包括:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值均指示所述对应的可能源语言是所述片段的语言的置信度。
16.根据权利要求15所述的计算机可读存储介质,
其中,基于所述两种以上可能源语言中的第一种的所述对应初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
17.根据权利要求14所述的计算机可读存储介质,其中,所述操作进一步包括:
从所述片段的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数的语言的译本作为所述片段的译本。
18.根据权利要求14所述的计算机可读存储介质,
其中,通过译本打分模型执行对所述准确度分数的计算,所述译本打分模型被训练成利用包括各自包含输入片段、输出片段、以及分数的数据点的训练数据生成译本分数。
19.一种用于生成片段的译本的系统,包括:
存储器;
一个或多个处理器;
界面,被配置为接收所述片段的指示;
预翻译语言识别器,被配置为确定所述片段的两种以上可能源语言;
翻译器,被配置为生成所述片段的两个以上译本,所述片段的所述两个以上译本中的每个均具有指定的译本源语言,
其中,生成所述片段的所述两个以上译本中的至少一个,将所述片段的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段的所述两个以上译本中的至少另一个,将所述片段的所述两种以上可能源语言中的除所述片段的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
译本打分模型,被配置为计算所述片段的已生成的所述两个以上译本中的至少两个的准确度分数;以及
置信分数生成器,被配置为产生所述片段的至少两种已选择的可能源语言中的每种的置信因数,其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数中的一个或多个,产生每种已选择的可能源语言的所述置信因数;
其中,所述界面被进一步配置为从所述片段的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数的所述可能源语言的译本作为所述片段的译本。
20.根据权利要求19所述的系统,其中,所述预翻译语言识别器被配置为通过下列项确定所述片段的所述两种以上可能源语言:
执行所述片段的初始源语言识别;
其中,所述片段的所述初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值指示对应的可能源语言是所述片段的语言的置信度;并且
其中,基于所述两种以上可能源语言中的第一种的对应的初始置信值高于阈值,选择所述两种以上可能源语言中的第一种。
21.一种用于识别片段(602)的最可能源语言的计算机实现方法,包括:
接收所述片段(602)的指示;
确定所述片段(602)的两种以上可能源语言;
使用机器翻译引擎生成所述片段(602)的两个以上译本,每个均具有指定的译本源语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,将所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);
产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与所述已选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616);并且选择与最高置信因数(616)相关联的所述片段(602)的所述可能源语言作为所述最可能源语言。
22.根据权利要求21所述的方法,
其中,所述片段(602)的所述两个以上译本中的至少一个包括多个译本,每个译本均具有共同的指定的译本源语言;
其中,计算准确度分数(612)包括计算所述多个译本的组合准确度分数(612),每个译本均具有共同的指定的译本源语言,其中,通过将与具有共同的指定的译本源语言的所述多个译本中的每个对应的单独准确度分数(612)组合,执行对各个组合准确度分数(612)的计算;并且
其中,基于各自具有所述共同的指定的译本源语言的所述多个译本的所述组合准确度分数(612)产生所述共同的指定的译本源语言的所述置信因数(616)。
23.根据权利要求22所述的方法,进一步包括:
对所述片段(602)执行初始源语言识别;
其中,对所述片段(602)的所述初始源语言识别识别各自具有对应的初始置信值(606)的所述可能源语言中的一种或多种;
其中,对于对应的可能源语言,每个初始置信值(606)指示所述对应的可能源语言是所述片段(602)的语言的置信度;并且
其中,产生所述可能源语言中的已选择的至少一种的所述置信因数(616)包括使用与所述可能源语言中的已选择的一种对应的所述组合准确度分数(612),对所述可能源语言中的已选择的一种的所述初始置信值(606)进行更新。
24.根据权利要求22或23所述的方法,
其中,所述共同的指定的译本源语言的所述置信因数是所述组合准确度分数(612)。
25.根据权利要求21或24中任一种所述的方法,进一步包括:
执行所述片段(602)的初始源语言识别;
其中,所述片段(602)的初始源语言识别识别各自具有对应的初始置信值的所述可能源语言中的一种或多种;并且
其中,对于对应的可能源语言,每个初始置信值指示所述对应的可能源语言是所述片段(602)的语言的置信度;
可选地,其中,基于所述两种以上可能源语言中的第一种的所述对应的初始置信值(606)高于阈值,选择所述两种以上可能源语言中的第一种。
26.根据权利要求25所述的方法,
其中,对所述片段(602)执行所述初始源语言识别包括对所述片段(602)的上下文的分析;
可选地,其中,所述片段(602)的上下文的分析使用下列中的一种或多种:
已知所述片段(602)的作者易做到的语言;
与被识别为所述片段(602)的所述作者的朋友的用户相关联的语言;
创建所述片段(602)的时间;
关于张贴所述片段(602)的虚拟位置的信息;或
上述项的任何组合。
27.根据权利要求21或26中任一项所述的方法,进一步包括:
从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是被选为所述片段(602)的所述最可能源语言的所述语言的译本作为所述片段(602)的译本。
28.根据权利要求21或27中任一项所述的方法,进一步包括:
接收所述片段(602)的观看用户的指示;并且
确定与所述片段(602)的观看用户相关联的输出语言;
其中,所述片段(602)的已生成的所述两个以上译本各自是与和所述片段(602)的观看用户相关联的输出语言相匹配的输出语言。
29.根据权利要求21或28中任一项所述的方法,
其中,通过译本打分模型(348;610)执行对所述准确度分数(612)的计算,所述译本打分模型(348;610)被训练成利用包括各自包含输入片段(602)、输出片段(602)、以及分数的数据点的训练数据以生成译本分数(612)。
30.根据权利要求21或29中任一项所述的方法,
其中,响应于要求所述片段(602)的译本的请求而执行所述方法,或
其中,响应于所述片段(602)的创建或所述片段(602)到社交媒体网站的张贴而执行所述方法。
31.根据权利要求21或30中任一项所述的方法,
其中,提供所述最可能源语言作为用于下列至少一项的处理引擎的参数:
应用机器翻译引擎;
执行拼写校正;以及
执行语法校正。
32.一种计算机可读存储介质,存储指令,当由计算系统(100;200;300)运行所述指令时,使所述计算系统(100;200;300)执行用于识别片段源语言的置信因数的操作,所述操作包括:
接收片段(602)的指示;
接收所述片段(602)的观看者的指示;
确定与所述片段(602)的所述观看者相关联的输出语言;
生成两个以上译本的所述片段(602)的所述两个以上译本,所述两个以上译本各自具有指定的译本源语言,并且所述两个以上译本中的每个为与和所述片段(602)的观看者相关联的输出语言相匹配的输出语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,将所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种设置为所述指定的译本源语言;
计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);
并且
产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与所述选择的可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616)。
33.根据权利要求32所述的计算机可读存储介质,其中,所述操作进一步包括:
从所述片段(602)的已生成的所述两个以上译本中选择所述指定的译本源语言是具有最高置信因数(616)的语言的译本作为所述片段(602)的译本。
34.根据权利要求32或33所述的计算机可读存储介质,
其中,当由所述计算系统(100;200;300)运行所述指令时,使所述计算系统(100;200;
300)执行根据权利要求21 31中任一项所述的方法。
35.一种用于生成片段(602)的译本的系统,例如,被布置成执行根据权利要求21 31中任一项所述的方法,包括:
存储器(150;306,308);
一个或多个处理器(110;304);
界面(342),被配置为接收所述片段(602)的指示;
预翻译语言识别器(344),被配置为确定所述片段(602)的两种以上可能源语言;
翻译器(346;608),被配置为生成所述片段(602)的两个以上译本,所述片段(602)的所述两个以上译本中的每个均具有指定的译本源语言,
其中,生成所述片段(602)的所述两个以上译本中的至少一个,将所述片段(602)的所述两种以上可能源语言中的第一种设置为所述指定的译本源语言,并且
其中,生成所述片段(602)的所述两个以上译本中的至少另一个,所述片段(602)的所述两种以上可能源语言中的除所述片段(602)的所述两种以上可能源语言中的第一种之外的第二种作为所述指定的译本源语言;
翻译打分模型(348;610),被配置为计算所述片段(602)的已生成的所述两个以上译本中的至少两个的准确度分数(612);以及
置信分数生成器(350),被配置为产生所述片段(602)的至少两种已选择的可能源语言中的每种的置信因数(616),其中,基于具有与已选择的所述可能源语言对应的源语言的经过计算的所述准确度分数(612)中的一个或多个,产生每种已选择的可能源语言的所述置信因数(616);
其中,所述界面(342)被进一步配置为从所述片段(602)的已生成的所述两个以上译本中提供所述指定的译本源语言是具有最高置信因数(616)的所述可能源语言的译本作为所述片段(602)的译本。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
分布式机器翻译方法及系统 | 2020-05-08 | 708 |
一种包含人工智能的人机结合译文批量处理翻译方法 | 2020-05-08 | 807 |
一种实现同步翻译的会议系统 | 2020-05-16 | 573 |
一种基于大数据的智能运维技术 | 2020-05-19 | 365 |
一种基于神经元的机器翻译方法 | 2020-05-26 | 656 |
一种肢体语言翻译系统及方法 | 2020-05-20 | 962 |
中间语系统、中间语引擎、中间语翻译系统和相应方法 | 2020-05-21 | 496 |
词语规范化的方法和设备及机器翻译方法和设备 | 2020-05-24 | 265 |
一种MerCube机器翻译管理控制系统及方法、计算机程序 | 2020-05-16 | 516 |
一种基于发布会场景的多语同传翻译终端控制装置 | 2020-05-21 | 358 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。