专利汇可以提供语言内统计机器翻译专利检索,专利查询,专利分析的服务。并且可提供 训练数据 ,该训练数据包括源短语和目标短语对。这些对可用于训练语言内统计 机器翻译 模型,其中该语言内统计 机器学习 模型在被给予人类语言的文本输入短语时可计算输入短语与人类语言的输入短语的可能翻译在语义上等价的概率。该统计机器翻译模型可用于在查询和列表之间进行翻译。查询可以是提交给 搜索引擎 的人类语言的文本串。列表串可以是将要由搜索引擎搜索以找出对查询串的匹配的真实世界实体的正式名称的文本串。,下面是语言内统计机器翻译专利的具体信息内容。
1.一种用于人类语言的短语的语言内机器翻译的计算机实现的方法,所述方法包括:
接收训练数据,所述训练数据包括源短语和目标短语对(120、156、158);
使用训练数据对来训练(100)语言内统计机器翻译模型(160、162),其中所述语言内统计机器翻译模型在被给予所述人类语言的文本输入短语时能够计算所述输入短语与所述人类语言的输入短语的可能翻译在语义上等价的概率(102);以及
使用所述统计机器翻译模型来在查询和列表之间进行翻译(164),其中所述查询包括提交给搜索引擎(156)的所述人类语言的文本串,其中列表串包括将由所述搜索引擎搜索以找出对所述查询串的匹配(158)的真实世界实体的正式名称的文本串。
2.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与用户查询相匹配的列表(158);
通过使用所述翻译模型来将所述列表中的一个翻译成查询形式来生成所述列表中的一个的查询形式(164、166);
使用所述翻译模型来计算所述查询形式与所述用户查询的相关度,并且基于计算出的相似度来确定所述列表不匹配所述用户查询。
3.如权利要求1所述的方法,其特征在于,所述使用所述语言内统计翻译模型包括:
从所述搜索引擎接收所述搜索引擎将其与所述用户查询相匹配的列表(158);
使用所述模型(162)来找出所述列表是所述用户查询的翻译的概率;以及基于所述概率来确定所述列表是否匹配所述用户查询。
4.如权利要求1所述的方法,其特征在于,所述语言内统计翻译模型包括基于n元语法的翻译模型(126)。
5.如权利要求4所述的方法,其特征在于,所述训练包括重新排列训练对中的所述源短语和/或目标短语以使得所述源短语和目标短语的在语义上等价的单词被对齐(122);
以及
迭代地更新所述对齐和所述基于n元语法的翻译模型的参数。
6.如权利要求1所述的方法,其特征在于,还包括使用所述语言内统计翻译模型来生成所述人类语言的语言模型(168),所述语言模型能够确定所述人类语言的串的可能性。
7.如权利要求6所述的方法,其特征在于,所述使用所述语言内统计翻译模型来生成所述语言模型包括与来自所述语言内统计翻译模型的语言模型翻译包括在一起。
8.如权利要求6所述的方法,其特征在于,还包括用所述语言模型来执行自动语音识别。
9.一种或多种存储使计算设备能够执行一种过程的信息的计算机可读介质,所述过程用于将人类语言的短语翻译成所述语言的其他短语,所述过程包括:
访问包括所述人类语言的短语对的训练对(120、156、158);
用所述训练对来训练统计机器翻译模型(160),所述统计机器翻译模型能够计算所述人类语言的目标串是所述人类语言的给定源串的有效翻译的概率;
接收所述人类语言的文本短语,将所述文本短语解码成所述文本短语的不同候选翻译(102),并使用所述统计机器翻译模型来计算所述候选翻译是所述文本短语的翻译的概率;
以及
基于所述概率,由计算机来存储和/或显示所述候选翻译中的一个或多个。
10.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所述训练对包括用户提交的与列表配对的查询串,搜索引擎将所述列表与所述查询串进行匹配。
11.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所接收到的文本短语包括用户输入的查询串,所述查询串包括所述人类语言的文本,并且所述过程还包括使用所述统计机器翻译模型来标识所述查询串的多个可能的翻译,所述可能的翻译包括所述人类语言的文本。
12.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所接收到的文本短语包括从用于搜索商家/组织名称的列表的搜索引擎获取的组织或商家实体的名称,所述名称已根据用户输入的查询来从所述搜索引擎获取,并且其中所述过程还包括使用所述统计机器翻译模型来确定所述名称是所述查询串的有效翻译并基于所述概率来确定所述列表与所述查询的相关度。
13.如权利要求9所述的一种或多种计算机可读介质,其特征在于,还包括使用所述统计机器翻译模型来构建所述人类语言的统计语言模型,其中所述统计语言模型提供所述人类语言中的短语的概率。
14.如权利要求9所述的一种或多种计算机可读介质,其特征在于,所述过程还包括使用所述统计机器翻译模型来将由语音识别器识别的文本查询翻译成显示形式。
15.一种由一个或多个计算机执行的方法,所述方法包括:
提供被配置成计算相同人类语言的短语的翻译的概率的统计机器翻译模型(162);以及
使用所述统计机器翻译模型来在组织和/或商家的查询形式和列表形式之间进行翻译,其中所述查询形式包括提交给搜索引擎(152)的所述人类语言的短语,并且其中所述列表形式包括可由所述搜索引擎搜索的组织和/或商家的所述人类语言的正式名称。
16.如权利要求15所述的方法,其特征在于,所述使用所述统计机器翻译模型包括计算查询形式和列表形式之间的相关度。
17.如权利要求15所述的方法,其特征在于,给定用户输入的所述人类语言的用户查询(156),给定由所述搜索引擎(152)找到的所述人类语言的对应的列表,并且给定所述列表的一组候选翻译,所述候选翻译也是所述人类语言的,所述使用所述统计机器翻译模型包括计算所述候选翻译的概率。
18.如权利要求17所述的方法,其特征在于,还包括基于计算出的概率来为所述给定用户查询生成搜索结果。
19.如权利要求15所述的方法,其特征在于,还包括基于由所述统计机器翻译模型计算出的概率来生成或修改所述搜索引擎的搜索结果,所述搜索结果对应于用户输入的查询形式。
20.如权利要求19所述的方法,其特征在于,还包括使用所述概率来排列或消除搜索结果。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
翻译质量测评方法及装置 | 2020-05-19 | 295 |
一种包含人工智能的人机结合译文批量处理翻译方法 | 2020-05-08 | 807 |
一种基于大数据的智能运维技术 | 2020-05-19 | 365 |
一种跨语言分析报告的生成方法 | 2020-05-24 | 507 |
一种面向神经网络机器翻译的英文词法分析方法及系统 | 2020-05-11 | 962 |
一种基于篇章的机器翻译引擎测评优选方法及系统 | 2020-05-14 | 118 |
通用翻译 | 2020-05-22 | 232 |
融合句法解析树的汉-越神经机器翻译方法 | 2020-05-14 | 515 |
一种机器翻译引擎测评优选方法及系统 | 2020-05-11 | 755 |
用于生成对话代理的方法和系统 | 2020-05-17 | 366 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。