专利汇可以提供一种自然语言语义信息统一编码方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种采用自然语言语义约定客观规律实现各种自然语言语义信息统一编码的方法。此方法可使用户通过采用自己熟悉的任意自然语言进行 人机交互 ,实现对任意 自然语言文本 的语义信息统一编码。其语义信息统一编码结果,可利用计算机技术自动转换为保证语义信息传递 质量 的各种译文,并且对各种 自然语言处理 技术,比如知识传播、合同签订、语言教学、文本检索、自动文摘技术的发展可起到十分重要的推动作用。,下面是一种自然语言语义信息统一编码方法专利的具体信息内容。
1.一种自然语言语义信息统一编码方法,其特征在于:A、取任意自然语言的语法概念递归集进行语法信息统一编码;B、对各种自然语言常用词汇符号的语义项,用其他常用符号以句子形式进行语义描述,对多义符号的不同义项,分别进行语义描述,并根据常用词汇符号语义项的描述结果,对不同语言语义项匹配成功者给出一级语义统一编码;C、建立语义扩展统一编码模板,取各种自然语言非常用词汇符号,通过添入扩展统一编码模板的位置获得二级语义统一编码,并且特指对象、特用于某种情况的词汇符号加上特指、特用对象描述。D、凡是不能添入一级语义编码语义扩展统一编码模板的自然语言其他词汇符号及符号语义项,或用已进行一、二级语义编码的词汇符号及相关语义项以句子形式进行语义描述,或通过添入三级编码语义扩展编码模板,以获得三级语义编码;E、对固定搭配短语、固定搭配句子,用已进行一、二级语义编码的词汇符号及相关语义项加语法概念交集进行语义描述,实现四级语义统一编码。F、用不同自然语言的词汇符号调用该词符号的所有已获得语义统一编码的语义项,自动生成不同语言的语法统一编码词典、词汇语义统一编码词典、固定搭配短语、固定搭配句子统一编码辞典。G、任意自然语言用户自主新增词汇符号或对已有符号新加语义项,均通过调用语法统一编码词典、词汇语义统一编码词典、固定搭配短语、固定搭配句子统一编码辞典的符号及相关语义项进行语义描述,获得语义统一编码。
2.根据权利要求1所述的方法,其特征在于,所述步骤C的语义扩展统一编码模板内容至少包括:纵向坐标为近义程度+1、近义程度+2、近义程度-1、近义程度-2,横向坐标为通用语、书面语、口语、俚语、专用语、成语。
3.根据权利要求1所述的方法,其特征在于,所述步骤A的取任意自然语言的语法概念递归集进行统一编码方法还包括:所述的编码对象包括语法词汇、词汇变形、词汇排序等各种形式表达的语法概念;所述的语法概念递归集至少包括句法成分、时态、语态、语体;所述的语法概念递归集句法成分至少包括:主句、子句、主语、主语修饰、主语补充、谓词、谓词修饰、谓词补充、宾语、宾语修饰、宾语补充、插入语;并且所述的子句句法成分、有句法结构的插入语的句法成分与主句句法成分结构相同。
4.根据权利要求1所述的方法,其特征在于,所述步骤A的取任意自然语言的语法概念递归集进行统一编码方法还包括:定语和状语递归为修饰或补充成分进行句法成分编码;实际为宾语的形式主语作为宾语进行句法成分编码;需要强调的句子成分均通过在相应句子成分成分区加用强调符进行统一编码。
5.根据权利要求1所述的方法,其特征在于,所述步骤B的对不同语言词汇符号语义项匹配成功者给出一级语义统一编码方法还包括:当不同自然语言常用符号的语义项不能对齐时,则在缺少对应符号方用该自然语言常用符号及相关语义项以句子形式进行语义描述,以保证各种自然语言常用词汇符号的语义项对齐,并获得相同的语义统一编码。
6.根据权利要求1所述的方法,其特征在于,所述步骤B的语义项内容包括:同义词、反义词、语义描述、词性、上位语义、应用举例;并且是上述内容的某一部分。
7.根据权利要求1所述的方法,其特征在于,所述步骤C的取各自语言其它词汇符号,通过添入扩展统一编码模板的位置获得二级语义统一编码的方法还包括:语义相同、词性不同的符号,保留符号原形并给出词性标注,对“特指”、“特用”词汇符号后面所用词语必须是已被语义统一编码的词汇符号以及相关语义项。
8.根据权利要求1所述的方法,其特征在于,所述步骤C的取各种自然语言其它词汇符号,通过添入扩展统一编码模板的位置获得二级语义统一编码结果,由一级编码结果、语义扩展编码结果,“特指....”的一、二级语义编码结果构成。
9.根据权利要求1所述的方法,其特征在于,所述步骤D中取各种自然语言其它非常用词汇符号的三级语义扩展统一编码结果,由三级语义统一编码结果、描述其语义的一、二级统一编码结果、语义扩展统一编码结果,特指、专用于....”的一、二级语义编码结果构成。
10.根据权利要求1和2所述的方法,其特征还在于,对句子连词和可插入其他内容的短语采用专用标识进行语义编码。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于深度问答的答案检索方法及装置 | 2020-05-13 | 567 |
一种智能文本处理方法、装置、电子设备及存储介质 | 2020-05-11 | 5 |
一种针对电力巡检文本的错误识别方法 | 2020-05-11 | 765 |
一种处理文本的方法和装置 | 2020-05-12 | 181 |
一种电商产品竞争分析方法及系统 | 2020-05-14 | 221 |
一种基于大数据的国防科技热词发现方法及系统 | 2020-05-08 | 800 |
基于物理距离和语义距离的双向LSTM模型的构建方法 | 2020-05-08 | 713 |
一种面向金融事件的混合型因果关系发现方法 | 2020-05-11 | 513 |
基于XML的领域要素提取配置语言系统 | 2020-05-08 | 55 |
一种公司形象提升系统的社交网络数据提取方法及系统 | 2020-05-11 | 985 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。