首页 / 专利库 / 人工智能 / 人工智能 / 自然语言处理 / 一种基于深度学习的中文自然语言处理方法

一种基于深度学习的中文自然语言处理方法

阅读:263发布:2020-05-08

专利汇可以提供一种基于深度学习的中文自然语言处理方法专利检索,专利查询,专利分析的服务。并且本 申请 涉及一种基于 深度学习 的中文 自然语言处理 方法,所述方法包括: 语义处理 系统接收语句数据,得到语句文字数据;提取语句文字数据中的固定语信息和泛化对象信息;判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;呈现信息或命令的执行结果。本 发明 具有高效、智能、准确的学习特点。,下面是一种基于深度学习的中文自然语言处理方法专利的具体信息内容。

1.一种基于深度学习的中文自然语言处理方法,其特征在于:包括:
语义处理系统接收语句数据,得到语句文字数据;
提取语句文字数据中的固定语信息和泛化对象信息;
判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;
提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;
呈现信息或命令的执行结果。
2.根据权利要求1所述的一种基于深度学习的中文自然语言处理方法,其特征在于,提取所述第一语句的一个或多个关键词包括:
对所述第一语句进行分词得到多个词语;
使用所述多个词语与预先配置的多个模板进行匹配,其中,所述模板是指由多个语义元组成的连贯语义模式,每个所述语义元有预先设定的与所述模板对应的语义贡献度,所述语义元是指具有相同或近似语义的关键词集合;
从所述多个模板中获取第一模板,所述第一模板是指与所述多个词语部分或全部语义关联度最高的模板;
获取所述多个词语中与所述第一模板中的语义元匹配成功的词语,将所述匹配成功的词语作为关键词。
3.根据权利要求1所述的一种基于深度学习的中文自然语言处理方法,其特征在于,当所述骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将所述骨干结构存储至所述知识库中。
4.根据权利要求1所述的一种基于深度学习的中文自然语言处理方法,其特征在于,所述语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,得到语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。

说明书全文

一种基于深度学习的中文自然语言处理方法

技术领域

[0001] 本发明涉及数据处理技术领域,,具体涉及一种基于深度学习的中文自然语言处理方法。

背景技术

[0002] 随着自然语言理解技术的普及,不同的行业都会面临一个共同的问题,深度学习需要特定领域庞大的语料作驱动。对于不同的应用领域来说,如何获取有效的数据,成为问题的核心。大部分任务在创建之初并没有可供使用的特定语料,因此很难在特定的领域实现不同人机的对话;同时对于自然语言的处理,也无法准确确定自然语言处理结果,向终端等设备呈现的结果也不准确,导致在人机沟通的过程中降低用户的体验感。

发明内容

[0003] 为解决上述问题,本发明提供了一种基于深度学习的中文自然语言处理方法。
[0004] 为实现上述目的,本发明采取的技术方案为:
[0005] 一种基于深度学习的中文自然语言处理方法,包括:
[0006] 语义处理系统接收语句数据,得到语句文字数据;
[0007] 提取语句文字数据中的固定语信息和泛化对象信息;
[0008] 判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;
[0009] 提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;
[0010] 呈现信息或命令的执行结果。
[0011] 具体的,提取所述第一语句的一个或多个关键词包括:
[0012] 对所述第一语句进行分词得到多个词语;
[0013] 使用所述多个词语与预先配置的多个模板进行匹配,其中,所述模板是指由多个语义元组成的连贯语义模式,每个所述语义元有预先设定的与所述模板对应的语义贡献度,所述语义元是指具有相同或近似语义的关键词集合;
[0014] 从所述多个模板中获取第一模板,所述第一模板是指与所述多个词语部分或全部语义关联度最高的模板;
[0015] 具体的,当所述骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将所述骨干结构存储至所述知识库中。
[0016] 具体的,语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,得到语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。
[0017] 本发明具有以下有益效果:本发明具有高效、智能、准确的学习特点。

具体实施方式

[0018] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
[0019] 本发明实施例提供了一种基于深度学习的中文自然语言处理方法,所述方法包括:语义处理系统接收语句数据,得到语句文字数据;提取语句文字数据中的固定语信息和泛化对象信息;判断所提取的骨干结构中是否存在特殊疑问词,当存在时,则获取所述特殊疑问词的类型;提取第一语句的一个或多个关键词;查找到一个或多个关键词对应的信息或命令;呈现信息或命令的执行结果。
[0020] 优选的,提取所述第一语句的一个或多个关键词包括:
[0021] 对所述第一语句进行分词得到多个词语;
[0022] 使用所述多个词语与预先配置的多个模板进行匹配,其中,所述模板是指由多个语义元组成的连贯语义模式,每个所述语义元有预先设定的与所述模板对应的语义贡献度,所述语义元是指具有相同或近似语义的关键词集合;
[0023] 从所述多个模板中获取第一模板,所述第一模板是指与所述多个词语部分或全部语义关联度最高的模板;
[0024] 优选的,所述骨干结构中既不存在特殊疑问词,又不存在一般疑问词时,则将所述骨干结构存储至所述知识库中。
[0025] 优选的,所述语句数据包括语句语音数据和语句文字数据;所述语义处理系统接收语句数据,得到语句文字数据具体为:所述语义处理系统的语音转换器接收所述语句数据,对所述语句数据中的语句语音数据进行识别,得到所述语句语音数据的语句文字数据,并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾;所述语义处理系统的轮询器监听所述输入队列的数据插入,从所述输入队列中获取所述输入队列末尾的语句文字数据,得到所述当前语句文字数据。
[0026] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈