首页 / 专利库 / 人工智能 / 对话代理 / 聊天机器人 / 车载环境下聊天机器人的语料处理方法、装置及存储介质

车载环境下聊天机器人的语料处理方法、装置及存储介质

阅读:54发布:2020-05-12

专利汇可以提供车载环境下聊天机器人的语料处理方法、装置及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种车载环境下 聊天 机器人 的语料处理方法、装置及存储介质,该方法包括:基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本,根据所述对话描述文本中的问答关系,确定提问文件和响应文件,将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型,在进行语料处理时,省去了较为繁琐的语料处理步骤,采用问答分离式处理方法,提高了语料处理效率。,下面是车载环境下聊天机器人的语料处理方法、装置及存储介质专利的具体信息内容。

1.一种车载环境下聊天机器人的语料处理方法,其特征在于,包括:
基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本;
根据所述对话描述文本中的问答关系,确定提问文件和响应文件;
将所述提问文件以及所述响应文件输入序列对序列Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型。
2.根据权利要求1所述的方法,其特征在于,所述基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本,包括:
对每种语音功能进行子功能划分;
确定每种语音功能包括的多个子功能中,每个子功能的典型话术及从文本到语音TTS播报内容的对话描述;
根据所有语音功能对应的对话描述,确定所述对话描述文本。
3.根据权利要求2所述的方法,其特征在于,所述语音功能分类包括:系统控制、音乐、电台、电话、导航、视频、充电桩、天气、股票及酒店中的任一种或者多种功能。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述确定车载环境中的具有问答关系的对话描述文本,包括:
将提问语句存储在奇数行中,将响应语句存储在偶数行中,形成所述对话描述文本;
相应地,所述根据所述对话描述文本中的问答关系,确定提问文件和响应文件,包括:
提取所述对话描述文本中的奇数行的语句,形成所述提问文件;
提取所述对话描述文本中的偶数行的语句,形成所述响应文件。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述提问文件以及所述响应文件输入序列对序列Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型,包括:
对所述提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件;
对所述标准化提问文件和所述标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件;
将所述向量化提问文件和所述向量化响应文件输入所述Seq2Seq模型中,对所述Seq2Seq模型进行训练,形成问答模型。
6.根据权利要求5所述的方法,其特征在于,所述对所述提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件,包括:
将所有提问语句中的最长的提问语句的字符数作为标准提问语句字符数,将所有响应语句中的最长的响应语句的字符数作为标准响应语句字符数;
将长度小于所述标准提问语句字符数的提问语句的长度填充至所述标准提问语句字符,形成填充后的提问语句;
对长度等于所述标准提问语句字符数的提问语句以及所述填充后的提问语句添加起止字符,形成所述标准化提问文件;
将长度小于所述标准响应语句字符数的响应语句的长度填充至所述标准响应语句字符,形成填充后的响应语句;
对长度等于所述标准响应语句字符数的响应语句以及所述填充后的响应语句添加起止字符,形成所述标准化响应文件。
7.根据权利要求5所述的方法,其特征在于,所述对所述标准化提问文件和所述标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件,包括:
对所述标准化提问文件和标准化响应文件中字符的出现次数进行统计,按照出现次数从小到大的顺序进行排列,生成字符字典;
根据所述字符字典与语句向量的对应关系,确定每个字符对应的向量;
根据所述每个字符对应的向量,形成所述向量化提问文件和向量化响应文件。
8.一种车载环境下聊天机器人的语料处理装置,其特征在于,包括:
第一确定模,用于基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本;
第二确定模块,用于根据所述对话描述文本中的问答关系,确定提问文件和响应文件;
训练模块,用于将所述提问文件以及所述响应文件输入序列对序列Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型。
9.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的车载环境下聊天机器人的语料处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的车载环境下聊天机器人的语料处理方法。

说明书全文

车载环境下聊天机器人的语料处理方法、装置及存储介质

技术领域

[0001] 本发明实施例涉及车联网领域,尤其涉及一种车载环境下聊天机器人的语料处理方法、装置及存储介质。

背景技术

[0002] 随着汽车产业的发展,车联网领域受到越来越多的关注。在车联网领域中,人工智能技术扮演着至关重要的色。车载环境下的聊天机器人已经成为各大车企竞相角逐的重点之一。车载环境下聊天机器人的语料处理也变得越来越重要。
[0003] 目前,采用以下方式进行车载环境下聊天机器人的语料处理:首先,对原始数据进行清洗,把不感兴趣的、视为噪音的内容清洗删除;然后,对数据进行分词,按照文本处理最小单位粒度,即词或者词语,将文本全部进行分词;其次,对分词后的词语进行词性标注,对每个词或者词语打词类标签;最后,去掉对文本特征没有任何贡献的字词。
[0004] 但是,上述处理步骤较为繁琐,导致语料处理效率较低。

发明内容

[0005] 本发明提供一种车载环境下聊天机器人的语料处理方法、装置及存储介质,以解决目前语料处理步骤较为繁琐,导致处理效率较低的技术问题。
[0006] 第一方面,本发明实施例提供一种车载环境下聊天机器人的语料处理方法,包括:
[0007] 基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本;
[0008] 根据所述对话描述文本中的问答关系,确定提问文件和响应文件;
[0009] 将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型。
[0010] 如上所示的方法中,所述基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本,包括:
[0011] 对每种语音功能进行子功能划分;
[0012] 确定每种语音功能包括的多个子功能中,每个子功能的典型话术及从文本到语音TTS播报内容的对话描述;
[0013] 根据所有语音功能对应的对话描述,确定所述对话描述文本。
[0014] 如上所示的方法中,所述语音功能分类包括:系统控制、音乐、电台、电话、导航、视频、充电桩、天气、股票及酒店中的任一种或者多种功能。
[0015] 如上所示的方法中,所述确定车载环境中的具有问答关系的对话描述文本,包括:
[0016] 将提问语句存储在奇数行中,将响应语句存储在偶数行中,形成所述对话描述文本;
[0017] 相应地,所述根据所述对话描述文本中的问答关系,确定提问文件和响应文件,包括:
[0018] 提取所述对话描述文本中的奇数行的语句,形成所述提问文件;
[0019] 提取所述对话描述文本中的偶数行的语句,形成所述响应文件。
[0020] 如上所示的方法中,所述将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型,包括:
[0021] 对所述提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件;
[0022] 对所述标准化提问文件和所述标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件;
[0023] 将所述向量化提问文件和所述向量化响应文件输入所述Seq2Seq模型中,对所述Seq2Seq模型进行训练,形成问答模型。
[0024] 如上所示的方法中,所述对所述提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件,包括:
[0025] 将所有提问语句中的最长的提问语句的字符数作为标准提问语句字符数,将所有响应语句中的最长的响应语句的字符数作为标准响应语句字符数;
[0026] 将长度小于所述标准提问语句字符数的提问语句的长度填充至所述标准提问语句字符,形成填充后的提问语句;
[0027] 对长度等于所述标准提问语句字符数的提问语句以及所述填充后的提问语句添加起止字符,形成所述标准化提问文件;
[0028] 将长度小于所述标准响应语句字符数的响应语句的长度填充至所述标准响应语句字符,形成填充后的响应语句;
[0029] 对长度等于所述标准响应语句字符数的响应语句以及所述填充后的响应语句添加起止字符,形成所述标准化响应文件。
[0030] 如上所示的方法中,所述对所述标准化提问文件和所述标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件,包括:
[0031] 对所述标准化提问文件和标准化响应文件中字符的出现次数进行统计,按照出现次数从小到大的顺序进行排列,生成字符字典;
[0032] 根据所述字符字典与语句向量的对应关系,确定每个字符对应的向量;
[0033] 根据所述每个字符对应的向量,形成所述向量化提问文件和向量化响应文件。
[0034] 第二方面,本发明实施例提供一种车载环境下聊天机器人的语料处理装置,包括:
[0035] 第一确定模,用于基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本;
[0036] 第二确定模块,用于根据所述对话描述文本中的问答关系,确定提问文件和响应文件;
[0037] 训练模块,用于将所述提问文件以及所述响应文件输入序列对序列Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型。
[0038] 第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
[0039] 一个或多个处理器;
[0040] 存储器,用于存储一个或多个程序;
[0041] 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面提供的车载环境下聊天机器人的语料处理方法。
[0042] 第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面提供的车载环境下聊天机器人的语料处理方法。
[0043] 本实施例提供一种车载环境下聊天机器人的语料处理方法、装置及存储介质,该方法包括:基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本,根据所述对话描述文本中的问答关系,确定提问文件和响应文件,将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型,在进行语料处理时,省去了较为繁琐的语料处理步骤,采用问答分离式处理方法,提高了语料处理效率。附图说明
[0044] 图1为本发明提供的车载环境下聊天机器人的语料处理方法实施例的流程示意图;
[0045] 图2A为图1所示实施例中步骤101的一种实现过程的流程示意图;
[0046] 图2B为图1所示实施例中步骤103的一种实现过程的流程示意图;
[0047] 图3为本发明提供的车载环境下聊天机器人的语料处理装置实施例的结构示意图;
[0048] 图4A为图3所示实施例中的第一确定模块的一种可能的结构示意图;
[0049] 图4B为图3所示实施例中的训练模块的一种可能的结构示意图;
[0050] 图5为本发明提供的服务器的结构示意图。

具体实施方式

[0051] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0052] 图1为本发明提供的车载环境下聊天机器人的语料处理方法实施例的流程示意图。本实施例适用于对车载环境下聊天机器人的语料进行处理的场景。本实施例可以由车载环境下聊天机器人的语料处理装置来执行,该车载环境下聊天机器人的语料处理装置可以由软件和/或硬件的方式实现,该车载环境下聊天机器人的语料处理装置可以集成于服务器中。如图1所示,本实施例提供的车载环境下聊天机器人的语料处理方法包括如下步骤:
[0053] 步骤101:基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本。
[0054] 具体地,本实施例首先确定车载环境中的对话描述文本。该对话描述文本具有问答关系。该对话描述文本为车载环境中可能出现的用户与聊天机器人交互的对话描述文本。
[0055] 本实施例中,按照整车车型语音功能需求,可以将车载环境中的语音功能分为系统控制、音乐、电台、电话、导航、视频、充电桩、天气、股票及酒店中的任一种或者多种功能。
[0056] 为了保证该对话描述文本的全面性,本实施例中可以采用以下方法确定该对话描述文本。图2A为图1所示实施例中步骤101的一种实现过程的流程示意图。如图2A所示,步骤101可以包括具体以下步骤。
[0057] 步骤1011:对每种语音功能进行子功能划分。
[0058] 为了保证对话描述文本尽可能的完全覆盖车辆环境中的语音需求,在步骤1011中,对每种语音功能进行子功能划分。举例来说,可以将“导航”功能细化为“路径导航”功能、“路况导航”功能以及“功能搜索”功能,将“系统控制”功能细化为“空调控制”功能、“车窗控制”功能、“车控制”功能等。
[0059] 步骤1012:确定每种语音功能包括的多个子功能中,每个子功能的典型话术及从文本到语音播报内容的对话描述。
[0060] 在将每种语音功能进行子功能划分后,可以针对每个子功能,确定典型话术及从文本到语音(Text To Speech,TTS)播报内容的对话描述。举例来说,对于“空调控制”功能,可能的典型话术及TTS播报内容可以为:“打开空调”-“空调已打开”,“把温度调高”-“温度已调高”。
[0061] 需要说明的是,每个子功能的典型话术及从文本到语音播报内容的对话描述可以是开发人员根据经验确定的。本实施例中的典型话术指的是使用频率较高的语句。
[0062] 在确定了每个子功能的典型话术及TTS播报内容的对话描述后,可以确定出每种语音功能对应的对话描述。
[0063] 步骤1013:根据所有语音功能对应的对话描述,确定对话描述文本。
[0064] 在步骤1012中,确定了每种语音功能对应的对话描述后,可以将所有语音功能对应的对话描述合并,形成对话描述文本。
[0065] 步骤102:根据对话描述文本中的问答关系,确定提问文件和响应文件。
[0066] 具体地,步骤102中,基于步骤101确定出的对话描述文本的问答关系,确定提问文件和响应文件。
[0067] 一种可能的实现方式为:在步骤101中,将提问语句存储在奇数行中,将响应语句存储在偶数行中,形成对话描述文本,则在步骤102中,提取对话描述文本中的奇数行的语句,形成提问文件,提取对话描述文本中的偶数行的语句,形成响应文件。
[0068] 当然,在步骤101中,也可以是将提问语句存储在偶数行中,将响应语句存储在奇数行中,形成对话描述文本,则在步骤102中,提取对话描述文本中的偶数行的语句,形成提问文件,提取对话描述文本中的奇数行的语句,形成响应文件。
[0069] 另一可能的实现方式为:步骤102中基于对话描述文本中每个语句的语义,确定提问文件和响应文件。
[0070] 在确定出提问文件及响应文件之后,可以基于提问文件及响应文件,对序列对序列(Sequence to Sequence,Seq2Seq)模型进行训练。
[0071] Seq2Seq模型由两个主要部件组成,一个是编码器循环神经网络(Recurrent Neural Network,RNN),另一个是解码器RNN。从高层次上来说,编码器的工作是将输入文本信息生成固定的表示。解码器则是接收这个表示,并生成一个可变长度的文本,以响应它。
[0072] 步骤103:将提问文件以及响应文件输入Seq2Seq模型,对Seq2Seq模型进行训练,形成问答模型。
[0073] 具体地,基于该问答模型可以形成车载环境下聊天机器人。聊天机器人分为检索式聊天机器人和生成式聊天机器人。
[0074] 检索式聊天机器人中,预存有对话库,聊天系统接收到用户输入句子后,通过在对话库中以搜索匹配的方式进行应答内容提取。很明显这种方式对对话库要求很高,需要对话库足够大,能够尽量多地匹配用户问句,否则会经常出现找不到合适回答内容的情形。因为在真实场景下用户说什么都是可能的,但是它的好处是回答质量高,因为对话库中的内容都是真实的对话数据,表达比较自然。
[0075] 生成式聊天机器人则采取不同的技术思路,在接收到用户输入句子后,采用一定技术手段自动生成一句话作为应答,这个路线的机器人的好处是可能覆盖任意话题的用户问句,但是缺点是生成应答句子质量很可能会存在问题,比如可能存在语句不通顺存在句法错误等看上去比较低级的错误。
[0076] 由于Seq2Seq模型对输入的文件的格式有要求,因此,在步骤103中,需要首先对提问文件以及响应文件进行格式转换处理。
[0077] 图2B为图1所示实施例中步骤103的一种实现过程的流程示意图。如图2B所示,步骤103包括如下步骤。
[0078] 步骤1031:对提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件。
[0079] 一种可能的实现过程为:将所有提问语句中的最长的提问语句的字符数作为标准提问语句字符数,将所有响应语句中的最长的响应语句的字符数作为标准响应语句字符数;将长度小于标准提问语句字符数的提问语句的长度填充至标准提问语句字符,形成填充后的提问语句;对长度等于标准提问语句字符数的提问语句以及填充后的提问语句添加起止字符,形成标准化提问文件;将长度小于标准响应语句字符数的响应语句的长度填充至标准响应语句字符,形成填充后的响应语句;对长度等于标准响应语句字符数的响应语句以及填充后的响应语句添加起止字符,形成标准化响应文件。
[0080] 在该实现方式中,在对长度小于标准提问语句字符数的提问语句,以及,对长度小于标准响应语句字符数的响应语句进行字符填充时,可以是填充预先定义的无实义的字符。
[0081] 在该实现方式中,也可以是先在提问语句和响应语句中添加起止字符,之后,再进行字符填充。本实施例对此不作限制。
[0082] 最终形成的标准化提问文件中的每个提问语句的长度相等,且每个提问语句具有起止符号,以与其他提问语句进行区分。最终形成的标准化响应文件中的每个响应语句的长度相等,且每个响应语句具有起止符号。
[0083] 步骤1032:对标准化提问文件和标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件。
[0084] 一种可能的实现过程为:对标准化提问文件和标准化响应文件中字符的出现次数进行统计,按照出现次数从小到大的顺序进行排列,生成字符字典;根据字符字典与语句向量的对应关系,确定每个字符对应的向量;根据每个字符对应的向量,形成向量化提问文件和向量化响应文件。
[0085] 这种实现方式中,可以对字符字典中排列在前的字符赋予长度较长的向量,对排列在后的字符赋予长度较短的向量,这使得出现次数较小的字符转换成的向量的长度较长,出现次数较多的字符转换成的向量的长度较短,可以减小向量化提问文件和向量化响应文件的大小,使得Seq2Seq模型训练效率较高。
[0086] 步骤1033:将向量化提问文件和向量化响应文件输入Seq2Seq模型中,对Seq2Seq模型进行训练,形成问答模型。
[0087] 在进行训练时,可以将向量化提问文件分为训练向量化提问文件以及测试向量化提问文件,将向量化响应文件分为训练向量化响应文件以及测试向量化响应文件,以对Seq2Seq模型进行训练和测试。
[0088] 在形成问答模型后,该问答模型可以对输入的句子预测对应的答案。
[0089] 本实施例提供的车载环境下聊天机器人的语料处理方法,通过基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本,根据所述对话描述文本中的问答关系,确定提问文件和响应文件,将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型,在进行语料处理时,省去了较为繁琐的语料处理步骤,采用问答分离式处理方法,提高了语料处理效率。
[0090] 图3为本发明提供的车载环境下聊天机器人的语料处理装置实施例的结构示意图。该车载环境下聊天机器人的语料处理装置可以集成于服务器中。如图3所示,本实施例提供的车载环境下聊天机器人的语料处理装置包括:第一确定模块31、第二确定模块32以及训练模块33。
[0091] 第一确定模块31,用于基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本。
[0092] 可选地,上述语音功能分类包括:系统控制、音乐、电台、电话、导航、视频、充电桩、天气、股票及酒店中的任一种或者多种功能。
[0093] 图4A为图3所示实施例中的第一确定模块的一种可能的结构示意图。如图4A所示,可选地,第一确定模块31具体可以包括:划分子模块311、第一确定子模块312以及第二确定子模块313。
[0094] 划分子模块311,用于对每种语音功能进行子功能划分。
[0095] 第一确定子模块312,用于确定每种语音功能包括的多个子功能中,每个子功能的典型话术及从TTS播报内容的对话描述。
[0096] 第二确定子模块313,用于根据所有语音功能对应的对话描述,确定对话描述文本。
[0097] 第二确定模块32,用于根据对话描述文本中的问答关系,确定提问文件和响应文件。
[0098] 一种实现方式中,第一确定模块31具体用于:将提问语句存储在奇数行中,将响应语句存储在偶数行中,形成对话描述文本。相应地,第二确定模块32具体用于:提取对话描述文本中的奇数行的语句,形成提问文件;提取对话描述文本中的偶数行的语句,形成响应文件。
[0099] 训练模块33,用于将提问文件以及响应文件输入Seq2Seq模型,对Seq2Seq模型进行训练,形成问答模型。
[0100] 图4B为图3所示实施例中的训练模块的一种可能的结构示意图。如图4B所示,可选地,训练模块33具体可以包括:处理子模块331、转换子模块332以及训练子模块333。
[0101] 处理子模块331,用于对提问文件中的每个提问语句和响应文件中的每个响应语句进行长度标准化处理,形成标准化提问文件和标准化响应文件。
[0102] 可选地,处理子模块331具体用于:将所有提问语句中的最长的提问语句的字符数作为标准提问语句字符数,将所有响应语句中的最长的响应语句的字符数作为标准响应语句字符数;将长度小于标准提问语句字符数的提问语句的长度填充至标准提问语句字符,形成填充后的提问语句;对长度等于标准提问语句字符数的提问语句以及填充后的提问语句添加起止字符,形成标准化提问文件;将长度小于标准响应语句字符数的响应语句的长度填充至标准响应语句字符,形成填充后的响应语句;对长度等于标准响应语句字符数的响应语句以及填充后的响应语句添加起止字符,形成标准化响应文件。
[0103] 转换子模块332,用于对标准化提问文件和标准化响应文件分别进行语句向量转换,形成向量化提问文件和向量化响应文件。
[0104] 可选地,转换子模块332具体用于:对标准化提问文件和标准化响应文件中字符的出现次数进行统计,按照出现次数从小到大的顺序进行排列,生成字符字典;根据字符字典与语句向量的对应关系,确定每个字符对应的向量;根据每个字符对应的向量,形成向量化提问文件和向量化响应文件。
[0105] 训练子模块333,用于将向量化提问文件和向量化响应文件输入Seq2Seq模型中,对Seq2Seq模型进行训练,形成问答模型。
[0106] 本发明实施例所提供的车载环境下聊天机器人的语料处理装置可执行本发明任意实施例所提供的车载环境下聊天机器人的语料处理方法,具备执行方法相应的功能模块和有益效果。
[0107] 图5为本发明提供的服务器的结构示意图。如图5所示,该服务器包括处理器70和存储器71。该服务器中处理器70的数量可以是一个或多个,图5中以一个处理器70为例;该服务器的处理器70和存储器71可以通过总线或其他方式连接,图5中以通过总线连接为例。
[0108] 存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的车载环境下聊天机器人的语料处理方法对应的程序指令以及模块(例如,车载环境下聊天机器人的语料处理装置中的第一确定模块31、第二确定模块32以及训练模块33)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的车载环境下聊天机器人的语料处理方法。
[0109] 存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实施例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0110] 本发明还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种车载环境下聊天机器人的语料处理方法,该方法包括:
[0111] 基于车载环境中的语音功能分类,确定车载环境中的具有问答关系的对话描述文本;
[0112] 根据所述对话描述文本中的问答关系,确定提问文件和响应文件;
[0113] 将所述提问文件以及所述响应文件输入Seq2Seq模型,对所述Seq2Seq模型进行训练,形成问答模型。
[0114] 当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的车载环境下聊天机器人的语料处理方法中的相关操作。
[0115] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0116] 值得注意的是,上述车载环境下聊天机器人的语料处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0117] 注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈