一种语音输入方法、装置及终端专利检索-修改国际申请第I章专利合作条约专利权专利检索查询-专利查询网

一种语音输入方法、装置及终端

阅读：993发布：2023-01-20

专利汇可以提供一种语音输入方法、装置及终端专利检索，专利查询，专利分析的服务。并且本发明实施例公开了一种语音输入方法，包括：在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式；在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。本发明实施例还公开了一种语音输入装置及终端。采用本发明实施例，可以完全通过语音控制进行语音输入，提高语音输入的工作效率。，下面是一种语音输入方法、装置及终端专利的具体信息内容。

权利要求

1.一种语音输入方法，其特征在于，所述方法包括：
在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；
当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式；
在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。
2.如权利要求1所述的方法，其特征在于，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：
获取用户输入的语音信息的语音音量；
若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
3.如权利要求1所述的方法，其特征在于，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：
获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；
计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；
若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
4.如权利要求1所述的方法，其特征在于，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：
获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；
计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；
若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
5.如权利要求1所述的方法，其特征在于，所述在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的信息内容包括：
对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；
将所述第二信息内容与所述第一信息内容作对比；
根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。
6.如权利要求1所述的方法，其特征在于，所述在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容之前，还包括：
根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息；
获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令；
建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系。
7.如权利要求1～6任意一项所述的方法，其特征在于，所述在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容包括：
获取预先训练出的语音模块库；
将用户输入的所述第一语音与预先训练出的语音模板库中语音信息进行比较；
对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。
8.如权利要求1所述的方法，其特征在于，所述在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容之后，还包括：
当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。
9.一种语音输入装置，其特征在于，所述装置包括：
语音识别模块，用于在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；
模式切换模块，用于当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式；
内容修改模块，用于在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。
10.如权利要求9所述的装置，其特征在于，
所述模式切换模块，还用于获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
11.如权利要求9所述的装置，其特征在于，
所述模式切换模块，还用于获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
12.如权利要求9所述的装置，其特征在于，
所述模式切换模块，还用于获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。
13.如权利要求9所述的装置，其特征在于，
所述内容修改模块，具体用于对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；将所述第二信息内容与所述第一信息内容作对比；根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。
14.如权利要求9所述的装置，其特征在于，所述装置还包括：
信息显示模块，用于根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息；
指令获取模块，用于获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令；
关系建立模块，用于建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系。
15.如权利要求9～14任意一项所述的装置，其特征在于，
所述语音识别模块，具体用于获取预先训练出的语音模块库；将用户输入的所述第一语音与预先训练出的语音模板库中语音信息进行比较；对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。
16.如权利要求9所述的装置，其特征在于，所述装置还包括：
修改提示模块，用于当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。
17.一种终端，其特征在于，所述终端包括：
如权利要求9～16任意一项所述的语音输入装置。

说明书全文

一种语音输入方法、装置及终端

技术领域

[0001] 本发明涉及电子技术领域，尤其涉及一种语音输入方法、装置及终端。

背景技术

[0002] 语音输入即嘴巴打字、麦克风输入法。它可以认为是目前世界上最简便、最易用的输入法，只要说话就能打字。语音输入是根据操作者的讲话，计算机识别成汉字的输入方法(又称声控输入)。现在的语音输入已广泛存在，语音识别的准确率也在逐步提高，个别语音识别的准确率在98％以上，但还是存在一些语音识别错误的情况。在现有技术方案中，用户在发现语音识别出的信息内容错误时，一般通过手动修改的方式对出现错误的信息内容进行修改，必然导致影响语音输入的工作效率。

发明内容

[0003] 本发明实施例提供一种语音输入方法、装置及终端。可以完全通过语音控制进行语音输入，提高语音输入的工作效率。

[0004] 本发明实施例提供了一种语音输入方法，包括：

[0005] 在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；

[0006] 当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式；

[0007] 在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。

[0008] 其中，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：

[0009] 获取用户输入的语音信息的语音音量；

[0010] 若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0011] 其中，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：

[0012] 获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；

[0013] 计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；

[0014] 若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0015] 其中，所述当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式包括：

[0016] 获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；

[0017] 计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；

[0018] 若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0019] 其中，所述在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的信息内容包括：

[0020] 对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；

[0021] 将所述第二信息内容与所述第一信息内容作对比；

[0022] 根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。

[0023] 其中，所述在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容之前，还包括：

[0024] 根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息；

[0025] 获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令；

[0026] 建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系。

[0027] 其中，所述在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容包括：

[0028] 获取预先训练出的语音模块库；

[0029] 将用户输入的所述第一语音与预先训练出的语音模板库中语音信息进行比较；

[0030] 对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。

[0031] 其中，所述在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容之后，还包括：

[0032] 当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。

[0033] 相应地，本发明实施例提供了一种语音输入装置，包括：

[0034] 语音识别模块，用于在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；

[0035] 模式切换模块，用于当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式；

[0036] 内容修改模块，用于在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。

[0037] 所述模式切换模块，还用于获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0038] 其中，所述模式切换模块，还用于获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0039] 其中，所述模式切换模块，还用于获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0040] 其中，所述模式切换模块，还用于获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。

[0041] 其中，所述内容修改模块，具体用于对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；将所述第二信息内容与所述第一信息内容作对比；根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。

[0042] 其中，所述装置还包括：

[0043] 信息显示模块，用于根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息；

[0044] 指令获取模块，用于获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令；

[0045] 关系建立模块，用于建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系。

[0046] 其中，所述语音识别模块，具体用于获取预先训练出的语音模块库；将用户输入的所述第一语音与预先训练出的语音模板库中语音信息进行比较；对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。

[0047] 修改提示模块，用于当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。

[0048] 相应地，本发明实施例还提供了一种终端，包括：

[0049] 如上述的任意一项的语音输入装置。

[0050] 在本发明实施例中，针对现有技术中需要手动修改语音识别错误的信息内容的技术问题，首先在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；然后当用户确认经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从语音输入模式切换到语音修改模式；最后在语音修改模式下根据用户输入的与第一语音相关的第二语音修改经过语音识别得到的第一信息内容。从而可以完全通过语音控制进行语音输入，提高语音输入的工作效率。附图说明

[0051] 为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0052] 图1是本发明提出的一种语音输入方法的第一实施例流程图；

[0053] 图2是本发明提出的一种语音输入方法的另一实施例的流程图；

[0054] 图3是本发明实施例提出的一种语音输入装置的结构示意图。

具体实施方式

[0055] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0056] 请参考图1，图1是本发明提出的一种语音输入方法的第一实施例流程图。如图所示，本发明实施例中的语音输入方法包括：

[0057] S101，在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容。

[0058] 具体实现中，可以预先训练出语音模板库，语音模块库中的信息内容所包含的每个词语分别与用户输入的语音信息建立对应关系。在获取到用户输入的第一语音之后，获取预先训练出的语音模块库，将用户输入的第一语音与预先训练出的语音模板库中语音信息进行比较；对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。

[0059] S102，当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式。

[0060] 具体实现中，在进行语音输入之前，根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息；获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令；建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系，并保存在语音指令数据库中。在接收到用户输入的语音控制切换指令时，从语音指令数据库中查找与语音控制切换指令的语音信息匹配的语音信息，并执行该语音信息对应的语音控制操作指令。

[0061] 其中，在执行语音控制操作指令之前，可以通过以下几种方式判断用户输入的语音信息是语音控制操作指令的语音信息还是上述进行语音识别的第一语音。

[0062] 可选的，获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值，则确认用户输入的语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第一预设阈值可以设置为50分贝或者60分贝，但不局限上述分贝值。

[0063] 可选的，获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第二预设阈值可以设置为10秒或者8秒，但不局限上述时长。

[0064] 可选的，获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值且或所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。

[0065] 例如：当接收用户输入的“修改”语音信息时，可以判断该“修改”语音信息的语音音量是否大于第一预设阈值，或者是否是在输入第一语音之后停顿了第二预设阈值的时长接收到的该“修改”语音信息，若是，则确认该“修改”的语音信息为语音控制切换指令的语音信息，从而进入语音修改模式。在语音修改模式下，可以通过语音音量判断用户输入的语音信息是否为语音控制操作指令的语音信息，若语音音量大于第一预设阈值，则执行语音控制操作指令，例如：倒退、删除等等。若语音音量不大于第一预设阈值，则通过用户输入的第二语音对第一信息内容进行修改。

[0066] S103，在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。

[0067] 具体实现中，可以对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；将所述第二信息内容与所述第一信息内容作对比；根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。例如：在用户输入第一语音“天堂在哪里”，而通过语音识别得到第一信息内容“厅堂在哪里”，因此，在进入到语音修改模式之后，可以输入第二语音“天堂”，将语音识别得到的第二信息内容“天堂”与第一信息内容做比较，确认需要修改第一信息内容中的“厅堂”，因此，将第二信息内容“天堂”替换掉第一信息内容中的“厅堂”。

[0068] 可选的，当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。需要说明的是，预设次数可以为4次或者5次，但不局限于上述次数。如：当用户重复多次输入语音信息之后，仍然显示的是“天堂”，则可以提示用户进行手动输入修改。

[0069] 在本发明实施例中，首先在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；然后当用户确认经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从语音输入模式切换到语音修改模式；最后在语音修改模式下根据用户输入的与第一语音相关的第二语音修改经过语音识别得到的第一信息内容。从而可以完全通过语音控制进行语音输入，提高语音输入的工作效率。

[0070] 请参考图2，图2是本发明提出的一种语音输入方法的第二实施例的流程图。如图所示，本发明实施例中的语音输入方法包括：

[0071] S201，根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息。

[0072] 具体实现中，可以通过手动方式从工作模式切换到指令训练模式。其中，列表信息包括删除、切换以及倒退等语音控制操作指令的按键值。

[0073] S202，获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令。

[0074] 具体实现中，按照界面显示的语音操作控制指令的按键值，分别获取用户输入与语音操作控制指令的按键值对应的语音信息。例如：界面显示语音操作控制指令的按键值“删除”，则获取用户输入的“删除”的语音信息。

[0075] S203，建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系，并保存在语音指令数据库中。

[0076] S204，在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容。

[0077] 具体实现中，可以预先训练出语音模板库，语音模块库中的信息内容所包含的每个词语分别与用户输入的语音信息建立对应关系。在获取到用户输入的第一语音之后，获取预先训练出的语音模块库，将用户输入的第一语音与预先训练出的语音模板库中语音信息进行比较；对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。

[0078] S205，当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式。

[0079] 具体实现中，在接收到用户输入的语音控制切换指令时，从语音指令数据库中查找与语音控制切换指令的语音信息匹配的语音信息，并执行该语音信息对应的语音控制操作指令。其中，在执行语音控制操作指令之前，可以通过以下几种方式判断用户输入的语音信息是语音控制操作指令的语音信息还是上述进行语音识别的第一语音。

[0080] 可选的，获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值，则确认用户输入的语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第一预设阈值可以设置为50分贝或者60分贝，但不局限上述分贝值。

[0081] 可选的，获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第二预设阈值可以设置为10秒或者8秒，但不局限上述时长。

[0082] 可选的，获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值且或所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。

[0083] 例如：当接收用户输入的“修改”语音信息时，可以判断该“修改”语音信息的语音音量是否大于第一预设阈值，或者是否是在输入第一语音之后停顿了第二预设阈值的时长接收到的该“修改”语音信息，若是，则确认该“修改”的语音信息为语音控制切换指令的语音信息，从而进入语音修改模式。在语音修改模式下，可以通过语音音量判断用户输入的语音信息是否为语音控制操作指令的语音信息，若语音音量大于第一预设阈值，则执行语音控制操作指令，例如：倒退、删除等等。若语音音量不大于第一预设阈值，则通过用户输入的第二语音对第一信息内容进行修改。

[0084] S206，在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。

[0085] 具体实现中，可以对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；将所述第二信息内容与所述第一信息内容作对比；根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。例如：在用户输入第一语音“天堂在哪里”，而通过语音识别得到第一信息内容“厅堂在哪里”，因此，在进入到语音修改模式之后，可以输入第二语音“天堂”，将语音识别得到的第二信息内容“天堂”与第一信息内容做比较，确认需要修改第一信息内容中的“厅堂”，因此，将第二信息内容“天堂”替换掉第一信息内容中的“厅堂”。

[0086] 可选的，当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。需要说明的是，预设次数可以为4次或者5次，但不局限于上述次数。如：当用户重复多次输入语音信息之后，仍然显示的是“天堂”，则可以提示用户进行手动输入修改。

[0087] 在本发明实施例中，首先在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；然后当用户确认经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从语音输入模式切换到语音修改模式；最后在语音修改模式下根据用户输入的与第一语音相关的第二语音修改经过语音识别得到的第一信息内容。从而可以完全通过语音控制进行语音输入，提高语音输入的工作效率。

[0088] 请参考图3，图3是本发明实施例提出的一种语音输入装置的结构示意图。如图所示，本发明实施例中的语音输入装置包括：

[0089] 信息显示模块301，用于根据用户输入的模式切换指令进入指令训练模式并显示语音控制操作指令的列表信息。

[0090] 具体实现中，可以通过手动方式从工作模式切换到指令训练模式。其中，列表信息包括删除、切换以及倒退等语音控制操作指令的按键值。

[0091] 指令获取模块302，用于获取用户输入的语音控制操作指令的语音信息，所述语音控制操作指令包括所述语音控制切换指令。

[0092] 具体实现中，按照界面显示的语音操作控制指令的按键值，分别获取用户输入与语音操作控制指令的按键值对应的语音信息。例如：界面显示语音操作控制指令的按键值“删除”，则获取用户输入的“删除”的语音信息。

[0093] 关系建立模块303，用于建立所述语音控制操作指令的语音信息与所述列表信息中的语音控制操作指令的按键值的对应关系，并保存在语音指令数据库中。

[0094] 语音识别模块304，用于在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容。

[0095] 具体实现中，可以预先训练出语音模板库，语音模块库中的信息内容所包含的每个词语分别与用户输入的语音信息建立对应关系。在获取到用户输入的第一语音之后，获取预先训练出的语音模块库，将用户输入的第一语音与预先训练出的语音模板库中语音信息进行比较；对所述预先训练出的语音模板库中的与所述第一语音匹配的语音信息进行输出得到第一信息内容。

[0096] 模式切换模块305，用于当用户确认所述经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从所述语音输入模式切换到语音修改模式。

[0097] 具体实现中，在接收到用户输入的语音控制切换指令时，从语音指令数据库中查找与语音控制切换指令的语音信息匹配的语音信息，并执行该语音信息对应的语音控制操作指令。其中，在执行语音控制操作指令之前，可以通过以下几种方式判断用户输入的语音信息是语音控制操作指令的语音信息还是上述进行语音识别的第一语音。

[0098] 可选的，获取用户输入的语音信息的语音音量；若所述语音信息的语音音量大于第一预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值，则确认用户输入的语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第一预设阈值可以设置为50分贝或者60分贝，但不局限上述分贝值。

[0099] 可选的，获取用户输入的语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。需要说明的是，第二预设阈值可以设置为10秒或者8秒，但不局限上述时长。

[0100] 可选的，获取用户输入的语音信息的语音音量，所述语音信息的起始时间点以及所述第一语音的终止时间点；计算所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长；若所述语音信息的语音音量大于第一预设阈值且所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长大于第二预设阈值，则确定所述语音信息为语音控制切换指令的语音信息。若所述语音信息的语音音量不大于第一预设阈值且或所述语音信息的起始时间点与所述第一语音的终止时间点之间的时长不大于第二预设阈值，则确认该语音信息为上述进行语音识别的第一语音，继续对该语音信息进行语音识别得到第一信息内容。

[0101] 例如：当接收用户输入的“修改”语音信息时，可以判断该“修改”语音信息的语音音量是否大于第一预设阈值，或者是否是在输入第一语音之后停顿了第二预设阈值的时长接收到的该“修改”语音信息，若是，则确认该“修改”的语音信息为语音控制切换指令的语音信息，从而进入语音修改模式。在语音修改模式下，可以通过语音音量判断用户输入的语音信息是否为语音控制操作指令的语音信息，若语音音量大于第一预设阈值，则执行语音控制操作指令，例如：倒退、删除等等。若语音音量不大于第一预设阈值，则通过用户输入的第二语音对第一信息内容进行修改。

[0102] 内容修改模块306，用于在所述语音修改模式下根据用户输入的与所述第一语音相关的第二语音修改所述经过语音识别得到的第一信息内容。

[0103] 具体实现中，可以对所述与所述第一语音相关的第二语音经过语音识别得到第二信息内容；将所述第二信息内容与所述第一信息内容作对比；根据所述第一信息内容与所述第一信息内容的对比结果，修改所述第一信息内容中的错误信息。例如：在用户输入第一语音“天堂在哪里”，而通过语音识别得到第一信息内容“厅堂在哪里”，因此，在进入到语音修改模式之后，可以输入第二语音“天堂”，将语音识别得到的第二信息内容“天堂”与第一信息内容做比较，确认需要修改第一信息内容中的“厅堂”，因此，将第二信息内容“天堂”替换掉第一信息内容中的“厅堂”。

[0104] 修改提示模块307，用于当确认所述第一信息内容为错误信息且修改所述第一信息内容的次数大于预设次数时，则提示用户对所述第一信息内容进行手动输入修改。需要说明的是，预设次数可以为4次或者5次，但不局限于上述次数。如：当用户重复多次输入语音信息之后，仍然显示的是“天堂”，则可以提示用户进行手动输入修改。

[0105] 在本发明实施例中，首先在语音输入模式下对获取到的用户输入的第一语音进行语音识别，并显示经过语音识别得到的第一信息内容；然后当用户确认经过语音识别得到的第一信息内容为错误信息时，根据用户输入的语音控制切换指令，从语音输入模式切换到语音修改模式；最后在语音修改模式下根据用户输入的与第一语音相关的第二语音修改经过语音识别得到的第一信息内容。从而可以完全通过语音控制进行语音输入，提高语音输入的工作效率。

[0106] 在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

[0107] 此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

[0108] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

[0109] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

[0110] 应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

[0111] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

[0112] 此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

[0113] 上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

标题	发布/更新时间	阅读量
修改带	2020-05-11	874
修改液笔	2020-05-11	122
OCT图像修改	2020-05-12	223
百叶修改器	2020-05-12	38
修改命令	2020-05-11	960
一种修改纸	2020-05-11	122
一种修改纸	2020-05-11	105
修改图表	2020-05-11	469
修改设备通知	2020-05-13	292
引导过程修改	2020-05-13	555

一种语音输入方法、装置及终端

一种语音输入方法、装置及终端

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：