移动终端的音量调节方法、装置、移动终端及存储介质专利检索-倒谱数学与统计专利检索查询-专利查询网

移动终端的音量调节方法、装置、移动终端及存储介质

阅读：901发布：2020-05-11

专利汇可以提供移动终端的音量调节方法、装置、移动终端及存储介质专利检索，专利查询，专利分析的服务。并且本申请实施例公开了一种移动终端的音量调节方法、装置、移动终端及存储介质，涉及移动终端技术领域。该方法应用于移动终端，该方法包括：获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息；基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景；当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量；当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量。本申请可根据不同的场景对移动终端的音量进行适应性调节。，下面是移动终端的音量调节方法、装置、移动终端及存储介质专利的具体信息内容。

权利要求

1.一种移动终端的音量调节方法，其特征在于，应用于移动终端，所述方法包括：
获取所述移动终端当前所处环境的音频信号，并获取所述移动终端的当前位置信息；
基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景或者非安静场景；
当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于非安静场景时，将所述移动终端的音量调节至大于或等于第一预设音量；
当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景，且基于所述位置信息确定所述移动终端不位于指定区域时，将所述移动终端的音量调节至小于或等于第二预设音量，其中，所述第一预设音量大于所述第二预设音量。
2.根据权利要求1所述的方法，其特征在于，所述基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景或者非安静场景，包括：
获取所述音频信号的音频特征；
将所述音频特征输入所述预先训练的场景分类模型，并获取所述场景分类模型输出的场景标签，其中，所述场景标签包括安静场景标签和非安静场景标签；
基于所述场景标签确定所述移动终端处于安静场景或者非安静场景。
3.根据权利要求1所述的方法，其特征在于，在所述获取所述移动终端当前所处环境的音频信号，并获取所述移动终端的当前位置信息之前，还包括：
获取多个样本音频特征和多个场景标签，所述多个样本音频特征和所述多个场景标签一一对应，其中，所述多个样本音频特征通过对多个样本场景对应的样本音频信号进行提取获得；
基于所述多个场景标签与所述多个样本音频特征对神经网络模型进行训练，得到场景分类模型。
4.根据权利要求3所述的方法，其特征在于，在所述获取多个样本音频特征和多个场景标签之前，还包括：
获取多个样本场景对应的多个样本音频信号，所述多个样本场景和所述多个样本音频信号一一对应；
分别从所述多个样本音频信号中提取多维特征作为样本音频特征，获得多个样本音频特征，其中，所述多维特征包括梅尔频率倒谱系数、色度频率、光谱质心、光谱带宽、光谱衰减以及过零率中的一种或多种的组合。
5.根据权利要求1-4任一项所述的方法，其特征在于，所述当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于非安静场景时，将所述移动终端的音量调节至大于或等于第一预设音量包括：
获取所述移动终端的状态信息；
当基于所述状态信息确定所述移动终端处于运动状态，基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于非安静场景时，所述将所述移动终端的音量调节至大于或等于第一预设音量。
6.根据权利要求5所述的方法，其特征在于，所述当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景，且基于所述位置信息确定所述移动终端不位于指定区域时，将所述移动终端的音量调节至小于或等于第二预设音量，包括：
当基于所述状态信息确定所述移动终端处于静止状态，基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景，基于所述位置信息确定所述移动终端不位于指定区域时，所述将所述移动终端的音量调节值小于或等于第二预设音量。
7.根据权利要求1-4任一项所述的方法，其特征在于，在所述获取所述移动终端当前所处环境的音频信号，并获取所述移动终端的当前位置信息之前，还包括：
分别获取所述移动终端在多个区域的历史停留时长；
从所述多个区域中，按所述历史停留时长从大到小的顺序获取预设数量的区域作为指定区域。
8.根据权利要求7所述的方法，其特征在于，所述分别获取所述移动终端在多个区域的历史停留时间，包括：
获取工作日程表；
根据所述工作日程表确定非工作时间；
分别获取所述移动终端在所述非工作时间内在多个所述区域的停留时长；
将所述停留时长确定为所述历史停留时长。
9.一种移动终端的音量调节装置，其特征在于，应用于移动终端，所述装置包括：
检测模块，用于获取所述移动终端当前所处环境的音频信号，并获取所述移动终端的当前位置信息；
场景确定模块，用于基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景或者非安静场景；
第一调节模块，用于当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于非安静场景时，将所述移动终端的音量调节至大于或等于第一预设音量；
第二调节模块，用于当基于所述音频信号和预先训练的场景分类模型确定所述移动终端处于安静场景，且基于所述位置信息确定所述移动终端不位于指定区域时，将所述移动终端的音量调节值小于或等于第二预设音量，其中，所述第一预设音量大于所述第二预设音量。
10.一种移动终端，其特征在于，包括：
一个或多个处理器；
存储器；
一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行如权利要求1-8任一项所述的方法。
11.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-8任一项所述的方法。

说明书全文

移动终端的音量调节方法、装置、移动终端及存储介质

技术领域

[0001] 本申请涉及移动终端技术领域，更具体地，涉及一种移动终端的音量调节方法、装置、移动终端及存储介质。

背景技术

[0002] 随着移动互联网的快速发展，像智能手机、个人电脑这类移动终端成为了人们日常生活中必不可少的通讯工具。因此，用户通常会随身携带移动终端以确保及时接收消息、电话等。然而，目前的移动终端在接收到消息或者电话后的提醒方式是由用户自己设定，这样可能会因为用户对移动终端的提醒方式调整不及时，而导致用户无法较好地接收到移动终端的来电通知，例如在嘈杂的室外环境，用户可能因为之前对移动终端设置的铃声音量较小而错过电话或消息，从而降低了用户的使用体验。发明内容

[0003] 鉴于上述问题，本申请提出了一种移动终端的音量调节方法、装置、移动终端及存储介质，以解决上述问题。

[0004] 第一方面，本申请实施例提供了一种移动终端的音量调节方法，该方法应用于移动终端，该方法包括：获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息；基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景；当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量；当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0005] 第二方面，本申请实施例提供了一种移动终端的音量调节装置，该装置应用于移动终端，该移动终端的音量调节装置包括：检测模块、场景确定模块、第一调节模块以及第二调节模块。其中，检测模块用于获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。场景确定模块用于基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景。第一调节模块，用于当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。第二调节模块用于当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节值小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0006] 第三方面，本申请实施例提供了一种移动终端，包括一个或多个处理器、存储器、以及一个或多个程序，其中一个或多个程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个程序配置用于执行上述的移动终端的音量调节方法。

[0007] 第四方面，本申请实施例提供了一种计算机可读取存储介质，计算机可读取存储介质中存储有程序代码，程序代码可被处理器调用执行上述的移动终端的音量调节方法。

[0008] 本申请实施例提供的移动终端的音量调节方法、装置、移动终端及存储介质，通过获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息，再基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景，从而可以快速、准确地识别出移动终端当前所处的场景。当移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量，从而保证用户能够在比较嘈杂的环境中及时听到移动终端的提醒信息。当移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量，从而避免移动终端在需要保持安静的场景中因为提醒信息的音量太大而打扰到他人。另外，通过确定移动终端不位于指定区域时才调低移动终端的音量，可以避免移动终端在像家里或宿舍等指定区域中也将音量调低，而影响用户对移动终端的正常使用。从而实现根据不同的场景对移动终端的音量进行适应性调节，提高了音量调节的灵活性。附图说明

[0009] 为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0010] 图1示出了根据本申请一个实施例的移动终端的音量调节方法流程图。

[0011] 图2示出了根据本申请另一个实施例的移动终端的音量调节方法流程图。

[0012] 图3示出了根据本申请又一个实施例的移动终端的音量调节方法流程图。

[0013] 图4示出了根据本申请再一个实施例的移动终端的音量调节方法流程图。

[0014] 图5示出了根据本申请图4所示的移动终端的音量调节方法中步骤S410的一个实施例的方法流程图。

[0015] 图6示出了本申请一个实施例提供的移动终端的音量调节的功能模块图。

[0016] 图7示出了本申请实施例提供的移动终端的结构框图。

[0017] 图8是本申请实施例的用于保存或者携带实现根据本申请实施例的移动终端的音量调节方法的程序代码的存储介质。

具体实施方式

[0018] 为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

[0019] 目前，移动终端作为人们生活中最主要通讯工具，每个人都会时刻携带移动终端来保持与他人的通讯，因此移动终端的提醒信息变得格外重要，用户能否有效接收到移动终端的提醒信息直接决定了用户能否及时地反馈来电信息等。

[0020] 通常移动终端的提醒方式都是通过铃声或者震动等提醒信息来提醒用户有收到消息或电话。然而，移动终端的提醒方式通常都是由用户手动设置的，比如将手机调节到静音模式、震动模式、响铃模式、音量调大等等，由于在用户设置提醒方式之后，提醒方式将保持不变，从而导致移动终端的提醒方式无法灵活地适应于不同的场景。例如在嘈杂的室外场景，用户可能因为移动终端的来电铃声音量过小而错过通话，又例如在图书馆或者会议室这种需要保持安静的场景，却又因为电话铃声没有关闭，而打扰到他人或者干扰到会议的进行，从而降低了用户的使用体验。

[0021] 发明人在实际研究中发现，如果能够确定移动终端当前处于什么样的场景，并根据当前的场景来自动调节移动终端的音量大小，则可以提高移动终端使用的灵活性，比如在移动终端确定当前处于像会议室、图书馆等安静的场景时，自动将音量调小，甚至调到静音，可以避免在来电时打扰到他人，在移动终端确定当前处于像公园、医院等嘈杂的场景时，自动将音量调大，可以保证在来电时用户能够听到来电铃声。

[0022] 发明人还发现，通过对移动终端进行定位，并根据定位的地点可以确定移动终端当前所处的场景。

[0023] 然而，能够通过定位识别的场景都是预先将该场景和地点进行了关联的，当移动终端定位的地点为第一次到达的陌生地点时，则无法识别出当前的场景，所以采用该场景识别方法能识别的场景较少，应用范围较小。因此，目前的移动终端还无法对其当前的所处的场景进行较好的识别。

[0024] 因此，针对于上述问题，发明人提出了本申请实施例中的移动终端的音量调节方法、装置、移动终端及存储介质，可以通过移动终端当前采集的音频信息和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景，从而可以从广泛的场景中有效地识别出安静场景和非安静场景，并根据不同的对移动终端的音量进行适应性调节，提高了音量调节的灵活性以及提升了用户的使用体验感。

[0025] 请参阅图1，图1示出了本申请一个实施例提供的移动终端的音量调节方法流程图，该方法可以应用于移动终端，可选地，该移动终端可以是具有音频采集模块、定位模块、音频播放模块、加速度传感器的移动终端，移动终端包括但不限于：智能手机、平板电脑、个人电脑、音频播放器、视频播放器等。

[0026] 其中，该移动终端的音量调节方法可以包括：

[0027] S110，获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。

[0028] 在一些实施方式中，移动终端可以通过音频采集模块采集当前环境的音频信号，例如智能手机可以通过其设置在收音口处的麦克风采集周围环境的音频信号，其中，音频信号可以是人说话时的语音，也可以是音频播放设备播放的音频，还可以是自然环境产生的声音等等。

[0029] 其中，移动终端可以通过定位模块获取当前用户所处的位置信息，可选地，定位模块可以是全球定位系统(global positioning system，GPS)、北斗等卫星定位模块，也可以是如超宽带(ultra wide band，UWB)室内定位模块、无线保真(wireless fidelity，WiFi)室内定位模块、蓝牙室内定位模块等。

[0030] 在一些实施方式中，移动终端可以通过卫星定位的方式进行定位，也可以通过室内定位的方式进行定位，还可以同时结合卫星定位和室内定位的方式来进行定位，例如移动终端先通过卫星定位的方式定位到当前用户所处的办公楼，再由室内定位的方式定位到该办公楼中用户所处的会议室，从而达到精准定位的目的。

[0031] S120，基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景。

[0032] 其中，预先训练的场景分类模型可以用于根据输入的音频信息对该音频信息对应的场景进行分类，具体可以分为安静场景和非安静场景。其中，安静场景可以是长期都保持安静的场景，例如家、公司、办公室、会议室、图书馆、上课中的教室等场景。非安静场景可以是长期处于嘈杂的场景，例如街道、广场、集市、地铁等。

[0033] 在一些实施方式中，预先训练的场景分类模型可以配置在移动终端本地，在使用时，移动终端可以直接调用该场景分类模型对音频信号进行识别，以得到当前场景的分类结果，以能够快速地识别出当前场景。在另一些实施方式中，预先训练的场景分类模型可以配置在与移动终端通信的云端服务器，移动终端可以将采集的音频信号发送至云端服务器，由云端服务器对音频信号进行识别后得到当前场景的分类结果，再把该分类结果反馈到移动终端，从而降低了移动终端的存储压力。

[0034] S130，当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0035] S140，当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0036] 其中，指定区域可以是该移动终端的用户的私人区域，例如家或者宿舍等非公共场所，由于在该指定区域时，移动终端的提示信息不会导致打扰到他人，因此，不必在指定区域中将移动终端的音量调节至小于或等于第二预设音量，如果在指定区域将移动终端调小反而会影响用户对移动终端的正常使用。

[0037] 在本实施例中，通过获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息，再基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景，从而可以快速、准确地识别出移动终端当前所处的场景，另外，由于安静场景具有相似或相同的音频特征，非安静场景同样具有相似或相同的音频特征，因此相比于通过定位的地点去识别现有的场景，通过音频信号可以识别出更多陌生的场景，并且不用受定位信号强弱的影响，从而可以适用于更多的场景。当移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量，从而保证用户能够在比较嘈杂的环境中及时听到移动终端的提醒信息。当移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量，从而避免移动终端在需要保持安静的场景中因为提醒信息的音量太大而打扰到他人。另外，通过确定移动终端不位于指定区域时才调低移动终端的音量，可以避免移动终端在像家里或宿舍等指定区域中也将音量调低，而影响用户对移动终端的正常使用。从而实现根据不同的场景对移动终端的音量进行适应性调节，提高了音量调节的灵活性。

[0038] 请参阅图2，图2示出了本申请另一个实施例提供的移动终端的音量调节方法流程图，该方法可以包括：

[0039] S210，获取多个样本音频特征和多个场景标签，多个样本音频特征和多个场景标签一一对应，其中，多个样本音频特征通过对多个样本场景对应的样本音频信号进行提取获得。

[0040] 其中，场景标签可以根据场景的类型进行标注，例如将家、公司、办公室、会议室、图书馆、上课中的教室等场景可以标注安静场景的标签。如街道、广场、集市、地铁等场景可以标注非安静场景的标签。

[0041] 在一些实施方式中，可以到不同的场景的现场去采集各个场景对应的样本音频信号，并从样本音频信号中提取出样本音频特征。也可以从网络上下载不同场景对应的样本音频信号，并从中提取出样本音频特征。可选地，样本音频信号可以为时长为3秒的音频信号，也可以时长为3秒以上的音频信号，从而可以保证音频信号的有效性。

[0042] 在一些实施方式中，S210中获取样本音频特征的方式可以是，先获取多个样本场景对应的多个样本音频信号，其中，多个样本场景和多个样本音频信号一一对应。再分别从多个样本音频信号中提取多维特征作为样本音频特征，获得多个样本音频特征，其中，多维特征可以包括梅尔频率倒谱系数、色度频率、光谱质心、光谱带宽、光谱衰减以及过零率中的一种或多种的组合。

[0043] 其中，多维特征可以是45维特征，该45维特征可以是MFCC特征(40维)、色度频率、光谱质心、光谱带宽、光谱衰减、过零率。

[0044] 考虑到如果仅通过单一的音频特征来关联场景可能存在误差，例如，仅通过场景中的音量大小特征来识别场景，音量大的场景确定为非安静场景，那么当用户正在进行会议，并且与他人争论某些问题而产生较大音量，此时将会把会议场景错误的确定为非安静场景。因此，在本实施方式中，通过提取出音频信号中的MFCC特征、色度频率、光谱质心、光谱带宽、光谱衰减、过零率等多维特征来结合场景标签训练模型，可以保证训练好的模型能够更加准确地根据音频信号识别出场景。

[0045] S220，基于多个场景标签与多个样本音频特征对神经网络模型进行训练，得到场景分类模型。

[0046] 在一些实施方式中，样本音频特征可以是梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient，MFCC)。

[0047] 其中，梅尔频率倒谱系数可以从音频信号中提取，具体地，提取时，可以先将音频信号利用傅里叶变换算法从时域特征转化为频域特征进而可以计算得到MFCC特征，这个过程能过滤掉音频信号中的无效噪声信号，保留人耳频段的有效信息。

[0048] 然后，可以将样本音频特征向量输入Dense层为2的全连接神经网络模型进行模型训练，从而得到二分类的场景分类模型。

[0049] S230，获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。

[0050] 其中，S230的具体实施方式可以参考S110，故不在此赘述。

[0051] S240，获取音频信号的音频特征。

[0052] 其中，S240的具体实施方式可以参考S210中获取样本音频特征的方式，故不在此赘述。

[0053] S250，将音频特征输入预先训练的场景分类模型，并获取场景分类模型输出的场景标签，其中，场景标签包括安静场景标签和非安静场景标签。

[0054] 其中，可以将音频特征输入到S220中得到的场景分类模型，由于该场景分类模型基于多个样本音频特征和多个场景标签，因此可以根据输入的音频特征得到与该音频特征对应的场景标签。

[0055] S260，基于场景标签确定移动终端处于安静场景或者非安静场景。

[0056] 其中，由于每个场景都根据各自场景的类型标注了对应的场景标签，因此可以直接根据场景标签可以确定出移动终端当前所处的场景是安静场景还是非安静场景。

[0057] S270，当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0058] S280，当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0059] 其中，S270-S280的具体实施方式可以参考S130-S140，故不在此赘述。

[0060] 在本实施例中，通过获取多个样本音频特征和多个场景标签，并基于多个场景标签与多个样本音频特征对神经网络模型进行训练，可以有效得到用于根据音频特征识别场景标签的场景分类模型，再从移动终端采集的其所处当前场景的音频信号中提取出音频特征，基于该音频特征和场景分类模型可以快速准确地识别出移动终端所处的当前场景，提高了识别效率和扩大了识别范围。

[0061] 请参阅图3，图3示出了本申请又一个实施例提供的移动终端的音量调节方法流程图，该方法可以包括：

[0062] S310，获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。

[0063] 其中，S310的具体实施方式可以参考S110，故不在此赘述。

[0064] S320，获取移动终端的状态信息。

[0065] 其中，该状态信息可以用于表征移动终端处于运动状态或者静止状态。

[0066] 在一些实施方式中，移动终端可以通过加速度传感器或者陀螺仪传感器来获取状态信息，具体地，状态信息可以是加速度传感器检测得到的加速度数据。

[0067] S330，当基于状态信息确定移动终端处于运动状态，基于音频信号和场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0068] 作为一种示例，如果加速度传感器、陀螺仪传感器等检测到的加速度超过加速度阈值，则可以确定移动终端处于运动状态，而加速度传感器、陀螺仪传感器等检测到的加速度没有超过加速度阈值，则可以确定移动终端处于静止状态，可选地，加速度阈值可以为0。

[0069] 作为一种示例，当加速度传感器检测到移动终端在一定时间内持续保持静止状态，例如用户正携带移动终端在行走或者跑动，并持续了30秒以上，且基于音频信号和场景分类模型识别出用户处于非安静场景，也就是嘈杂的场景时，将移动终端的音量调大到高于第一预设音量。可选地，当移动识别出用户处于非安静场景时，还可以检测移动终端当前是否处于震动模式，如果不处于，可以将移动终端调节到震动模式，以进一步达到有效提醒用户的作用。

[0070] 在一些实施方式中，可以在将移动终端的音量调节至大于或等于第一预设音量之前，检测移动终端的音量是否已经大于或等于第一预设音量，当移动终端的音量大于或等于第一预设音量时，可以保持当前音量，当移动终端的音量小于第一预设音量时，将移动终端的音量调节至大于或等于第一预设音量。从而避免了重复对音量进行调节，产生不必要的功耗。

[0071] 在一些实施方式中，第一预设音量可以根据当前场景中采集的音频信号的音量大小来确定。具体地，可以将第一预设音量设置为大于前场景中采集的音频信号的音量的最大值，从而可以确保移动终端的提醒信息能够在当前的场景中对用户起到有效的提醒。

[0072] S340，当基于状态信息确定移动终端处于静止状态，基于音频信号和场景分类模型确定移动终端处于安静场景，基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节值小于或等于第二预设音量。

[0073] 作为一种示例，当移动终端的加速度传感器检测到加速度数据为0时，则确定移动终端处于静止状态，例如用户在开会或者看书，将移动终端放到桌上，然后移动终端基于当前采集的音频信号和预先训练的场景分类模型识别出移动终端是否处于安静场景，当处于时，通过位置信息确定是否处于家里或者宿舍等指定区域，若不处于指定区域，则可以认为该用户处于需要保持安静的公共环境，然后可以将移动终端的音量调节至小于或等于第二预设音量，可选地，第二预设音量可以为0。可选地，当用户处于需要保持安静的公共环境，可以将移动终端切换到静音震动的模式。

[0074] 在本实施例中，通过获取移动终端的状态信息，并根据状态信息确定移动终端处于静止状态还是运动状态，当处于静止状态时，再确定移动终端是否处于安静场景和指定区域。由于移动终端处于静止状态时，可以说明用户没有使用移动终端，通常是处于安静的场景，因此结合移动终端的静止状态和音频信号可以提高对安静场景的识别准确率。当移动终端处于运动状态时，通常可以说明用户正在嘈杂的环境移动，或者由于用户的移动即将会进入嘈杂的环境中，因此结合移动终端的运动状态和音频信号可以提高对非安静场景的识别准确率。

[0075] 请参阅图4，图4示出了本申请再一个实施例提供的移动终端的音量调节方法流程图，该方法可以包括：

[0076] S410，分别获取移动终端在多个区域的历史停留时长。

[0077] 作为一种示例，移动终端可以通过查看其安装的导航、定位等应用程序的历史使用记录来获取移动终端在多个区域的历史停留时长，可选地，历史停留时长的可以是以天作为单位也可以是以小时作为单位，例如获取的各个区域对应的历史停留时长如表1所示：

[0078] 表1

[0079]区域 A B C D
历史停留时长 3小时 4小时 10小时 1小时

[0080] 在一些实施方式中，如图5所示，S410可以包括如下步骤：

[0081] S411，获取工作日程表。

[0082] 在一些实施方式中，工作日程表可以由用户手动输入到移动终端的备忘录或者日历中，因此移动终端可以从备忘录或者日历中获取工作日程表。可选地，工作日程表还可以是移动终端上的办公软件(如钉钉)通过管理员的设置自动生成，因此，移动终端可以从指定的办公软件中获取工作日程表。其中，工作日程表可以记录了用户的工作时间，例如工作日程表记录了工作为9:00-12:00和13：00-17:00。

[0083] S412，根据工作日程表确定非工作时间。

[0084] 可以理解的是，在工作日程表中记录了工作时间，则除工作时间以外的时间可以确定为非工作时间。例如根据上述工作时间，可以确定12:00-13:00以及17:00-9:00的时间为非工作时间。

[0085] S413，分别获取移动终端在非工作时间内在多个区域的停留时长。

[0086] 作为一种示例，可以在12:00-13:00以及17:00-9:00期间分别获取移动终端在多个区域的停留时长。

[0087] S414，将停留时长确定为历史停留时长。

[0088] 在本实施方式中，通过获取用户的工作日程表，并根据工作日程表确定用户的非工作时间，且在用户非工作时间中获取移动终端在多个区域的停留时长作为历史停留时长，可以避免误将停留时间较长但不属于用户的私人区域的区域确定为指定区域，例如办公室等区域，从而确保了指定区域为非公共区域。

[0089] S420，从多个区域中，按历史停留时长从大到小的顺序获取预设数量的区域作为指定区域。

[0090] 作为一种示例，例如预设数量为1，可以先将表1中的区域按区域C、区域B、区域A以及区域D的顺序进行排列，然后选取出区域C作为指定区域。又例如预设数量为2，则可以选取出区域C和区域B共同作为指定区域。由于用户停留时间较长的区域通常为用户的私人区域，如家里、宿舍等等。因此可以将区域C确定用户的家或者宿舍等非公共区域。

[0091] S430，获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。

[0092] S440，基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景。

[0093] S450，当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0094] S460，当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0095] 其中，S430-S460的具体实施方式可以参考S110-S140，故不在此赘述。

[0096] 在本实施例中，通过分别获取移动终端在多个区域的历史停留时长，并从多个区域中，按历史停留时长从大到小的顺序获取预设数量的区域作为指定区域，从而可以准确、有效地将用户的家或者宿舍等非公共区域作为指定区域，避免移动终端在非公共区域误将音量自动调小而导致用户无法在自己的私人区域正常使用，进而提高了用户体验。

[0097] 请参阅图6，其示出了本申请实施例提供的移动终端的音量调节装置500，该装置500可以应用于移动终端，该移动终端的音量调节装置500包括：检测模块510、场景确定模块520、第一调节模块530以及第二调节模块540。

[0098] 其中，检测模块510，用于获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息。

[0099] 场景确定模块520，用于基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景。

[0100] 第一调节模块530，用于当基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0101] 第二调节模块540，用于当基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节值小于或等于第二预设音量，其中，第一预设音量大于第二预设音量。

[0102] 进一步的，场景确定模块520，包括：

[0103] 音频特征获取单元，用于获取音频信号的音频特征。

[0104] 场景标签获取单元，用于将音频特征输入预先训练的场景分类模型，并获取场景分类模型输出的场景标签，其中，场景标签包括安静场景标签和非安静场景标签。

[0105] 场景确定单元，用于基于场景标签确定移动终端处于安静场景或者非安静场景。

[0106] 进一步的，该装置500还包括：

[0107] 样本获取模块，用于获取多个样本音频特征和多个场景标签，多个样本音频特征和多个场景标签一一对应，其中，多个样本音频特征通过对多个样本场景对应的样本音频信号进行提取获得。

[0108] 模型训练模块，用于基于多个场景标签与多个样本音频特征对神经网络模型进行训练，得到场景分类模型。

[0109] 进一步的，该装置500还包括：

[0110] 样本音频信号获取模块，用于获取多个样本场景对应的多个样本音频信号，多个样本场景和多个样本音频信号一一对应。

[0111] 特征提取模块，用于分别从多个样本音频信号中提取多维特征作为样本音频特征，获得多个样本音频特征，其中，多维特征包括梅尔频率倒谱系数、色度频率、光谱质心、光谱带宽、光谱衰减以及过零率中的一种或多种的组合。

[0112] 进一步的，第一调节模块530包括：

[0113] 状态信息获取单元，用于获取移动终端的状态信息。

[0114] 第一调节单元，用于当基于状态信息确定移动终端处于运动状态，基于音频信号和预先训练的场景分类模型确定移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量。

[0115] 进一步的，第二调节模块540包括：

[0116] 第二调节单元，用于当基于状态信息确定移动终端处于静止状态，基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景，基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节值小于或等于第二预设音量。

[0117] 进一步的，该装置500还包括：

[0118] 历史停留时长获取模块，用于分别获取移动终端在多个区域的历史停留时长。

[0119] 指定区域确定模块，用于从多个区域中，按历史停留时长从大到小的顺序获取预设数量的区域作为指定区域。

[0120] 进一步的，历史停留时长获取模块包括：

[0121] 工作日程表获取单元，用于获取工作日程表。

[0122] 非工作时间确定单元，用于根据工作日程表确定非工作时间。

[0123] 停留时长获取单元，用于分别获取移动终端在非工作时间内在多个区域的停留时长。

[0124] 历史停留时长确定单元，用于将停留时长确定为历史停留时长。

[0125] 所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

[0126] 在本申请所提供的几个实施例中，所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

[0127] 另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

[0128] 请参考图7，其示出了本申请实施例提供的一种移动终端的结构框图。该移动终端600可以是前述实施例中能够运行程序的移动终端600。本申请中的移动终端600可以包括一个或多个如下部件：处理器610、存储器620、以及一个或多个程序，其中一个或多个程序可以被存储在存储器620中并被配置为由一个或多个处理器610执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。

[0129] 处理器610可以包括一个或者多个处理核。处理器610利用各种接口和线路连接整个移动终端内的各个部分，通过运行或执行存储在存储器620内的指令、程序、代码集或指令集，以及调用存储在存储器620内的数据，执行移动终端的各种功能和处理数据。可选地，处理器610可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器610可集成中央处理器610(Central Processing Unit，CPU)、图像处理器610(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器610中，单独通过一块通信芯片进行实现。

[0130] 存储器620可以包括随机存储器620(Random Access Memory，RAM)，也可以包括只读存储器620(Read-Only Memory)。存储器620可用于存储指令、程序、代码、代码集或指令集。存储器620可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

[0131] 请参考图8，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质700中存储有程序代码710，程序代码710可被处理器调用执行上述方法实施例中所描述的方法。

[0132] 计算机可读存储介质700可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质具有执行上述方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。

[0133] 综上所述，本申请实施例提供的移动终端的音量调节方法、装置、移动终端及存储介质，通过获取移动终端当前所处环境的音频信号，并获取移动终端的当前位置信息，再基于音频信号和预先训练的场景分类模型确定移动终端处于安静场景或者非安静场景，从而可以快速、准确地识别出移动终端当前所处的场景，另外，由于安静场景具有相似或相同的音频特征，非安静场景同样具有相似或相同的音频特征，因此相比于通过定位的地点去识别现有的场景，通过音频信号可以识别出更多陌生的场景，并且不用受定位信号强弱的影响，从而可以适用于更多的场景。当移动终端处于非安静场景时，将移动终端的音量调节至大于或等于第一预设音量，从而保证用户能够在比较嘈杂的环境中及时听到移动终端的提醒信息。当移动终端处于安静场景，且基于位置信息确定移动终端不位于指定区域时，将移动终端的音量调节至小于或等于第二预设音量，其中，第一预设音量大于第二预设音量，从而避免移动终端在需要保持安静的场景中因为提醒信息的音量太大而打扰到他人。另外，通过确定移动终端不位于指定区域时才调低移动终端的音量，可以避免移动终端在像家里或宿舍等指定区域中也将音量调低，而影响用户对移动终端的正常使用。从而实现根据不同的场景对移动终端的音量进行适应性调节，提高了音量调节的灵活性。

[0134] 最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

标题	发布/更新时间	阅读量
语音情绪波动分析方法及装置	2020-05-08	791
基于声纹特征识别的聚乙烯气相流化床生产过程结块在线监测系统及方法	2020-05-12	273
基于室内声学信道扰动分析的物体识别方法	2020-05-13	100
实时声纹辨识系统与方法	2020-05-08	396
一种提高DNN模型泛化性能的语音增强方法	2020-05-11	452
一种基于情感识别的老人陪护机器人子系统	2020-05-08	841
一种风力发电机组稳态振动在线监测方法及监测系统	2020-05-11	661
一种风力发电机组稳态振动在线趋势预测方法及趋势预测系统	2020-05-11	689
基于音频分析与深度学习的争吵识别方法	2020-05-13	536
一种乒乓球比赛视频的智能数据采集方法	2020-05-13	472

移动终端的音量调节方法、装置、移动终端及存储介质

移动终端的音量调节方法、装置、移动终端及存储介质

技术领域

背景技术

具体实施方式

该功能需要专业版企业版VIP权限，您可以：