一种智能耳机、智能耳机处理方法、电子设备及存储介质专利检索-自动音乐标记人工智能专利检索查询-专利查询网

一种智能耳机、智能耳机处理方法、电子设备及存储介质

阅读：866发布：2020-05-13

专利汇可以提供一种智能耳机、智能耳机处理方法、电子设备及存储介质专利检索，专利查询，专利分析的服务。并且本发明提供了一种智能耳机、智能耳机处理方法、电子设备及存储介质，所述智能耳机包括：场景识别模块，用于识别智能耳机当前所处的场景类型；处理模块，用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。本发明提供的智能耳机可以自动识别外界场景并根据外界场景的改变进行自适应处理，从而提高了用户使用智能耳机的体验，增强了用户对智能耳机的使用依赖性。，下面是一种智能耳机、智能耳机处理方法、电子设备及存储介质专利的具体信息内容。

权利要求

1.一种智能耳机，其特征在于，包括：
场景识别模块，用于识别智能耳机当前所处的场景类型；
处理模块，用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；
以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；
其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景；其中，所述视觉影像内容包括：幻灯片播放、视频短片播放、舞台、屏幕或灯光播放；
其中，所述场景识别模块，具体用于：
根据智能耳机上的图像采集装置采集的环境图像信息，以及根据智能耳机上的声音采集装置采集的声音信息，识别智能耳机当前所处的场景类型；
当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时，识别智能耳机当前所处的场景类型为第一类场景；
当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景存在视觉影像内容时，识别智能耳机当前所处的场景类型为第二类场景；
其中，所述处理模块，具体用于：
在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；
在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。
2.根据权利要求1所述的智能耳机，其特征在于，还包括：第一触发模块、第二触发模块和第三触发模块；
所述第一触发模块，用于在接收到用户的第一触发信号后，自动对当前场景的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；
所述第二触发模块，用于在接收到用户的第二触发信号后，自动对当前场景中的视觉影像内容进行自动录像处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；
所述第三触发模块，用于在每接收到用户的一次第三触发信号后，自动对当前场景中的视觉影像进行单张图像采集。
3.根据权利要求1所述的智能耳机，其特征在于，所述场景识别模块，还用于识别智能耳机当前所处的场景类型是否为第三类场景；所述第三类场景为睡眠休息场景；
相应地，所述处理模块，还用于在识别出来的场景为第三类场景时，检测用户是否发出鼾声，若是，则通过安装在智能耳机上的振动模块或音乐提醒模块进行打鼾提醒，以使用户调整睡姿。
4.根据权利要求3所述的智能耳机，其特征在于，所述处理模块，还用于在识别出来的场景为第三类场景时，检测当前场景是否存在地震或火灾危险，若是，则通过安装在智能耳机上的振动模块或报警提醒模块进行危险提醒，以使用户尽快逃离现场。
5.一种智能耳机处理方法，其特征在于，包括：
识别智能耳机当前所处的场景类型；
在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；
以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；
其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景；其中，所述视觉影像内容包括：幻灯片播放、视频短片播放、舞台、屏幕或灯光播放；
其中，所述识别智能耳机当前所处的场景类型，具体包括：
根据智能耳机上的图像采集装置采集的环境图像信息，以及根据智能耳机上的声音采集装置采集的声音信息，识别智能耳机当前所处的场景类型；
当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时，识别智能耳机当前所处的场景类型为第一类场景；
当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景存在视觉影像内容时，识别智能耳机当前所处的场景类型为第二类场景；
其中，所述在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理，具体包括：
在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；
在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。
6.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求5所述智能耳机处理方法的步骤。
7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求5所述智能耳机处理方法的步骤。

说明书全文

一种智能耳机、智能耳机处理方法、电子设备及存储介质

技术领域

[0001] 本发明涉及智能设备技术领域，具体涉及一种智能耳机、智能耳机处理方法、电子设备及存储介质。

背景技术

[0002] 智能耳机是一种新型的可穿戴智能设备。智能耳机像其他智能设备一样可以具有独立的操作系统，也可以由用户安装软件、游戏等程序还可以通过移动通讯网络实现无线网络接入。

[0003] 然而，目前的智能耳机存在的一个主要问题是：智能耳机主要停留在接听声音这一主要功能上，很少具有其他自动智能功能。例如，目前的智能耳机很少关注外界因素的变化，无法根据外界因素的变化进行一些相适应的自动交互处理，从而造成了一些不便，不利于用户充分利用智能耳机，降低了用户对智能耳机的使用依赖程度。

发明内容

[0004] 针对现有技术中的问题，本发明提供一种智能耳机、智能耳机处理方法、电子设备及存储介质。

[0005] 具体地，本发明提供以下技术方案：

[0006] 第一方面，本发明提供了一种智能耳机，包括：

[0007] 场景识别模块，用于识别智能耳机当前所处的场景类型；

[0008] 处理模块，用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；

[0009] 以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；

[0010] 其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0011] 进一步地，所述场景识别模块，具体用于：

[0012] 根据智能耳机上的图像采集装置采集的环境图像信息，以及根据智能耳机上的声音采集装置采集的声音信息，识别智能耳机当前所处的场景类型；

[0013] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时，识别智能耳机当前所处的场景类型为第一类场景；

[0014] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景存在视觉影像内容时，识别智能耳机当前所处的场景类型为第二类场景。

[0015] 进一步地，所述处理模块，具体用于：

[0016] 在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0017] 在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。

[0018] 进一步地，所述智能耳机还包括：第一触发模块、第二触发模块和第三触发模块；

[0019] 所述第一触发模块，用于在接收到用户的第一触发信号后，自动对当前场景的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0020] 所述第二触发模块，用于在接收到用户的第二触发信号后，自动对当前场景中的视觉影像内容进行自动录像处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0021] 所述第三触发模块，用于在每接收到用户的一次第三触发信号后，自动对当前场景中的视觉影像进行单张图像采集。

[0022] 进一步地，所述场景识别模块，还用于识别智能耳机当前所处的场景类型是否为第三类场景；所述第三类场景为睡眠休息场景；

[0023] 相应地，所述处理模块，还用于在识别出来的场景为第三类场景时，检测用户是否发出鼾声，若是，则通过安装在智能耳机上的振动模块或音乐提醒模块进行打鼾提醒，以使用户调整睡姿。

[0024] 进一步地，所述处理模块，还用于在识别出来的场景为第三类场景时，检测当前场景是否存在地震或火灾危险，若是，则通过安装在智能耳机上的振动模块或报警提醒模块进行危险提醒，以使用户尽快逃离现场。

[0025] 第二方面，本发明还提供了一种智能耳机处理方法，包括：

[0026] 识别智能耳机当前所处的场景类型；

[0027] 在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；

[0028] 以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；

[0029] 其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0030] 进一步地，所述在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理，具体包括：

[0031] 在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0032] 在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。

[0033] 第三方面，本发明还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述智能耳机处理方法的步骤。

[0034] 第四方面，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所述智能耳机处理方法的步骤。

[0035] 由上面技术方案可知，本发明提供的智能耳机，包括：场景识别模块和处理模块，场景识别模块用于识别智能耳机当前所处的场景类型；处理模块用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理，以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；这里，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。可见，本发明提供的智能耳机能够自动根据智能耳机当前所处的场景进行相适应的处理。如智能耳机可以自动识别当前场景，若当前场景为不带有视觉影像内容的会话场景，则可以自动进行录音处理，若当前场景为带有视觉影像内容的场景，可以自动进行录像或拍照以及录音处理，从而使得智能耳机变得更加智能，例如，可以帮助用户解决在会议时忘记录音或记录会议内容而错过重要信息的问题。此外需要说明的是，本发明提供的智能耳机尤其适用于会议、讨论会、培训、讲座、电影观看、演唱会等场合的使用，本发明提供的智能耳机可以根据外界场景的改变进行自适应处理，从而提高了用户使用智能耳机的体验，增强了用户对智能耳机的使用依赖性。附图说明

[0036] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0037] 图1是本发明一实施例提供的智能耳机的一种结构示意图；

[0038] 图2是本发明一实施例提供的智能耳机的另一种结构示意图；

[0039] 图3是本发明另一实施例提供的智能耳机处理方法的流程图；

[0040] 图4是本发明又一实施例提供的电子设备的结构示意图。

具体实施方式

[0041] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0042] 本发明一实施例提供了一种智能耳机，参见图1，该智能耳机包括：场景识别模块11和处理模块12；其中：

[0043] 场景识别模块11，用于识别智能耳机当前所处的场景类型；

[0044] 处理模块12，用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；

[0045] 其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0046] 需要说明的是，本实施例中的场景识别模块11可以自动识别智能耳机当前所处的场景类型。在本实施例中，场景识别模块11可以自动识别的场景类型包括至少两种，一种是不带有视觉影像内容的会话场景，如会议场景、谈话场景、讨论场景，这类场景的特征一般是只具有两人或多人的谈话或讨论，而不具有视觉影像内容。另一种是带有视觉影像内容的场景，如培训、讲座、电影观看、演唱会等场景，这类场景的特征一般具有视觉影像内容，这里的视觉影像内容可以为：幻灯片播放、视频短片播放、舞台、屏幕或灯光播放等。其中，对于第二类场景来说，可以具有声音特征，也可以不具有声音特征，如可以是带有声音特征的场景，如电影的播放，带有语音自动讲解的幻灯片播放，或者配合人工讲解的幻灯片播放；也可以为不带声音特征的场景，如幻灯片讲义的静音播放，或是文本文件的顺序按页展示等等。

[0047] 相应地，所述处理模块12根据场景识别结果进行自动的相适应的处理。如，当识别出当前场景为不带有视觉影像内容的会话场景时，自动进行录音处理，当识别出前场景为带有视觉影像内容的场景，自动进行录像或拍照以及录音处理。

[0048] 举个例子，比如，当用户在会议室组织了一个针对某一问题的小型讨论会时，该用户忘记开启会议室的录音系统，或者忘记开启手机上的会议录音功能，那么在这场会议结束后，该用户将无法真实还原每个人的发言情况。而假如该用户佩戴了本实施例提供的智能耳机，则可以解决这个问题，因为本实施例提供的智能耳机，可以自动识别出当前的场景为第一类场景，那么智能耳机会自动进行录音处理，无需人为干预，从而大大方便了用户，解决了用户在会议时忘记录音或记录会议内容而错过重要信息的问题。

[0049] 同理，当用户去参加某一带有幻灯片讲义的培训时，经常不方便拍摄幻灯片内容，或者，经常发生在培训结束的时候才想起来没有把重要的幻灯片内容进行拍照保存的情况。而假如该用户佩戴了本实施例提供的智能耳机，则可以解决这个问题，因为本实施例提供的智能耳机，可以自动识别出当前的场景为第二类场景，那么智能耳机会自动进行录像或拍照以及录音处理，无需人为干预，从而大大方便了用户。

[0050] 需要说明的是，为满足智能耳机进行自动录像或拍照功能的需求，智能耳机上一般设置有录像或拍照模块，如所述智能耳机上设置有微型摄像头。此外，智能耳机也可以与其他可穿戴设备连接，用于触发其他可穿戴设备进行录像或拍照。如智能耳机与具有摄像功能的摄像眼镜连接，用于触发摄像眼镜进行录像或拍照。

[0051] 需要说明的是，本实施例所提到的应用场景均为同意记录或拍摄会议语音及视频内容的场景，对于涉及隐私保密的场景，不在本实施例的讨论范围之内。

[0052] 由上面技术内容可知，本实施例提供的智能耳机，包括：场景识别模块和处理模块，场景识别模块用于识别智能耳机当前所处的场景类型；处理模块用于在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理，以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；这里，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。可见，本实施例提供的智能耳机能够自动根据智能耳机当前所处的场景进行相适应的处理。如智能耳机可以自动识别当前场景，若当前场景为不带有视觉影像内容的会话场景，则可以自动进行录音处理，若当前场景为带有视觉影像内容的场景，可以自动进行录像或拍照以及录音处理，从而使得智能耳机变得更加智能，例如，可以帮助用户解决在会议时忘记录音或记录会议内容而错过重要信息的问题。此外需要说明的是，本发明提供的智能耳机尤其适用于会议、讨论会、培训、讲座、电影观看、演唱会等场合的使用，本实施例提供的智能耳机可以根据外界场景的改变进行自适应处理，从而提高了用户使用智能耳机的体验，增强了用户对智能耳机的使用依赖性。

[0053] 在一种可选实施方式中，所述场景识别模块11，具体用于：

[0054] 根据智能耳机上的图像采集装置采集的环境图像信息，以及根据智能耳机上的声音采集装置采集的声音信息，识别智能耳机当前所处的场景类型；

[0055] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时，识别智能耳机当前所处的场景类型为第一类场景；

[0056] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景存在视觉影像内容时，识别智能耳机当前所处的场景类型为第二类场景。

[0057] 在本实施方式中，在判断当前场景是否存在视觉影像内容时，可以根据智能耳机上的图像采集装置采集的360°的环境图像，判断360°的环境图像中是否有呈幻灯片播放、视频播放、舞台灯光屏幕等特征，若有，则判断当前场景存在视觉影像内容，若无，则判断当前场景不存在视觉影像内容。此外，在判断环境图像中是否有呈幻灯片播放、视频播放、舞台灯光屏幕等特征时，可以利用特征匹配的方式进行判断，也可以利用图像像素亮度值的方式进行判断。

[0058] 此外，在本实施方式中，在对第一类场景进行识别时，为避免错误识别，或者为提高场景识别的准确度，可以在检测到满足“当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时”这一条件时，再追加一步判断，即根据图像采集装置采集的环境图像信息判断当前场景是否为室内场景或更进一步判断是否为会议室，若是，则识别智能耳机当前所处的场景类型为第一类场景，这是因为一般正式的讨论会都在室内或会议室进行，这样处理的目的是为了避免将几个朋友之间闲聊的场景识别为第一类场景。

[0059] 基于上述内容，在一种可选实施方式中，所述处理模块12，具体用于：

[0060] 在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0061] 在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。

[0062] 可见，在本实施方式中，在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。例如，最后可以一份录音文件以及一份文字文件，其中，文字文件中的形式为：

[0063] 张三：发言内容(可选：发言时长)；

[0064] 李四：发言内容；

[0065] 王五：发言内容；

[0066] 赵六：发言内容；

[0067] 张三：发言内容；

[0068] 王五：发言内容；

[0069] 孙九：发言内容。

[0070] 可见，本实施方式的处理方式不但可以真实还原每个人在会议上的发言语音，还可以在会议结束后得到一份文字文件，这份文字文件以会议纪实的方式完完整整记录下了会议过程，且将每个人的发言进行对应归位，以文字的形式清晰展示了每个人的发言过程以及多个发言人之间的交互过程，这个结果可以帮助会议总结人员进行资料整理，或者也可以直接利用这份文件作为会议记录，从而省去了大量的文字整理工作。此外，在上述文字文件中还可以增加发言时长这一信息。

[0071] 此外，在本实施方式中，在识别出来的场景为第二类场景时，可以根据需求选择对当前场景中的视觉影像内容进行自动录像处理还是进行自动单张影像连续采集处理。例如，当只需要获取关于正在播放的幻灯片的图片信息时，按照预设拍照间隔进行自动单张影像连续采集处理即可。当需要获取完整的幻灯片播放过程时，则可以对当前场景中的视觉影像内容进行自动录像处理。

[0072] 在一种可选实施方式中，参见图2，所述智能耳机还包括：第一触发模块13、第二触发模块14和第三触发模块15；

[0073] 所述第一触发模块13，用于在接收到用户的第一触发信号后，自动对当前场景的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0074] 所述第二触发模块14，用于在接收到用户的第二触发信号后，自动对当前场景中的视觉影像内容进行自动录像处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0075] 所述第三触发模块15，用于在每接收到用户的一次第三触发信号后，自动对当前场景中的视觉影像进行单张图像采集。

[0076] 可见，在本实施方式中，智能耳机可以在用户的触发下进行一些处理，也就是说，智能耳机除了可以执行上述实施例所述的场景自动识别以及自动处理以外，还可以在用户的触发下，进行应急处理。

[0077] 例如，当用户需要根据培训会上的培训内容，自由选择哪些影像资料需要进行采集，哪些资料不需要采集时，在这种情况下，用户可以在看到想要保存的内容时，临时触发第三触发模块15，然后使得智能耳机自动对当前场景中的视觉影像进行单张图像采集。这里，第三触发模块15一般为设置在智能耳机上的按键，如为按键3，那么当用户想要采集当下的正在播放的一张幻灯片图像时，用户可以通过按下按键3的方式触发智能耳机自动对当前场景中的视觉影像进行单张图像采集。

[0078] 在本实施例中，第一触发模块13、第二触发模块14和第三触发模块15的应用场景可以是在智能耳机上的场景自动识别功能关闭后进行操作的场景。当然，也有一种情况是，当智能耳机上的场景自动识别出现问题而识别不准时，也可以采用第一触发模块13、第二触发模块14和第三触发模块15进行临时补救，且该补救操作简单便捷。

[0079] 此外，需要说明的是，所述第三触发模块15的处理可以和第一触发模块13或第二触发模块14的处理并行。举个例子，就是说可以在对当前播放的幻灯片进行自动录像处理的同时，还对某些重点幻灯片页进行拍照处理(这里如有必要，可以设置两个独立的摄像头，一个负责录像，一个负责拍照)。这样处理的好处是，既可以得到完整的录像视频，也可以得到较为重点的几张幻灯片页的图像，从而方便用户根据自己需要进行查看。

[0080] 在一种可选实施方式中，所述场景识别模块11，还用于识别智能耳机当前所处的场景类型是否为第三类场景；所述第三类场景为睡眠休息场景；

[0081] 相应地，所述处理模块12，还用于在识别出来的场景为第三类场景时，检测用户是否发出鼾声，若是，则通过安装在智能耳机上的振动模块或音乐提醒模块进行打鼾提醒，以使用户调整睡姿。

[0082] 可见，在本实施方式中，所述场景识别模块11还可以识别睡眠休息场景，然后检测用户是否发出鼾声，并在用户发出鼾声时，通过安装在智能耳机上的振动模块或音乐提醒模块进行打鼾提醒，以使用户调整睡姿，从而保证用户的健康。

[0083] 需要说明的是，在进行睡眠休息场景识别时，可以根据用户的心跳、血压等信息进行识别，也可以通过采集图像的方式进行识别，如识别用户是否为睡姿等。

[0084] 需要说明的是，在检测用户是否发出鼾声时，可以采用鼾声传感器进行检测，也可以采用其他可以鼾声的传感器进行检测，本发明对此不做限定。

[0085] 在一种可选实施方式中，所述处理模块12，还用于在识别出来的场景为第三类场景时，检测当前场景是否存在地震或火灾危险，若是，则通过安装在智能耳机上的振动模块或报警提醒模块进行危险提醒，以使用户尽快逃离现场。

[0086] 可见，在本实施方式中，在当前场景为睡眠休息场景时，还用于检测当前场景是否存在地震或火灾危险，若是，则通过安装在智能耳机上的振动模块或报警提醒模块进行危险提醒，以使用户尽快逃离现场，从而保证用户的生命安全。

[0087] 需要说明的是，在检测当前场景是否存在地震或火灾危险时，可以通过振动传感器、温度传感器或其他可以检测地震或火灾的传感器进行检测，本发明对此不做限定。需要说明的是，本实施例所给出的多个可选实施方式，在逻辑或结构相互不冲突的前提下，可以自由组合，本发明对此不做限定。

[0088] 基于相同的发明构思，本发明另一实施例还提供了一种智能耳机处理方法，参见图3，该方法包括如下步骤：

[0089] 步骤101：识别智能耳机当前所处的场景类型。

[0090] 步骤102：在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0091] 在一种可选实施方式中，上述步骤101可以通过如下方式实现：

[0092] 根据智能耳机上的图像采集装置采集的环境图像信息，以及根据智能耳机上的声音采集装置采集的声音信息，识别智能耳机当前所处的场景类型；

[0093] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景不存在视觉影像内容，且根据智能耳机上的声音采集装置采集的声音信息判断存在两人或多人会话内容时，识别智能耳机当前所处的场景类型为第一类场景；

[0094] 当根据智能耳机上的图像采集装置采集的环境图像信息判断当前场景存在视觉影像内容时，识别智能耳机当前所处的场景类型为第二类场景。

[0095] 在一种可选实施方式中，上述步骤102可以通过如下方式实现：

[0096] 所述在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理，具体包括：

[0097] 在识别出来的场景为第一类场景时，对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0098] 在识别出来的场景为第二类场景时，对当前场景中的视觉影像内容进行自动录像处理或进行自动单张影像连续采集处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储。

[0099] 在一种可选实施方式中，本实施例提供的智能耳机处理方法，还包括：

[0100] 在接收到用户的第一触发信号后，自动对当前场景的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0101] 在接收到用户的第二触发信号后，自动对当前场景中的视觉影像内容进行自动录像处理，且若判断当前场景中同时存在声音内容，则同时对当前场景中的声音进行自动录音处理，且在录音的同时根据发言者的音频特征标记对应声音所属的发言者ID，并在录音的同时将录音文件同步转换成文字文件，所述文字文件中将发言者ID以及对应的发言内容按照实际发生的时间顺序进行顺序对应存储；

[0102] 在每接收到用户的一次第三触发信号后，自动对当前场景中的视觉影像进行单张图像采集。

[0103] 在一种可选实施方式中，本实施例提供的智能耳机处理方法，还包括：

[0104] 识别智能耳机当前所处的场景类型是否为第三类场景；所述第三类场景为睡眠休息场景，并在识别出来的场景为第三类场景时，检测用户是否发出鼾声，若是，则通过安装在智能耳机上的振动模块或音乐提醒模块进行打鼾提醒，以使用户调整睡姿。

[0105] 在一种可选实施方式中，本实施例提供的智能耳机处理方法，还包括：

[0106] 在识别出来的场景为第三类场景时，检测当前场景是否存在地震或火灾危险，若是，则通过安装在智能耳机上的振动模块或报警提醒模块进行危险提醒，以使用户尽快逃离现场。

[0107] 本实施例提供的智能耳机处理方法，可以采用上述实施例提供的智能耳机实现，其具体工作原理和有益效果类似，具体内容可参见上述实施例的介绍，此处不再详述。

[0108] 需要说明的是，本实施例所给出的多个可选实施方式，在逻辑或结构相互不冲突的前提下，可以自由组合，本发明对此不做限定。

[0109] 基于相同的发明构思，本发明又一实施例提供了一种电子设备，参见图4，所述电子设备具体包括如下内容：处理器301、存储器302、通信接口303和总线304；

[0110] 其中，所述处理器301、存储器302、通信接口303通过所述总线304完成相互间的通信；所述通信接口303用于实现各建模软件及智能制造装备模块库等相关设备之间的信息传输；

[0111] 所述处理器301用于调用所述存储器302中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例一中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

[0112] 步骤101：识别智能耳机当前所处的场景类型。

[0113] 步骤102：在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0114] 基于相同的发明构思，本发明又一实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例一的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

[0115] 步骤101：识别智能耳机当前所处的场景类型。

[0116] 步骤102：在识别出来的场景为第一类场景时，进行与第一类场景相适应的处理；以及在识别出来的场景为第二类场景时，进行与第二类场景相适应的处理；其中，第一类场景为不带有视觉影像内容的会话场景；所述第二类场景为带有视觉影像内容的场景。

[0117] 需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

[0118] 以上实施例仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

标题	发布/更新时间	阅读量
一种艺术课程推广管理系统	2020-05-19	503
一种互动数字音乐教学系统	2020-05-21	289
心理健康行业闭环生态链平台及商业运营模式	2020-05-23	982
智能匹配素材并进行AI编辑的自动化广告生成系统	2020-05-24	17
一种带有仿真机械臂的哄睡机器人	2020-05-11	179
基于TonaLighting调节技术的智能音乐和弦-氛围灯系统	2020-05-12	157
录音装置	2020-05-13	405
运动步频智能音乐播放联动系统	2020-05-18	146
一种数字音乐教学系统的乐谱播放模块组件	2020-05-21	91
一种智能耳机、智能耳机处理方法、电子设备及存储介质	2020-05-22	334

一种智能耳机、智能耳机处理方法、电子设备及存储介质

一种智能耳机、智能耳机处理方法、电子设备及存储介质

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：