浏览器语音发送和接收方法、装置及语音对讲系统专利检索-插件软件组件软件包软件专利检索查询-专利查询网

浏览器语音发送和接收方法、装置及语音对讲系统

阅读：983发布：2024-01-04

专利汇可以提供浏览器语音发送和接收方法、装置及语音对讲系统专利检索，专利查询，专利分析的服务。并且本发明实施例提供了一种浏览器语音发送和接收方法、装置及语音对讲系统，其中，浏览器语音发送方法包括：通过浏览器自带的音频采集接口采集第一语音数据；获得目标设备可处理语音数据对应的第一语音采样参数；基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据；将所述目标语音数据发送至所述目标设备。应用本发明实施例，使得浏览器在不使用插件的情况下能够实现语音对讲功能。，下面是浏览器语音发送和接收方法、装置及语音对讲系统专利的具体信息内容。

权利要求

1.一种浏览器语音发送方法，其特征在于，包括：
通过浏览器自带的音频采集接口采集第一语音数据；
获得目标设备可处理语音数据对应的第一语音采样参数；
基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据；
将所述目标语音数据发送至所述目标设备。
2.根据权利要求1所述的方法，其特征在于，所述第一语音采样参数包括第一语音采样精度和第一语音采样频率。
3.根据权利要求2所述的方法，其特征在于，所述基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据，包括：
计算所述第一语音采样频率和第二语音采样频率的比值，其中，所述第二语音采样频率为所述浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；
基于所述比值和第一语音采样精度，对所述第一语音数据进行采样，得到目标语音数据。
4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
与目标设备通过websocket建立通信通道；
所述将所述目标语音数据发送至所述目标设备为：通过所述通信通道将所述目标语音数据发送至所述目标设备。
5.根据权利要求4所述的方法，其特征在于，所述获得目标设备可处理语音数据对应的第一语音采样参数为：通过所述通信通道接收目标设备发送的所述第一语音采样参数。
6.一种浏览器语音接收方法，其特征在于，包括：
接收目标设备发送的第二语音数据；
获得目标设备可处理语音数据对应的第一语音采样参数；
根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据；
利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；
播放解码后的第二语音数据。
7.根据权利要求6所述的方法，其特征在于，所述第一语音采样参数包括第一语音采样精度和第一语音采样频率。
8.根据权利要求6所述的方法，其特征在于，所述方法还包括：
与目标设备通过websocket建立通信通道；
所述接收目标设备发送的第二语音数据为：通过所述通信通道接收目标设备发送的第二语音数据。
9.根据权利要求8所述的方法，其特征在于，所述获得目标设备可处理语音数据对应的第一语音采样参数为：通过所述通信通道接收目标设备发送的所述第一语音采样参数。
10.一种浏览器语音发送装置，其特征在于，包括：
采集单元，用于通过浏览器自带的音频采集接口采集第一语音数据；
第一获取单元，用于获得目标设备可处理语音数据对应的第一语音采样参数；
采样单元，用于基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据；
发送单元，用于将所述目标语音数据发送至所述目标设备。
11.根据权利要求10所述的装置，其特征在于，所述第一获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。
12.根据权利要求11所述的装置，其特征在于，所述采样单元，包括：
计算子单元，用于计算所述第一语音采样频率和第二语音采样频率的比值，其中，所述第二语音采样频率为所述浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；
采样子单元，用于基于所述比值和第一语音采样精度，对所述第一语音数据进行采样，得到目标语音数据。
13.根据权利要求10所述的装置，其特征在于，所述装置还包括：
第一通信连接单元，用于与目标设备通过websocket建立通信通道；
所述发送单元，用于通过所述第一通信连接单元所建立的通信通道将所述目标语音数据发送至所述目标设备。
14.根据权利要求13所述的装置，其特征在于，所述第一获取单元，用于通过所述第一通信连接单元所建立的通信通道接收目标设备发送的所述第一语音采样参数。
15.一种浏览器语音接收装置，其特征在于，包括：
接收单元，用于接收目标设备发送的第二语音数据；
第二获取单元，用于获得目标设备可处理语音数据对应的第一语音采样参数；
封装单元，用于根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据；
解码单元，用于利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；
播放单元，用于播放解码后的第二语音数据。
16.根据权利要求15所述的装置，其特征在于，所述第二获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。
17.根据权利要求15所述的装置，其特征在于，所述装置还包括：
第二通信连接单元，用于与目标设备通过websocket建立通信通道；
所述接收单元，用于通过所述第二通信连接单元所建立的通信通道接收目标设备发送的第二语音数据。
18.根据权利要求17所述的装置，其特征在于，所述第二获取单元，用于通过所述第二通信连接单元所建立的通信通道接收目标设备发送的所述第一语音采样参数。
19.一种语音对讲系统，其特征在于，包括：浏览器语音发送装置和目标设备；其中，所述浏览器语音发送装置，用于通过浏览器自带的音频采集接口采集第一语音数据，获得目标设备可处理语音数据对应的第一语音采样参数，基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据，将所述目标语音数据发送至所述目标设备；
所述目标设备，用于接收所述浏览器语音发送装置发送的所述目标语音数据。
20.一种语音对讲系统，其特征在于，包括：浏览器语音接收装置和目标设备；其中，所述目标设备，用于向所述浏览器语音接收装置发送第二语音数据；
所述浏览器语音接收装置，用于接收目标设备发送的第二语音数据，获得目标设备可处理语音数据对应的第一语音采样参数，根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据，利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码，播放解码后的第二语音数据。

说明书全文

浏览器语音发送和接收方法、装置及语音对讲系统

技术领域

[0001] 本发明涉及网页web前端技术领域，特别是涉及一种浏览器语音发送和接收方法、装置及语音对讲系统。

背景技术

[0002] 目前，在安防系统中，常通过浏览器插件来实现浏览器和安防系统的服务器之间的语音对讲。当用户有语音对讲需求时，需要向终端中的浏览器输入所要对讲的语音，浏览器采集该所要对讲的语音数据。而在现有的对讲方案中，浏览器需要通过插件采集语音信号，并且通过插件实现浏览器与安防系统的服务器之间的长连接，以保证语音对讲的实时性并将所采集到的语音信号发送到安防系统的服务器。另外，浏览器接收安防系统的服务器发送的语音数据也需要通过插件来实现，也就是说，浏览器插件对语音对讲的实现起着举足轻重的作用。其中，该服务器与浏览器均作为对讲设备。

[0003] 但是，在浏览器中安装插件，会使用户权限变大，例如：用户可以对插件进行修改，并利用该修改后的插件下载其他用户的信息而不被发现，对用户信息安全造成了隐患。因此，随着浏览器的发展，浏览器很可能禁用插件，此时的浏览器与安防服务器的语音对讲功能则无法实现。

[0004] 因此，亟需提供一种新的语音对讲方案，使得浏览器在不使用插件的情况下能够实现语音传输。

发明内容

[0005] 本发明实施例的目的在于提供一种浏览器语音发送和接收方法、装置及语音对讲系统，使得浏览器在不使用插件的情况下能够实现语音传输。具体技术方案如下：

[0006] 第一方面，本发明实施例提供了一种浏览器语音发送方法，所述方法可以包括：

[0007] 通过浏览器自带的音频采集接口采集第一语音数据；

[0008] 获得目标设备可处理语音数据对应的第一语音采样参数；

[0009] 基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据；

[0010] 将所述目标语音数据发送至所述目标设备。

[0011] 可选地，所述第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0012] 可选地，所述基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据，可以包括：

[0013] 计算所述第一语音采样频率和第二语音采样频率的比值，其中，所述第二语音采样频率为所述浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；

[0014] 基于所述比值和第一语音采样精度，对所述第一语音数据进行采样，得到目标语音数据。

[0015] 可选地，所述方法还可以包括：

[0016] 与目标设备通过websocket建立通信通道；

[0017] 所述将所述目标语音数据发送至所述目标设备为：通过所述通信通道将所述目标语音数据发送至所述目标设备。

[0018] 可选地，所述获得目标设备可处理语音数据对应的第一语音采样参数为：通过所述通信通道接收目标设备发送的所述第一语音采样参数。

[0019] 第二方面，本发明实施例提供了一种浏览器语音接收方法，所述方法可以包括：

[0020] 接收目标设备发送的第二语音数据；

[0021] 获得目标设备可处理语音数据对应的第一语音采样参数；

[0022] 根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据；

[0023] 利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；

[0024] 播放解码后的第二语音数据。

[0025] 可选地，所述第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0026] 可选地，所述方法还可以包括：

[0027] 与目标设备通过websocket建立通信通道；

[0028] 所述接收目标设备发送的第二语音数据为：通过所述通信通道接收目标设备发送的第二语音数据。

[0029] 可选地，所述获得目标设备可处理语音数据对应的第一语音采样参数为：通过所述通信通道接收目标设备发送的所述第一语音采样参数。

[0030] 第三方面，本发明实施例提供了一种浏览器语音发送装置，所述装置可以包括：采集单元、第一获取单元、采样单元和发送单元；

[0031] 所述采集单元，用于通过浏览器自带的音频采集接口采集第一语音数据；

[0032] 所述第一获取单元，用于获得目标设备可处理语音数据对应的第一语音采样参数；

[0033] 所述采样单元，用于基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据；

[0034] 所述发送单元，用于将所述目标语音数据发送至所述目标设备。

[0035] 可选地，所述第一获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0036] 可选地，所述采样单元，可以包括：计算子单元和采样子单元；

[0037] 所述计算子单元，用于计算所述第一语音采样频率和第二语音采样频率的比值，其中，所述第二语音采样频率为所述浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；

[0038] 所述采样子单元，用于基于所述比值和第一语音采样精度，对所述第一语音数据进行采样，得到目标语音数据。

[0039] 可选地，所述装置还可以包括：第一通信连接单元；

[0040] 所述第一通信连接单元，用于与目标设备通过websocket建立通信通道；

[0041] 所述发送单元，用于通过所述第一通信连接单元所建立的通信通道将所述目标语音数据发送至所述目标设备。

[0042] 可选地，所述第一获取单元，用于通过所述第一通信连接单元所建立的通信通道接收目标设备发送的所述第一语音采样参数。

[0043] 第四方面，本发明实施例提供了一种浏览器语音接收装置，所述装置可以包括：接收单元、第二获取单元、封装单元、解码单元和播放单元；

[0044] 所述接收单元，用于接收目标设备发送的第二语音数据；

[0045] 所述第二获取单元，用于获得目标设备可处理语音数据对应的第一语音采样参数；

[0046] 所述封装单元，用于根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据；

[0047] 所述解码单元，用于利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；

[0048] 所述播放单元，用于播放解码后的第二语音数据。

[0049] 可选地，所述第二获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0050] 可选地，所述装置还可以包括：第二通信连接单元；

[0051] 所述第二通信连接单元，用于与目标设备通过websocket建立通信通道；

[0052] 所述接收单元，用于通过所述第二通信连接单元所建立的通信通道接收目标设备发送的第二语音数据。

[0053] 可选地，所述第二获取单元，用于通过所述第二通信连接单元所建立的通信通道接收目标设备发送的所述第一语音采样参数。

[0054] 第五方面，本发明实施例提供了一种语音对讲系统，所述系统可以包括：浏览器语音发送装置和目标设备；其中，

[0055] 所述浏览器语音发送装置，用于通过浏览器自带的音频采集接口采集第一语音数据，获得目标设备可处理语音数据对应的第一语音采样参数，基于所述第一语音采样参数对所述第一语音数据进行采样，得到目标语音数据，将所述目标语音数据发送至所述目标设备；

[0056] 所述目标设备，用于接收所述浏览器语音发送装置发送的所述目标语音数据。

[0057] 第六方面，本发明实施例提供了另一种语音对讲系统，所述系统可以包括：浏览器语音接收装置和目标设备；其中，

[0058] 所述目标设备，用于向所述浏览器语音接收装置发送第二语音数据；

[0059] 所述浏览器语音接收装置，用于接收目标设备发送的第二语音数据，获得目标设备可处理语音数据对应的第一语音采样参数，根据第一语音采样参数对所述第二语音数据进行封装，以获得封装语音数据，利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码，播放解码后的第二语音数据。

[0060] 在本发明实施例中，通过浏览器自带的音频采集接口来采集第一语音数据，避免使用浏览器插件采集第一语音数据；在向所连接的目标设备发送语音数据之前，利用从目标设备获取得到的第一语音数据采样参数对该第一语音数据进行采样，从而得到目标语音数据；在将该目标语音数据发送至目标设备后，目标设备能对该目标语音数据进行播放，使得浏览器在不使用插件的情况下，仍然能够实现对语音数据的采集和传输。当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明

[0061] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0062] 图1为本发明实施例提供的一种浏览器语音发送方法的流程图；

[0063] 图2为本发明实施例提供的一种浏览器语音接收方法的流程图；

[0064] 图3为本发明实施例提供的一种浏览器语音发送装置的结构框图；

[0065] 图4为本发明实施例提供的一种浏览器语音接收装置的结构框图；

[0066] 图5为本发明实施例提供的一种语音对讲系统的结构框图；

[0067] 图6为本发明实施例提供的另一种语音对讲系统的结构框图。

具体实施方式

[0068] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

[0069] 为了解决现有技术问题，本发明实施例分别从浏览器发送语音数据和接收语音数据的角度提供了一种浏览器语音发送方法及装置、一种浏览器语音接收方法及装置，以及语音对讲系统。

[0070] 下面首先从浏览器发送语音数据(即目标设备被动接收语音数据)角度，对本发明实施例提供的浏览器语音发送进行介绍。

[0071] 需要说明的是，该浏览器语音发送方法应用于浏览器，该浏览器与目标设备互为对讲设备，且该浏览器与该目标设备建立通信连接。其中，可由浏览器向目标设备发送通信请求，也可以由目标设备向浏览器发送通信请求；在建立通信连接后，即可实现该浏览器与该目标设备之间通信，保证浏览器语音发送的实时性。

[0072] 可以理解的是，该浏览器能够设置在任意终端上，该终端可以为：智能电视、笔记本电脑、平板电脑以及智能手机等设备。其中，该浏览器可为网页浏览器，也可为设置于终端中的浏览器客户端软件，这都是合理的。其中，目标设备可以为服务器，这也是合理的。

[0073] 如图1所示，本发明实施例从浏览器发送语音数据的角度提供了一种浏览器语音发送方法，该方法可以包括如下步骤：

[0074] S101：通过该浏览器自带的音频采集接口采集第一语音数据；

[0075] 其中，在浏览器接收到语音发送指令时，利用浏览器自身携带的音频采集接口(例如getUserMedia接口)采集第一语音数据，避免了采用插件采集语音数据所带来的安全隐患，提高了用户信息的安全性。

[0076] 其中，音频采集接口getUserMedia为浏览器自带的接口，浏览器通过该接口可以采集用户输入的语音数据，并且，在采集时，按照该接口自身的采样精度和采样频率来采集语音数据。

[0077] S102：获得目标设备可处理语音数据对应的第一语音采样参数；

[0078] 其中，在浏览器采集到第一语音数据后，该第一语音数据想要能够被目标设备识别并且播放，需要对该第一语音数据进一步采样；在采样之前，需要从目标设备中获得目标设备自身配置的能够处理语音数据的语音采样参数。其中，该第一语音采样参数为该目标设备自身配置的能够处理语音数据的语音采样参数。

[0079] 需要强调的是，可以在每次执行该浏览器语音发送方法时，从目标设备中获得该第一语音采样参数。也可以在第一次执行该浏览器语音发送方法时，从目标设备获得该第一语音采样参数，并将该第一语音采样参数保存到本地，以使得后续执行该语音对讲方法时，直接从本地获得该第一语音采样参数。

[0080] 其中，在每次或者第一次执行浏览器语音发送方法时，从目标设备获得该第一语音采样参数的具体实现方式可以为：在浏览器与目标设备在建立连接的三次握手过程中传送该第一语音采样参数；或，在浏览器与目标设备建立通信通道的同时，浏览器主动或者被动的从目标设备获取第一语音采样参数；或，在执行步骤S101之前，浏览器主动或者被动的从目标设备获取该第一语音采样参数。也就是说，步骤S101和步骤S102并不构成对第一语音采样参数的获取顺序的限定。

[0081] 可以理解的是，当目标设备自身的第一语音采样参数固定不变时，可以将从目标设备请求到的第一语音采样参数保存到本地以便后续使用；而当目标设备自身的第一语音采样参数经常发生变化时，可以在每次执行该浏览器语音发送方法时从目标设备请求获得该第一语音采样参数。

[0082] S103：基于该第一语音采样参数对该第一语音数据进行采样，得到目标语音数据；

[0083] 其中，在从目标设备获得的第一语音采样参数，或者从本地获得预先存储的该目标设备的第一语音采样参数后，利用获取得到的第一语音采样参数，对该第一语音数据进行采样，采样后得到目标语音数据。其中，该目标语音数据能够被目标设备识别并播放。

[0084] S104：将该目标语音数据发送至该目标设备。

[0085] 其中，在采样得到目标语音数据后，浏览器将目标语音数据发送至目标设备，实现了浏览器无插件化的语音发送。

[0086] 需要强调的是，可以在两个方向同时发送语音数据，并不局限于浏览器向目标设备发送语音数据。

[0087] 在本发明实施例中，通过浏览器自带的音频采集接口来采集第一语音数据，避免使用浏览器插件采集第一语音数据；在向所连接的目标设备发送语音数据之前，利用从目标设备获取得到的第一语音数据采样参数对该第一语音数据进行采样，从而得到目标语音数据；在将该目标语音数据发送至目标设备后，目标设备能对该目标语音数据进行播放，使得浏览器在不使用插件的情况下，仍然能够实现对语音数据的采集和传输。

[0088] 作为本发明的一种实施方式，该第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0089] 可以理解的是，第一语音采样参数包括但并不局限于第一语音采样精度和第一语音采样频率，其中，第一语音采样精度用于对语音数据的频率进行采样，第一语音采样精度用于对语音数据的幅度进行采样。

[0090] 作为本发明的一种实施方式，该基于该第一语音采样参数对该第一语音数据进行采样，得到目标语音数据，包括：

[0091] 计算该第一语音采样频率和第二语音采样频率的比值，其中，该第二语音采样频率为该浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；基于该比值和第一语音采样精度，对该第一语音数据进行采样，得到目标语音数据。

[0092] 可以理解的是，由于第一语音采样频率为目标设备自身配置的能够处理语音数据的一种语音采样参数；第二语音采样频率为该浏览器自带的音频采集接口所配置的能够处理语音数据的一种语音采样参数。例如：浏览器自带的音频采集接口getUserMedia采样频率是48kHz，采样精度是32位；但是目标设备的采样频率不为48k，采样精度不为32位时，需要对浏览器自带的音频采集接口getUserMedia所采集到语音进行采样，以使采样的语音数据符合目标设备的采样频率和采样精度。

[0093] 其中，浏览器所采集到的第一语音数据想要能够被目标设备识别并播放，可以通过计算该第一语音采样频率和第二语音采样频率的比值，以根据该比值对第一语音数据进行重采样。例如：当第一语音采样频率为24kHz，第二语音采样频率为48kHz，即第一语音采样频率和第二语音采样频率的比值为1/2时，可以根据该比值对第一语音数据进行重采样，即将第一语音数据的采样频率进行1倍压缩。另外，按照第一语音采样精度对经过频率采样后的第一语音数据精确地进行精度采样，以得到目标语音数据，得到的目标语音数据能够被目标设备识别并播放。

[0094] 作为本发明的一种实施方式，该目标语音数据和该第一语音数据为脉冲编码调制PCM格式。

[0095] 可以理解的是，浏览器自带的音频采集接口按照PCM格式采集话音信号，并得到第一语音数据。即浏览器自带的音频采集接口对话音信号每隔一定时间进行取样，使其离散化，并将抽样值按分层单位四舍五入取整量化，同时将抽样值按一组二进制码来表示抽样脉冲的幅值，得到基于二进制编码的第一语音数据；同时，浏览器给目标设备发送的目标语音信号也是最底层的基于二进制编码的语音数据，并不需要使用插件辅助该目标语音信号的传输。

[0096] 作为本发明的一种实施方式，该方法还可以包括：

[0097] 与目标设备通过websocket建立通信通道；

[0098] 该将该目标语音数据发送至该目标设备为：通过该通信通道将该目标语音数据发送至该目标设备。

[0099] 可以理解的是，在该种实现方式中，该浏览器与该目标设备通过websocket建立通信连接，实现浏览器和目标设备的长连接，保证浏览器与目标设备能够进行正常通信，即浏览器可以通过该通信通道将目标语音数据发送至目标设备，实现语音的传输。

[0100] 其中，可由浏览器向目标设备发送websocket通信请求，也可以由目标设备向浏览器发送websocket通信请求；在建立websocket通信连接后，即可实现该浏览器与该目标设备之间的长连接，且所发送的websocket通信请求的header很小，能够有效的减少带宽资源的占用。其中，websocket所对应的Websocket Protocol是HTML5的一种新的协议，它能够实现浏览器与目标设备的全双工通信，使得能够保证浏览器语音发送的实时性。

[0101] 作为本发明的一种实施方式，该获得目标设备可处理语音数据对应的第一语音采样参数为：通过该通信通道接收目标设备发送的该第一语音采样参数。

[0102] 可以理解的是，在该种实现方式中，浏览器与目标设备通过websocket建立通信通道后，浏览器可以通过通信通道接收目标设备发送的第一语音采样参数，实现对第一语音采样参数的获取。

[0103] 作为本发明的一种实施方式，在该将该目标语音数据发送至该目标设备后，还可以包括：

[0104] 基于通过websocket所建立的通信通道，接收该目标设备发送的应答该目标语音数据的应答语音数据；

[0105] 获得目标设备可处理语音数据对应的第一语音采样参数；

[0106] 根据第一语音采样参数，对该应答语音数据进行封装，以获得封装后的应答语音数据；

[0107] 利用浏览器自带的音频解码接口对所获得的该封装后的应答语音数据进行解码；

[0108] 播放解码后的应答语音数据。

[0109] 可以理解的是，通过websocket所建立的通信通道，将目标语音数据发送至目标设备后，目标设备接收该目标语音数据，并针对所接收到目标语音数据给浏览器回复应答语音数据；浏览器在接收到目标设备发送的应答语音数据后，根据所获得的目标设备可处理语音数据对应的第一语音采样参数，对该应答语音数据进行封装，得到封装后的应答语音数据；并利用浏览器自带的音频解码接口(例如：decodeAudioData)解码该封装后的语音数据，并可利用浏览器自带的音频播放接口(例如：AudioContext)播放解码后的应答语音数据。

[0110] 需要强调的是，对该应答语音数据进行封装的格式包括但是并不局限于wav格式。

[0111] 作为本发明的一种实施方式，该应答语音数据为脉冲编码调制PCM格式。

[0112] 可以理解的是，当应答的语音数据为PCM格式时，则目标设备给浏览器发送的应答语音数据是最底层的基于二进制编码的语音数据，浏览器或者浏览器所在终端并不需要通过插件实现该应答语音数据的接收。

[0113] 其次，从浏览器接收语音数据(即目标设备主动发送语音数据)的角度，对本发明实施例提供的浏览器语音接收方法进行介绍。

[0114] 需要说明的是，该浏览器语音接收方法应用于浏览器，该浏览器与目标设备互为对讲设备，且该浏览器与该目标设备建立通信连接。其中，可由浏览器向目标设备发送通信请求，也可以由目标设备向浏览器发送通信请求；在建立通信连接后，即可实现该浏览器与该目标设备之间的通信，保证浏览器语音接收的实时性。

[0115] 可以理解的是，该浏览器能够设置在任意终端上，该终端可以为：智能电视、笔记本电脑、平板电脑以及智能手机等设备。其中，该浏览器可为网页浏览器，也可为设置与终端中的浏览器客户端软件，这都是合理的。其中，目标设备可以为服务器，这也是合理的。

[0116] 如图2所示，本发明实施例从浏览器接收语音数据的角度提供了一种浏览器语音接收方法，该方法可以包括如下步骤：

[0117] S201：接收该目标设备发送的第二语音数据；

[0118] 其中，在浏览器接收到语音接收指令时，可利用浏览器自身携带的音频采集接口(例如getUserMedia接口)接收目标设备发送的第二语音数据，避免了采用插件接收语音数据所带来的安全隐患，提高了用户信息的安全性。

[0119] 另外，浏览器在没给目标设备发送语音数据的情况下，目标设备也可以主动给浏览器发送第二语音数据，浏览器接收该目标设备发送的第二语音数据。

[0120] S202：获得目标设备可处理语音数据对应的第一语音采样参数；

[0121] 其中，在浏览器接收到第二语音数据后，为了减少播放该第二语音数据的播放噪声，需要对该第二语音数据进行封装；在封装之前，需要获得目标设备自身配置的能够处理语音数据的语音采样参数。其中，该第一语音采样参数为该目标设备自身配置的能够处理语音数据的语音采样参数。

[0122] 需要强调的是，可以在每次执行该浏览器语音接收方法时，从目标设备中获得该第一语音采样参数；也可以在第一次执行该浏览器语音接收方法时，从目标设备获得该第一语音采样参数，并将该第一语音采样参数保存到本地，以使得后续执行该浏览器语音接收方法时，直接从本地获得该第一语音采样参数。

[0123] 其中，在每次或者第一次执行浏览器语音接收方法方法时，从目标设备获得该第一语音采样参数的具体实现方式可以为：在浏览器与目标设备在建立连接的三次握手过程中传送该第一语音采样参数；或，在浏览器与目标设备建立通信通道的同时，浏览器主动或者被动的从目标设备获取第一语音采样参数；或，在执行步骤S201之前，浏览器主动或者被动的从目标设备获取该第一语音采样参数。也就是说，步骤S201和步骤S202并不构成对第一语音采样参数的获取顺序的限定。

[0124] 可以理解的是，当目标设备自身的第一语音采样参数固定不变时，可以将从目标设备请求到的第一语音采样参数保存到本地以便后续使用；而当目标设备自身的第一语音采样参数经常发生变化时，可以在每次执行该浏览器语音接收方法时从目标设备请求获得该第一语音采样参数

[0125] S203：根据第一语音采样参数对该第二语音数据进行封装，以获得封装语音数据；

[0126] 其中，浏览器根据第一语音采样参数，对该接收到的第二语音数据进行封装，得到第二封装语音数据。需要强调的是，对该第二语音数据进行封装的格式包括但是并不局限于wav格式。

[0127] S204：利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；

[0128] 其中，浏览器利用自带的音频解码接口(例如：decodeAudioData)和封装中所包含的第一语音采样参数，对该封装语音数据进行解码，得到解码后的第二语音数据。

[0129] S205：播放解码后的第二语音数据。

[0130] 其中，通过浏览器自带的音频播放接口播放解码后的第二语音数据，使得浏览器在不使用插件的情况下，仍然能够接收目标设备所发送的第二语音数据，进而实现浏览器与目标设备的对讲功能中的接收和播放功能。

[0131] 在本发明实施例中，浏览器在没给目标设备发送语音数据的情况下，目标设备主动给浏览器发送第二语音数据，浏览器根据第一语音采样参数，对该接收到的第二语音数据进行封装，得到封装语音数据；浏览器利用自带的音频解码接口对该封装语音数据进行解码，并通过浏览器自带的音频播放接口播放解码后的第二语音数据，使得浏览器在不使用插件的情况下，仍然能够接收目标设备所发送的第二语音数据，进而实现与目标设备的对讲功能。

[0132] 可选地，该第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0133] 可以理解的是，第一语音采样参数包括但并不局限于第一语音采样精度和第一语音采样频率，其中，第一语音采样精度用于对语音数据的频率进行采样，第一语音采样精度用于对语音数据的幅度进行采样。

[0134] 作为本发明的一种实施方式，该第二语音数据为脉冲编码调制PCM格式。

[0135] 可以理解的是，当第二语音数据为PCM格式时，则目标设备给浏览器发送的第二语音信号是最底层的基于二进制编码的语音的数据，浏览器或者浏览器所在终端并不需要通过插件实现该第二语音信号的接收。

[0136] 作为本发明的一种实施方式，该方法还可以包括：

[0137] 与目标设备通过websocket建立通信通道；

[0138] 该接收目标设备发送的第二语音数据为：通过该通信通道接收目标设备发送的第二语音数据。

[0139] 可以理解的是，在该种实现方式中，该浏览器与该目标设备通过websocket建立通信连接，实现浏览器和目标设备的长连接，保证浏览器与目标设备能够进行正常通信，即浏览器可以通过该通信通道接收目标设备所发送的第二语音数据，实现语音的接收。

[0140] 其中，可由浏览器向目标设备发送websocket通信请求，也可以由目标设备向浏览器发送websocket通信请求；在建立websocket通信连接后，即可实现该浏览器与该目标设备之间的长连接，且所发送的websocket通信请求的header很小，能够有效的减少带宽资源的占用。其中，websocket所对应的Websocket Protocol是HTML5的一种新的协议，它能够实现浏览器与目标设备的全双工通信，使得能够保证浏览器语音接收的实时性。

[0141] 可选地，该获得目标设备可处理语音数据对应的第一语音采样参数为：通过该通信通道接收目标设备发送的该第一语音采样参数。

[0142] 可以理解的是，在该种实现方式中，浏览器与目标设备通过websocket建立通信通道后，浏览器可以通过通信通道接收目标设备发送的第一语音采样参数，实现对第一语音采样参数的获取。

[0143] 相应于上述浏览器语音发送方法实施例，如图3所示，本发明实施例还提供了一种浏览器语音发送装置，该装置可以包括：采集单元301、第一获取单元302、采样单元303和发送单元304；

[0144] 该采集单元301，用于通过该浏览器自带的音频采集接口采集第一语音数据；

[0145] 该第一获取单元302，用于获得目标设备可处理语音数据对应的第一语音采样参数；

[0146] 该采样单元303，用于基于该第一语音采样参数对该第一语音数据进行采样，得到目标语音数据；

[0147] 该发送单元304，用于将该目标语音数据发送至该目标设备。

[0148] 在本发明实施例中，通过浏览器自带的音频采集接口来采集第一语音数据，避免使用浏览器插件采集第一语音数据；在向所连接的目标设备发送语音数据之前，利用从目标设备获取得到的第一语音数据采样参数对该第一语音数据进行采样，从而得到目标语音数据；在将该目标语音数据发送至目标设备后，目标设备能对该目标语音数据进行播放，使得浏览器在不使用插件的情况下，仍然能够实现对语音数据的采集和传输。

[0149] 作为本发明的一种实施方式，该第一获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0150] 作为本发明的一种实施方式，该采样单元，可以包括：计算子单元和采样子单元；

[0151] 该计算子单元，用于计算该第一语音采样频率和第二语音采样频率的比值，其中，该第二语音采样频率为该浏览器自带的音频采集接口所配置的能够处理语音数据的语音采样参数；

[0152] 该采样子单元，用于基于该比值和第一语音采样精度，对该第一语音数据进行采样，得到目标语音数据。

[0153] 作为本发明的一种实施方式，该目标语音数据和该第一语音数据为脉冲编码调制PCM格式。

[0154] 作为本发明的一种实施方式，该装置还可以包括：第一通信连接单元；

[0155] 该第一通信连接单元，用于与目标设备通过websocket建立通信通道；

[0156] 该发送单元，用于通过该第一通信连接单元所建立的通信通道将该目标语音数据发送至该目标设备。

[0157] 可选地，该第一获取单元，用于通过该第一通信连接单元所建立的通信通道接收目标设备发送的该第一语音采样参数。

[0158] 相应于上述浏览器语音接收方法实施例，如图4所示，本发明实施例还提供了一种浏览器语音接收装置，应用于浏览器，该装置可以包括：接收单元401、第二获取单元402、封装单元403、解码单元404和播放单元405；

[0159] 该接收单元401，用于接收目标设备发送的第二语音数据；

[0160] 该第二获取单元402，用于获得目标设备可处理语音数据对应的第一语音采样参数；

[0161] 该封装单元403，用于根据第一语音采样参数对该第二语音数据进行封装，以获得封装语音数据；

[0162] 该解码单元404，用于利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码；

[0163] 该播放单元405，用于播放解码后的第二语音数据。

[0164] 在本发明实施例中，浏览器在没给目标设备发送语音数据的情况下，目标设备主动给浏览器发送第二语音数据，浏览器根据所获取的第一语音采样参数，对该接收到的第二语音数据进行封装，得到封装语音数据；浏览器利用自带的音频解码接口对该封装语音数据进行解码，并通过浏览器自带的音频播放接口播放解码后的第二语音数据，使得浏览器在不使用插件的情况下，仍然能够接收目标设备所发送的第二语音数据，进而实现与目标设备的对讲功能。

[0165] 可选地，该第二获取单元获得的第一语音采样参数包括第一语音采样精度和第一语音采样频率。

[0166] 作为本发明的一种实施方式，该第二语音数据为脉冲编码调制PCM格式。

[0167] 可选地，该装置还可以包括：第二通信连接单元；

[0168] 该第二通信连接单元，用于与目标设备通过websocket建立通信通道；

[0169] 该接收单元，用于通过该第二通信连接单元所建立的通信通道接收目标设备发送的第二语音数据。

[0170] 可选地，该第二获取单元，用于通过该第二通信连接单元所建立的通信通道接收目标设备发送的该第一语音采样参数。

[0171] 相应于上述浏览器语音发送装置和浏览器语音接收装置实施例，本发明实施例还提供了一种语音对讲系统，如图5所示，该系统可以包括：浏览器语音发送装置510和目标设备520；其中，

[0172] 该浏览器语音发送装置510，用于通过浏览器自带的音频采集接口采集第一语音数据，获得目标设备520可处理语音数据对应的第一语音采样参数，基于该第一语音采样参数对该第一语音数据进行采样，得到目标语音数据，将该目标语音数据发送至该目标设备；

[0173] 该目标设备520，用于接收该浏览器语音发送装置510发送的该目标语音数据。

[0174] 相应于上述浏览器语音发送装置和浏览器语音接收装置实施例，本发明实施例还提供了另一种语音对讲系统，如图6所示，该系统可以包括：浏览器语音接收装置610和目标设备620；其中，

[0175] 该目标设备620，用于向该浏览器语音接收装置610发送第二语音数据；

[0176] 该浏览器语音接收装置610，用于接收目标设备发送的第二语音数据，获得目标设备可处理语音数据对应的第一语音采样参数，根据第一语音采样参数对该第二语音数据进行封装，以获得封装语音数据，利用浏览器自带的音频解码接口，对所获得的封装语音数据进行解码，播放解码后的第二语音数据。

[0177] 需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

[0178] 本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

[0179] 以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

标题	发布/更新时间	阅读量
一种在高温条件下工作的电离室	2020-05-08	90
一种实现容器存储扩容的方法及系统	2020-05-08	657
一种提高扫描系统插件运行效率的方法、设备及介质	2020-05-08	543
一种液冷电池包	2020-05-08	87
基于NB-IoT的油气生产智能监控系统	2020-05-08	2
便携式多接口通信电缆测试工具	2020-05-08	996
一种用于装配式房屋的铝合金连接构件	2020-05-11	67
一种接插件的插接结构	2020-05-08	186
一种锁紧释放机构及电接线端子	2020-05-08	447
一种便于安装的电动车雨棚	2020-05-11	831

浏览器语音发送和接收方法、装置及语音对讲系统

浏览器语音发送和接收方法、装置及语音对讲系统

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：