一种购物方法、装置及系统专利检索-倒谱数学与统计专利检索查询-专利查询网

一种购物方法、装置及系统

阅读：463发布：2020-05-12

专利汇可以提供一种购物方法、装置及系统专利检索，专利查询，专利分析的服务。并且本申请实施例公开了一种购物方法、装置及系统，其中所述方法包括：接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；根据所述用户标识获取所述用户的至少一个语音支付标准信息；所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。相比现有技术，本申请简化了支付流程，提高了购物效率。，下面是一种购物方法、装置及系统专利的具体信息内容。

权利要求

1.一种购物方法，其特征在于，所述方法包括：
接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；
根据所述用户标识获取所述用户的至少一个语音支付标准信息；
将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。
2.如权利要求1所述的购物方法，其特征在于，所述将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音进行支付相关操作包括：
逐一计算所述语音与每一所述语音支付标准信息的相似度；
将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息；
根据所述目标语音信息的内容进行支付相关操作。
3.如权利要求2所述的购物方法，其特征在于，所述将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息包括：
将与所述语音之间的相似度的值最高且大于预设阈值的语音支付标准信息确定为目标语音信息。
4.如权利要求2或3所述的购物方法，其特征在于，所述逐一计算所述语音与每一所述语音支付标准信息的相似度包括：
分别提取所述语音与所述每一所述语音支付标准信息的特征；
将所述第一特征输入至预设的相似度计算模型计算得到所述语音与每一所述语音支付标准信息之间的相似度。
5.如权利要求4所述的购物方法，其特征在于，所述分别提取所述语音与所述每一所述语音支付标准信息的特征包括：
分别提取所述语音与所述每一所述语音支付标准信息的梅尔频率倒谱系数特征；
通过双卷积神经网络模型和双向长短记忆网络对所述梅尔频率倒谱系数特征进行处理得到特征向量并进行特征编码；
通过注意力机制对编码阶段的特征向量进行加权求和，获取不同特征向量的注意力权值；
利用全连接层对赋予注意力权值的特征向量进行降维处理获得预设维度的特征向量。
6.一种购物方法，其特征在于，所述方法包括：
客户端基于接收到的当前视频中的商品的订单于预设时间内发送包括所述客户端关联的用户标识和语音的语音支付请求至交易支付平台；
所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；
所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。
7.一种购物装置，其特征在于，所述装置包括：
语音支付请求接收单元，用于接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；
语音支付标准信息获取单元，用于根据所述用户标识获取所述用户的至少一个语音支付标准信息；
语音支付请求验证单元，用于将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。
8.如权利要求7所述的装置，其特征在于，所述语音支付请求验证单元包括相似度计算单元、目标语音信息确定单元、支付操作单元；
所述相似度计算单元用于逐一计算所述语音与每一所述语音支付标准信息的相似度；
所述目标语音信息确定单元用于将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息；
所述支付操作单元用于根据所述目标语音信息的内容进行支付相关操作。
9.一种购物系统，其特征在于，所述系统包括客户端和交易支付平台：
客户端基于接收到的当前视频中的商品的订单于预设时间内发送包括所述客户端关联的用户标识和语音的语音支付请求至所述交易支付平台；
所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；
所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。
10.一种计算机系统，其特征在于，包括：
一个或多个处理器；以及
与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行如权利要求1-5中任一项所述的方法。

说明书全文

一种购物方法、装置及系统

技术领域

[0001] 本申请涉及购物领域，特别是涉及一种基于视频的购物方法、装置及系统。

背景技术

[0002] 随着网络技术、通信安全技术的发展以及用户终端的普及，网络购物已经越来越普遍。用户使用终端，在任意的销售平台上随时可以浏览下单平台商品并进行支付。为了使用户更直观立体的了解商品的各种信息，目前视频购物已经逐渐开展，在进行视频购物时，用户观看视频中的商品并决定是否下单，一旦决定下单则跳转出当前的视频界面进入单独的支付界面进行支付操作，在当前用户追求购物快速便捷的高需求下，这样的购物流程降低了购物效率。

[0003] 因此如何提供一种更为高效的购物方式是目前急需解决的问题。发明内容

[0004] 本申请提供了一种购物方法、装置及系统，以解决现有技术中视频购物效率低的问题。

[0005] 本申请提供了如下方案：

[0006] 第一方面公开了一种购物方法，所述方法包括：

[0007] 接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；

[0008] 根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0009] 将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。

[0010] 优选的，所述将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音进行支付相关操作包括：

[0011] 逐一计算所述语音与每一所述语音支付标准信息的相似度；

[0012] 将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息；

[0013] 根据所述目标语音信息的内容进行支付相关操作。

[0014] 优选的，所述将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息包括：

[0015] 将与所述语音之间的相似度的值最高且大于预设阈值的语音支付标准信息确定为目标语音信息。

[0016] 优选的，所述逐一计算所述语音与每一所述语音支付标准信息的相似度包括：

[0017] 分别提取所述语音与所述每一所述语音支付标准信息的特征；

[0018] 将所述第一特征输入至预设的相似度计算模型计算得到所述语音与每一所述语音支付标准信息之间的相似度。

[0019] 优选的，所述分别提取所述语音与所述每一所述语音支付标准信息的特征包括：

[0020] 分别提取所述语音与所述每一所述语音支付标准信息的梅尔频率倒谱系数特征；

[0021] 通过双卷积神经网络模型和双向长短记忆网络对所述梅尔频率倒谱系数特征进行处理得到特征向量并进行特征编码；

[0022] 通过注意力机制对编码阶段的特征向量进行加权求和，获取不同特征向量的注意力权值；

[0023] 利用全连接层对赋予注意力权值的特征向量进行降维处理获得预设维度的特征向量。

[0024] 本申请第二方面还公开了一种购物方法，所述方法包括：

[0025] 客户端基于接收到的当前视频中的商品的订单于预设时间内发送包括所述客户端关联的用户标识和语音的语音支付请求至交易支付平台；

[0026] 所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0027] 所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。

[0028] 本申请第三方面还公开了一种购物装置，所述装置包括：

[0029] 语音支付请求接收单元，用于接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；

[0030] 语音支付标准信息获取单元，用于根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0031] 语音支付请求验证单元，用于将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。

[0032] 优选的，所述语音支付请求验证单元包括相似度计算单元、目标语音信息确定单元、支付操作单元；

[0033] 所述相似度计算单元用于逐一计算所述语音与每一所述语音支付标准信息的相似度；

[0034] 所述目标语音信息确定单元用于将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息；

[0035] 所述支付操作单元用于根据所述目标语音信息的内容进行支付相关操作。

[0036] 本申请还公开了一种购物系统，所述系统包括客户端和交易支付平台：

[0037] 客户端基于接收到的当前视频中的商品的订单发送包括所述客户端关联的用户标识和语音的语音支付请求至所述交易支付平台；

[0038] 所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0039] 所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。

[0040] 本申请最后一方面还公开了一种计算机系统，包括：

[0041] 一个或多个处理器；以及

[0042] 与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行第一方面所述的方法。

[0043] 根据本申请提供的具体实施例，本申请公开了以下技术效果：

[0044] 本申请的技术方案将语音支付应用到视频购物中，由于语音可以在视频购物界面输入，因此无需跳转视频购物界面即可完成支付，提高了速度，另外由于预存了用户的语音支付标准信息，因此只需要判断接收的语音是否是该用户发出，无需判断具体是由谁发出，降低了工作量，进一步提高了处理速度。

[0045] 进一步的本申请利用了深度学习方法，提取待匹配的两段音频的梅尔频率倒谱系数特征，之后使用双卷积神经网络的卷积池化层获取音频的局部信息，接着采用双向长短记忆网络获取音频特征的上下文信息，然后利用注意力机制突出两段音频中的重要片段，最后在全连接层处进行降维后，将两段音频的输出使用余弦距离求解相似度。相对于传统的相似度度量方法，本申请的相似度计算方法能够更好的提取音频中局部信息，避免全局信息的干扰。附图说明

[0046] 为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

[0047] 图1是本申请实施例提供的系统结构图；

[0048] 图2是本申请实施例提供的方法流程图；

[0049] 图3是本申请实施例提供的模型训练流程图；

[0050] 图4是本申请实施例提供的特征提取示意图；

[0051] 图5本申请实施例提供的方法流程图；

[0052] 图6本申请实施例提供的计算机系统架构图。

具体实施方式

[0053] 下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

[0054] 如背景技术所述，目前的视频购物方式直观立体，必然受到用户的喜爱，然而支付过程需要跳转出视频购物界面，降低了购物效率。为此，本申请提供一种基于视频购物的语音支付方式，在当前视频购物界面即可利用已经开启的音频设备接收用户的语音支付信息进行语音支付。由于无需跳转界面，相比现有技术更加高效。

[0055] 支付涉及用户的财产，因此任何的支付方式都要考虑安全性，语音支付的安全性要求有两个：识别出音频的内容和判断说话人的身份。目前的技术方式是采用语音识别和声纹识别技术来实现。通过语音识别来识别出用户的语音是否涉及支付，以及是支付中的哪种信息(确认支付、支付取消等)，通过声纹识别来确定出是谁发出了这一语音，该人是否是购物的用户。这样传统的语音识别和声纹识别的技术会导致用户等待回应的时间较长。而且在声纹识别中一般的方式是通过建立分类器，判断音频属于那一种类，判断过程本身具有一定误差，而语音识别也不能保证绝对准确。这种场景下大大降低了语音支付的安全性和高效性。

[0056] 为解决该问题，提高安全性和高效性，本申请在进行语音支付时，首先在交易支付平台中预存购物客户端关联用户的语音支付标准信息，之后将从客户端获得的语音支付信息与该用户的语音支付标准信息利用已经训练好的语音相似度计算模型进行相似度计算，一旦计算得到的相似度超过预设的阈值，则认为当前接收的语音支付信息与预存的该用户的语音支付标准信息相同，语音支付验证成功。在该过程中，由于语音标准信息是该用户自己的语音信息，因此无需分别利用语音识别识别内容和利用声纹识别的分类器判断接收到的语音支付信息属于哪一类音频，而只需要判断接收的语音信息是否与标准语音信息的特征是否相同即可。降低了出错的概率，提高了验证速度。

[0057] 本申请中，对于每个用户，交易支付平台中可预存一定数量如10条以内的语音支付标准信息，具体可涉及“确认”、“取消”等类型。在这一场景下，用户需要进行语音支付时，只按照规定的回答标准进行回应即可。

[0058] 图1示出了一种具体的基于语音支付的视频购物系统，其具体包括：

[0059] 用户购物的客户端11、销售运营商的商品销售平台12、交易支付平台13以及运营商的客服端14。

[0060] 其中商品销售平台12用于提供各商户的商品视频等数据信息，并与客户端建立长连接，根据用户的商品浏览请求发送对应商品的视频数据信息至客户端11进行展示。用户在客户端11上浏览商品并对视频界面上的商品进行下单操作，该下单操作信息被发送至商品销售平台12并进而被商品销售平台12发送至客服端14，客服端14端展示商品视频信息并与客户端11建立点对点连接，将视频中商品的订单信息发送至客户端11。此时客户端11检测收到订单信息后，进行语音支付等待状态或直接进入语音支付状态。

[0061] 如进入语音支付等待状态，则需要在客户端输入确定进入语音支付的指令，比如点击视频界面上表示进入语音支付的按钮等，或者可以在客户端11输出是否进行语音支付的提示信息，待用户确定后进入语音支付状态。如客户端11的视频界面输出“是否进入语音支付”，用户输入“确定”则进入语音支付状态。之后在进入语音支付状态后的预设时间内接收到的语音信息都将被是为语音支付信息发送至交易支付平台进行验证。

[0062] 直接进入语音支付状态是指一旦收到订单信息，则接下来预设时间内收到的语音信息都将被视为语音支付信息发送至交易支付平台13进行语音验证。

[0063] 在客户端11与运营商的平台、客服端进行交互的过程中，必然会发生多种的语音交互信息，比如客户端11可能通过语音信息与客服端14进行信息的交互确认，此时的语音不是用于支付。为此需要通过订单或者结合订单和用户确认来确定客户端11和交易支付平台13进入语音支付状态的时刻，以便客户端11将接下来预设时间内的语音发送至交易支付平台13进行语音支付的验证。

[0064] 语音支付的状态不可能一直持续，因此，本申请设定在预设时间内的语音信息会被作为语音支付信息验证，比如0.5秒，该时间的设置可长可短，本申请不作具体限制。另外当时间到达，用户也可基于再次的请求再次进入语音支付状态。

[0065] 交易支付平台13中预存了注册用户的语音支付标准信息，每当用户进行购物账户的注册时，皆可让用户录入自己的数条语音支付标准信息并将用户标识与该标准信息关联存储在交易支付平台13的数据库。交易支付平台13根据用户语音支付请求中的用户标识在数据库中获取该用户预存的所有语音支付标准信息，并与接收的语音支付请求中的语音信息逐一输入模型进行特征提取和相似度的计算。

[0066] 若所有的相似度计算结果均低于预设的阈值，说明该语音信息与任何一语音支付标准均不相同，则验证失败，返回验证失败信息至客户端11。

[0067] 若有相似度计算结果高于预设的阈值，说明存在语音支付标准信息与接收的语音信息相同，则选取最高相似度的对应的语音支付标准信息作为匹配到的目标语音支付信息并基于此返回验证结果和进行后续支付操作。

[0068] 当然上述图1所提供的系统结构图示本申请的一个具体实施场景，在其他实施例中，运营商可基于一个或者更多的平台完成上述操作。比如运营商可基于一个平台处理所有客户端发送的语音信息，当根据订单等信息进入语音支付状态后，对接收的语音执行的是语音支付验证操作，其他状态下不对语音进行支付验证操作。

[0069] 本申请重点在于订单完成后的语音支付过程，因此后续介绍中不在对用户如何浏览商品以及下单进行赘述。

[0070] 实施例一

[0071] 基于上述描述，本申请实施例一提供了一种基于语音支付的视频购物方法，应用于交易支付平台侧，如图2所示，该方法包括如下步骤：

[0072] S21、接收所述客户端基于当前视频中的商品的订单在预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音。

[0073] 如前所述，客户端在当前视频界面下执行下单操作后会收到视频中商品的订单信息，此时进入语音支付等待或语音支付状态。

[0074] 语音支付等待状态下，用户需要在客户端进一步输入语音支付开始的指令方可进入语音支付状态，如用户通过视频界面上的按钮发送进入语音支付的指令，此时运营商侧也进入语音支付验证状态。

[0075] 在一些实施例中，当订单生成后，运营商侧或客户端侧也可发出进行是否进行语音支付的提示信息，以便用户进行选择。

[0076] 直接进入语音支付验证状态则是默认一旦订单生成，则在预定时间内发出的语音信息都将被视为语音支付信息发送至交易支付平台进行语音验证。

[0077] 需要说明的是，在同一购物平台具有多种可选择的支付方式时，直接进入语音支付验证状态的方式是不可选的。

[0078] 视频界面下可以进行语音的接收发送，因此无需跳转视频界面即可进行语音的输入以便后续验证支付。

[0079] S22、根据所述用户标识获取所述用户的至少一个语音支付标准信息。

[0080] 该用户的标识一般是用户在购物平台上注册的ID，在用户进行注册时关联存储了该ID与该用户的语音支付标准信息，只需根据ID从数据库获取所述用户的所有语音支付标准信息，每一用户可能有大于1条的语音支付标准信息。当然，用于表示用户支付的指令并不多，因此该语音支付标准信息的数量也不会很大。

[0081] S23、将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。

[0082] 一旦与预存的该用户的语音支付标准信息匹配，则证明语音由该用户发出且内容符合支付相关内容，因此验证通过可执行后续支付相关操作。

[0083] 本申请中，语音支付标准信息包含了确认支付、取消支付等信息，因此后续支付相关操作也包括取消支付等操作。

[0084] 由于语音可以在视频购物界面输入，因此无需跳转视频购物界面即可完成支付，提高了速度，另外由于预存了用户的语音支付标准信息，因此只需要判断接收的语音是否是该用户发出，无需判断具体是由谁发出，降低了工作量，进一步提高了处理速度。

[0085] 在进行具体的匹配验证时，本申请可通过语音之间的相似度进行判断，逐一计算所述语音与每一所述语音支付标准信息的相似度，将满足相似度预设条件的语音支付标准信息确定为目标语音信息，如将与所述语音之间的相似度的值最高且大于预设阈值的语音支付标准信息确定为目标语音信息，根据所述目标语音信息的内容进行支付相关操作。

[0086] 传统的相似度度量方法，如余弦距离、欧式距离等，都需要将音频的两端对齐后进行判断，两端对齐操作复杂，且这些相似度度量方法难以深层的挖掘出音频信息，很多场景下决定两端音频是否相似的关键片段占比不会太大。

[0087] 为此本申请训练了一种相似度计算模型，训练过程如图3所示：

[0088] 构建训练集:

[0089] 通过音频获取模块获取用于训练的音频数据集，在训练阶段的数据输入形式为[音频1，音频2，标签1或0]，其中1表示音频1与音频2为同一人在不同场景下说出同样的内容，0则否比如不是同一人所说或所说内容不同或者非同一人说出不同内容。

[0090] 特征提取与处理:

[0091] 通过特征提取模块提取音频数据进行预处理，提取两个音频的抽象特征，主要是梅尔频率倒谱系数mfcc特征，mfcc特征可以获取音频每一帧的特征表达，每一帧都具有短时平稳性。

[0092] 之后利用卷积模块的双卷积神经网络对mfcc特征进行卷积池化，两个卷积的感知视野不同，使得两个卷积能够获取不同维度的特征信息，同时采用BN层来保持网络泛化性，之后通过矩阵相乘进行有机相连，最后通过全连接层对两个卷积的结果进行权重分配。如图4示出了双卷积神经网络处理过程。

[0093] 接着BiLSTM网络模块利用双向长短记忆网络BiLSTM将音频的帧级mfcc特征向量最终转换为音频的隐含层状态特征向量，进行特征编码。

[0094] 之后注意力模块将特征编码后的隐含层状态特征相连利用注意力机制Attention进行权重分配。具体的采用的注意力机制为BahdanauAttention。BahdanauAttention通过给予每个特征向量权重能够很好的提取上下文信息，对于长向量的效果更加明显。

[0095] 之后还会利用另一个全连接层对输出的特征向量降维，把特征调整到固定的维度用于后续进行计算。

[0096] 模型训练：

[0097] 之后将经过注意力机制分配权重后的特征与标签一起输入相似度计算模型进行迭代优化得到训练后的相似度计算模型。

[0098] 上述模型利用了深度学习方法，使用mfcc提取待匹配的两段音频的特征，之后使用双卷积神经网络的卷积池化层获取音频的局部信息，接着采用BiLSTM获取音频特征的上下文信息，然后利用Attention机制突出两段音频中的重要片段，最后在最后一个全连接层处将两段音频的输出使用余弦距离求解相似度。相对于传统的相似度度量方法，本申请的相似度计算方法能够更好的提取音频中局部信息，避免全局信息的干扰。

[0099] 在预测阶段，即可利用上述特征提取方法进行特征提取后将特征向量输入训练好的相似度计算模型进行相似度计算，得到计算结果：

[0100] 分别提取所述语音与所述每一所述语音支付标准信息的mfcc特征；

[0101] 通过双卷积神经网络模型和双向长短记忆网络BiLSTM对所述mfcc特征进行处理得到特征向量并进行特征编码；

[0102] 通过注意力机制对编码阶段的特征向量进行加权求和，获取不同特征向量的注意力权值；

[0103] 将分配有注意力权值的特征向量利用另一个全连接层降维处理后，输入预设的相似度计算模型计算得到所述语音与每一所述语音支付标准信息之间的相似度。

[0104] 实施例二

[0105] 如图5所示，针对上述实施例一的方法，本申请实施例二提供了一种购物方法，应用于客户端侧，所述方法包括：

[0106] S51、客户端基于接收到的当前视频中的商品的订单发送包括所述客户端关联的用户标识和语音的语音支付请求至交易支付平台；

[0107] S52、所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0108] S53、所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。

[0109] 优选的，上述步骤S52包括：

[0110] 交易支付平台逐一计算所述语音与每一所述语音支付标准信息的相似度；

[0111] 交易支付平台将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息，如将与所述语音之间的相似度的值最高且大于预设阈值的语音支付标准信息确定为目标语音信息。

[0112] 交易支付平台根据所述目标语音信息的内容进行支付相关操作。

[0113] 优选的，交易支付平台逐一计算所述语音与每一所述语音支付标准信息的相似度包括：

[0114] 交易支付平台分别提取所述语音与所述每一所述语音支付标准信息的特征；具体的，交易支付平台分别提取所述语音与所述每一所述语音支付标准信息的mfcc特征，之后通过双卷积神经网络模型和双向长短记忆网络BiLSTM对所述mfcc特征进行处理得到特征向量并进行特征编码并通过注意力机制对编码阶段的特征向量进行加权求和，获取不同特征向量的注意力权值。

[0115] 交易支付平台将上述提取的所述特征输入至预设的相似度计算模型计算得到所述语音与每一所述语音支付标准信息之间的相似度。

[0116] 实施例三

[0117] 对应上述实施例一的方法，本申请还提供了一种购物装置，所述装置包括：

[0118] 语音支付请求接收单元，用于接收所述客户端基于当前视频中的商品的订单发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；

[0119] 语音支付标准信息获取单元，用于根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0120] 语音支付请求验证单元，用于将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。

[0121] 所述语音支付请求验证单元包括相似度计算单元、目标语音信息确定单元、支付操作单元；

[0122] 所述相似度计算单元用于逐一计算所述语音与每一所述语音支付标准信息的相似度；

[0123] 所述目标语音信息确定单元用于将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息；

[0124] 所述支付操作单元用于根据所述目标语音信息的内容进行支付相关操作。

[0125] 其中所述相似度计算单元包括：

[0126] mfcc特征提取模块，用于提取两个音频的抽象特征，主要是mfcc特征，mfcc可以获取音频每一帧的特征表达。

[0127] 卷积模块，采用双卷积的思路，两个卷积的感知视野不同，使得两个卷积能够获取不同维度的特征信息，同时采用BN层来保持网络泛化性，之后通过矩阵相乘进行有机相连，最后通过全连接层进行权重分配。

[0128] 双向长短记忆BiLSTM网络模块，用于将音频的帧级mfcc特征向量最终转换为音频的隐含层状态特征向量，进行特征编码。

[0129] 注意力机制Attention模块，用于通过给予每个特征向量权重能够很好的提取上下文信息，对于长向量的效果更加明显。

[0130] 相似度衡量模块，用于根据注意力机制Attention模块输入的特征向量计算输出相似度。

[0131] 实施例四

[0132] 对应上述实施例二，本申请实施例四提供一种购物系统，所述系统包括客户端和交易支付平台：

[0133] 客户端基于接收到的当前视频中的商品的订单于预设时间内发送包括所述客户端关联的用户标识和语音的语音支付请求至所述交易支付平台；

[0134] 所述交易支付平台根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0135] 所述交易支付平台将所述语音与所述语音支付标准信息进行验证，若验证通过则发送验证结果至所述客户端并根据所述语音对所述订单进行支付相关操作。

[0136] 其他部分内容可参见本申请其他实施例和图1的介绍，此处不在详述。

[0137] 实施例五

[0138] 对应上述方法和装置，本申请实施例五提供一种计算机系统，包括：

[0139] 一个或多个处理器；以及

[0140] 与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行如下操作：

[0141] 接收所述客户端基于当前视频中的商品的订单于预设时间内发送的语音支付请求；所述语音支付请求包括所述客户端关联的用户标识和语音；

[0142] 根据所述用户标识获取所述用户的至少一个语音支付标准信息；

[0143] 将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音对所述订单进行支付相关操作。

[0144] 优选的，所述将所述语音与所述语音支付标准信息进行验证，若验证通过则根据所述语音进行支付相关操作包括：

[0145] 逐一计算所述语音与每一所述语音支付标准信息的相似度；

[0146] 将与所述语音之间的相似度满足预设条件的语音支付标准信息确定为目标语音信息，如将与所述语音之间的相似度的值最高且大于预设阈值的语音支付标准信息确定为目标语音信息。

[0147] 根据所述目标语音信息的内容进行支付相关操作。

[0148] 优选的，所述逐一计算所述语音与每一所述语音支付标准信息的相似度包括：

[0149] 分别提取所述语音与所述每一所述语音支付标准信息的特征，并将所述特征输入至预设的相似度计算模型计算得到所述语音与每一所述语音支付标准信息之间的相似度。

[0150] 优选的，所述分别提取所述语音与所述每一所述语音支付标准信息的特征包括：

[0151] 分别提取所述语音与所述每一所述语音支付标准信息的mfcc特征；

[0152] 通过双卷积神经网络模型和双向长短记忆网络BiLSTM对所述mfcc特征进行处理得到特征向量并进行特征编码；

[0153] 通过注意力机制对编码阶段的特征向量进行加权求和，获取不同特征向量的注意力权值。

[0154] 其中，图5示例性的展示出了计算机系统的架构，具体可以包括处理器1510，视频显示适配器1511，磁盘驱动器1512，输入/输出接口1513，网络接口1514，以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口
1514，与存储器1520之间可以通过通信总线1530进行通信连接。

[0155] 其中，处理器1510可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请所提供的技术方案。

[0156] 存储器1520可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521，用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)。另外，还可以存储网页浏览器1523，数据存储管理系统1524，以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之，在通过软件或者固件来实现本申请所提供的技术方案时，相关的程序代码保存在存储器1520中，并由处理器1510来调用执行。

[0157] 输入/输出接口1513用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

[0158] 网络接口1514用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

[0159] 总线1530包括一通路，在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514，与存储器1520)之间传输信息。

[0160] 另外，该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息，以用于进行条件判断，等等。

[0161] 需要说明的是，尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514，存储器1520，总线1530等，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本申请方案所必需的组件，而不必包含图中所示的全部组件。

[0162] 通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，云服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

[0163] 本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

[0164] 以上对本申请所提供的购物方法、装置及设备，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本申请的限制。

标题	发布/更新时间	阅读量
语音情绪波动分析方法及装置	2020-05-08	791
基于声纹特征识别的聚乙烯气相流化床生产过程结块在线监测系统及方法	2020-05-12	273
基于室内声学信道扰动分析的物体识别方法	2020-05-13	100
实时声纹辨识系统与方法	2020-05-08	396
一种提高DNN模型泛化性能的语音增强方法	2020-05-11	452
一种基于情感识别的老人陪护机器人子系统	2020-05-08	841
一种风力发电机组稳态振动在线监测方法及监测系统	2020-05-11	661
一种风力发电机组稳态振动在线趋势预测方法及趋势预测系统	2020-05-11	689
基于音频分析与深度学习的争吵识别方法	2020-05-13	536
一种乒乓球比赛视频的智能数据采集方法	2020-05-13	472

一种购物方法、装置及系统

一种购物方法、装置及系统

技术领域

背景技术

具体实施方式

该功能需要专业版企业版VIP权限，您可以：