首页 / 专利库 / 多媒体工具与应用 / 媒体流 / 视频流 / 对直播间计算相似度的方法、装置、设备和存储介质

对直播间计算相似度的方法、装置、设备和存储介质

阅读:617发布:2020-05-08

专利汇可以提供对直播间计算相似度的方法、装置、设备和存储介质专利检索,专利查询,专利分析的服务。并且本 发明 实施例 公开了一种对直播间计算相似度的方法、装置、设备和存储介质,其中,所述方法包括:在直播间产生直播 视频流 的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;根据所述用户行为数据流,更新 指定 的直播间指标;根据更新后的直播间指标计算所述直播间之间的相似度。本发明实施例对直播间计算相似度的方法,实现了采用实时数据对直播间计算相似度,使得直播间之间的相似度具有较高的实时性,能够得到直播间之间的准确相似度。,下面是对直播间计算相似度的方法、装置、设备和存储介质专利的具体信息内容。

1.一种对直播间计算相似度的方法,其特征在于,包括:
在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
根据所述用户行为数据流,更新指定的直播间指标;
根据更新后的直播间指标计算所述直播间之间的相似度。
2.如权利要求1所述的方法,其特征在于,所述根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流,包括:
每当监测到所述用户退出所述直播间结束观看所述直播视频流时,采集与所述用户相关的用户行为数据;
按照预设数据流格式,采用所述用户行为数据生成用户行为数据流。
3.如权利要求2所述的方法,其特征在于,所述用户行为数据包括直播间标识、用户标识、观看结束时间和观看时长,所述采集与所述用户相关的用户行为数据,包括:
获取所述直播间的直播间标识、所述用户的用户标识、所述用户结束观看所述直播视频流的观看结束时间;
统计所述用户观看所述直播视频流的观看时长;
所述按照预设数据流格式,采用所述用户行为数据生成用户行为数据流,包括:
按照预设数据流格式,采用所述直播间标识、所述用户标识、所述观看结束时间和所述观看时长生成用户行为数据流。
4.如权利要求1或2或3所述的方法,其特征在于,所述根据所述用户行为数据流,更新指定的直播间指标,包括:
从所述用户行为数据流中提取用户行为数据;
判断所述用户行为数据是否有效;
若是,则查找所述用户行为数据对应的直播间指标,并根据所述用户行为数据更新所述直播间指标。
5.如权利要求4所述的方法,其特征在于,所述用户行为数据包括观看时长,所述判断所述用户行为数据是否有效,包括:
判断所述观看时长是否大于预设值;
若是,则确定所述用户行为数据有效;
若否,则确定所述用户行为数据无效。
6.如权利要求4所述的方法,其特征在于,所述用户行为数据包括观看时长、直播间标识、用户标识和观看结束时间,所述直播间指标包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,所述查找所述用户行为数据对应的直播间指标,并根据所述用户行为数据更新所述直播间指标,包括:
查找所述用户标识对应的观看次数;
对所述观看次数进行累加处理;
查找所述直播间标识对应的用户集合;
若所述用户标识未记录在所述用户集合中,则将所述用户标识写入所述用户集合中;
查找所述用户标识和所述直播间标识共同对应的最后观看时间;
采用所述观看结束时间覆盖所述最后观看时间。
7.如权利要求1或2或3所述的方法,其特征在于,所述直播间指标包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,所述根据更新后的直播间指标计算所述直播间之间的相似度,包括:
从所述直播间中选取第一直播间和第二直播间;
从所述直播间指标中获取所述第一直播间的第一用户集合和所述第二直播间的第二用户集合;
基于所述第一用户集合和所述第二用户集合,确定共同观看所述第一直播间的直播视频流和所述第二直播间的直播视频流的第三用户集合;
获取所述第三用户集合中的每个用户的第一最后观看时间和第二最后观看时间,其中,所述第一最后观看时间为所述用户观看所述第一直播间的直播视频流的最后观看时间,所述第二最后观看时间为所述用户观看所述第二直播间的直播视频流的最后观看时间;
获取所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数;
基于所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数,以及所述第三用户集合中的每个用户的所述第一最后观看时间和所述第二最后观看时间,计算所述第一直播间和所述第二直播间之间的相似度。
8.一种对直播间计算相似度的装置,其特征在于,包括:
用户行为数据流生成模,用于在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
直播间指标更新模块,用于根据所述用户行为数据流,更新指定的直播间指标;
相似度计算模块,用于根据更新后的直播间指标计算所述直播间之间的相似度。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的对直播间计算相似度的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的对直播间计算相似度的方法。

说明书全文

对直播间计算相似度的方法、装置、设备和存储介质

技术领域

[0001] 本发明实施例涉及大数据处理技术领域,尤其涉及一种对直播间计算相似度的方法、装置、设备和存储介质。

背景技术

[0002] 在大数据应用领域中,可以根据海量数据对用户进行个性化推荐,比如在网络直播平台中,向用户推荐与用户观看过的直播间相似的直播间,直播间之间的相似度越准确,向用户推荐的直播间越符合用户的个人兴趣。
[0003] 目前,对直播间计算相似度主要是基于离线数据,离线数据是指将实时采集的数据按照一定的时间周期(通常是按一定的天数)存储到数据库中,在对直播间计算相似度时,从数据库中读取相关数据计算直播间之间的相似度。在实际应用中,由于离线数据存储的延迟性,一方面,当天新出现的直播间中用户行为数据无法及时存储到数据库中,造成新出现的直播间数据缺失或者数据稀疏,无法度量新出现的直播间与其它直播间之间的相似度;另一方面,直播间之间发生联动事件会大幅度增加直播间之间的相似度,联动事件产生的用户行为数据也无法及时存储到数据库中,影响了相似度的准确度。
[0004] 因此,目前基于离线数据对直播间计算相似度的方法存在直播间之间的相似度实时性差,造成直播间之间的相似度不准确的问题。

发明内容

[0005] 本发明实施例提供一种对直播间计算相似度的方法、装置、设备和存储介质,以实现采用实时数据对直播间计算相似度,解决现有技术中对直播间计算相似度的方法存在相似度实时性差,造成直播间之间的相似度不准确的问题。
[0006] 第一方面,本发明实施例提供了一种对直播间计算相似度的方法,包括:
[0007] 在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
[0008] 根据所述用户行为数据流,更新指定的直播间指标;
[0009] 根据更新后的直播间指标计算所述直播间之间的相似度。
[0010] 第二方面,本发明实施例提供了一种对直播间计算相似度的装置,包括:
[0011] 用户行为数据流生成模,用于在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
[0012] 直播间指标更新模块,用于根据所述用户行为数据流,更新指定的直播间指标;
[0013] 相似度计算模块,用于根据更新后的直播间指标计算所述直播间之间的相似度。
[0014] 第三方面,本发明实施例提供了一种设备,所述设备包括:
[0015] 一个或多个处理器;
[0016] 存储装置,用于存储一个或多个程序,
[0017] 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任一实施例所提供的对直播间计算相似度的方法。
[0018] 第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任一实施例所提供的对直播间计算相似度的方法。
[0019] 本发明实施例对直播间计算相似度的方法,通过在直播间产生直播视频流的过程中,根据用户在直播间中观看直播视频流的用户行为生成用户行为数据流,并根据用户行为数据流更新指定的直播间指标,以便根据更新后的直播间指标计算直播间之间的相似度,解决了对直播间计算相似度的方法存在直播间之间的相似度实时性差,造成直播间之间的相似度不准确的问题,实现了采用实时数据对直播间计算相似度,使得直播间之间的相似度具有较高的实时性,能够得到直播间之间的准确相似度。附图说明
[0020] 图1是本发明实施例一提供的一种对直播间计算相似度的方法流程图
[0021] 图2A是本发明实施例二提供的一种对直播间计算相似度的方法流程图;
[0022] 图2B是本发明实施例二提供的方法中采集用户行为数据的方法流程图;
[0023] 图2C是本发明实施例二提供的方法中消息中间件kafka的架构图;
[0024] 图2D是本发明实施例二提供的方法中更新直播间指标的方法流程图;
[0025] 图2E是本发明实施例二提供的方法中计算直播间之间的相似度的方法流程图;
[0026] 图3是本发明实施例三提供的一种对直播间计算相似度的装置的结构示意图;
[0027] 图4是本发明实施例四提供的一种设备的结构示意图。

具体实施方式

[0028] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0029] 实施例一
[0030] 图1为本发明实施例一提供的一种对直播间计算相似度的方法流程图,本发明实施例可适用于网络直播平台对直播间计算相似度的情况,该方法可以由对直播间计算相似度的装置来执行,该装置可以通过软件和/或硬件的方式来实现,并集成在执行本方法的设备中,具体的,如图1所示,该方法可以包括如下步骤:
[0031] S101、在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流。
[0032] 具体的,本发明实施例的直播系统可以包括直播平台和客户端,直播平台可以是提供直播服务的服务器,直播平台可以通过互联网与多个客户端进行通信连接。在多个客户端中,可以包括主播客户端和观众客户端,直播平台为主播客户端创建虚拟直播间,用户通过主播客户端或者观众客户端登录直播平台后可以进入直播间中,主播在直播间进行直播时产生直播视频流,用户可以通过观众客户端观看该直播视频流。
[0033] 本发明实施例中,用户行为可以是用户进入直播间、用户退出直播间、用户与主播的互动等行为,则可以获取与用户行为相关的用户行为数据后,按照预设格式生成用户行为数据流,该用户行为数据流包括了多个用户的用户行为数据,并且以流的形式输出。
[0034] S102、根据所述用户行为数据流,更新指定的直播间指标。
[0035] 本发明实施例中,可以预设直播间指标数据库,该直播间指标数据库中包含了各个直播间的用户集合、用户观看直播间的直播视频流的次数、用户观看各个直播间的直播视频流的最后观看时间等指标,其中,每个直播间指标可以是一个变量,该变量对应有变量值,可以在每次对直播间指标的更新中对该变量值进行实时更新。
[0036] 例如,当接收到一条用户行为数据流后,可以根据用户行为数据流中的用户行为数据更新相应的直播间指标,以实现对直播间指标的实时更新,使得采用直播间指标计算的直播间之间的相似度具有较高的实时性和准确度。
[0037] S103、根据更新后的直播间指标计算所述直播间之间的相似度。
[0038] 具体的,可以设置对直播间计算相似度的触发事件,该触发事件可以是设定的时间点、设定的时间周期或者监测到用户的指定行为等,其中,用户的指定行为可以是用户进入直播间、用户在直播间中与主播连麦、用户在直播间中与主播对战等行为。当监测到触发事件被触发时,从直播间中选取两个直播间,采用更新后的直播间指标计算两个直播间之间的相似度。
[0039] 本发明实施例对直播间计算相似度的方法,通过在直播间产生直播视频流的过程中,根据用户在直播间中观看直播视频流的用户行为生成用户行为数据流,并根据用户行为数据流更新指定的直播间指标,以便根据更新后的直播间指标计算直播间之间的相似度,解决了对直播间计算相似度的方法存在直播间之间的相似度实时性差,造成直播间之间的相似度不准确的问题,实现了采用实时数据对直播间计算相似度,使得直播间之间的相似度具有较高的实时性,能够得到直播间之间的准确相似度。
[0040] 实施例二
[0041] 图2A为本发明实施例二提供的一种对直播间计算相似度的方法流程图,本实施例是在上述实施例一的基础上,对生成用户行为数据流和更新直播间指标进行优化。具体的,如图2A所示,本发明实施例中提供的方法可以包括如下步骤:
[0042] S201、在直播间产生直播视频流的过程中,每当监测到所述用户退出所述直播间结束观看所述直播视频流时,采集与所述用户相关的用户行为数据。
[0043] 本发明实施例中,在直播间产生直播视频流的过程中,通常有多个用户同时观看直播间产生的直播视频流,可以采用每个用户的行为数据生成用户行为数据流,因此可以在监测到用户退出直播间结束观看直播视频流时,采集与该用户相关的用户行为数据,可选地,如图2B所示,采集与所述用户相关的用户行为数据,具体可以包括:
[0044] S2011、获取所述直播间的直播间标识、所述用户的用户标识、所述用户结束观看所述直播视频流的观看结束时间;
[0045] S2012、统计所述用户观看所述直播视频流的观看时长。
[0046] 具体的,每个直播间具有唯一的直播间标识(直播间ID),每个用户也具有唯一的用户标识(用户ID),当用户退出直播间时,可以获取该直播间的直播间标识、用户的用户标识和该用户退出直播间结束观看直播视频流的观看结束时间,并且通过观看结束时间和用户进入该直播间的时间,统计出该用户观看直播间的直播视频流的观看时长,将直播间标识、用户标识、观看结束时间和观看时长作为用户行为数据。
[0047] S202、按照预设数据流格式,采用所述用户行为数据生成用户行为数据流。
[0048] 具体的,可以按照预设数据流格式,采用直播间标识、用户标识、观看结束时间和观看时长生成用户行为数据流,例如,预设数据流格式可以如下:
[0049] {"room_id":r,"uid":u,"end_time":et,"wat_time":wt}
[0050] 其中,room_id为直播间标识,uid为用户标识,end_time为观看结束时间,wat_time为观看时长。
[0051] 在实际应用中,可以通过消息中间件kafka实现流式数据的生成。
[0052] 如图2C所示为消息中间件kafka的架构图,参考图2C,消息中间件kafka包括多个消息生产者、多个消息消费者以及kafka服务器,其中,多个消息生产者和多个消息消费者通过kafka服务器连接,其中,多个消息生产者可以是向kafka服务器发送消息的客户端,多个消息消费者可以是从kafka服务器读取消息的客户端,具体到本发明实施例中,消息生产者可以是嵌在直播客户端或者直播平台中的应用程序,通过该应用程序可以实现对直播间进行监测,在监测到用户退出直播间结束观看直播视频流时,采集与用户相关的用户行为数据,并持续发送至kafka服务器,kafka服务器对接收到的用户行为数据进行流式处理并进行缓存,以便多个消息消费者读取。例如,多个消息消费者可以是对直播间计算相似度的业务端应用程序,比如可以是storm流式处理框架。该业务端应用程序可以从kafka服务器读取用户行为数据流,根据用户行为数据流对直播间指标进行更新。
[0053] S203、从所述用户行为数据流中提取用户行为数据。
[0054] 具体的,用户行为数据流为每个用户退出直播间结束观看直播视频流时,根据每个用户的用户行为数据所生成,在接收到用户行为数据流后,可以从中提取每个用户的用户行为数据。
[0055] S204、判断所述用户行为数据是否有效。
[0056] 在实际应用中,可以对用户行为数据进行过滤,去掉无效的用户行为数据,例如,去掉用户误操作生成的用户行为数据,具体的,用户行为数据中包括观看时长,可以判断用户行为数据中包含的观看时长是否大于预设值;若是,则确定该用户行为数据有效,执行S205;若否,则确定该用户行为数据无效,可以丢弃该用户行为数据。
[0057] 例如,预设值可以为10秒,如果观看时长大于10秒,说明用户对该直播间比较感兴趣;如果观看时长小于10秒,有可能是用户误操作进入直播间或者用户对该直播间不感兴趣,通过对用户行为数据有效性进行判断,可以避免采用无效用户行为数据更新直播间指标,造成直播间之间的相似度不准确的问题,提高了直播间之间的相似度的准确度。
[0058] S205、查找所述用户行为数据对应的直播间指标,并根据所述用户行为数据更新所述直播间指标。
[0059] 本发明实施例中,用户行为数据还可以包括直播间标识、用户标识和观看结束时间,直播间指标可以包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,如图2D所示,查找所述用户行为数据对应的直播间指标,并根据所述用户行为数据更新所述直播间指标,具体可以包括:
[0060] S2051,查找所述用户标识对应的观看次数;
[0061] S2052,对所述观看次数进行累加处理;
[0062] S2053,查找所述直播间标识对应的用户集合;
[0063] S2054,若所述用户标识未记录在所述用户集合中,则将所述用户标识写入所述用户集合中;
[0064] S2055,查找所述用户标识和所述直播间标识共同对应的最后观看时间;
[0065] S2056,采用所述观看结束时间覆盖所述最后观看时间。
[0066] 具体的,直播间指标可以采用“key=value”的方式表达,即可以通过key的键值获取对应的一个值,则可以以用户行为数据中包含的用户标识为键值,查找用户标识对应的观看次数,将该观看次数进行累加,即在当前观看次数的基础上加1处理,得到用户标识对应的用户观看所有直播间的直播视频流的次数;以直播间标识为键值,查找该直播间标识对应的用户集合,如果用户行为数据中包含的用户标识未记录在用户集合中,则将用户标识写入用户集合中;联合用户标识和直播间标识为键值,查找用户标识和用户标识共同对应的最后观看时间,采用用户行为数据中包含的观看结束时间覆盖查找到的最后观看时间,得到用户标识对应的用户观看直播间标识对应的直播间的直播视频流的最后观看时间,通过上述步骤,实现了每产生一条用户行为数据,实时更新相应的直播间指标,使得采用直播间指标计算的直播间之间的相似度具有较高的实时性,计算得到的相似度也更为准确。
[0067] S206,根据更新后的直播间指标计算所述直播间之间的相似度。
[0068] 本发明实施例中,直播间指标包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,可选地,如图2E所示,根据更新后的直播间指标计算所述直播间之间的相似度具体可以包括:
[0069] S2061、从所述直播间中选取第一直播间和第二直播间。
[0070] 在一可选实施例中,第一直播间和第二直播间可以是从所有直播间中任意选取的两个直播间。
[0071] 在另一可选实施例中,在向用户推荐直播间时,第一直播间可以是直播平台为该用户创建的直播间、该用户最后观看直播视频流的直播间、该用户观看直播视频流最多或者观看时长最长的直播间中的一个,第二直播间可以是除了上述第一直播间以外的直播间。
[0072] S2062、从所述直播间指标中获取所述第一直播间的第一用户集合和所述第二直播间的第二用户集合。
[0073] 具体的,在直播间指标中,可以通过第一直播间的直播间标识查找第一直播间的第一用户集合,通过第二直播间的直播间标识查找第二直播间的第二用户集合。
[0074] S2063、基于所述第一用户集合和所述第二用户集合,确定共同观看所述第一直播间的直播视频流和所述第二直播间的直播视频流的第三用户集合。
[0075] 具体的,可以对第一用户集合和第二用户集合取交集,得到第三用户集合,例如第一用户集合为{U1、U2、U3},第二用户集合为{U1、U4},第一用户集合和第二用户集合取交集后得到第三用户集合{U1}。
[0076] S2064、获取所述第三用户集合中的每个用户的第一最后观看时间和第二最后观看时间,其中,所述第一最后观看时间为所述用户观看所述第一直播间的直播视频流的最后观看时间,所述第二最后观看时间为所述用户观看所述第二直播间的直播视频流的最后观看时间。
[0077] 具体的,在直播间指标中,可以以每个用户的用户标识和第一直播间的直播间标识为键值,查找该键值对应的值即为最后观看时间,将该最后观看时间作为每个用户观看第一直播间的直播视频流的第一最后观看时间;同理,以每个用户的用户标识和第二直播间的直播间标识为键值,查找该键值对应的值即为最后观看时间,将该最后观看时间作为每个用户观看第二直播间的直播视频流的第二最后观看时间。
[0078] S2065、获取所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数。
[0079] 本实施例中,在直播间指标中,可以每个用户的用户标识为键值,查找该键值对应的值即为该用户的观看次数。
[0080] S2066、基于所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数,以及所述第三用户集合中的每个用户的所述第一最后观看时间和所述第二最后观看时间,计算所述第一直播间和所述第二直播间之间的相似度。
[0081] 具体的,可以通过以下公式计算第一直播间和第二直播间之间的相似度:
[0082]
[0083] 其中,sim(i,j)是第一直播间i和第二直播间j的相似度,Ui是第一直播间i的第一用户集合,Uj第二直播间j的第二用户集合,U是共同观看了第一直播间i和第二直播间j的第三用户集合,tui是第三用户集合U中每个用户观看第一直播间i的第一最后观看时间,tuj是第三用户集合U中每个用户观看第二直播间j的第二最后观看时间,δ是权重系数;
[0084] qu是第三用户集合U中每个用户观看直播间的直播视频流的观看次数。
[0085] 以下结合示例对计算第一直播间和所述第二直播间之间的相似度进行说明:
[0086] 在计算相似度时,假设直播间指标如下:
[0087] 第一直播间的用户集合为{U1、U2、U3},第二直播间的用户集合为{U1、U4},则第一直播间和第二直播间的共有用户的用户集合为{U1}。
[0088] 用户U1、U2、U3的观看次数分别为10、4、6、2次,用户U1最后观看第一直播间的最后观看时间为2018年10月10日上午10点,用户U1最后观看第二直播间的最后观看时间为2018年10月10日上午12点,权重系数δ为0.5,则:
[0089]
[0090]
[0091]
[0092]
[0093] 第一直播间和第二直播间的相似度为:
[0094]
[0095] 计算得到的相似度越大,说明第一直播间和第二直播间越相似。
[0096] 本发明实施例对直播间计算相似度的方法,通过在直播间产生直播视频流的过程中,根据用户在直播间中观看直播视频流的用户行为生成用户行为数据流,并根据用户行为数据流更新指定的直播间指标,以便根据更新后的直播间指标计算直播间之间的相似度,解决了对直播间计算相似度的方法存在直播间之间的相似度实时性差,造成直播间之间的相似度不准确的问题,实现了采用实时数据对直播间计算相似度,使得直播间之间的相似度具有较高的实时性,能够得到直播间之间的准确相似度。
[0097] 在本发明的可选实施例中,还可以根据直播间之间的相似度进行业务处理。
[0098] 对于不同的业务,可以采用直播间之间的相似度进行不同形式的处理。
[0099] 在一种业务中,可以根据直播间之间的相似度向用户推送直播间。
[0100] 例如,在监测到用户进入直播间、用户在直播间中与主播连麦、用户在直播间中与主播对战等行为时,可以计算当前直播间与其它直播间之间的相似度,向用户展示与当前直播间相似度最高的多个直播间。
[0101] 又例如,可以将相似度最高的多个直播间展示在直播客户端页面的推荐栏中,或者是用户在直播客户端页面对直播间列表执行刷新操作后,将相似度最高的多个直播间展示在直播间列表中。由于采用实时数据对直播间计算相似度,相似度具有较高的实时性,相似度的准确性高,从而使得推荐给用户的直播间更贴近用户的需求。
[0102] 实施例三
[0103] 图3为本发明实施例的一种对直播间计算相似度的装置的结构示意图,如图3所示,该装置具体包括:
[0104] 用户行为数据流生成模块301,用于在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
[0105] 直播间指标更新模块302,用于根据所述用户行为数据流,更新指定的直播间指标;
[0106] 相似度计算模块303,用于根据更新后的直播间指标计算所述直播间之间的相似度。
[0107] 可选地,所述用户行为数据流生成模块301包括:
[0108] 用户行为数据采集子模块,用于每当监测到所述用户退出所述直播间结束观看所述直播视频流时,采集与所述用户相关的用户行为数据;
[0109] 用户行为数据流生成子模块,用于按照预设数据流格式,采用所述用户行为数据生成用户行为数据流。
[0110] 可选地,所述用户行为数据包括直播间标识、用户标识、观看结束时间和观看时长,所述用户行为数据采集子模块包括:
[0111] 标识和观看结束时间获取单元,用于获取所述直播间的直播间标识、所述用户的用户标识、所述用户结束观看所述直播视频流的观看结束时间;
[0112] 观看时长统计单元,用于统计所述用户观看所述直播视频流的观看时长;
[0113] 所述用户行为数据流生成子模块包括:
[0114] 用户行为数据流生成单元,用于按照预设数据流格式,采用所述直播间标识、所述用户标识、所述观看结束时间和所述观看时长生成用户行为数据流。
[0115] 可选地,所述直播间指标更新模块302包括:
[0116] 用户行为数据提取子模块,用于从所述用户行为数据流中提取用户行为数据;
[0117] 用户行为数据有效性判断子模块,用于判断所述用户行为数据是否有效;
[0118] 直播间指标更新子模块,用于查找所述用户行为数据对应的直播间指标,并根据所述用户行为数据更新所述直播间指标。
[0119] 可选地,所述用户行为数据包括观看时长,所述用户行为数据有效性判断子模块包括:
[0120] 观看时长判断单元,用于判断所述观看时长是否大于预设值;
[0121] 用户行为数据有效确定单元,用于确定所述用户行为数据有效;
[0122] 用户行为数据无效确定单元,用于确定所述用户行为数据无效。
[0123] 可选地,所述用户行为数据还包括直播间标识、用户标识和观看结束时间,所述直播间指标包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,所述直播间指标更新子模块包括:
[0124] 观看次数查找单元,用于查找所述用户标识对应的观看次数;
[0125] 观看次数累加单元,用于对所述观看次数进行累加处理;
[0126] 用户集合查找单元,用于查找所述直播间标识对应的用户集合;
[0127] 用户标识写入单元,用于若所述用户标识未记录在所述用户集合中,则将所述用户标识写入所述用户集合中;
[0128] 最后观看时间查找单元,用于查找所述用户标识和所述直播间标识共同对应的最后观看时间;
[0129] 最后观看时间覆盖单元,用于采用所述观看结束时间覆盖所述最后观看时间。
[0130] 可选地,所述直播间指标包括用户观看直播间的直播视频流的观看次数、直播间的用户集合和用户结束观看直播间的直播视频流的最后观看时间,所述相似度计算模块303包括:
[0131] 直播间选取子模块,用于从所述直播间中选取第一直播间和第二直播间;
[0132] 用户集合获取子模块,用于从所述直播间指标中获取所述第一直播间的第一用户集合和所述第二直播间的第二用户集合;
[0133] 第三用户集合确定子模块,用于基于所述第一用户集合和所述第二用户集合,确定共同观看所述第一直播间的直播视频流和所述第二直播间的直播视频流的第三用户集合;
[0134] 最后观看时间获取子模块,用于获取所述第三用户集合中的每个用户的第一最后观看时间和第二最后观看时间,其中,所述第一最后观看时间为所述用户观看所述第一直播间的直播视频流的最后观看时间,所述第二最后观看时间为所述用户观看所述第二直播间的直播视频流的最后观看时间;
[0135] 观看次数获取子模块,用于获取所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数;
[0136] 相似度计算子模块,用于基于所述第三用户集合中的每个用户观看所述直播间的直播视频流的观看次数,以及所述第三用户集合中的每个用户的所述第一最后观看时间和所述第二最后观看时间,计算所述第一直播间和所述第二直播间之间的相似度。
[0137] 可选地,还包括:
[0138] 业务处理模块,用于根据所述直播间之间的相似度进行业务处理。
[0139] 本发明实施例所提供的对直播间计算相似度的装置可执行本发明任意实施例所提供的对直播间计算相似度的方法,具备执行方法相应的功能模块和有益效果。
[0140] 实施例四
[0141] 图4为本发明实施例四提供的一种设备的结构示意图,如图4所示,该设备包括处理器400、存储器401、输入装置402和输出装置403;设备中处理器400的数量可以是一个或多个,图4中以一个处理器400为例;设备中的处理器400、存储器401、输入装置402和输出装置403可以通过总线或其他方式连接,图4中以通过总线连接为例。
[0142] 存储器401作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的对直播间计算相似度的方法对应的程序指令/模块(例如,对直播间计算相似度的装置中的用户行为数据流生成模块301、直播间指标更新模块302和相似度计算模块303)。处理器400通过运行存储在存储器401中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的对直播间计算相似度的方法。
[0143] 存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器401可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器401可进一步包括相对于处理器400远程设置的存储器,这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0144] 输入装置402可用于接收输入的数字或字符信息,以及产生与设备/终端/服务器的用户设置以及功能控制有关的键信号输入。输出装置403可包括显示屏等显示设备。
[0145] 实施例五
[0146] 本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种对直播间计算相似度的方法,该方法包括:
[0147] 在直播间产生直播视频流的过程中,根据用户在所述直播间中观看所述直播视频流的用户行为生成用户行为数据流;
[0148] 根据所述用户行为数据流,更新指定的直播间指标;
[0149] 根据更新后的直播间指标计算所述直播间之间的相似度。
[0150] 当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的对直播间计算相似度的方法中的相关操作.
[0151] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0152] 值得注意的是,上述对直播间计算相似度的装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0153] 注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈