专利汇可以提供一种用户兴趣分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了数据分类技术领域的种用户兴趣分类方法,使用UCB方法来计算用户的兴趣偏好,是在近实时的情况下进行计算,借助 大数据 工具Spark Streaming系统+Kafka系统+Hbase系统来搭建整个计算流程,本发明通过UCB 算法 来构建置信区间曲线,通过实际的反馈不断重新计算UCB的值,以达到动态调整置信区间曲线,使其不断拟合趋近于真实的概率分布曲线,某个类别的UCB的值越大,代表用户更喜欢这个类别,使用UCB方法来计算用户的兴趣偏好,对用户对歌曲的兴趣偏好进行分类,方便根据用户的兴趣进行偏好歌曲的推送,以及 服务器 数据的更新。,下面是一种用户兴趣分类方法专利的具体信息内容。
1.一种用户兴趣分类方法,其特征在于:使用UCB方法来计算用户的兴趣偏好,是在近实时的情况下进行计算,借助大数据工具Spark Streaming系统+Kafka系统+Hbase系统来搭建整个计算流程,整个计算流程步骤如下:
S1:服务器通过Kafka系统将原始数据收据,并通过Kafka系统传输到下游;
S2:通过Spark Streaming系统接收步骤S1中Kafka系统传输下来的数据,并将传输下来的数据解析聚合成计算机语言的数据格式,再通过Kafka系统传输到下游;
S3:下游通过Spark Streaming系统接收步骤S2中Kafka系统传输下来的解析合成数据,首先对传输下来的解析合成数据进行解析,实时统计当前批次用户的各个类别的曝光次数分布、播放次数分布,并且获取当前批次用户在Hbase系统已经存储的各个类别的历史曝光次数分布、历史播放次数分布,代入UCB公式,得到当前批次用户的各个类别UCB的最新值;
S4:将步骤S3中计算后得出的当前批次的用户的最新的各个类别的曝光次数分布、播放次数分布、UCB分值进行分类,同步更新到Hbase系统中,方便服务器根据用户的兴趣进行分类推送。
2.根据权利要求1所述的一种用户兴趣分类方法,其特征在于:所述Kafka系统是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。
3.根据权利要求1所述的一种用户兴趣分类方法,其特征在于:所述Spark Streaming系统对于Spark核心API的拓展,从而支持对于实时数据流的可拓展,高吞吐量和容错性流处理,所述Spark Streaming系统接收到实时数据流同时将其划分为分批,这些数据的分批将会被Spark的引擎所处理从而生成同样按批次形式的最终流。
4.根据权利要求3所述的一种用户兴趣分类方法,其特征在于:所述Spark是专为大规模数据处理而设计的快速通用的计算引擎,所述API是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。
5.根据权利要求1所述的一种用户兴趣分类方法,其特征在于:所述Hbase系统是一个分布式的、面向列的开源数据库,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。
6.根据权利要求5所述的一种用户兴趣分类方法,其特征在于:所述PCServer是电脑服务器,是指网络中能对其它机器提供某些服务的计算机系统。
7.根据权利要求1所述的一种用户兴趣分类方法,其特征在于:所述UCB公式为整个公式由两部分组成收益+探索两部分组
成,前者是倾向于推荐当前平均播放收益大的类别的音频产品,后者是倾向于推荐曝光次数相对较少的类别的音频产品。
8.根据权利要求7所述的一种用户兴趣分类方法,其特征在于:所述PCj和PHj为用户在类别j的当前批次的播放次数和历史播放次数,PC和PH为用户当前批次所有类别的播放次数和所有类别的历史播放次数,VCj和VHj为用户在类别j的当前批次的曝光次数和历史曝光次数,VC和VH为用户当前批次所有类别的曝光次数和所有类别的曝光播放次数,参数β控制收益部分和探索部分的比重。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
固化修复树脂 | 2020-05-08 | 520 |
经修饰的膜型丝氨酸蛋白酶1(MTSP-1)多肽及其使用方法 | 2020-05-08 | 573 |
一种钓鱼网站检测方法、装置和存储介质 | 2020-05-08 | 814 |
麦克风组件及电子设备 | 2020-05-08 | 656 |
船舶用柴油发动机 | 2020-05-08 | 722 |
一种电子设备用散热装置 | 2020-05-08 | 231 |
修改音频对象的风格的方法、以及对应电子装置、计算机可读程序产品和计算机可读存储介质 | 2020-05-08 | 578 |
使用横向推进和垂直移动控制飞行器的系统和方法 | 2020-05-08 | 575 |
暖通空调系统及其控制方法 | 2020-05-08 | 223 |
激光电视的滤网固定结构及激光电视机 | 2020-05-08 | 246 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。