专利汇可以提供一种基于内容画像的播单评分方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于内容画像的播单评分方法,所述评分方法包括:根据音频的内容信息构建内容画像系统;根据所构建的内容画像系统构建播单画像系统,所述播单画像系统用于描述所述音频与所述播单之间的关系;基于所构建的所述内容画像系统和所述播单画像系统,通过 深度学习 算法 对所述音频的内容信息和所述播单的内容信息构建模型以完成所述播单内容的价值评估。其设计合理,可智能化的完成音频播单相关的价值评分。,下面是一种基于内容画像的播单评分方法专利的具体信息内容。
1.一种基于内容画像的播单评分方法,其特征在于,所述评分方法包括:
根据音频的内容信息构建内容画像系统;
根据所构建的内容画像系统构建播单画像系统,所述播单画像系统用于描述所述音频与所述播单之间的关系;
基于所构建的所述内容画像系统和所述播单画像系统,通过深度学习算法对所述音频的内容信息和所述播单的内容信息构建模型以完成所述播单内容的价值评估。
2.根据权利要求1所述的一种基于内容画像的播单评分方法,其特征在于,所述内容画像系统包括:
获取所述音频的历史信息;
根据所获取的音频信息,通过数据挖掘算法和数据统计算法构建所述内容画像系统。
3.根据权利要求2所述的一种基于内容画像的播单评分方法,其特征在于,所述音频的历史信息包括:
静态信息,所述静态信息包括所述音频的上传时间、所属类目和时长;
动态信息,所述动态信息包括所述音频的播放次数、播放总时长和评论数。
4.根据权利要求1所述的一种基于内容画像的播单评分方法,其特征在于,所述播单画像系统包括:
获取所述播单的历史信息;
根据所获取的播单信息,通过数据挖掘算法和数据统计算法构建所述播单画像系统。
5.根据权利要求4所述的一种基于内容画像的播单评分方法,其特征在于,其中所述播单的历史信息包括:
所述播单中的音频顺序;
所述播单中当前每个音频的曝光次数、点击次数、播放次数、完播次数、下载次数、点赞次数、正面评论数量、负面评论数量;
所述播单中音频内容的曝光率、点击率和完播放率;
距离当前时间的预设时间内,在预设时间段里每个音频的曝光次数、点击次数、播放次数、完播次数、下载次数、点赞次数、正面评论数量和负面评论数量。
6.根据权利要求5所述的一种基于内容画像的播单评分方法,其特征在于,通过所述模型对待预测播单生成统计特征和序列特征,并且将统计特征和序列特征输入模型,模型最终计算的结果是所述模型对所述待预测播单的评分。
7.根据权利要求6所述的一种基于内容画像的播单评分方法,其特征在于,所述模型的具体算法包括:
步骤S201,针对训练数据中的每个播单,使用n维向量表示每个音频在所述播单中的位置,每个音频的位置向量具体为:Flocation(n)=[x1,...,xk],其中0≦n≦k,n为每个音频在所述播单中的位置向量长度,k为位置向量长度;
步骤S202,根据所获取的每个音频的曝光次数、点击次数、播放次数、完播次数、下载次数、被点赞次数、正面评论数量和负面评论数量中每个特征分别与位置向量进行拼接,每个特征拼接位置向量后的向量作为一个field,每个field的拼接方式如下:
Ffield(n)=[Ffeature(n1),Fflocaton(n1),...,Ffeature(nk),Flocation(nk)],其中k为位置向量长度,通过计算以得到相对应的七个特征向量,每个特征向量分别为该播单针对每个原始特征的信息;
根据所获取的在预设时间段里每个音频的曝光次数、点击次数、播放次数、完播次数、下载次数、点赞次数、正面评论数量和负面评论数量中每个特征序列分别与位置向量进行拼接,每个特征拼接位置向量后的向量序列作为一个field,每个field的拼接方式如下:
Ffield_seq(n)=[Ffeature_seq(n1),Fflocaton(n1),...,Ffeature_seq(nk),Flocation(nk)]其中k为位置向量长度,通过计算以得到相对应的七个特征向量序列,每个特征向量序列分别为该播单针对每个原始特征序列的信息;
步骤S203,所述模型将步骤S202中计算所得的特征输入DNN(Deep Neural Networks深度神经网络),具体计算公式如下:
Dnn_k(Ffield(n))=[x1,x2...,xm]其中m为位置向量长度,Dnn_k为第k个feature训练的DNN模型,所述DNN模型的输入为固定维度的特征向量,维度为m,则输出为压缩后的特征向量,维度为s,s≦m,K个所述Dnn模型输出的embedding维度相同。
此外,所述模型将步骤S202中的序列特征输入Rnn(Recurrent Neural Networks循环神经网络),具体计算公式如下:
Rnn_k(Ffield_seq(n))=[x1,x2,...,xm],其中m为位置向量长度,Rnn_k为第k个feature序列训练的Rnn模型,所述Rnn模型的输入为固定维度的特征向量序列,维度为m,则输出为压缩后的特征向量,维度为s,s≦m,K个所述Rnn模型输出的embedding维度相同;
步骤S204,将步骤S203中七个DNN和七个Rnn的输出embedding按照固定顺序拼接,具体计算公式如下:
Fcombine(n)=[Dnn_0(Ffield(n)),Dnn_1(Ffield(n)),...,Dnn_k(Ffield(n)),Rnn_
0(Ffield_seq(n)),Rnn_1(Ffield_seq(n)),...,Rnn_k(Ffield_seq(n))],同时将拼接后的向量作为输入特征,输入新的DNN网络,新的DNN网络为DNN层连接sigmoid激活函数,且新DNN网络为Dnn_final(n)=sigmoid(w×Fcombine(n)+b);
步骤S205,按照步骤S204中的拼接方式进行拼接embedding向量,拼接后的向量输入fm模型,所述fm模型公式为:Yfm=
步骤S206,所述模型最终的输出计算公式为:y=sigmoid(Dnn_final(n)+Yfm),训练数据的真实标签是人工为该播单打的分数,损失函数为l2损失,参数更新使用批量下降。
8.根据权利要求1至7任一所述的一种基于内容画像的播单评分方法,其特征在于,在第一预设时间内实时动态收集所述音频的信息以再次生成所述播单中每个音频新的统计数据和序列数据,同时通过所述模型完成所述播单内容新的价值评估。
9.根据权利要求8所述的一种基于内容画像的播单评分方法,其特征在于,在第二预设时间内通过人工完成新播单内容的价值评估,并将所述新播单的评估数据添加到训练数据集以对所述模型进行微调训练。
10.根据权利要求1至7任一所述的一种基于内容画像的播单评分方法,其特征在于,所述模型采用Rnn与DeepFM的融合算法。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于数据中台的用户窃电行为分析预警方法 | 2020-05-08 | 238 |
基于大数据的抑菌物质分离纯化控制系统及方法 | 2020-05-12 | 800 |
一种spark下的机器学习快速大规模样本签名方法 | 2020-05-08 | 48 |
一种基于改进粒子群优化SVM的空气质量预测算法 | 2020-05-08 | 994 |
基于条件的多媒体影像评论数据挖掘与处理方法及系统 | 2020-05-11 | 452 |
一种基于自拍抖音视图补充公安侦查数据集的方法 | 2020-05-11 | 635 |
一种基于内容画像的播单评分方法 | 2020-05-11 | 107 |
一种对数据文件的数据清洗方法和数据文件处理方法 | 2020-05-11 | 901 |
一种用于矽钢片自动生产线的质量管控系统 | 2020-05-11 | 620 |
一种火电站金属设备大数据分析和可靠性评价管理系统 | 2020-05-08 | 744 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。