专利汇可以提供一种基于半监督主题建模的图像标注方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于半监督主题建模的图像标注方法。本发明的方法首先从互联网上得到图像,包括已有文本标注的图像,以及未标注图像。接着利用一种类似于概率 潜在语义分析 的模型,对所有图像的视觉特征和文本标注之间的联系通过潜在主题进行建模。然后构建所有图像的最近邻图,并根据由最近邻图进行建模得到的流形结构对模型进行调整。通过期望最大化 算法 学习该模型,并分别计算各个潜在主题与图像匹配的概率。最后根据潜在主题匹配图像的概率计算每个文本标注匹配未标注图像的概率,并选择概率最高的文本标注对未标注图像进行标注。,下面是一种基于半监督主题建模的图像标注方法专利的具体信息内容。
1.一种基于半监督主题建模的图像标注方法,其特征在于:
1)从互联网上得到图像,包括已有文本标注的图像,以及未标注图像;
2)利用一种类似于概率潜在语义分析的模型,对所有图像的视觉特征和文本标注之间的联系通过潜在主题进行建模;
3)构建所有图像的最近邻图,并根据由最近邻图进行建模得到的流形结构对步骤2)的模型进行调整;
4)通过期望最大化算法学习步骤2)的模型,并分别计算各个潜在主题与图像匹配的概率;
5)根据潜在主题匹配图像的概率计算每个文本标注匹配未标注图像的概率,并选择概率最高的文本标注对未标注图像进行标注。
2.根据权利要求1所述的一种半监督下的基于主题建模的图像标注的方法,其特征在于:步骤2)中的建模过程是按照如下方式进行的:对于每个图像i,首先用向量Fi表示图像视觉特征,向量Wi来表示图像文本标注,其中Fi={f1,…,fn},其中fu表示第u个视觉特征单词在第i个图片中出现的次数;Wi={w1,…,wn},其中wv表示第v个文本标注单词在第i个图片中出现的次数。
并假设fi(其中i=1,…,n)服从多项式分布 wi(其中i=1,…,n)服从多项式分布 未标注图像Wi=0;然后用多项分布α建模图像与潜在主题Zi的关系,最后得到所有图像与潜在主题的匹配概率的对数似然为L,L的计算公式如下:
其中,I为图像总数,K为潜在主题总数,P(zk|α)表示在α分布下潜在主题zk与第i个图像匹配的概率,U为视觉特征单词总数,P(fu|zk,β)表示在β分布下视觉特征fu与潜在主题zk匹配的概率,V为图像文本特征单词总数, 表示在 分布下文本标注wv与潜在主题zk匹配的概率。
3.根据权利要求1所述的一种半监督下的基于主题建模的图像标注的方法,其特征在于:步骤3)中的最近邻图的构造方法为,所有图像构成最近邻图的点,若图像i与图像j的文本标注和视觉特征的重合度达到某个阀值,则在最近邻图中创建一条连接图像i与图像j的边。
4.根据权利要求1所述的一种半监督下的基于主题建模的图像标注的方法,其特征在于:步骤4)中使用期望最大化算法计算学习步骤2)的模型,并分别计算各个潜在主题与图像匹配的概率,以及三个多项式分布α,β,Φ。
5.根据权利要求1所述的一种半监督下的基于主题建模的图像标注的方法,其特征在于:步骤5)中利用步骤4)所得到的结果,从而获得文本标注匹配未标注图像的概率,并选取概率最大的文本标注对未标注图像进行标注,文本标注匹配未标注图像的概率P(wv)的计算公式如下:
其中,K为潜在主题总数,pki为步骤4)所得到的潜在主题与图像匹配的概率,表示在 分布下文本标注wv与潜在主题zk匹配的概率。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种低信噪比环境下的极化码辅助载波同步系统及方法 | 2020-05-16 | 583 |
一种时空数据智能聚合方法 | 2020-05-19 | 474 |
一种通用主题嵌入模型联合训练方法 | 2020-05-20 | 824 |
非临床环境下对高血压进行非干预式的监测和评估方法 | 2020-05-08 | 179 |
基于多能量系统响应矩阵的放射源定位重建方法 | 2020-05-15 | 509 |
基于时间序列分析的阀门故障实时诊断系统及诊断方法 | 2020-05-19 | 309 |
一种语音检测方法及装置 | 2020-05-19 | 599 |
用于确定PET成像动力学参数的系统、方法 | 2020-05-11 | 134 |
一种基于高维Copula技术的光伏发电爬坡事件概率预测方法 | 2020-05-18 | 131 |
图片分割方法、装置和系统 | 2020-05-13 | 108 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。