首页 / 专利库 / 人工智能 / 关联性分析 / 基于图像识别的商品信息分析方法、系统及存储介质

基于图像识别的商品信息分析方法、系统及存储介质

阅读:1010发布:2020-06-02

专利汇可以提供基于图像识别的商品信息分析方法、系统及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了基于 图像识别 的商品信息分析方法、系统及存储介质,方法包括:根据获取的商品图像信息构建商品 数据库 ;通过挖掘到的商品关联信息,创建语义模型;分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射;根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;根据商品编码进行数据分析,生成商品信息分析结果。本发明能够将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格,提高了图像匹配的准确率,能够提高对商品图像信息进行数据分析的 精度 ,得到更加准确有用的分析结果,可广泛应用于图像识别技术领域。,下面是基于图像识别的商品信息分析方法、系统及存储介质专利的具体信息内容。

1.基于图像识别的商品信息分析方法,其特征在于:包括以下步骤:
根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
通过挖掘到的商品关联信息,创建语义模型;
分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
2.根据权利要求1所述的基于图像识别的商品信息分析方法,其特征在于:所述根据获取的商品图像信息构建商品数据库这一步骤,包括以下步骤:
通过店面的拍照设备,获取不同店面的商品图像信息,建立以店面为单位的店面数据集;其中,所述商品图像信息包括商品样本信息、商品价格标签信息、商品货架信息;
对店面数据集进行图像分割,得到商品类别;
根据商品类别,获取商品图像信息中的商品名称特征信息、商品价格标签特征信息和商品货架特征信息;
对商品名称特征信息、商品价格标签特征信息和商品货架特征信息进行特征过滤,提取文字信息、数字信息和不规则字体信息;
根据提取到的文字信息、数字信息和不规则字体信息,搭建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库。
3.根据权利要求1所述的基于图像识别的商品信息分析方法,其特征在于:所述通过挖掘到的商品关联信息,创建语义模型这一步骤,包括以下步骤:
获取市场上流通的商品关联信息,并将商品关联信息作为原语义训练集;所述商品关联信息包括商品俗称、商品别名和商品规格;
统计原语义训练集中各组训练集的词汇出现频率,并将出现频率最高的词汇作为各组训练集的标准化词汇;
计算每组训练集中每个词汇与该组的标准化词汇之间的向量余弦值;
根据向量余弦值的计算结果,优化标准化词汇;
根据优化得到的标准化词汇,构建得到语义模型。
4.根据权利要求1所述的基于图像识别的商品信息分析方法,其特征在于:所述分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格这一步骤,包括以下步骤:
根据商品样本数据库、商品价格数据库和商品货架数据库中的文字信息,确定标准化对象;所述标准化对象包括商品名称、商品价格标签和商品货架;
将标准化对象映射到高维向量;
将标准化对象的高维向量与标准化词汇的高维向量进行匹配,计算标准化对象与标准化词汇之间的余弦值;
根据计算得到的余弦值,确定标准化对象对应的标准化词汇。
5.根据权利要求1所述的基于图像识别的商品信息分析方法,其特征在于:所述根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码这一步骤,包括以下步骤:
将商品样本数据库、商品价格数据库和商品货架数据库中同一个商品的标准商品名称和标准商品价格进行匹配,得到含有标准商品名称、标准商品价格以及标准商品货架的商品关联体系;
根据商品关联体系,对每一个商品生成唯一的商品编码;
根据商品编码,对不同店面以及不同时段的商品信息进行汇总,生成商品实时信息表;
其中,所述商品编码的构成格式为:商品大类+商品小类+商品名称+商品价格;
所述商品实时信息表的内容包括商品编码、时段、商品样本信息、商品价格信息以及商品货架信息。
6.根据权利要求5所述的基于图像识别的商品信息分析方法,其特征在于:所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,包括以下步骤:
根据商品实时信息表,将同一商品编码的商品进行归类;
对每类商品的折扣前价格、折后价格、优惠度进行对比,生成商品价格对比表;
所述商品价格对比表的内容包括商品编码、商品名称、商品规格、各店面的商品价格、最优惠价格以及最优惠店面。
7.根据权利要求6所述的基于图像识别的商品信息分析方法,其特征在于:所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,还包括以下步骤:
计算货架上商品与货架面积的占比和货架空余面积占比,确定货架上的待补给商品数量;
根据商品名称信息和商品货架信息,生成放错货架位置的商品数量,并查找商品的正确位置;
根据商品实时信息表,统计商品在不同时段的销售数量和销售速度,生成不同商品之间的关联性,进而确定商品的最优摆放位置。
8.基于图像识别的商品信息分析系统,其特征在于:包括:
数据库构建模,用于根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
模型创建模块,用于通过挖掘到的商品关联信息,创建语义模型;
数据处理模块,用于分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
编码生成模块,用于根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
数据分析模块,用于根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
9.基于图像识别的商品信息分析系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7中任一项所述的基于图像识别的商品信息分析方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-7中任一项所述的基于图像识别的商品信息分析方法。

说明书全文

基于图像识别的商品信息分析方法、系统及存储介质

技术领域

[0001] 本发明涉及图像识别技术领域,尤其是基于图像识别的商品信息分析方法、系统及存储介质。

背景技术

[0002] 现有技术利用图像识别方法对商品、商品价格标签、商品货架都有进行识别研究,例如申请号为“CN107045641A”的中国专利申请文件中公开了一种基于图像识别技术的货架识别方法,该方法基于深度学习的图像识别智能技术,能快速、准确地识别货架图片中的信息并统计,避免了人工现场核查的麻烦,能在短时间内掌握多个铺面的排货情况。申请号为“CN108364005A”的中国专利申请文件中公开了一种价格标签的自动识别方法、系统、设备及存储介质,该方法通过采集货架及商品的图像,识别图像上商品的条形码中商品名称和价格标签区域中文字信息的商品名称,从而便于将价格标签区域与图像上的商品进行一一对应,以形成数据库,便于商品的管理。
[0003] 由于主观因素(书写习惯、对物品的认知等)和客观因素(商品规格多样性、标签的大小、促销度),导致不同的店面价格标签对商品命名和描述存在差异,价格的书写不规范,价格多样性等,不利于不同店面中商品价格的汇总、分析对比。例如“一种价格标签的自动识别方法、系统、设备及存储介质”通过识别图像上的价格标签区域,从而便于将价格标签区域名称与图像上的商品名称进行匹配,但并没有对价格标签进行修正并标准化,导致匹配结果不够准确。

发明内容

[0004] 有鉴于此,本发明实施例提供一种准确率高的,基于图像识别的商品信息分析方法、系统及存储介质。
[0005] 第一方面,本发明实施例提供了一种基于图像识别的商品信息分析方法,包括以下步骤:
[0006] 根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
[0007] 通过挖掘到的商品关联信息,创建语义模型;
[0008] 分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
[0009] 根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
[0010] 根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
[0011] 进一步,所述根据获取的商品图像信息构建商品数据库这一步骤,包括以下步骤:
[0012] 通过店面的拍照设备,获取不同店面的商品图像信息,建立以店面为单位的店面数据集;其中,所述商品图像信息包括商品样本信息、商品价格标签信息、商品货架信息;
[0013] 对店面数据集进行图像分割,得到商品类别;
[0014] 根据商品类别,获取商品图像信息中的商品名称特征信息、商品价格标签特征信息和商品货架特征信息;
[0015] 对商品名称特征信息、商品价格标签特征信息和商品货架特征信息进行特征过滤,提取文字信息、数字信息和不规则字体信息;
[0016] 根据提取到的文字信息、数字信息和不规则字体信息,搭建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库。
[0017] 进一步,所述通过挖掘到的商品关联信息,创建语义模型这一步骤,包括以下步骤:
[0018] 获取市场上流通的商品关联信息,并将商品关联信息作为原语义训练集;所述商品关联信息包括商品俗称、商品别名和商品规格;
[0019] 统计原语义训练集中各组训练集的词汇出现频率,并将出现频率最高的词汇作为各组训练集的标准化词汇;
[0020] 计算每组训练集中每个词汇与该组的标准化词汇之间的向量余弦值;
[0021] 根据向量余弦值的计算结果,优化标准化词汇;
[0022] 根据优化得到的标准化词汇,构建得到语义模型。
[0023] 进一步,所述分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格这一步骤,包括以下步骤:
[0024] 根据商品样本数据库、商品价格数据库和商品货架数据库中的文字信息,确定标准化对象;所述标准化对象包括商品名称、商品价格标签和商品货架;
[0025] 将标准化对象映射到高维向量;
[0026] 将标准化对象的高维向量与标准化词汇的高维向量进行匹配,计算标准化对象与标准化词汇之间的余弦值;
[0027] 根据计算得到的余弦值,确定标准化对象对应的标准化词汇。
[0028] 进一步,所述根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码这一步骤,包括以下步骤:
[0029] 将商品样本数据库、商品价格数据库和商品货架数据库中同一个商品的标准商品名称和标准商品价格进行匹配,得到含有标准商品名称、标准商品价格以及标准商品货架的商品关联体系;
[0030] 根据商品关联体系,对每一个商品生成唯一的商品编码;
[0031] 根据商品编码,对不同店面以及不同时段的商品信息进行汇总,生成商品实时信息表;
[0032] 其中,所述商品编码的构成格式为:商品大类+商品小类+商品名称+商品价格;
[0033] 所述商品实时信息表的内容包括商品编码、时段、商品样本信息、商品价格信息以及商品货架信息。
[0034] 进一步,所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,包括以下步骤:
[0035] 根据商品实时信息表,将同一商品编码的商品进行归类;
[0036] 对每类商品的折扣前价格、折后价格、优惠力度进行对比,生成商品价格对比表;
[0037] 所述商品价格对比表的内容包括商品编码、商品名称、商品规格、各店面的商品价格、最优惠价格以及最优惠店面。
[0038] 进一步,所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,还包括以下步骤:
[0039] 计算货架上商品与货架面积的占比和货架空余面积占比,确定货架上的待补给商品数量;
[0040] 根据商品名称信息和商品货架信息,生成放错货架位置的商品数量,并查找商品的正确位置;
[0041] 根据商品实时信息表,统计商品在不同时段的销售数量和销售速度,生成不同商品之间的关联性,进而确定商品的最优摆放位置。
[0042] 第二方面,本发明实施例还提供了一种基于图像识别的商品信息分析系统,包括:
[0043] 数据库构建模,用于根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
[0044] 模型创建模块,用于通过挖掘到的商品关联信息,创建语义模型;
[0045] 数据处理模块,用于分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
[0046] 编码生成模块,用于根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
[0047] 数据分析模块,用于根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
[0048] 第三方面,本发明实施例还提供了一种基于图像识别的商品信息分析系统,包括:
[0049] 至少一个处理器;
[0050] 至少一个存储器,用于存储至少一个程序;
[0051] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于图像识别的商品信息分析方法。
[0052] 第四方面,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于图像识别的商品信息分析方法。
[0053] 上述本发明实施例中的一个或多个技术方案具有如下优点:本发明的实施例通过创建语义模型,将构建的商品数据库与语义模型进行映射,能够将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格,提高了图像匹配的准确率,能够提高后续对商品图像信息进行数据分析的精度,得到更加准确有用的分析结果。附图说明
[0054] 图1为本发明实施例的步骤流程图

具体实施方式

[0055] 下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0056] 参照图1,本发明实施例提供了一种基于图像识别的商品信息分析方法,包括以下步骤:
[0057] 根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
[0058] 通过挖掘到的商品关联信息,创建语义模型;
[0059] 分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
[0060] 根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
[0061] 根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
[0062] 进一步作为优选的实施方式,所述根据获取的商品图像信息构建商品数据库这一步骤,包括以下步骤:
[0063] 通过店面的拍照设备,获取不同店面的商品图像信息,建立以店面为单位的店面数据集;其中,所述商品图像信息包括商品样本信息、商品价格标签信息、商品货架信息;
[0064] 对店面数据集进行图像分割,得到商品类别;
[0065] 根据商品类别,获取商品图像信息中的商品名称特征信息、商品价格标签特征信息和商品货架特征信息;
[0066] 对商品名称特征信息、商品价格标签特征信息和商品货架特征信息进行特征过滤,提取文字信息、数字信息和不规则字体信息;
[0067] 根据提取到的文字信息、数字信息和不规则字体信息,搭建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库。
[0068] 进一步作为优选的实施方式,所述通过挖掘到的商品关联信息,创建语义模型这一步骤,包括以下步骤:
[0069] 获取市场上流通的商品关联信息,并将商品关联信息作为原语义训练集;所述商品关联信息包括商品俗称、商品别名和商品规格;
[0070] 统计原语义训练集中各组训练集的词汇出现频率,并将出现频率最高的词汇作为各组训练集的标准化词汇;
[0071] 计算每组训练集中每个词汇与该组的标准化词汇之间的向量余弦值;
[0072] 根据向量余弦值的计算结果,优化标准化词汇;
[0073] 根据优化得到的标准化词汇,构建得到语义模型。
[0074] 进一步作为优选的实施方式,所述分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格这一步骤,包括以下步骤:
[0075] 根据商品样本数据库、商品价格数据库和商品货架数据库中的文字信息,确定标准化对象;所述标准化对象包括商品名称、商品价格标签和商品货架;
[0076] 将标准化对象映射到高维向量;
[0077] 将标准化对象的高维向量与标准化词汇的高维向量进行匹配,计算标准化对象与标准化词汇之间的余弦值;
[0078] 根据计算得到的余弦值,确定标准化对象对应的标准化词汇。
[0079] 进一步作为优选的实施方式,所述根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码这一步骤,包括以下步骤:
[0080] 将商品样本数据库、商品价格数据库和商品货架数据库中同一个商品的标准商品名称和标准商品价格进行匹配,得到含有标准商品名称、标准商品价格以及标准商品货架的商品关联体系;
[0081] 根据商品关联体系,对每一个商品生成唯一的商品编码;
[0082] 根据商品编码,对不同店面以及不同时段的商品信息进行汇总,生成商品实时信息表;
[0083] 其中,所述商品编码的构成格式为:商品大类+商品小类+商品名称+商品价格;
[0084] 所述商品实时信息表的内容包括商品编码、时段、商品样本信息、商品价格信息以及商品货架信息。
[0085] 进一步作为优选的实施方式,所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,包括以下步骤:
[0086] 根据商品实时信息表,将同一商品编码的商品进行归类;
[0087] 对每类商品的折扣前价格、折后价格、优惠力度进行对比,生成商品价格对比表;
[0088] 所述商品价格对比表的内容包括商品编码、商品名称、商品规格、各店面的商品价格、最优惠价格以及最优惠店面。
[0089] 进一步作为优选的实施方式,所述根据商品编码进行数据分析,生成商品信息分析结果这一步骤,还包括以下步骤:
[0090] 计算货架上商品与货架面积的占比和货架空余面积占比,确定货架上的待补给商品数量;
[0091] 根据商品名称信息和商品货架信息,生成放错货架位置的商品数量,并查找商品的正确位置;
[0092] 根据商品实时信息表,统计商品在不同时段的销售数量和销售速度,生成不同商品之间的关联性,进而确定商品的最优摆放位置。
[0093] 与图1的方法相对应,本发明实施例还提供了一种基于图像识别的商品信息分析系统,
[0094] 包括:
[0095] 数据库构建模块,用于根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
[0096] 模型创建模块,用于通过挖掘到的商品关联信息,创建语义模型;
[0097] 数据处理模块,用于分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
[0098] 编码生成模块,用于根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
[0099] 数据分析模块,用于根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
[0100] 与图1的方法相对应,本发明实施例还提供了一种基于图像识别的商品信息分析系统,包括:
[0101] 至少一个处理器;
[0102] 至少一个存储器,用于存储至少一个程序;
[0103] 当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于图像识别的商品信息分析方法。
[0104] 与图1的方法相对应,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于图像识别的商品信息分析方法。
[0105] 下面详细描述本发明一种基于图像识别的商品信息分析方法的具体实施步骤:
[0106] S1、根据获取的商品图像信息构建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库;
[0107] 具体的,所述步骤S1包括:
[0108] S11、通过店面的拍照设备,获取不同店面的商品图像信息,建立以店面为单位的店面数据集;其中,所述商品图像信息包括商品样本信息、商品价格标签信息、商品货架信息;
[0109] 本实施例通过店面的拍照设备,快速地获取不同店面所有的商品信息图像,包括商品样本信息、商品价格标签信息(包括促销牌)、商品货架信息,以店面为单位,建立不同店面数据集。
[0110] S12、对店面数据集进行图像分割,得到商品类别;
[0111] S13、根据商品类别,获取商品图像信息中的商品名称特征信息、商品价格标签特征信息和商品货架特征信息;
[0112] S14、对商品名称特征信息、商品价格标签特征信息和商品货架特征信息进行特征过滤,提取文字信息、数字信息和不规则字体信息;
[0113] S15、根据提取到的文字信息、数字信息和不规则字体信息,搭建商品数据库,所述商品数据库包括商品样本数据库、商品价格数据库和商品货架数据库。
[0114] 本实施例利用图像识别技术,将不同店面的数据集,例如超市的数据集supermarkets(n)里面的图像分别进行分割,按商品的样本、价格标签、货架分离,将不同类的商品进行识别分类。获取商品样本的外观特征或商品包装外观特征信息,获取商品价格标签和货架的特征信息。对特征信息进行过滤,提取包括文字(商品名称、商品别名等)、数字(包装规格等)或其他不规则字体(拼音、英文等其他语言文字)等图像信息,分别搭建商品样本数据库(包含但不限于:商品名称+商品规格+体积)、商品价格数据库(包含但不限于:商品名称+商品规格+商品折扣前价格+折后价格)、商品货架数据库(包含但不限于:商品名称+商品规格+货架体积+货架层数+货架位置)。
[0115] S2、通过挖掘到的商品关联信息,创建语义模型;
[0116] 在很多情况下,直接计算词语之间的相似度非常困难,而本实施例的原语义—标准化语义关系模型是基于余弦相似度算法搭建。余弦相似度算法是目前基于统计的词语相似度计算中使用比较广泛的一种,该算法是通过大量语料的训练,将每一个词语映射到高维度的向量当中,通过求余弦的方式,计算这一组特征词(在实际大规模语料中出现频率最高的词汇)向量与每个词向量的余弦值,这个余弦值就是这个词与这组特征词的相似度。
[0117] 具体地,所述步骤S2包括:
[0118] S21、获取市场上流通的商品关联信息,并将商品关联信息作为原语义训练集;所述商品关联信息包括商品俗称、商品别名和商品规格;
[0119] 在本实施例中,通过线上爬虫技术,实体店面商品信息库,社会调查问卷,政府发布的商品信息等方式获取市面上已流通的商品相关信息(包括商品的俗称、别名、规格)作为原语义训练集。
[0120] S22、统计原语义训练集中各组训练集的词汇出现频率,并将出现频率最高的词汇作为各组训练集的标准化词汇;
[0121] 本实施例对原语义训练集进行标准化词汇提炼,即把每组出现频率最高的词汇作为这个组的标准化词汇(包括商品名称、商品规格、商品价格)。
[0122] S23、计算每组训练集中每个词汇与该组的标准化词汇之间的向量余弦值;
[0123] 本实施例将每组每一个词汇(包括标准化词汇)映射到高维度的向量当中,计算每组中每个词汇向量与标准化词汇的向量的余弦值,余弦值越大,相似度越高,当余弦值为1,则相似度高度一致。
[0124] S24、根据向量余弦值的计算结果,优化标准化词汇;
[0125] 本实施例确定一个阈值,当余弦值低于这个阈值时,对词汇进行人工检验修正,继续优化原语义—标准化语义关系模型。
[0126] S25、根据优化得到的标准化词汇,构建得到语义模型。
[0127] S3、分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,以将商品数据库中的商品名称转换成标准商品名称,并将商品数据库中的商品价格转换成标准商品价格;
[0128] 本实施例分别将商品样本数据库、商品价格数据库和商品货架数据库与语义模型进行映射,计算三个数据库商品信息与语义模型原语义相似度。选取相似度高的信息进行匹配汇总,三个数据库得到商品名称标准词汇和商品的标准规格,价格标准化和折扣标准化。
[0129] 然后将三个数据库中相似度低的信息选取出来,加上人工修正,重新提炼信息和优化语义模型,重新映射和计算相似度并进行标准化整理
[0130] 具体地,所述步骤S3包括:
[0131] S31、根据商品样本数据库、商品价格数据库和商品货架数据库中的文字信息,确定标准化对象;所述标准化对象包括商品名称、商品价格标签和商品货架;
[0132] S32、将标准化对象映射到高维向量;
[0133] S33、将标准化对象的高维向量与标准化词汇的高维向量进行匹配,计算标准化对象与标准化词汇之间的余弦值;
[0134] S34、根据计算得到的余弦值,确定标准化对象对应的标准化词汇。
[0135] 下面举例说明本实施例计算三个数据库商品信息与语义模型原语义相似度的过程:
[0136] 1、例如提取商品样本信息数据库中某个识别到的商品名称A1,将其映射到高维向量[0,0,1,2,1];
[0137] 2、与原语义—标准化语义关系模型中的标准化词汇的高维向量进行匹配,例如标准词汇为B1[1,1,0,0,1]、B2[0,0,1,2,0];
[0138] 3、计算商品A1与标准词汇B1、B2的余弦值,其中高维空间余弦公式如下:
[0139]
[0140] 则
[0141] 同理,
[0142] 4、向量空间中两个向量夹间的余弦值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于0,表明两个向量越相似。由上可知,A1与B1的余弦值约为0.24,A1B2的余弦值约为0.91。对于商品A1来说,与标准词汇B2的余弦值最大,商品A1名称与词汇B2最相似,则B2是商品A1的标准词汇。
[0143] 5、当三个数据库文本信息中最大余弦值都小于某个阈值,将其选取出来,加上人工修正,重新提炼信息和优化语义模型,重新映射和计算余弦值,并进行标准化整理。
[0144] S4、根据标准商品名称和标准商品价格,对商品样本数据库、商品价格数据库和商品货架数据库进行关联,生成商品编码;
[0145] 具体地,所述步骤S4包括:
[0146] S41、将商品样本数据库、商品价格数据库和商品货架数据库中同一个商品的标准商品名称和标准商品价格进行匹配,得到含有标准商品名称、标准商品价格以及标准商品货架的商品关联体系;
[0147] 本实施例实时收集到三个数据库的信息标准化之后,将同一个商品有相同的标准化名称和标准化规格进行匹配,使得三个数据库的数据关联成含有商品信息、货架信息、价格标签信息的一个完整的体系。
[0148] S42、根据商品关联体系,对每一个商品生成唯一的商品编码;
[0149] 本发明为了能将商品快速定位和便于统计分析,将产生一个与市面上流通的商品编码不一样的、可识别、便于统计的商品编码标识key。因为数字型编码结构简单,使用方便,便于计算机识别和计算,利于后期的统计分析,所以本发明商品编码标识key的构成规则是:大类(XX)+小类(XXX)+商品名称(XXXXX)+商品规格(XXXX),其中“X”用阿拉伯数字0-9表示,大类和小类的分类按照国家统计局商品分类标准。每个key将代表同种商品每个规格的唯一标识。
[0150] S43、根据商品编码,对不同店面以及不同时段的商品信息进行汇总,生成商品实时信息表;
[0151] 本发明对不同个店面的商品按照商品编码标识构成规则生成唯一标识,根据商品编码标识key,将不同店面、不同时段的商品信息进行汇总,形成所有商品实时基本信息表。
[0152] 其中,所述商品编码的构成格式为:商品大类+商品小类+商品名称+商品价格;
[0153] 所述商品实时信息表的内容包括商品编码、时段、商品样本信息、商品价格信息以及商品货架信息。
[0154] S5、根据商品编码进行数据分析,生成商品信息分析结果;所述商品信息分析结果包括不同商家的商品价格对比结果、货架上的待补给商品数量以及不同商品之间的关联性。
[0155] 具体地,所述步骤S5包括以下步骤:
[0156] S51、根据商品实时信息表,将同一商品编码的商品进行归类;
[0157] S52、对每类商品的折扣前价格、折后价格、优惠力度进行对比,生成商品价格对比表;
[0158] 所述商品价格对比表的内容包括商品编码、商品名称、商品规格、各店面的商品价格、最优惠价格以及最优惠店面。
[0159] 本实施例对不同的超市数据集supermarkets(n)中同种商品的价格进行对比分析。根据商品实时基本信息表,首先把同一编码的商品进行归类,然后对每类商品的折扣前价格、折后价格、优惠力度进行对比,形成商品价格对比表(包括但不限于:商品编码+商品名称+商品规格+超市1价格+超市2价格+……+超市n价格+最优惠价格+最优惠超市);或将不同编码的商品选取出来,参考该超市的商品价格,从而进行市场拓展。
[0160] S53、计算货架上商品与货架面积的占比和货架空余面积占比,确定货架上的待补给商品数量;
[0161] 本实施例实时计算在货架上商品与货架面积占比,货架空余面积占比,计算需要补给的商品数量,快速实现商品的追加和调度。
[0162] 本实施例中,需追加商品数量=(所在货架总体积-(商品体积*货存数量))/商品体积。
[0163] 其中,需追加商品数量为理想状态数量值,当该数量值大于一个阈值,则产生预警,提醒该商品的这个规格需要追加的数量和该商品所在位置。
[0164] S54、根据商品名称信息和商品货架信息,生成放错货架位置的商品数量,并查找商品的正确位置;
[0165] 本实施例通过对比商品信息和货架信息,快速定位货架上已错位或错放的商品和商品数量,并提供一个快速查找商品正确位置的方法。
[0166] S55、根据商品实时信息表,统计商品在不同时段的销售数量和销售速度,生成不同商品之间的关联性,进而确定商品的最优摆放位置。
[0167] 本实施例统计不同时段不同商品数量,计算商品销售速度,跟踪不同商品的销售情况,分析商品销售规律,挖掘商品之间的关联性(类似啤酒和尿布之间的关系),并用不同店面数据进行验证,快速定位商品的最优摆放位置。
[0168] 本实施例中,销售速度=(上一时段货存数量+已追加商品数量-当前时段货存数量)/上一时段货存数量。
[0169] 下面以某品牌的饮料为例,收集这些饮料的图像并进行分割;使用原语义—标准化语义关系模型将其标准化;按照商品编码构成规则,生成key(例如该饮料有瓶装、罐装、盒装,每种包装有两个规格,有单卖(单瓶/单罐/单盒)和整卖(整箱),则这品牌饮料生成12个商品编码);实时记录这品牌饮料的商品信息,汇总成商品基本信息表;
[0170] 对该饮料的商品最优位置选取分析:
[0171] 1、抽取各个店面这品牌饮料12个规格每个时段的货存数量和已追加商品数量;
[0172] 2、计算这品牌饮料12个规格的销售速度(销售速度=(上一时段货存数量+已追加商品数量-当前时段货存数量)/上一时段货存数量);
[0173] 3、以时段为时间粒度,生成这品牌饮料销售速度的时间序列表
[0174] 4、根据这品牌饮料销售速度的时间序列表,进行散点图分析;
[0175] 5、以时段为时间粒度,选取销售速度相对平稳且趋势良好的规格,计算同个店面该品牌饮料规格的平均销售速度(sum(各个规格销售速度)/规格总个数);
[0176] 6、同理,获取同个店面其他商品的平均销售速度;
[0177] 7、对该品牌饮料与其他商品的平均销售速度进行相关性分析,选取相关性高的商品;
[0178] 8、同理,计算不同店面这两种商品的平均销售速度,通过分析其相关性进行验证,确定两种商品的相关性;
[0179] 9、当两种商品的相关性高,则定位该品牌饮料和该商品的货架信息(如货架的大小、货架所在位置),对这两种商品的货架位置进行调整。
[0180] 综上所述,相较于现有技术,本发明利用图像识别技术,识别店面的商品样本信息、商品价格标签信息(包括促销牌信息)、货架信息,对不同店面、不同类的商品进行分类,对同类商品进行标准化整理,对不同商品样本本身与价格标签内容进行修正、标准化、关联,对标准化的商品样本信息和商品价格标签信息、货架信息进行快速汇总、对比分析并定位商品的位置。
[0181] 本发明具有以下优点:
[0182] 1、现有技术局限于价格标签本身或商品本身进行读取和分析,并没有与对应的商品样本本身进行关联、修正,本发明基于图像识别不止对价格标签进行读取分析,也关注价格标签与商品本身之间的联系、修正,以及标准化处理,使得商品有唯一标识,有利于不同店面之间、不同类商品之间、同类商品不同规格之间的对比分析。
[0183] 2、现有技术局限于同类商品数量的识别,本发明基于图像识别全部商品信息和货架信息,分析不同不同店面不同商品的摆放规模和销售速度,从而快速实现商品的追加和调度,分析各个店面热销商品情况。
[0184] 3、现有技术针对同个店面的同类商品销售额或销售数量进行分析,本发明基于图像识别针对不同的店面不同商品销售情况和货架信息,分析商品之间关联性和商品摆放的合理性,定位最佳位置。
[0185] 本发明使得商品价格标签与商品样本本身进行关联,使得商品价格标签标准化,增强了价格标签的可读性,便于后续不同店面之间、不同类商品的区分和同类商品的关联。不同店面商品基本信息表和价格优惠表的形成,使得大家可以从不同维度快速检索所需商品。通过分析商品信息和货架信息,实现商品的补给,商品错位的纠正,商品之间关联性,商品最佳摆放位置的调整。
[0186] 在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0187] 此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0188] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0189] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0190] 计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0191] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0192] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0193] 以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈