首页 / 专利库 / 人工智能 / 机器学习 / 集成学习 / 随机森林 / 一种基于特征选择的皮肤检测混合颜色空间的选取方法

一种基于特征选择的皮肤检测混合颜色空间的选取方法

阅读:992发布:2020-05-13

专利汇可以提供一种基于特征选择的皮肤检测混合颜色空间的选取方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于特征选择的 皮肤 检测混合 颜色 空间的选取方法,由于其理论完备、计算便捷,可以用来解决皮肤检测过程中颜色空间的选取问题。此外,针对传统的基于互信息的特征选择方法的不足,本发明还提出了以下两点改进:1)使用互信息缩小特征选择范围,然后选择使分类效果最佳的特征子集;2)尝试多种可能的特征子集初始化方案,然后选择其中最优的结果。实验结果和对比分析表明,使用改进后的基于互信息的特征选择方法得到的混合颜色空间,其皮肤检测效果优于传统颜色空间和已有混合颜色空间。,下面是一种基于特征选择的皮肤检测混合颜色空间的选取方法专利的具体信息内容。

1.一种基于特征选择的皮肤检测混合颜色空间的选取方法,其特征在于,包括以下步骤:
(1)获取皮肤检测数据集,其包括图片及其对应的标记信息,对该皮肤检测数据集中的所有图片进行颜色空间转换,对转换后的所有图片和对应的标记信息进行向量化处理,以得到样本矩阵和标记矩阵,并对样本矩阵中每一列的值进行归一化处理;
(2)计算归一化处理后的样本矩阵中的每一列和标记矩阵之间的互信息,将互信息结果按照从大到小的顺序进行排列;
(3)从步骤(2)中得到的排列结果中选择K个最大的互信息,对应的颜色分量作为待选集合IFS={fi,f2,…,fK},其中f表示互信息对应的颜色分量,K的取值范围是大于0,且小于等于h,其中h为自然数;
(4)设置计数器i=1;
(5)判断计数器i是否等于K+1,若等于,则转入步骤(10),然后过程结束,否则设置h个颜色分量组成的集合为U={Ui,U2,…,Uh},并转入步骤(6),其中U中的元素表示样本矩阵对应列的颜色分量;
(6)初始化颜色特征集合S为空,并将待选集合IFS中的第i个颜色分量fi加入该颜色特征集合S中,并从集合U中删除该颜色分量fi;
(7)对集合U中当前的所有元素,计算其每一个元素Um与颜色特征集合S构成的颜色特征集合{S,Um}与标记矩阵C之间的互信息I({S,Um};C),并对得到的所有互信息按照从大到小的顺序进行排列,选取其中最大的M个互信息对应的颜色分量,记为集合TFS={ft1,ft2,…,ftM},其中M取值范围是大于0,小于U中当前的所有元素的个数;
(8)对于集合TFS中的每一个元素ftp,计算分类器在颜色特征集合{S,ftp}上的分类效果,从而得到M个不同的分类结果,并选择M个分类结果中分类准确率最高的一个元素对应的颜色特征ftg,将其加入颜色特征集合S中,并从集合U中删除该颜色分量ftg;
(9)判断颜色特征集合S中当前的所有元素数量是小于还是等于阈值,如果小于则返回步骤(7),如果等于,则将此时的颜色特征集合S和其分类准确率记录在集合L中,设置i=i+
1,并返回步骤(5);
(10)从集合L所包含的K个颜色特征集合中,选择分类准确率最高的颜色特征集合,该颜色特征集合最终构成最佳的皮肤检测混合颜色空间。
2.根据权利要求1所述的选取方法,其特征在于,步骤(1)具体为,首先通过颜色空间转换将RGB颜色空间的皮肤检测数据集中的所有n个像素转换为多个颜色空间,对于每一种颜色空间,转换的结果是得到一个n行3列的矩阵,从而所有颜色空间构成n*H的矩阵,然后,去除掉H列中颜色分量重复的列,从而得到n*h的样本矩阵,同时,n个像素中,如果某个像素对应的标记信息是黑,则将该像素向量化处理后标记矩阵中该像素对应的值设置为0,否则设置为1,从而得到n*1的标记矩阵C,最后,对得到的该样本矩阵的每一列的值进行归一化处理,其中H为自然数。
3.根据权利要求1所述的选取方法,其特征在于,分类器是随机森林分类器、SVM分类器、或者贝叶斯分类器。
4.根据权利要求1所述的选取方法,其特征在于,阈值的取值范围是1到h。
5.一种基于特征选择的皮肤检测混合颜色空间的选取系统,其特征在于,包括以下步骤:
第一模,用于获取皮肤检测数据集,其包括图片及其对应的标记信息,对该皮肤检测数据集中的所有图片进行颜色空间转换,对转换后的所有图片和对应的标记信息进行向量化处理,以得到样本矩阵和标记矩阵,并对样本矩阵中每一列的值进行归一化处理;
第二模块,用于计算归一化处理后的样本矩阵中的每一列和标记矩阵之间的互信息,将互信息结果按照从大到小的顺序进行排列;
第三模块,用于从第二模块中得到的排列结果中选择K个最大的互信息,对应的颜色分量作为待选集合IFS={fi,f2,…,fK},其中f表示互信息对应的颜色分量,K的取值范围是大于0,且小于等于h;
第四模块,用于设置计数器i=1;
第五模块,用于判断计数器i是否等于K+1,若等于,则转入第十模块,然后过程结束,否则设置h个颜色分量组成的集合为U={Ui,U2,…,Uh},并转入第六模块,其中U中的元素表示样本矩阵对应列的颜色分量;
第六模块,用于初始化颜色特征集合S为空,并将待选集合IFS中的第i个颜色分量fi加入该颜色特征集合S中,并从集合U中删除该颜色分量fi;
第七模块,用于对集合U中当前的所有元素,计算其每一个元素Um与颜色特征集合S构成的颜色特征集合{S,Um}与标记矩阵C之间的互信息I({S,Um};C),并对得到的所有互信息按照从大到小的顺序进行排列,选取其中最大的M个互信息对应的颜色分量,记为集合TFS={ft1,ft2,…,ftM},其中M取值范围是大于0,小于U中当前的所有元素的个数;
第八模块,用于对于集合TFS中的每一个元素ftp,计算分类器在颜色特征集合{S,ftp}上的分类效果,从而得到M个不同的分类结果,并选择M个分类结果中分类准确率最高的一个元素对应的颜色特征ftg,将其加入颜色特征集合S中,并从集合U中删除该颜色分量ftg;
第九模块,用于判断颜色特征集合S中当前的所有元素数量是小于还是等于阈值,如果小于则返回第七模块,如果等于,则将此时的颜色特征集合S和其分类准确率记录在集合L中,设置i=i+1,并返回第五模块;
第十模块,用于从集合L所包含的K个颜色特征集合中,选择分类准确率最高的颜色特征集合,该颜色特征集合最终构成最佳的皮肤检测混合颜色空间。

说明书全文

一种基于特征选择的皮肤检测混合颜色空间的选取方法

技术领域

[0001] 本发明属于机器学习技术领域,更具体地,涉及一种基于特征选择的皮肤检测混合颜色空间的选取方法。

背景技术

[0002] 皮肤检测在很多图像处理相关的应用中扮演着非常重要的色,例如在人脸检测、人脸跟踪手势识别、图像检索和各种人机交互过程中,皮肤检测都是作为重要的预处理步骤。近年来,随着机器学习技术的兴起,基于像素的皮肤检测方法开始大量涌现。这些利用机器学习技术,基于像素的皮肤检测方法,其主要特点在于,在特定的颜色空间中,对皮肤、非皮肤两类像素进行分类。很多研究者在进行皮肤检测之前,都会将数据从RGB颜色空间转换到特定的颜色空间,以减少皮肤、非皮肤两类数据在特征空间中的重叠,从而提高分类器的准确率。
[0003] 然而,现有的皮肤检测方法,其普遍存在的问题在于,其皮肤检测的准确率偏低。

发明内容

[0004] 针对现有技术的以上缺陷或改进需求,本发明提供了一种基于特征选择的皮肤检测混合颜色空间的选取方法和系统,其目的在于,解决现有皮肤检测方法中存在的皮肤检测准确率低的技术问题。
[0005] 为实现上述目的,按照本发明的一个方面,提供了一种基于特征选择的皮肤检测混合颜色空间的选取方法,包括以下步骤:
[0006] (1)获取皮肤检测数据集,其包括图片及其对应的标记信息,对该皮肤检测数据集中的所有图片进行颜色空间转换,对转换后的所有图片和对应的标记信息进行向量化处理,以得到样本矩阵和标记矩阵,并对样本矩阵中每一列的值进行归一化处理;
[0007] (2)计算归一化处理后的样本矩阵中的每一列和标记矩阵之间的互信息,将互信息结果按照从大到小的顺序进行排列;
[0008] (3)从步骤(2)中得到的排列结果中选择K个最大的互信息,对应的颜色分量作为待选集合IFS={fi,f2,…,fK},其中f表示互信息对应的颜色分量,K的取值范围是大于0,且小于等于h;
[0009] (4)设置计数器i=1;
[0010] (5)判断计数器i是否等于K+1,若等于,则转入步骤(10),然后过程结束,否则设置h个颜色分量组成的集合为U={Ui,U2,…,Uh},并转入步骤(6),其中U中的元素表示样本矩阵对应列的颜色分量;
[0011] (6)初始化颜色特征集合S为空,并将待选集合IFS中的第i个颜色分量fi加入该颜色特征集合S中,并从集合U中删除该颜色分量fi;
[0012] (7)对集合U中当前的所有元素,计算其每一个元素Um与颜色特征集合S构成的颜色特征集合{S,Um}与标记矩阵C之间的互信息I({S,Um};C),并对得到的所有互信息按照从大到小的顺序进行排列,选取其中最大的M个互信息对应的颜色分量,记为集合TFS={ft1,ft2,…,ftM},其中M取值范围是大于0,小于U中当前的所有元素的个数;
[0013] (8)对于集合TFS中的每一个元素ftp,计算分类器在颜色特征集合{S,ftp}上的分类效果,从而得到M个不同的分类结果,并选择M个分类结果中分类准确率最高的一个元素对应的颜色特征ftg,将其加入颜色特征集合S中,并从集合U中删除该颜色分量ftg;
[0014] (9)判断颜色特征集合S中当前的所有元素数量是小于还是等于阈值,如果小于则返回步骤(7),如果等于,则将此时的颜色特征集合S和其分类准确率记录在集合L中,设置i=i+1,并返回步骤(5);
[0015] (10)从集合L所包含的的K个颜色特征集合中,选择分类准确率最高的颜色特征集合,该颜色特征集合最终构成最佳的皮肤检测混合颜色空间。
[0016] 优选地,步骤(1)具体为,首先通过颜色空间转换将RGB颜色空间的皮肤检测数据集中的所有n个像素转换为多个颜色空间,对于每一种颜色空间,转换的结果是得到一个n行3列的矩阵,从而所有颜色空间构成n*H的矩阵,然后,去除掉H列中颜色分量重复的列,从而得到n*h的样本矩阵,同时,n个像素中,如果某个像素对应的标记信息是黑,则将该像素向量化处理后标记矩阵中该像素对应的值设置为0,否则设置为1,从而得到n*1的标记矩阵C,最后,对得到的该样本矩阵的每一列的值进行归一化处理,其中H和h均为自然数。
[0017] 优选地,分类器是随机森林分类器、SVM分类器、或者贝叶斯分类器。
[0018] 优选地,阈值的取值范围是1到h。
[0019] 按照本发明的另一方面,提供了一种基于特征选择的皮肤检测混合颜色空间的选取方法,包括:
[0020] 第一模,用于获取皮肤检测数据集,其包括图片及其对应的标记信息,对该皮肤检测数据集中的所有图片进行颜色空间转换,对转换后的所有图片和对应的标记信息进行向量化处理,以得到样本矩阵和标记矩阵,并对样本矩阵中每一列的值进行归一化处理;
[0021] 第二模块,用于计算归一化处理后的样本矩阵中的每一列和标记矩阵之间的互信息,将互信息结果按照从大到小的顺序进行排列;
[0022] 第三模块,用于从第二模块中得到的排列结果中选择K个最大的互信息,对应的颜色分量作为待选集合IFS={fi,f2,…,fK},其中f表示互信息对应的颜色分量,K的取值范围是大于0,且小于等于h;
[0023] 第四模块,用于设置计数器i=1;
[0024] 第五模块,用于判断计数器i是否等于K+1,若等于,则转入第十模块,然后过程结束,否则设置h个颜色分量组成的集合为U={Ui,U2,…,Uh},并转入第六模块,其中U中的元素表示样本矩阵对应列的颜色分量;
[0025] 第六模块,用于初始化颜色特征集合S为空,并将待选集合IFS中的第i个颜色分量fi加入该颜色特征集合S中,并从集合U中删除该颜色分量fi;
[0026] 第七模块,用于对集合U中当前的所有元素,计算其每一个元素Um与颜色特征集合S构成的颜色特征集合{S,Um}与标记矩阵C之间的互信息I({S,Um};C),并对得到的所有互信息按照从大到小的顺序进行排列,选取其中最大的M个互信息对应的颜色分量,记为集合TFS={ft1,ft2,…,ftM},其中M取值范围是大于0,小于U中当前的所有元素的个数;
[0027] 第八模块,用于对于集合TFS中的每一个元素ftp,计算分类器在颜色特征集合{S,ftp}上的分类效果,从而得到M个不同的分类结果,并选择M个分类结果中分类准确率最高的一个元素对应的颜色特征ftg,将其加入颜色特征集合S中,并从集合U中删除该颜色分量ftg;
[0028] 第九模块,用于判断颜色特征集合S中当前的所有元素数量是小于还是等于阈值,如果小于则返回第七模块,如果等于,则将此时的颜色特征集合S和其分类准确率记录在集合L中,设置i=i+1,并返回第五模块;
[0029] 第十模块,用于从集合L所包含的的K个颜色特征集合中,选择分类准确率最高的颜色特征集合,该颜色特征集合最终构成最佳的皮肤检测混合颜色空间。
[0030] 总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0031] (1)本发明的皮肤检测准确率较高:由于本发明使用互信息缩小特征选择范围,然后通过分类器选择使分类效果最佳的特征,并采用多种可能的颜色特征集合初始化方案,然后选择其中最优的结果,从而能够保证高的皮肤检测率。
[0032] (2)本发明通过引入分类器来评价颜色特征集合和通过调节K,M来扩大特征选择算法搜索范围的做法,提高了基于互信息的特征选择算法的表现。
[0033] (3)本发明提出的方法可以稳定地找到最佳颜色特征集合,这表明该特征选择算法具有较好的鲁棒性。附图说明
[0034] 图1是本发明基于特征选择的皮肤检测混合颜色空间的选取方法的流程图

具体实施方式

[0035] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0036] 本发明的基本思路在于,提出一种改进的基于互信息的特征选择方法:首先使用互信息排序方法快速产生待选择的特征,以此来缩小包装器(Wrapper)方法的搜索范围,然后使用包装器方法来选择分类效果最佳的特征子集.基于这种方式的特征选择,与包装器方式相比较,大大减少了需要训练的分类器个数,因此减少了特征选择算法达到收敛所需的时间。
[0037] 如图1所示,本发明基于特征选择的皮肤检测混合颜色空间的选取方法包括以下步骤:
[0038] (1)获取皮肤检测数据集,其包括图片及其对应的标记信息,对该皮肤检测数据集中的所有图片进行颜色空间转换,对转换后的所有图片和对应的标记信息进行向量化处理,以得到样本矩阵和标记矩阵,并对样本矩阵中每一列的值进行归一化处理;
[0039] 本步骤具体为,首先通过颜色空间转换将RGB颜色空间的皮肤检测数据集中的所有像素(其数量为n)转换为nRGB、XYZ、YCbCr、YUV、YIQ、i1i2i3、YES、HSV、HLS、TSY、LAB、LUV、YPbPr、YCgCr一共14种颜色空间(应该理解这仅仅是出于示例的目的,也可以转换为其它数量和类型的颜色空间),对于每一种颜色空间,转换的结果是得到一个n行3列的矩阵,从而所有15种颜色空间构成n*45的矩阵,然后,去除掉45列中颜色分量重复的列(例如YES和XYZ中Y颜色分量就是重复的),从而得到n*38的样本矩阵,同时,n个像素中,如果某个像素对应的标记信息是黑,则将该像素向量化处理后标记矩阵中该像素对应的值设置为0,否则设置为1,从而得到n*1的标记矩阵C;最后,对得到的该样本矩阵的每一列的值进行归一化处理。
[0040] (2)计算归一化处理后的样本矩阵中的每一列和标记矩阵之间的互信息,将互信息结果按照从大到小的顺序进行排列;
[0041] (3)从步骤(2)中得到的排列结果中选择K个最大的互信息(其中K的取值范围是大于0,且小于等于38,优选值为8),对应的颜色分量作为待选集合IFS={fi,f2,…,fK},其中f表示互信息对应的颜色分量;
[0042] (4)设置计数器i=1;
[0043] (5)判断计数器i是否等于K+1,若等于,则转入步骤(10),然后过程结束,否则设置38个颜色分量组成的集合为U={Ui,U2,…,U38},并转入步骤(6),其中U中的元素表示对应列的颜色分量,
[0044] (6)初始化颜色特征集合S为空,并将待选集合IFS中的第i个颜色分量fi加入该颜色特征集合S中,并从集合U中删除该颜色分量fi;
[0045] (7)对集合U中当前的所有元素,计算将每一个元素Um加入颜色特征集合S之后颜色特征集合{S,Um}与标记矩阵C之间的互信息I({S,Um};C),并对得到的所有互信息按照从大到小的顺序进行排列,选取其中最大的M个(其中M取值范围是大于0,小于U中当前的所有元素的个数)互信息对应的颜色分量,记为集合TFS={ft1,ft2,…,ftM};
[0046] (8)对于集合TFS中的每一个元素ftp,计算随机森林(Random forest)分类器在颜色特征集合{S,ftp}上的分类效果,从而得到M个不同的分类结果,并选择M个分类结果中分类准确率最高的一个元素对应的颜色特征ftg,将其加入颜色特征集合S中,并从集合U中删除该颜色分量ftg;;
[0047] 应该理解的是,本发明并不局限于上述分类器,也可以使用本领域公知的其他分类器,例如支持向量机(Support vector machine,简称SVM)以及贝叶斯分类器。
[0048] (9)判断颜色特征集合S中当前的所有元素数量是小于还是等于阈值,如果小于则返回步骤(7),如果等于,则将此时的颜色特征集合S和其分类准确率记录在集合L中,设置i=i+1,并返回步骤(5);
[0049] 在本发明中,该阈值被设置为3,其取值范围是1到38。
[0050] (10)从集合L所包含的的K个颜色特征集合中,选择分类准确率最高的颜色特征集合,该颜色特征集合最终构成最佳的皮肤检测混合颜色空间。
[0051] 实验结果
[0052] 结合提出的特征选择算法和上文提到的相关参数,我们在3个数据集上分别进行测试,得到的结果见表1。其中,实验结果1是取K=8,M=10时分别在3个数据集上得到的结果。实验结果2是在取K=M=1时得到的结果。
[0053] 表1
[0054]
[0055]
[0056] 根据上表1的数据,我们可以得出以下结论:
[0057] (1)从3个数据集上的分类表现来看,DB-Skin数据集上的分类效果最差,SFA数据集次之,HGA数据集上分类效果最好。这可能是因为DB-Skin数据集中图片分辨率较低,而且图片背景和光照条件均比较复杂,从而导致皮肤像素和非皮肤像素之间的颜色更难分辨,而HGA和SFA数据集均是在室内采集的手势或面部照片,图片中干扰皮肤检测的因素相对较少,所以分类结果较为准确;
[0058] (2)比较传统颜色空间、文献中已提出的混合颜色空间和实验结果1的数据,可以发现按照我们提出的特征选择方法,在3种数据集上分别得到的混合颜色空间,其分类表现均优于已有的传统颜色空间和已有的混合颜色空间。这说明,对于给定数据集,我们提出的特征选择算法可以稳定地找到最佳颜色特征集合,这表明该特征选择算法具有较好的鲁棒性;
[0059] (3)比较实验结果1和实验结果2的数据,可以发现,若每次选择特征加入S时,都选择使互信息最大的特征,最终得到的颜色特征集合,其分类效果并不是最好的。因此我们在算法中引入分类器来评价颜色特征集合和通过调节K,M来扩大特征选择算法搜索范围的做法,确实提高了基于互信息的特征选择算法的表现。
[0060] 本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈