本发明的目的在于实现一个基于统计结构特征的联机手写汉字识别方法。本识别方法以 单个的联机手写汉字字符作为处理对象,首先对处理的字符对象进行必要的预处理,然后提 取出能很好反映联机手写汉字特点的统计结构特征,再将得到的这些原始特征使用线性
鉴别 分析LDA压缩变换为识别特征,最后用改进型二次分类器MQDF进行识别。
本发明由以下几部分组成:预处理、统计结构特征的提取、特征变换、分类器设计。
1.预处理
预处理的目的是在识别之前尽量消除笔迹中的噪声和书写
变形,使待识汉字有一个更好 的识别基础。其任务一是滤除笔迹采集设备和书写者造成的噪声干扰,如孤立点噪声、锯齿 形噪声、笔速不匀等,主要处理方法为滤波平滑和重新采样;二是对待识汉字作整形处理以 消除部分书写变形,包括线性归一化、非线性归一化两个功能,使待识汉字所占空间区域映 射到一个大小固定的
位置,而且整形后字符笔划在空间分布上更加均匀。
设一个联机手写汉字的笔迹为:
P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
这是计算机通过数字化仪实时地对书写时笔尖的移动轨迹进行采样得到的一系列从时间 上依序排列的点坐标,(break)标记代表两个自然笔划间抬笔和落笔的中断。
去除孤立点噪声是指从笔迹点序列中去除只由一两个点组成的笔划。滤除锯齿形噪声的 方法是对相邻点的坐标值进行加权平均,达到低通滤波的效果。滤波公式为:
消除笔速不匀的重新采样方法是对于书写的轨迹用一个固定长度间隔重新采样,使得一 定长度的笔划用一定数量的点来代表,其公式为:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N 且si≤jL<si+1;
为两个点之间的长度;
为累计长度, 并设定
为重新采样得到的新坐标点。
整形处理需要得到各笔迹点在变换后的新坐标,在本发明中通过密度均衡法来计算。首 先将联机汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,整形变换前的图像宽度为W,高度为 H,任何一个笔迹点P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。 U(x″),V(y″)分别表示象素点在
水平和垂直方向上的密度投影,即:
其中,αU,αV为偏置常数,此处设定αU=αV=6。则原坐标为(x″,y″)的笔迹点的新坐标 为(x’″,y’″):
其中,W′为处理后的最大横坐标,H′为处理后的最大纵坐标,这两个值是处理后的笔迹点 坐标范围的期望值,需要在整形处理之前预先设定好,此处都设为64。
预处理的最后一个步骤是把每个自然笔划内的笔迹点都依序首尾相连,连线上与原笔迹 点不重合的点插入笔迹序列,并消除相邻笔迹点中的重合点。
2.统计结构特征的提取
统计结构特征的提取是在预处理之后的联机手写汉字笔迹上进行的。本发明通过仔细研 究联机手写汉字的结构特性,设计和提取了两种统计结构特征,分别称为方向特征和边缘特 征。
2.1方向特征的提取
方向特征的提取结果也分为两种,称为相邻点方向特征和相邻拐点方向特征。
2.1.1相邻点方向特征
首先计算每个笔迹点的方向:在笔迹点坐标序列中,任取一点Pi,除最后一点外,都有 至少一个后继点Pj(j>i),我们把从Pi指向Pj的有向线段的方向设定为Pi点的方向值θi, 其值域范围为[0°,360°),如图3所示,(a)为点Pi到相邻点Pi+1的方向,(b)为拐点Pi到相 邻拐点Pj的方向,(c)为有向线段方向角度的计算示意图。当j=i+1时,该方向值称为相邻 点方向。
θi计算方法为,设(Xi,Yi)为点Pi的坐标,(Xj,Yj)为点Pj的坐标。
由于θi的三角正切函数
故
然后计算每个笔迹点的方向属性系数。所谓笔迹点的方向属性系数,是指以该点的方向 值为自变量,利用图4所示的梯形和半梯形函数,计算得到的该点的4种函数值:
横方向属性系数函数
竖方向属性系数函数
撇方向属性系数函数
捺方向属性系数函数
上面六个参数α1~α6是角度
阈值,它们的作用是确定方向属性系数函数的形状,在本发 明中分别设为:α1=-10°,α2=260°,α3=280°,α4=250°,α5=300°,α6=330°。
得到方向属性系数之后,把笔迹点图像的坐标空间均匀划分成K1×K1个子
块,如图5所示。 分别统计每个子块中所有笔迹点的各自4种方向属性系数之和,共得到K1×K1×4维特征。以 第(k,l)(这里1≤k≤K1,1≤l≤K1)个子块为例,统计得到的4维特征分别为:
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
2.1.2相邻拐点方向特征
当笔迹颤动时,相邻点方向的计算会产生较大的偏差,所以我们还设计了相邻拐点方向, 即把Pi和Pj设定为笔迹点中相邻的拐点,重新计算每个笔迹点的方向。所谓拐点是指笔划 书写的方向前后变化剧烈的点,同时把笔划端点也设定为一种拐点。拐点的确定根据多边形 逼近的基本方法:先计算笔划中每个点与相邻点间张角的余弦值。拐点的判定是当张角γ的 余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约为2.5弧度。
张角γ的余弦值可利用三角余弦定理计算。设a,b,c分别为当前笔迹点与前后相邻笔迹 点构成的三角形的三边。张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形
顶点 的坐标分别计算三边的长度,由余弦定理可求得
如图6所示。
点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括Pi点在内的在这两点之间的笔迹 点的方向都设定为从点Pi指向点Pj的有向线段方向。
重新计算每个笔迹点相邻拐点的方向属性系数并统计每个空间划分子块中的4种方向属 性系数之和,得到另外K1×K1×4维特征。
方向特征是这两种特征的合并,共有K1×K1×8维特征。
2.2边缘特征的提取
边缘特征与方向特征不同之处在于边缘特征能较好地反映出汉字的外围结构信息。
以从左到右方向为例,提取边缘特征的方法为:把预处理后的联机汉字笔迹所对应图像 的左半部分空间等距分为K2个横向子区域,如图7(a)所示。在每一个子区域内,从箭头方 向,即图像左边缘往右进行
逐行扫描。若第i次行扫描时,首次扫描到某个坐标点为笔迹点 时,计算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直没 有扫描到笔迹点,则这4个系数为0;继续扫描,当再次扫描到另外某个坐标点为笔迹点时, 计算这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同样的,如果一直没 有再次扫描到笔迹点,则这4个系数为0。一直到i次行扫描完毕,分别累计各行得到的以 上系数,得到8维特征:
K2个子区域共得到K2×8维边缘特征。
从其余7个箭头方向,即右、上、下另三个边缘及对角线方向重复以上方法,如图7(b) 所示,箭头方向为空间等分和扫描方向,共得到K2×8×8维的边缘特征。
方向特征和边缘特征合并后得到完整的一个联机手写汉字的统计结构特征V。
3.特征变换
前面提取得到的原始特征维数比较高,在样本数不是很充分的情况下,会造成计算复杂 度增加并降低分类器性能。所以,在原始特征送到分类器之前,还需要对之进行特征变换, 把高维原始特征变换压缩到低维特征空间。本发明采用线性鉴别分析技术LDA进行特征变换。 设{{Vi (j),1≤i≤Nj},1≤j≤C}为原始特征向量集合,式中Vi (j)表示属于第j个类别的第i个样 本提取的原始特征向量,Nj表示第j个类别的样本个数,C表示类别数目。每个类别代表国 家标准汉字集合中的一个汉字。用下式计算每个类别的均值以及所有类别的均值:
然后计算类内散度矩阵Sw和类间散度矩阵Sb:
我们选取|(Sb+Sw)/Sw|作为优化准则,即求取线性变换矩阵A,使得
最大。 变换矩阵A为n×m维矩阵,n为原始特征维数,设定变换后的特征维数为m。变换矩阵的求 取方法如下:我们对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到特征值 {γi,i=1,2,...,n},特征值按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m个特征向 量组成矩阵A=[ξ1,ξ2,...,ξm],则A就是符合前面要求的线性变换矩阵。
特征选择的公式如下:
Y=AT·V
上式中,V为原始结构特征向量,Y是经过变换后的特征向量。
4.分类器设计
本发明使用了针对高斯模型的改进型二次分类器MQDF。这里先介绍标准二次分类器QDF。 QDF的判决函数为:
上式中,Y是输入的特征向量,m为特征维数,μj代表第j个类别的均值向量,ζi (j)是第j个 类别的协方差阵的第i个特征向量,λi (j)是第j个类别的协方差阵的第i个特征值。对输入Y 进行识别时,用如下准则进行分类:
把Y归为第i个类别,如果
式中C为类别数目
在实际应用中,由于对小特征值的估计不准确,造成QDF的性能下降。为降低小特征值 估计不准对分类性能的不利影响,我们使用改进的二次分类器MQDF。MQDF对过小的特征值用 事先确定的常数代替,其判别函数如下:
上式中,k为小于m的正整数,λ是常数。k和λ为经验参数,由实验确定。在分类时,输入 Y被划分为使gj(Y)取最小值的类别。
本发明的特征在于,它是一种基于统计结构特征的联机手写汉字识别方法。它依次含有 以下步骤:
(1)对输入的联机手写汉字笔迹进行预处理。
假设一个联机手写汉字的笔迹为:P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1, yi+1),…,P(xN,yN)。依次进行如下预处理。
(1.1)去除孤立点噪声。
从笔迹点序列中去除只由一两个点组成的笔划。
(1.2)滤除锯齿形噪声。
用下式对相邻点的坐标值进行加权平均,达到低通滤波的效果:
(1.3)消除笔速不匀的重新采样。
对于书写的轨迹用一个固定长度间隔采用下式重新采样,使得一定长度的笔划用一定 数量的点来代表:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i 满足1≤i≤N且si≤jL<si+1;
为两个点之间的长度;
为累计长度,并设定
为重新采样得到的新坐 标点。
(1.4)用密度均衡法整形处理。
首先将联机汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,图像宽度为W,高度为H,任 何一个笔迹点P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。计 算图像在水平和垂直方向上的密度投影U(x″),V(y″):
其中,αU,αV为偏置常数,此处设定αU=αV=6。则原坐标为(x″,y″)的笔迹点 的新坐标为(x’″,y’″):
其中,整形处理后的最大横坐标为W’,最大纵坐标为H’。
(1.5)插值和删除重合点。
把每个自然笔划内的笔迹点都依序首尾相连,连线上与原笔迹点不重合的点插入笔迹 序列,并消除相邻笔迹点中的重合点。
(2)提取统计结构特征
在预处理之后的联机手写汉字笔迹上提取方向特征和边缘特征,合并为原始的统计结构 特征。其提取方法分别如下:
(2.1)提取方向特征 方向特征是相邻点方向特征和相邻拐点方向特征的合并。这两种特征的提取步骤如 下:
(2.1.1)提取相邻点方向特征
(a)首先计算除最后一点外的所有笔迹点的相邻点方向:从Pi指向Pi+1的有向线 段的方向θi,其值域范围为[0°,360°)。最后一点的方向设为无效。
(b)然后按下式根据每个笔迹点的方向值θi计算该点的4种方向属性系数:
横方向属性系数函数
竖方向属性系数函数
撇方向属性系数函数
捺方向属性系数函数
六个参数α1~α6是角度阈值,它们的作用是确定方向属性系数函数的形状,在本 发明中分别设为:α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°。
(c)把笔迹点坐标所占空间均匀划分成K1×K1个子块,分别统计每个子块中所有 笔迹点的4种方向属性系数之和。以第(k,l),1≤k≤K1,1≤l≤K1个子块为例, 统计得到的4维特征分别为:
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
θ为点P(x,y)的方向值;
一共得到K1×K1×4维特征相邻点方向特征。
(2.1.2)提取相邻拐点方向特征
用多边形逼近的方法确定笔迹中的拐点,拐点即笔划书写的方向前后变化剧烈的点,包 括笔划拐点在内,先计算笔划中每个点与相邻点间张角的余弦值;
张角γ的余弦值可利用三角余弦定理计算,设a,b,c分别为当前笔迹点与前后相邻笔迹 点构成的三角形的三边,张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点 的坐标分别计算三边的长度,由余弦定理可求得
拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约 为2.5弧度;把笔划端点也设定为一种拐点。
计算每个笔迹点的相邻拐点方向:设点Pi和Pj,j>i为笔迹点中相邻的拐点, 所有包括Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有 向线段方向。
重复(2.1.1)中的(b)(c)两步,得到K1×K1×4维的相邻拐点方向特征。
(2.2)提取边缘特征
首先提取左→右方向扫描的边缘特征:把预处理后的联机汉字笔迹所对应图像的左半 部分空间等距分为K2个横向子区域,如图7(a)所示;从箭头方向(即图像左边缘 往右)进行逐行扫描。若第i次行扫描时,第一次扫描到某个坐标点为笔迹点时,计 算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直 没有扫描到笔迹点,则这4个系数为0;继续扫描,当第二次扫描到某个坐标点为笔 迹点时,计算这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同 样的,如果一直没有第二次扫描到笔迹点,则这4个系数为0。行扫描完毕,分别累 计各行得到的以上系数,得到8维特征:
K2个子区域共得到K2×8维边缘特征。
然后接着从右、上、下另三个边缘及四个斜线扫描方向,如图7(b),重复以上步骤, 共得到K2×8×8维的边缘特征。
(3)特征变换
用线性鉴别分析LDA从原始的统计结构特征中提取识别特征,以改善特征分布,提高识 别性能,它依次含有以下步骤:
(3.1)用下式计算每个类别的均值μj以及所有类别的均值μ:
其中,Vi (j)为属于第j个类别的第i个样本提取的原始特征向量,Nj表示第j个类 别的样本个数,C表示类别数目。
(3.2)用下式计算类内散度矩阵Sw和类间散度矩阵Sb:
(3.3)对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到按特征值的大小降序排列的 特征值γi,i=1,2,...,n和特征向量ξi,i=1,2,...,n。
(3.4)用前m个特征向量组成线性变换矩阵A=[ξ1,ξ2,...,ξm]。
(3.5)用原始特征V和变换矩阵A计算变换后的特征向量Y:
Y=AT·V
(4)用MQDF分类器进行联机手写汉字识别。
用MQDF分类器进行识别包括两个部分:首先要根据前面得到的识别特征通过事先采集好 的样本训练生成识别库文件;然后才能利用识别库对实际输入待识样本进行识别。
(4.1)训练过程:
(4.1.1)首先对每个类别j,根据前面得到的m维识别特征,用下式统计其均值μj和 协方差阵∑j:
其中,Yi (j)为属于第j个类别的第i个样本提取的识别特征向量,Nj表示第j个 类别的样本个数。
(4.1.2)对每个类别的协方差阵∑j进行特征值和特征向量分解,得到按值的大小降序 排列的特征值λi (j),i=1,2,...,m和特征向量ζi (j),i=1,2,...,m
(4.1.3)计算小特征值的替代值:
其中,k为小于m的正整数,由实验确定。
(4.1.4)把前面得到的λi (j),j=1,2,...,C,i=1,2,...,k、ζi (j),j=1,2,...,C,i=1,2,...,m、 μj,j=1,2,...,C和λ存储到识别库文件中,供后续的识别使用。
(4.2)识别过程:
(4.2.1)由待识样本得到识别特征Y,用下式计算每个类别的判决函数gj(Y):
其中,m、k的取值同训练过程。
(4.2.2)输入的待识样本被划分为使gj(Y)取最小值的类别。
实验证明,本发明的平均识别率为98.43%,达到令人满意的效果。
附图说明
图1联机手写汉字识别系统的构成。
图2预处理流程
图3笔迹点方向的计算方法。
图4方向属性系数的计算方法。
图5笔迹点坐标空间的子块划分方法。
图6计算拐点的方法。
图7边缘特征的提取方法。
图8 LDA特征变换方法流程。
实现基于统计结构特征的联机手写汉字识别系统时,首先要通过训练得到识别库,然后 就可以根据识别库对联机手写汉字字符进行识别。因而,实用的基于统计结构特征的联机手 写汉字识别系统的实现需要考虑训练过程的实现和识别过程的实现两个方面,其系统构成如 图1所示。这两个过程中有部分处理内容是相同的。
下面详细介绍系统的各个部分:
A.训练过程的实现
A.1预处理
预处理流程如图2所示。假设一个联机手写汉字的笔迹为:P(x1,y1),P(x2,y2),…,P(xi, yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
首先要去除孤立点噪声,从笔迹点序列中去除只由一两个点组成的笔划。
然后对相邻点的坐标值进行加权平均,滤除锯齿形噪声,滤波公式为:
重新采样的目的是消除笔速不匀。其方法是对书写的轨迹用一个固定长度间隔重新采样, 使得一定长度的笔划用一定数量的点来代表,采样公式为:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N 且si≤jL<si+1;
为两个点之间的长度;
为累计长度, 并设定
为重新采样得到的新坐标点。
整形处理的任务是消除待识汉字的部分书写变形,包括线性归一化、非线性归一化两个 功能,使待识汉字所占空间区域映射到一个大小固定的位置,而且字符笔划在空间分布上更 加均匀。整形处理后各笔迹点变换到新坐标,变换公式通过密度均衡法来计算:首先将联机 汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,图像宽度为W,高度为H,任何一个笔迹点 P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。H(x″),V(y″) 分别表示象素点在水平和垂直方向上的密度投影,即:
其中,αU,αV为偏置常数,本发明中设定αU=αV=6。则原坐标为(x″,y″)的笔迹点 的新坐标为(x’″,y’″):
其中,W′为处理后的最大横坐标,H′为处理后的最大纵坐标。本发明中设定 W′=H′=64。
A.2统计结构特征的提取
这一步是在预处理之后的联机手写汉字笔迹的基础上提取出适合联机手写汉字的结构特 性的特征。本发明中设计和提取了两种统计结构特征,分别称为方向特征和边缘特征。
A.2.1方向特征的提取
方向特征是由相邻点方向特征和相邻拐点方向特征这两种特征合并而成。
相邻点方向特征的提取方法如下:
1)首先计算除最后一点外的所有笔迹点的相邻点方向:从当前点Pi指向下一点Pi+1的有 向线段的方向θi,其值域范围为[0°,360°)。最后一点的方向设为无效。
2)根据每个笔迹点的方向值θi按下式计算该点的4种方向属性系数:
横方向属性系数函数
竖方向属性系数函数
撇方向属性系数函数
捺方向属性系数函数
六个参数α1~α6是角度阈值,它们的作用是确定方向属性系数函数的形状,在本发明中 分别设为:α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°。
3)把笔迹点坐标所占空间均匀划分成K1×K1个子块,分别统计每个子块中所有笔迹点的 4种方向属性系数之和。以第(k,l)(1≤k≤K1,1≤l≤K1)个子块为例,统计得到的4维特征 分别为:
θ为点P(x,y)的方向值
θ为点P(x,y)的方向值
θ为点P(x,y)的方向值
θ为点P(x,y)的方向值
在本发明中,K1=8,所以相邻点方向特征共有8×8×4=256维。
相邻拐点方向特征的提取方法如下:
用多边形逼近的方法确定笔迹中的拐点,拐点即笔划书写的方向前后变化剧烈的点,包 括笔划拐点在内,先计算笔划中每个点与相邻点间张角的余弦值;
张角γ的余弦值可利用三角余弦定理计算,设a,b,c分别为当前笔迹点与前后相邻笔迹 点构成的三角形的三边,张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点 的坐标分别计算三边的长度,由余弦定理可求得
拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约 为2.5弧度;把笔划端点也设定为一种拐点。
计算每个笔迹点的相邻拐点方向:设点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括 Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有向线段方向。
重复上面的相邻点方向特征提取方法中的(2)(3)两步,得到256维的相邻拐点方向特征。
相邻点方向特征和相邻拐点方向特征合并成512维的方向特征。
A.2.2边缘特征的提取
边缘特征与方向特征不同之处在于边缘特征能较好地反映出汉字的外围结构信息。提取 边缘特征的方法如下:
首先提取从左到右扫描方向的边缘特征:把预处理后的联机汉字笔迹所对应
图像空间的 左半部分等距分为K2个横向子区域,如图7(a)所示。在每一个子区域内,从箭头方向,即 图像左边缘往右,进行逐行扫描。若第i次行扫描时,第一次扫描到某个坐标点为笔迹点时, 计算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直没有扫 描到笔迹点,则这4个系数为0;继续扫描,当第二次扫描到某个坐标点为笔迹点时,累计 遇到的这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同样的,如果一直 没有第二次扫描到笔迹点,则这4个系数为0。行扫描完毕,分别累计各行得到的以上系数, 得到8维特征:
K2个子区域共得到K2×8维边缘特征。
然后从右、上、下另三个边缘及4个斜线扫描方向重复以上方法,共得到K2×8×8维的 边缘特征。
在本发明中,K2=8,边缘特征共有512维。
方向特征和边缘特征合并后得到完整的1024维联机手写汉字统计结构特征。
A.3特征变换
特征变换的流程如图8所示,采用了线性鉴别分析技术LDA方法,通过求取变换矩阵A, 对原始特征进行变换压缩,得到最终的识别特征。
特征变换的具体步骤如下:
1)首先计算每个类别的均值以及所有类别的均值:
2)然后计算类内散度矩阵Sw和类间散度矩阵Sb:
3)对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n},特征值 按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m个特征向量组成矩阵 A=[ξ1,ξ2,...,ξ256],则A就是要求取的线性变换矩阵。在本发明中,m取128。
这个变换矩阵A需要存储到文件中,供识别过程的特征变换使用。
4)得到变换矩阵A后,即可求取最终的特征,变换公式为: Y=AT·V。
A.4训练MQDF分类器
根据得到的m维识别特征Y,对每个类别用下式统计其均值和协方差阵:
其中,Yi (j)表示第j个类别的第i个训练样本提取的特征向量,Nj是第j个类别的训练样本 数目,μj表示第j个类别的均值,∑j表示第j个类别的协方差矩阵。
对每个类别的协方差阵进行特征值和特征向量分解,得到特征值λi (j),i=1,2,...,m,特征值 按值的大小降序排列和特征向量ζi (j),i=1,2,...,m,λi (j)是∑j的第i个特征值,ζi (j)是∑j的第i 个特征向量。
我们用下式计算MQDF分类器中的参数λ,即小特征值的替代值:
上式中,k为小于m的正整数,在本发明中,k取32,C表示类别数目。
把以上参数λi (j),j=1,2,...,C,i=1,2,...,k、ζi (j),j=1,2,...,C,i=1,2,...,m、 μj,j=1,2,...,C、λ存储到识别库文件中,供识别过程使用。这样就完成了MQDF分类器的 训练过程。
B.识别过程的实现
识别过程如图1所示。同训练过程一样,识别过程也需要首先进行预处理,然后提取得 到原始的统计结构特征V。
在进行LDA特征变换时,识别过程直接采用训练过程提供的变换矩阵A,得到识别特征向 量Y=AT·V。
用MQDF分类器进行识别时,所有相关的分类器参数从训练过程提供的识别库文件中读取。 MQDF分类器的判决函数为:
识别时用上式计算每个类别的gj(Y),分类规则如下:
把Y归为第i个类别,如果
式中C为类别数目
为验证本发明的有效性,我们进行了如下实验:
训练样本集使用1000套国标二级汉字字集样本和400套GBK字集样本,另外60套国标 二级汉字字集样本和30套GBK字集样本作为测试样本,在GBK字集识别范围内进行测试。以 上样本均为自由书写的联机手写汉字。在联机手写汉字识别系统的训练和识别过程中,具体 参数值见上文具体实施方式中的设置。
实验结果如下: GB二级汉字字集 6763个汉字 60套共405,780个样本 GBK汉字字集 14240个汉字 30套共427,200个样本 综合平均 测试识别率 99.30% 98.17% 98.43%
从表中数据可看出,基于统计结构特征的联机手写汉字识别方法在两种不同识别范围下 均达到很高的识别性能,识别速度在主频为PentiumIV-1.7GHz的计算机上达到35.27字/秒, 完全能够满足实用需要。
综上所述,本发明提出的基于统计结构特征的联机手写汉字识别方法及识别系统,能够 识别自由书写的联机手写汉字,并且经实验证明达到极高的识别正确率和可靠性,具有非常 广泛的应用前景。