写字码电脑汉字输入法

阅读:819发布:2022-03-17

专利汇可以提供写字码电脑汉字输入法专利检索,专利查询,专利分析的服务。并且本 发明 是一种把组成汉字结构的基本元素归纳为:“八种笔画、四种 块 ”的写字码电脑汉字输入法,采用以声代形的取码方式,利用拆首(或末)笔画法的拆码规则和人们日常对汉字结构的描述方式对汉字进行编码,编码规范、易懂;如:丙=横内(BHN);串=吕竖(CLS);矛=予撇(MYP);令=今点(LJD);玲=今点(LWJD);国=口里玉(GKLY);闯= 门 里 马 (CMLM);李=木下子(LMXZ)。由于单字输入重码率低于6.5%,故本发明适合于广大电脑爱好者使用。,下面是写字码电脑汉字输入法专利的具体信息内容。

1.一种把组成汉字结构的基本元素归纳为“八种笔画、四种”,并采用以声代形的 取码方式把人们日常对汉字结构的描述方式溶入编码方案的写字码电脑汉字输入法,构成 写字码电脑汉字输入法编码方案的必要技术特征包括:
(I)组成汉字结构的八种笔画及其代码
笔画    横  竖  撇  捺  折  提  点   钩
代码    H   S   P   N   Z   T   D    L
(II)组成汉字结构的四种块和补足码的取码约定
(1)偏旁部首形块及其代码
写字码所指定的规范性偏旁部首和引申偏旁部首及其代码如下:
(2)近似字形块及其代码
(3)字形块及其代码
字形块的取码原则是:在取大字优先的前提下,取对字形块读音的首字母作为其代码;
写字码所规定的字形块是指在汉字结构中所含有的字,其码元构成包括所有存在于汉字结构中 的字。除以下几种情况所确定的字形块码元及其代码外,其余字形块的取码都是在满足写字码对不 同结构汉字编码方案的基础上取对其读音的首字母作为其代码。
①存在于汉字结构中的以下七个字形块及其固定代码如下:
汉字结构中的字形块:日   曰   目   子   孑  米  厶
字形块的代码:      R    R    M    Z    Z   M    Y
②汉字“鱼”的首声码代码为:“U”。
③当含有“农、田、成”字形块的汉字不能分成三个或三个块以上时,“农、田、成”字形块的 代码分别为“BP、KS、WZ”,其余情况下“农、田、成”字形块的代码分别为其首声码“N、T、C”。
④去掉汉字的首笔画后剩余部还可以构成字形块的码元及其代码包括:   汉字   拆除的   首笔画 拆除首笔画后 所成的字形块   代码   汉字 拆除的 首笔画 拆除首笔画后 所成的字形块   代码   来L   横H     米M   LHM   百B   横H     白B   BPR   干G   横H     十S   GHS   正Z   横H     止Z   ZHZ   白B   撇P     日R   BPR   再Z   横H     冉R   RHR   亚Y   横H     业Y   YHY   下X   横H     卜B   XHB   戋J   横H     戈G   JHG   失S   撇P     夫F   SPF   良L   点D     艮G   LDG   大D   横H     人R   DHR   户H   点D     尸S   HDS   王W   横H     土T   WHT   末M   横H     末M   MHM   方F   点D     万W   FDW   丙B   横H     内N   BHN   夫F   横H     大D   FHD   禾H   撇P     木M   HPM   买M   折Z     头T   MZT   乏F   撇P     之Z   FPZ   天T   横H     大D   THD   灭M   横H     火H   MHH   末M   横H     木M   MHM   主Z   点D     王W   ZDW   矢S   撇P     天T   SPT   卞B   点D     下X   BDX   朱Z   撇P     未M   ZPW   吏L   横H     史S   LHS   广G   点D     厂C   GDC   乇T   撇P     七Q   TPQ   午W   撇P     干Q   WPG   币B   撇P     巾J   BPJ   千Q   撇P     十S   QPS   元Y   横H     兀W   YHW   无W   横H     尢Y   WHY   自Z   撇P     目M   ZPM   歹D   横H     夕X   DHX   丢D   撇P     去Q   DPQ   夭Y   撇P     大D   YPD
⑤去掉汉字的末笔画后剩余部分还可以构成字形块的码元及其代码包括:    汉字 拆除末笔画后 所成的字形块 拆除的 末笔画   代码   汉字 拆除末笔画后 所成的字形块 拆除的 末笔画   代码     用Y     月Y   竖S     YPS   丰F     三S   竖S     FSS     生S     N   撇P     SNH   矛M     予Y   撇P     MYP     甩S     月Y   钩G     SYL   子Z     了L   横H     ZLH     太T     大D   点D     TDD   孑J     了L   提T     JLT     令L     今J   点D     LJD   申S     日R   竖S     SRS     犬Q     大D   点D     QDD   羊Y     兰L   竖S     YLS     土T     十S   横H     TSH   兔T     免M   点D     TMD     本B     木M   横H     BMH   孓J     了L   捺N     JLN     士S     十S   横H     SSH   甲J     日R   竖S     JRS     中Z     口K   竖S     ZKS   串C     吕L   竖S     CLS     产L     立L   撇P     CLP   于Y     二E   钩L     YEL     凡J     几J   点D     FJD   氐D     氏S   点D     DSD     斥C     斤J   点D     CJD   丸W     九J   点D     WJD     电D     日R   钩G     DRL   玉Y     王W   点D     YWD     尺C     尸S   捺N     CSN   甚S     其Q   折Z     SQZ     乒P     丘Q   撇P     PQP   术S     木M   点D     SMD     乓P     丘Q   捺N     PQN   韭J     非F   横H     JFH     凡F     几J   点D     FJD   丘Q     斤J   横H     QJH     少S     小X   撇P     SXP   世S     廿E   折Z     SEZ
⑥去掉汉字的前两个既不是字形块又不是偏旁部首的笔画后,剩余部分成字形块或近似字形块的码 元及其代码包括:   汉字 拆除的首笔画 拆除的次笔画 去掉首笔、次笔笔画后所成的字形块   代码   左Z     横H     撇P     工G   ZHPG   东D     横H     折Z     小X   DHZX   见J     竖S     折Z     人R   JSZR   尔E     撇P     折Z     小X   EPZX   石S     横H     撇P     口K   SHPK   米M     点D     点D     木M   MDDM   灰H     横H     撇P     火H   HHPH   J     撇P     折Z     用Y   JPZY   内N     竖S     折Z     人R   NSZR   卓Z     竖S     横H     早Z   ZSHZ   页Y     横H     撇P     贝B   YHPB   占Z     竖S     横H     口K   ZSHK   负F     撇P     折Z     贝B   FPZB   欠Q     撇P     折Z     人R   QPZR   反F     撇P     撇P     又Y   FPPY   布B     横H     撇P     巾J   BHPJ   车C     横H     折Z     十S   CHZS   友Y     横H     撇P     又Y   YHPY   色S     撇P     折Z     巴B   SPZB   贝B     竖S     折Z     贝B   BSZR   贞Z     竖S     横H     贝B   ZSHB   卢L     竖S     横H     尸S   LSHS   每M     撇P     横H     母M   MPHM   有Y     横H     撇P     月Y   YHPY
⑦截断贯穿汉字上下结构的竖笔画后,被分开的两部分形都能成字(或近似字)形块的码元及其代 码包括:   汉字 截断贯穿汉字上下结构的竖笔   画后上层结构所成的字形块 上下之间 加“X” 截断贯穿汉字上下结构的竖笔   画后下层结构所成的字形块   代码   里L     田T 田下土X     土T   LTXT   熏X     千Q 千下黑X     黑H   XQXH   果G     田T 田下木X     木M   GTXM   击J     土T 土下山X     山S   JTXS   重C     千Q 千下里X     里L   QTXL   出C     山S 山下山X     山S   CSXS   番P     采C 采下田X     田T   PCXT   缶F     午W 午下山X     山S   FWXS
(4)非字形块及其取码原则:
写字码所指定的非字形块码元包括除上面所指定的三种块“偏旁部首、近似字形块和字形块” 以外的其它所有的汉字结构部件。除以下四种情况所确定的几个的非字形块码元及其代码外,其余 非字形块都是取其首笔画的代码作为其代码。
①写字码确定的在汉字结构中是一个独立笔画的非字形块有五个,并取其笔画代码作为其代码;
汉字                  俪  隔   引   佥  行
在汉字中的非字形块    一  一   丨   一  一
非字形块代码          H    H    S   H    H
②由两个或多个笔画组成的非字形块,在与其前面(或其后面)的相邻块或几个结构块结合在一 起后,如果能够构成字形块,且所构成的字形块不是被编码汉字本身,其代码是取与前面(或其后 面)的相邻或几个块结合在一起后所构成的字形块的代码。在汉字结构中这样的非字形块有三个。 如下所示:
在“槽”字中的非字形块“ ”的键盘代码为“C”;
在“橄”字中的非字形块“ ”的键盘代码为“G”
在“都”字中的非字形块“ ”的键盘代码为“Z”。
③由两个或多个笔画组成的非字形块,在去掉其首(或末)笔画后,如果其剩余部分能构成字形 块,其代码是取:“非字形块的首笔画代码+去掉其首笔画后所构成的字形块读音声母的第一个字母” 或“去掉非字形块的末笔画后剩余部分所构成的字形块读音的声母的第一个字母+非字形块的笔画 代码”。在汉字结构中这样的非字形块有九个。如下所示:
在“曹”字中有非字形块“横笔画+曲”+“日”,非字形块的键盘代码为“HQ”。
在“敢”字中有非字形块“折笔画+”+“攵”偏旁,非字形块的键盘代码为“ZE”。
在“老、者、考”字中有非字形块“土+撇笔画”,非字形块的键盘代码为“TP”。
在“拔”字中有偏旁“扌”+非字形块“友+点笔画”,非字形块的键盘代码为“YD”。
在“告”字中有非字形块“撇笔画+土”+字形块“口”,非字形块的键盘代码为“PT”。
在“拜”字中的非字形块为“横笔画+丰”,非字形块的键盘代码为“HF”。
在“师”字中的非字形块为“横笔画+巾”,非字形块的键盘代码为“HJ”。
在“春”字中的非字形块为“横笔画+夫”,非字形块的键盘代码为“HF”。
在“举”字中的非字形块为“横笔画+十”,非字形块的键盘代码为“HF”。
④非字形块“沈”的代码为“BR”。
(5)补足码的取码约定及优先权
①当由两个块组成的汉字的末块中,含有由末笔画组成的除末块本身外的且不与其它笔画相交的 最大字形块时,取该字形块的代码作为补足码;汉字中所含有的这类字形块有五个,即“卓、色、 皮、鬼、甬”,其补足码分别为“Z、B、Y、Y、Y”。
②当由两个块组成的汉字的末块中,不含有由末笔画组成的除木块本身外的且不与其它笔画相交的 最大字形块时,如果末块是一个字形块取其首笔画的代码作为补足码;如果末块是一个非字形块则 是取非字形块的末笔画的代码作为补足码。
③当组成汉字结构的末块是偏旁时,重负输入偏旁的代码作为补足码。
写字码对以上所确定的“八种笔画、四种块”及拆首、末笔画后成字形块,拆前两笔画后成字 形块、截断贯穿汉字上下结构的竖笔画后被分开的两部分都能成字(或近似字)形块,以及对补足 码的取码约定构成了写字码对汉字编码的基本码元,其代码即为汉字的键盘输入码,汉字的输入步 骤是按照以下编码方案所确定的对于汉字结构中块的取码顺序进行汉字输入。编码方案中汉字编码 等式里的“+”号只是代码之间的一个连接符,不作为键盘输入码。
(III)对于不同结构汉字的编码方案:
(1)在去掉汉字的首(或末)笔画后,剩余部分还可以构成字形块的汉字的编码规则是:
汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母;或,
汉字编码=首声码+去掉汉字的末笔画后所成字形块读音的首字母+末笔画代码。
(2)去掉汉字的前两个既不能构成字(或近似字)形块又不能构成偏旁部首的笔画后,其剩余部 分还可以构成字形块或近似字形块的汉字的编码规则为:
汉字编码=首声码+首笔画代码+次笔画代码+去掉汉字的前两个笔画后剩余部分所构成的字形 块或近似字形块的代码;
(3)对于在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近似字)形 块的汉字的编码规则是:
汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被分开的下层字(或近似字) 形块的代码;
(4)按照上述3条拆码规则不能进行拆码的独体字的编码规则为:
汉字编码=首声码+首笔画的代码+次笔画的代码+末笔画的代码;
如果构成汉字的笔画只有一个笔画或两个笔画,按实际笔画数取其代码;
(5)对于不能分解成三个或三个块以上的汉字,当其中含有脱离开相交或相连的笔画后使得被分 开的两部分能构成偏旁部首或近似字形块的部件时,汉字的编码规则为:
把偏旁部首或或近似字形块与其相交或相连的笔画后,按照书写顺序分别取其首块代码、次块 代码和末块代码。
这类字形块有“农”和“成”两个字形块,“农”和“成”两个字形块的代码分别为“BP”和 “WZ”,其余情况下“农”和“成”两个字形块的代码分别为其首声码“N”和“C”。
(6)左右结构汉字的编码规则
①在取大优先的前提下,对于能分解成由字形块、偏旁部首形块或近似字形块组成 的三部分左右结构汉字的编码规则是:按照各个块的书写顺序取每个块的代码;
②当由三个块组成的左右结构汉字中含有非字形块时,对其中非字形块的取码应按 照非字形块取码原则中的有关规定进行,汉字的编码规则为:按照各个块的书写顺序分别 取各个块的代码;
③含有三个块以上的左右结构汉字的编码规则为:应优先对左边块取大字,当其右边的 块不能进行分块或当左边的几个块结合在一起后不能构成字形块时,再对左边块进行分块 取码,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+末块代码;
④当由两个块组成的左右结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形 块时,汉字的编码规则为:优先对该字形块进行拆码,并按照各个块的书写顺序分别取其拆 码后的代码;
⑤当由两个块组成的左右结构的汉字中的字形块不能使用拆首(或末)笔画法进行拆码 时,或当组成汉字结构的两个块是偏旁部首形块或近似字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码;
⑥当组成汉字结构的两个块中有一个是非字形块时,汉字的编码规则为:
汉字编码=首声码+首块代码+次块代码+补足码;
(7)“品”字形结构和倒“品”字形结构汉字的编码规则为:
按照各个块的书写顺序在取大字优先的前提下,分别取“品”字形或倒“品”字形结 构汉字中的前两个块的首块代码和末块代码;
(8)上下结构汉字的编码规则及优先权
①由上中下三个字形块或近似字形块组成的汉字,优先按照由上到下的顺序取每个块 的代码;
②在取大字优先的前提下,由上下两个字(或近似字)形块组成的上下结构汉字的编码 规则为:
汉字编码=首声码+上层字(或近似字)形块代码+X+下层字(或近似字)形块代码;
③在取大字优先的前提下,当组成汉字的上下结构的两个块中,至少有一个块是偏旁部首 形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+补足码;
④当组成上下结构汉字的两个块中,含有可以用对非字形块取码规则中的拆首(或末) 笔画后其剩余部分可构成字形块的非字形块时,汉字的编码是按照由上到下的顺序分别取 各个块拆码后的代码;
⑤在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由 三个或多个其它块组成的上下三层或多层结构汉字的编码规则为:在取大字优先的基础上, 按照由上到下的顺序分别取其前两层靠近左侧的首块代码和最底层的末块代码;
⑥在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由 三个或多个其它块组成的上下两层结构汉字的编码规则为:
在取大字优先的基础上,按照各个块的书写顺序分别取其首块代码、次块代码和末块 代码;
(9)“口”字形结构和“”字形结构汉字的编码规则为:
①当“口”或“门”字里所含有的块是字形块时,汉字的编码规则为:
汉字编码=首声码+KL(或ML)+口(或门)里所含有的字形块读音的首字母;
②当“口”或“门”字里所含有的块不是字形块时,汉字的编码规则为:按照由外向里 的顺序分别取其首块的代码、次块代码和末块代码;
(10)带有走之旁“辶”或建字旁“廴”汉字的编码规则:
①当走之旁“辶”或建字旁“廴”上是一个字形块或近似字形块时,汉字的编码规则 为:汉字编码=首声码+走之旁“辶”或建字旁“廴”上字形块或近似字形块读音的首字母 +XZ(或XJ);
②当走之旁“辶”上所含有的字形块读音的首字母与整体体字读音的首字母相同时,应 优先对该字形块进行分块取码或用拆首(或末)笔画法进行拆码,并按照各个块的书写顺 序分别取各个块拆码后的代码;
③当走之旁“辶”上是由两个字形块或两个以上其它结构块组成时,汉字的编码规则 是:按照书写顺序分别取其首块代码、次块代码再加上走之旁“辶”的代码“Z”;
④当走之旁“辶”上是一个或两个不能构成字形块的其它块时,汉字的编码规则为: 按照书写顺序分别取走之旁“辶”上各个块的代码和走之旁“辶”的代码;
(11)含有“戊”字形块结构的汉字编码规则为:
按照由外向内所组成的各个结构块的顺序分别取其首块代码、次块代码和末块代码;
(12)其它半包围结构汉字的编码规则为:
①在取大字优先的前提下,当汉字能分解成三个或多个块时,按照由上到下、由左到 右、由外向里的顺序依次取汉字结构的首块代码、次块代码和末块代码
②由两个块组成的半包围结构汉字的编码规则是:按照汉字各个结构块的书写顺序分 别取各个块的代码和补足码。
③当由两个块组成的半包围结构的汉字中含有可用拆首(或末)笔画法进行拆码的字形 块时,应使用拆首(或末)笔画法对该字形块进行拆码,汉字的编码规则为:按照各个块书写 顺序分别取其拆码后的代码;
写字码电脑汉字输入法对不同结构汉字编码方案的主要特征包括:
(1)在去掉汉字的首(或末)笔画后,剩余部分还可以构成字形块的汉字的编码规则是:
汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母,或,
汉字编码=首声码+去掉汉字的末笔画后所成字形块读音的首字母+汉字末笔画的代码;
(2)对于在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近 似字)形块的汉字短编码规则是:
汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被分开的下层字(或近似 字)形块的代码;
(3)当由两个块组成的左右结构或半包括围结构的汉字中,含有可以用拆首(或末)笔画法 进行拆码的字形块时,应使用拆首(末)笔画法对该字形块进行拆码,汉字的编码规则是:按照 书写顺序分别取其拆码后的代码。
(4)在取大字优先的前提下,由上下两个字(或近似字)形块组成的上下结构汉字 的编码规则为:
汉字编码=首声码+上层字(或近似字)形块的代码+X+下层字(或近似字)形块的代码;
(5)在取大字优先的前提下,当“口”或“门”字里所含有的是一个字形块时,汉字的 编码规则为:
汉字编码=首声码+KL(或ML)+口(或门)里所含有的字形块读音的首字母;
(6)当走之旁“辶”或建字旁“廴”上是一个字形块或近似字形块时,汉字的编码规则 为:汉字编码=首声码+走之旁“辶”或建字旁“廴”上字形块或近似字形块读音的首字母 +XZ(或XJ);
(7)当走之旁“辶”上所含有的字形块读音的首字母与整体体字读音的首字母相同时,应 优先对该字形块进行分块取码或用拆首(或末)笔画法进行拆码,并按照各个块的书写顺序 分别取各个块拆码后的代码;
2.根据权利要求1所述的写字码电脑汉字输入法,其中对汉字结构中所含有的偏旁 部首形块和近似字形块的取码都是固定的,且都是以取大优先,不可以拆分。
3.根据权利要求1所述的写字码电脑汉字输入,其中对由两个或多个笔画组成的 非字形块的取码,在去掉其首(或末)笔画后,如果其剩余部分能构成字形块,非字形
4.根据权利要求1所述的写字码电脑汉字输入法,其中对于汉字结构中所含有的 字形块进行拆码的优先条件是:优先对汉字结构中所含有的与整体字读音相同的字形块 进行拆码。

说明书全文

发明是一种采用音形码编码方案的电脑汉字输入法。

本发明的任务就是提供一种简单易学、编码规范、直观、易懂,单字输入重码率低于 6.5%的写字码电脑汉字输入法;写字码电脑汉字输入法(以下简称写字码)是以方汉字的 “块”为基础,并把人们日常对汉字结构的描述方式溶入编码方案,充分利用人们在日常生 活中读写汉字时对汉字结构的印象来达到见字识码的目的。

本发明把构成所有汉字的基本元素归纳为:“八种笔画、四种块”。 一.组成汉字结构的八种笔画及其代码

笔画   横  竖  撇  捺  折  提  点  钩

代码   H   S   P   N   Z   T   D   L

关于竖、折、钩三种笔画的笔形结构的划分特作如下说明:

1.竖笔画:是指垂直向下竖写的一笔;竖笔画的笔形结构为:“丨。

2.折笔画:是指横笔画带钩或横、斜笔画转折后带钩或不带钩的笔形;常见的笔形结 构有“ 乛、、、∠、乙、ㄋ、ㄅ、く、フ”。

3.钩笔画:这里是指竖笔或斜笔带钩的笔画;钩笔画主要有四种笔形结构“亅、 乚”。

注意:这里把“钩”笔画的取码特定为:“L”;这是与其它几种笔画取码不同的地方。 二.组成汉字结构的四种块及其取码约定

所谓“块”,这里定义为:在汉字结构中独立存在的偏旁部首、字形块、近似字形块及 一个或几个相连的笔画组成的既不是偏旁部首也不是字形块或近似字形块的汉字结构中的 其它部件均称为组成汉字结构的“块”。

块的划分原则:是以写字码所指定的偏旁部首和近似字形块为基础,在遵循以下编码方 案和取大字优先的原则基础上,以每个汉字能分解成由偏旁部首形块、字形块和近似字形块 组成的三个“块”者优先。

如:操扌品木    染氵九木    糊米古月    鞭革亻更    熟享丸灬

    塔艹合    磨广林石    露雨各    赐贝日勿    锅钅口内

    敌千口攵    翼羽田共    懿壹次心    额宀各页    倔亻尸出

    朝十早月    薪艹亲斤    冀北田共    票西二小    捺扌大示

    翠习习卒    茫艹氵亡    落艹氵各    警苟攵言    照日召灬

在取大字优先的前提下,如果存在不同的分块情况,应以取散块优先;

如:禁木木示    祟出二小

但是,当不足三个块的汉字中含有脱离开相交或相连的笔画后被分开的两部分均能构 成字(或偏旁部首、近似字)形块的部件时,应在脱离开相交或相连的笔画后再进行分块。

如:插扌千臼    谀讠臼人    沈氵冖     农冖        孛十冖子

1.偏旁部首形块及其代码

本发明所指定的偏旁部首是以规范性偏旁部首为主,并按照人们日常对其习惯性叫法 的读音进行取码;本发明所指定的规范性偏旁部首和引申偏旁部首及其代码如下:

对于上述几个规范性偏旁部首和引申偏旁部首的特殊取码方法作如下说明:

如:示字旁“礻”和衣字旁“衤”在《现代汉语词典》中又分别称为:“示补儿”和“ 衣补儿”,由于这两种偏旁在结构上非常接近,为了避免出现在输入汉字的过程中对这两种 偏旁的区分,统一取”示补儿”和“衣补儿”中“补”字的声母“B”作为其代码。

把“豸”引申为“豺字旁”,并取其代码为:“C”。

“丶、冫、氵、灬”和登字头“癶”的取码均为:“D”;对于首笔画为点的非规范 性偏旁部首,如:“亠、丷、、 屰、丬”的取码也统一规定为:“D”。

汉字结构中的部件“ㄗ”和单旁“卩”在结构上较为相近,故取其代码也为:“E”。 “廿”字的含义是“二十”,故把在汉字结构中的“廿”字形块的取码规定为:“E”。

把“ ”引申为“共字头”部首,并取其代码为:“G”。

卷字头“ ”的代码取为:“J”。把“ ”引申为:“祭字头”,取其代码为:“J”。

把“ ”引申为“鹿字头”,取其代码为“L”;由于汉字结构中常用到的部件“ ”和“立刀(刂)”在结构上相近,故把“ ”和“ ”的代码也取为:“L”。

如:在汉字“坚”和“归”中分别含有引申的偏旁部首“ ”和“ ”

把“ ”引申为“字头”部首,并取其代码为“N”。

对于偏旁“三撇(彡)”和引申偏旁部首“  爫”的取码都是分别取其首笔画的代码 “P”作为代码。如:在“衣”和“妥”字中就分别含有引申的偏旁部首“ ”和“爫”。

把“匚”引申为“区字框”,并取其代码为:“Q”。

把“ ”引申为与单人旁“亻”相近的引申偏旁,并取其代码为:“R”。

把“   ”和“ ”分别引申为“尚字头”和“十字旁”,并分别取对其读音的首 字母“S”作为代码;部件“ ”是写字码的引申偏旁,取其首笔画的代码“S”作为代码。

如:在汉字“淌”、“学”、“博”和“蔽”中就分别含有引申偏旁部首“ ”和“ ”。

折文旁“夂”、反文旁“攵”和王字旁“ ”的代码都取为:“W”。

竖心旁“忄”的代码是取“心”字的声母“X”作为代码;并把“彐、厷、 ” 分别引申为“字底”、“雄字旁”、“小字头”和“夕字头”,其代码均取为:“X”。

把“巛”引申为写字码的引申偏旁部首,并取其首笔画的代码“Z”作为其代码;部件 “ ”是竹字头“”的一部分,因此把“ ”的代码也取为“Z”。

如:在汉字“巢”和“临”字中就分别含有引申偏旁部首“巛”和“ ”。

2.近似字形块及其代码

近似字形块:是指在字形结构上与现有汉字很相近但又不是汉字的汉字结构中的部件。

近似字形块的取码原则是:取与其在结构上相近的汉字读音的首字母作为代码。

本发明常用到的近似字形块及其代码有:

说明:在汉字结构中,不论是近似字形块还是偏旁部首形块(包括引申偏旁部首)的取码 都是固定的,且都是以取大优先,不可以拆分。

如:在“尚、肖”两个汉字中就分别含有上面所引申的尚字头“ ”、小字头“ ” 和近似字形块“ ”,按照取大优先的原则,应把“尚”字分解成尚字头“ ”和“口”字 形块两部分;把“肖”字分解成小字头“ ”和近似字形块“ ”两部分。

3.字形块及其代码

字形块:是指在汉字结构中所含有的字。

如:在汉字“差、墩、敬”中分别含有“工、享、句”三个字形块。

字形块的取码原则:在取大字优先的前提下,取对字形块读音的首字母作为其代码。

说明:一个字形块可以包含有子字形块、偏旁部首形块、近似字形块和非字形块;但是 当在取大字优先的基础上,不能把汉字分解成三个或三个块以上时,应把包含有其它块的字 形块分解成若干个子项块。

如:在取大字优先的前提下,只能把“剑”字分解成“佥”字形块和立刀旁“刂”两部 分;但是,由于字形块“佥”还可以继续分解,因此在对“剑”字进行编码时,应把其分解成 “ 一、非字形块”和立刀旁“刂”四部分。

特别约定:

(1)取字母“U”作为“鱼”字的首声码。

(2)当“日、曰、目、子、孑、米、厶”七个汉字中的某一个在汉字结构中是作为一个 字形块存在时(除其本身的编码按照以下编码方案中的编码规则进行编码外),在任何情况 下都不对这七个字形块进行拆码,并分别取其代码为:“R、R、M、Z、Z、M、Y”。

此外,有些偏僻汉字在日常生活中虽然不经常用到,但在汉字结构中却大多含有这些字 形块存在,为此这里把一些在编码过程中常用到的偏僻汉字及其读音的首字母列表如下:

4.非字形块及其取码原则

非字形块:是指由一个独立的笔画或几个相连或相交的笔画组成的除写字码所指定的 偏旁部首形块、字形块和近似字形块外的汉字结构中的其它部件。

非字形块的取码原则:在遵循写字码编码方案的基础上,按照以下优先顺序进行取码:

(1)当汉字结构中的非字形块是一个独立的笔画时,其代码就是取其笔画的代码。

如:在“俪”字中的次块“一”和“引”字中的末块“丨”都属于汉字结构中的由一 个独立的笔画构成的非字形块,故按照上述原则应分别取其代码为:“H”“S”。

(2)当由两个或多个笔画组成的汉字结构中的非字形块在与其前面(或其后面)的相邻块 或几个结构块结合在一起后,如果能够构成字形块,且所构成的字形块不是被编码汉字本 身,非字形块的代码是取与其前面(或其后面)的相邻块或几个结构块结合在一起后所构成 的字形块的代码。

如:在“槽、橄、都”三个汉字中分别合有非字形块“ ”,由于其分别在汉 字结构中能与其后面的相邻块“日、攵、日”结合在一起后构成字形块“曹、敢、者”, 故按照上述规定,对“槽、橄、都”三个汉字中非字形块的取码分别为:“C、G、Z”。

(3)当由两个或多个笔画组成的汉字结构中的非字形块在去掉其首(或末)笔画后,如果 其剩余部分能够构成字形块,那么该非字形块的取码为:“非字形块的首笔画代码+去掉其 首笔画后所构成的字形块读音的首字母”或“去掉非字形块的末首笔画后剩余都分所构成 的字形块读音的首字母+非字形块的末笔画代码”;当汉字的编码超过四码时,只取非字形 块的首笔画的代码作为其代码。

如:在“曹、敢、者”三个汉字中所含有的非字形块“ ”,在分别去掉其首 (或末)笔画后其剩余部分分别能构成“曲、耳、土”三个字形块,故把非字形块“ ”在“曹、敢、者”三个汉字中分别拆成“横曲、折耳、土撇”,并分别取其代码分别 为:“HQ、ZE、TP”。

这类常用的非字形块还有以下几个,它们分别存在于以下汉字中:

如:告 撇土口  拜 横丰  师 横巾  春 横夫日  考 土撇横  举 兴横十

(4)其余情况下只取非字形块首笔画的代码作为非字形块的代码。

如:画 一田折  餐 竖又食  段 撇几又  鬼 撇厶  所 撇斤  那 折阝 三.对于不足四码的汉字补足码的取码约定及优先权

1.当只有两个块组成的汉字结构的末块中含有由末笔画组成的除末块本身外的且不与 其它笔画相交的最大字形块时,取该字形块的代码作为补足码;

如:棹 木卓早(Z)  绝 纟色巴(B)  帔 巾皮又(Y)  傀 亻鬼厶(Y)  涌 氵甬用(Y)

2.当只有两个块组成的汉字结构的末块中不含有由末笔画组成的除末块本身外的最大 字形块时,如果末块是一个字形块就取其首笔画的代码作为补足码;如果末块是一个非字形 块,则是取非字形块的末笔画的代码作为补足码。

如:捭 扌卑撇(P)  芭 艹巴折(Z)  沌 氵屯横(H)  钇 钅乙折(Z)  铣 钅先撇(P)

    朽 木横折(Z)  是 日横捺(N)  戎 戈横撇(P)  第 折撇(P)  冱 冫互横(H)

3.当组成汉字结构的末块是偏旁时,重复输入该偏旁的代码作为补足码。

如:邺 业阝阝(E)  刖 月刂刂(L)  郫 卑阝阝(E)  祁 礻阝阝(E) 四.编码方案

编码说明:每个汉字的最长编码为四位,取对汉字读音的首字母作为汉字编码的首码 (以下称之为首声码),对于多音字可以分别取对其读音的首字母作为首声码;其它几位编码 则是分别取由汉字的基本元素“八种笔画、四种块”所构成的字形结构的特征码。

“V”键为通用代码键,在不知道汉字的某位编码时可以用“V”键来代替。

1.拆首笔画法

去掉汉字的首笔画后,其剩余部分还可以构成字形块的汉字的编码规则为:

汉字编码=首声码+首笔画代码+去掉汉字的首笔画后所成字形块读音的首字母。

如:来 横米 LHM  丙 横内 BHN  王 横土 WHT  天 横大 THD  午 撇干 WPG

    干 横十 GHS  禾 撇木 HPM  方 点万 FDW  末 横木 MHM  千 撇十 QPS

    白 撇日 BPR  百 横白 BHB  夫 横大 FHD  矢 撇天 SPT  元 横兀 YHW

    亚 横业 YHY  正 横止 ZHZ  买 折头 MZT  朱 撇未 ZPW  自 撇目 ZPM

    戋 横戈 JHG  再 横冉 ZHR  乏 撇之 FPZ  吏 横史 LH3  丢 撇去 DPQ

    良 点艮 LDG  下 横卜 XHB  灭 横火 MHH  乇 撇七 TPQ  夭 撇大 YPD

    户 点尸 HDS  失 撇夫 SPF  主 点王 ZDW  币 撇巾 BPJ  无 横尢 WHY

    未 横木 WHM  大 横人 DHR  卞 点下 BDX  广 点厂 GDC  歹 横夕 DHX

2.拆末笔画法

去掉汉字的末笔画后,其剩余部分还可以构成字形块的汉字的编码规则为:

汉字编码=首声码+去掉汉字的末笔画后剩余部分所成字形块读音的首字母+汉字的末 笔画的代码。

如:用 月竖 YYS  甩 月钩 SYL  令 今点 LJD  土 十横 TSH  士 十横 SSH

    生 横 SNB  太 大点 TDD  犬 大点 QDD  本 木横 BMH  中 口竖 ZKS

    产 立撇 CLP  申 日竖 SRS  甲 日竖 JRS  电 日钩 DRL  玉 王点 YWD

    丰 三竖 FSS  羊 兰竖 YLS  串 吕竖 CLS  尺 尸捺 CSN  甚 其折 SQZ

    矛 予撇 MYP  亏 二折 KEZ  于 二钩 YEL  乒 丘撇 PQP  乓 丘捺 PQN

    子 了横 ZLH  兔 免点 TMD  凡 几点 FJD  丸 九点 WJD  术 木点 SMD

    孑 了提 JLT  孓 了接 JLN  斥 斤点 CJD  氐 氏点 DSD  韭 非横 JFH

如果在去掉汉字的首笔画或末笔画后其剩余部分都可以构成字形块,应以拆首笔画后 剩余部分能构成字形块的取码优先;如:壬 撇士 RPS。

这里把“少、世、丘”三个汉字的编码也按照拆末笔画法的取码规则特别约定如下:

如:少 撇 SXP  世 廿折 SEZ  丘 斤横 QJH

说明:当汉字结构中含有可以用拆首(或末)笔画法拆码的字形块时,且当汉字结构中的 其它结构块不能再进行分块或拆码时,除另有约定外,这类字形块也按照拆首(或末)笔画法 的拆码规则进行取码。

如:玲 今点 LWJD  洋 氵兰竖 YDLS  污 氵二折 WDEZ  泄 氵廿折 XDEZ。

3.去掉汉字的前两个既不能构成字(或近似字)形块又不能构成偏旁部首的笔画后,其 剩余部分还可以构成字形块或近似字形块的汉字的编码规则为:

汉字编码=首声码+首笔画代码+次笔画代码+去掉汉字的前两个笔画后剩余部分所构成 的字形块或近似字形块的代码。

如:左 横撇工  ZHPG  灰 横撇火 HHPH  负 撇折贝 FPZB  色 撇折巴 SPZB

    东 横折小  DHZX   撇折用 JPZY  欠 撇折人 QPZR  贝 竖折人 BSZR

    见 竖折 JSZR  内 竖折人 NSZR  反 撇撇又 FPPY  贞 竖横贝 ZSHB

    尔 撇折小  EPZX  卓 竖横早 ZSHZ  布 横撇巾 BHPJ  卢 竖横尸 LSHS

    石 横撇口  SHPK  页 横撇贝 YHPB  车 横折十 CHZS  每 撇横母 MPHM

    米 点点木  MDDM  占 竖横口 ZSHK  友 横撇又 YHPY  有 横撇 YHP和YHPY

说明:这里不能把“米”字中的前两个笔画当成写字码所引申的偏旁部首“丷”,因为 “米”字中的前两个笔画是被其竖笔画分开的两个部分。又如,在对“半”字取码时也是 不能把“半”字的前两个笔画当成引申部首“丷”。

4.在截断贯穿汉字上下结构的竖笔画后,使得被分开的两部分都能构成字(或近似字) 形块的汉字的编码规则为:汉字编码=首声码+被分开的上层字(或近似字)形块的代码+X+被 分开的下层字(或近似字)形块的代码。

如:里 田下土 LTXT    熏 千下黑 XQXH    果 田下木 GTXM    击 土下山 JTXS

    重 千下里 CQXL    出 山下山 CSXS    番 下田 PCXT    缶 午下山 FWXS

5.按照上述4条拆码规则不能进行拆码的独体字和国标字库中偏旁部首的编码规则为:

汉字编码=首声码+首笔画代码+次笔画代码+末笔画代码。

如:卑 撇竖竖 BPSS    戈 横钩点 GHLD    禺 竖折点 YSZD    木 横竖捺 MHSN

    斤 撇撇竖 JPPS    戊 横撇点 WHPD    五 横撇横 WHPH    山 竖折竖 SSZS

    垂 撇横横 CPHH    专 横横点 ZHHD    也 折竖钩 YZSL    平 横点竖 PHDS

    书 折折点 SZZD    与 横折横 YHZR    尸 折横撇 SZHP    女 折撇横 NZPH

  开 横横竖 KRHS    年 撇横竖 NPHS    毛 撇横钩 MPHL    上 竖横横 SSHH

如果构成汉字或偏旁部首的笔画只有一个笔画或两个笔画,按实际笔画数取其代码

如:一 横 YH    十 横竖 SHS    乙 折 YZ     折撇 LZP    九 撇折 JPZ

偏旁部首的编码=O(字母O)+首笔画代码+次笔画代码+末笔画代码。

如:=O+P(撇)+P(撇)+S(竖)           亻=O+P(撇)+竖(S)

6.对于不能分解成三个或三个块以上的汉字,当其结构中含有脱离开相交或相连的笔 画后使得被分开的两部分能构成偏旁部首或近似字形块的部件时,汉字的编码规则为:在脱 离开相交或相连的笔画后,按照其书写顺序分别取其首块代码、次块代码和末块代码。

如:农冖   NBP    浓 氵冖 NDBP  沈 氵冖 SDBR  孛 十冖子BSBZ

7.左右结构汉字的编码规则

(1)由三个或多个块组成的汉字编码

①在取大字优先的前提下,对于能分解成由字形块、偏旁部首形块或近似字形块组成 的三部分左右结构汉字的编码规则是:按照各个块的书写顺序取每个块的代码。

如:懿 壹次心  YYCX  敬 艹句攵 JCJW  颜 产彡页   YCPY  请 讠  QYZY

    刽 刂 GRYL  蹦 山朋 BZSP  彻 彳 刀 CRQD  蜡 虫 日 LCGR

    踢 日勿  TZRW  撤 扌育攵 CTYW  额 宀各页   EBGY  醭 酉业 BYYM

    操 扌品木  CTPM  糊 米古月 HMGY  影 日京彡   YRJP  结 纟士口  JJSK

    树 木又寸  SMYC  赣 章夂贡 GZWG  插 扌千臼   CTQJ  涨 氵弓长  ZDGZ

    倾 亻 页 QRBY  技 扌十又 JTSY  阿 阝 口 AEDK  掏 扌勹甫  TTBF

    墩 享攵  DTXW  谒 讠日匃 YYRX  陆 阝土山   LETS  播 扌 田 BTCT

②当由三个块组成的左右结构的汉字中含有非字形块时,对其中非字形块的取码应按 照非字形块取码原则中的有关规定进行,汉字的编码规则为:按照各个块的书写顺序分别 取各个块的代码。

如:旅 方撇撇 LFPP  哪 口那阝 NKNE  缎 纟段殳 DJDS  辨 点辛 BXDX

    漓 氵亠离 LDDL  倌 亻宀官 GRBG  偏 亻户扁 PRHB  骋 由横 CMYH

    搌 扌尸展 ZTSZ  梯 木丷弟 TMDD  猪 犭者日 ZQZR  墙 啬回 QTSE

    段 撇几又 DPJY  断 米折斤 DMZJ  蚓 虫弓竖 YCGS  释 又横 SCYH

③含有三个块以上的左右结构汉字的编码规则为:应优先对左边块取大字,当其右边的 块不能进行分块或当左边的几个块结合在一起后不能构成字形块时,再对左边块进行分块 取码,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+末块代码。

如:激 氵白攵 JDBW  假 亻折又 JRZY  撬 扌毛毛 QTMM  撰 扌巳共   ZTSG

    摘 扌亠古 ZTDG  溜 氵留田 LDLT  俪 亻一丽 LRHL  潮 氵十月   CDSY

    瀑 氵日 PDRS  欲 谷欠人 YGQR  辞 舌立十 CSLS  磁 幺   CSDY

    疏 亠钩 SZDL  谵 讠詹言 ZYZY  谬 讠羽彡 MYYP  壤 亠 RTDP

    稿 禾亠口 GHDK  僻 亻尸辛 PRSX  瀛 氵亡凡 YDWF  鼾 自田干   HZTG

    颤 亠回页 CDHY  短 矢横豆 DSHD  翰 十早羽 HSZY  酸 酉厶攵   SYYW

当汉字结构中含有与整体字读音的首字母相同的字形块时,应优先对该字形块进行分 块取码;如:豁 宀丰谷 HBFG。

(2)由两个块组成的左右结构汉字的编码

①当由两个块组成的左右结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形 块时,汉字的编码规则为:优先对该字形块进行拆码,并按照各个块的书写顺序分别取其拆 码后的代码。

如:肤 月横大 FYHD   杜 木十横 DMSH    样 木兰竖 YMLS    胜 月牛横  SYNH

    柄 木横内 BMHN   砂 小撇 SSXP    铲 钅立撇 CJLP    沫 氵横木  MDHM

    枉 木横土 WMHT   刊 横十刂 KHSL    使 亻横史 SRHS    执 扌九点  ZTJD

    矾 几点 FSJD    钅撇夫 TJPF    抉 扌折大 JTZD    押 扌日竖  YTRS

    利 撇木刂 LPML   和 撇木口 HPMK    拆 扌斤点 CTJD    列 横夕刂  LHXL

    柏 木撇日 BMPR   证 讠横止 ZYHZ    珠 撇未 ZWPW    泛 氵撇之  FDPZ

    仲 亻口竖 ZRKS   污 氵二折 WDEZ    粮 米点艮 LMDG    羚 今点  LYJD

    伸 亻日竖 SRRS   访 讠点万 FYDW    托 扌撇七 TTPQ    眇 目 撇 MMXP

说明:如果当组成汉字结构的两个块都能够用拆首(或末)笔画法进行拆码时,应优先拆 与整体字读音相同的字形块;如:种=Z+H(禾)+K(口)+S(竖)。

②当由两个块组成的左右结构汉字中的字形块不能使用拆首(或末)笔画法进行拆码 时,或当组成汉字结构的两个块是偏旁部首形块或近似字形块时,汉字的编码规则为:

汉字编码=首声码+首块代码+次块代码+补足码。

如:碑 卑撇 BSBP    绊 纟半点 BJBD    绝 纟色巴 JJSB    棹 木卓早   ZMZZ

    垠 艮折 YTGZ    虹 虫 工  HCG     仇 亻九   CRJ     涿 氵 横 ZDSH

    作 亻乍 ZRZ       昨 日乍撇 ZRZP    偶 亻禺   ORY     越 走     YZW

    地 也 DTY       弛 弓 也  CGY     拣 扌  JTD     戕 爿戈      QPG

    外 夕卜  WXB      判 刂   PBL     归 彐  GLX      捷 扌疌      JTJ

    助 力  ZQL     政 攵   ZZW     沛 氵巿  PDS      刺 刂     CSL

    陈 阝东 CED       杨 木   YMY     邢 开阝 XKE       张 弓长   ZGC或ZGZ

    攻 攵 GGW       郎 阝   LLE     极 木及 JMJ       机 木几   JM和JMJP

说明:除重码汉字外,对于大多数常用汉字一般不加补足码。

③当组成汉字结构的两个块中有一个块是非字形块时,汉字的编码规则为:

汉字编码=首声码+首块代码+次块代码+补足码。

如:所 撇斤 SPJ    朽 木横折 XMHZ    那 折阝 NZE    既 横钩 JGHL

当其中含有可以用非字形块取码规则中的拆首(或末)笔画后其剩余部分能构成字形块 的非字形块时,按照各个结构块的书写顺序分别取其拆码后的代码。

如:师  横巾 SLHJ  拜 横丰 BSHF    敢 折耳攵 GZEW    拔 扌友点 BTYD

8.“品”字形结构和倒“品”字形结构汉字的编码规则为:

按照各个块的书写顺序在取大字优先的前提下,分别取“品”字形或倒“品”字形结 构汉字中前两个块的首块代码和末块代码。

如:茹 艹女口 RCNK  蔽 艹 攵 BCSW    熨 尸寸火 YSCH    璧 尸辛玉 BSXY

    鼎 目  DMPP    势 扌丸力 STWL    熟 享丸灬 SXWD    染 氵九木  RDJM

    华 亻七十  HRQS    紧 又小  JLYX    琴 王王今 QWWJ    帮 阝巾 BFEJ

    戆 章攵心  GZWX    薪 艹亲斤  XCQJ    露 雨各 LYZG    茫 艹氵亡  MCDW

    落 艹氵各  LCDG    繁 每攵小  FMWX    照 日召灬 ZRZD    堡 亻呆土  BRDT

    警 苟攵言  JGWY    禁 木木示  JMMS    堕 阝有土 DEYT    翠 习习卒  CXXZ

    集 亻点木  JRDM    崔 山亻点  CSRD    乔 夭撇竖 QYPS    介 撇竖JRPS

    鬓 彡宾 BCPB    望 月王 WWYW    罚 罒 讠刂 FSYL    蠢 春虫虫 CCCC

9.上下结构汉字的编码规则及优先权

(1)由上中下三个字形块或近似字形块组成的汉字,优先按照由上到下的顺序取每个块 的代码。

如:章 立日十 ZLRS    竟 立日儿 JLRE    意 立日心 YLRX    冀 北田共 JBTG

    翼 羽田共 YYTG    票 覀二小 PXEX    叁 厶大三 SYDS    祟 出二小 SCEX

    覃 覀日十 TXRS    鼻 自田丌 BZTW    栽 十戈木 ZSGM    载 十戈车 ZSGC

(2)在取大字优先的前提下,由两个块组成的上下结构汉字的编码规则:

①由上下两个字(或近似字)形块组成的上下结构汉字的编码规则为:

汉字编码=首声码+上层字(或近似字)形块的代码+X+下层字(或近似字)形块的代码。

如:李 木下子  LMXZ    剪 前下刀 JQXD    皂 白下七 ZBXQ    穿 穴下牙  CXXY

    究 穴下九  JXXJ    崇 山下宗 CSXZ    弯 亦下弓 WYXG    窗 穴下囱  CXXC

    步 止下 BZXS    尧 下兀YGXW    贾 覀下贝 JXXB    恭 共下  GGXX

    亲 立下 QLXM    舌 千下口 SQXK    吕 口下口 LKXK    孟 子下皿  MZXM

    感 咸下心  GXXX    靠 告下非 KGXF    奔 大下卉 BDXH    真 直下 ZZXB

    柔 矛下木  RMXM    誉 兴下言 YXXY    晨 日下辰 CRXC    卡 上下卜   KSXB

    雹 雨下包  BYXB    惫 备下心 BBXX    忠 中下心 ZZXX    忍 刃下心   RRXX

    吞 天下口  TTXK    零 雨下令 LYXL    奕 亦下大 YYXD    焉 正下  YZXY

②在取大字优先的前提下,当组成汉字上下结构的两个块中,至少有一个块是偏旁部首 形块或近似字形块时,汉字的编码规则为:汉字编码=首声码+首块代码+次块代码+补足码。

如:芭 艹巴折 BCBZ   笔 毛撇  BZMP    惠 横心   HHX    亦 亠撇捺 YDPN

    条 夂  TWM    并 丷开    BDK     寓 宀禺   YBY    余 YRH

    表   BZP    兼 折捺 JDZN     各 夂口   GWK    仓  CRS

    典 竖  DSB    其 横  QHB      具 竖 JSB    亥 亠折捺 HDZN

    衣 亠  YDP    杰 木灬   JMD      芯 艹心   XCX    茜 艹西横 XCXH

说明:当这种结构的汉字中含有可以用拆首(或末)笔画法进行拆码的字形块时,汉字编 码规则为:按照从上到下的顺序分别取各个块拆码后的代码。

如:冤 冖免点 YBMD  食 点艮 SRDG  旁 点万 PDDW  笨 木横 BZMH

③当组成上下结构汉字的两个块中,含有可以用对非字形块取码规则中的拆首(或末) 笔画后其剩余部分可构成字形块的非字形块时,汉字的编码是按照由上到下的顺序分别取 各个块拆码后的代码。

如:告 撇土口 GPTK  老 土撇匕 LTPB  者 土撇日 ZTPR  考 土撇横 KTPH

(3)在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由 三个或多个其它块组成的上下三层或多层结构汉字的编码规则为:在取大字优先的基础上, 按照由上到下的顺序分别取其前两层靠左侧的首块代码和最底层的末块代码。

如:器 口犬口   QKQK    攀 木大手   PMDS    赢 亡口凡   YWKF    褒 亠保 BDBP

    菀 艹宀   YCBS    囊 横口 NHKP    煎  灬 JDYD    言 亠二口   YDEK

    登 癶一豆   DDHD    爵 爫罒寸   JPSC    熊 厶 灬 XYYD    卒 亠从十   ZDCS

    苍 艹 CCRS    享 亠口子   XDKZ    京 亠口小   JDKX    衷 亠中 ZDZP

    益  皿 YDBM    贵 中横贝   GZHB    凿 业点折   ZYDZ    篇 户扁   PZHB

    萦 艹冖小   YCBX    画 一田折   HHTZ    寅 宀横八   YBHB    兽 田口   SDTK

(4)在取大字优先的前提下,对于不能分解成上下两个或三个字形块的汉字,且当其是由 三个或多个其它块组成的上下两层结构汉字的编码规则为:

在取大字优先的基础上,按照各个块的书写顺序分别取其首块代码、次块代码和末块 代码;如:辔 纟车口 PJCK。

10.“口”字形结构和“”字形结构汉字的编码规则为:

(1)当“门”或“口”字里所含有的块是字形块时,汉字的编码规则为:

汉字编码=首声码+KL(或ML)+口(或门)内所含有的字形块读音的首字母。

如:国 口里玉 GKLY    回 口里口 HKLK    囚 口里人 QKLR    团 口里才 TKLC

    困 口里木 KKLM    因 口里大 YKLD    固 口里古 GKLG    四 口里儿 SKLE

    围 口里韦 WKLW    圆 口里员 YKLY    圈 口里卷 JKLJ    图 口里冬 TKLD

    同 门里口 WMLK    闯 门里马 CMLM    闲 门里木 XMLM    闵 门里文 MMLW

    间 门里日 JMLR    阔 门里活 KMLB    阐 门里单 CMLD     门里伐 FMLF

    闭 门里才 BMLC    闪 门里人 SMLR    闻 门里耳 WMLE    阁 门里各 GMLG

此外,把“日、目、曰、田”四个汉字的编码规则特别约定为:

如:日 口里横 RKLH    目 口里二 MKLE    曰 口里横 YKLH    田 口里十 TKLS

注意:这里把“口”内的单一横笔画取码为:“H”,两个横笔画的取码为:“E(二)”。

说明:当汉字中含有“田”字形块且在汉字结构中的其它块不能拆码时,应把“田”字 形块分解成“口、十”两部分,并取其代码为:“KS”;如:钿 钅口十 DJKS。

(2)当“口”或“门”字里所含有的块不是字形块时,汉字的编码规则为:应按照由外 向里的顺序分别取其首块代码、次块代码和末块的代码;

如:阙=Q+M(门)+D(屰)+Q(欠)    圜=H+K(口)+S(罒)+P( )

11.带有走之旁“辶”汉字的编码规则:

(1)当走之旁“辶”上是一个字形块或近似字形块时,汉字的编码规则为:

汉字编码=首声码+走之旁“辶”上字(或近似字)形块读音的首字母+XZ。

如:这 文下辶 ZWXZ    过 寸下辶 GCXZ    遇 禺下辶 YYXZ    道 首下辶 DSXZ

    造 告下辶 ZGXZ    还 还下辶 HBXZ    逋 甫下辶 BFXZ    速 束下辶 SSXZ

    迫 白下辶 PBXZ    逃 兆下辶 TZXZ    送 关下辶 SGXZ    选 先下辶 XXXZ

    追 下辶 ZQXZ    逛 狂下辶 GKXZ    途 余下辶 TYXZ    边 力下辶 BLXZ

    迷 米下辶  MMXZ    迹 亦下辶 JYXZ    逸 兔下辶 YTXZ    逮 隶下辶 DLXZ

(2)当走之旁“辶”上所含有的字形块读音的首字母与整体字读音的首字母相同时,应 优先对该字形块进行分块取码或用拆首(或末)笔画法进行拆码,汉字的编码规则是:按照各 个块的书写顺序分别取其拆码后的代码。

如:达 一人辶 DHRZ    返 反又辶   FFYZ    迟 尸捺辶 CSNZ    述 木点辶   SMDZ

    迩 尔小辶 EEXZ    逾 一辶 YRHZ    逯 录水辶 LLSZ    逍 辶 XXYZ

    遍 户扁辶 BHBZ    远 一兀辶   YHWZ    逦 一丽辶 LHLZ    逅 后口辶   HHKZ

    运 二厶辶 YEYZ    逗 一口辶   DHKZ    迕 撇干辶 WPGZ    迁 撇十辶   QPSZ

    逻 罒夕辶 LSXZ    逶 禾女辶   WHNZ    邈 豸白辶 MCBZ    迦 力口辶   JLKZ

    逞 口王辶 CKWZ    适 千口辶   SQKZ    遛 留刀辶 LLDZ    避 尸口辶   BSKZ

    逼 横口辶 BHKZ    遑 白王辶   HBWZ    遁 盾十辶 DDSZ    进 丷开辶   BDKZ

(3)当走之旁“辶”上是由两个字形块或两个以上其它结构块组成时,汉字的编码规则 是:按照汉字的书写顺序分别取首块代码、次块代码和走之旁“辶”的代码“Z”。

如:透 禾乃辶 THNZ    邀 白方辶 YBFZ    迢 刀口辶 TDKZ    邂 角刀辶 XJDZ

    遮 广廿辶 ZGEZ    遣 中一辶 QZHZ    遐 折折辶 XZZZ    遢 日羽辶 TRYZ

(4)当走之旁“辶”上是一个或两个不能构成字形块的其它块时,汉字的编码规则为: 按照汉字的书写顺序分别取走之旁“辶”上各个块代码和走之旁“辶”的代码。

如:逢 攵丰辶 FWFZ    迅 折十辶 XZSZ    迤 撇也辶 YPYZ    遂 丷豕辶 SDSZ

    逆 屰辶   NDZ     巡 巛辶   XZZ     遥 爫缶辶 YPFZ    遽 虍豕辶 JHSZ

12.由于在国标字库中含有建字旁“廴”的汉字很少,为减少重码,把建字旁“廴”的 代码取为:“J”,带有建字旁“廴”汉字的编码规则为:

汉字编码=首声码+建字旁“廴刀上字(或近似字)形块读音的首字母+XJ。

如:建 聿下廴 JYXJ    廷 壬下廴 TRXJ    延 下廴 YZXJ

13.含有“戊”字形块结构汉字的编码规则为:

按照由外向内所组成的各个结构块的顺序分另取其首块代码、次块代码和末块代码。

如:戍 戊点  SWD      戌 戊一   XWH     威 戊一 WWHN

    咸 戊一口 XWHK    戚 戊上小 QWSX    减 冫戊口 JDWK

说明:这里把“成”字的取码特别约定为:成=C+W(戊)+Z(戊字形块内折笔画的代码); 对在汉字结构中“成”字形块的取码也是按照这一约定进行取码;如:铖 钅戊折 CJWZ。

14.其它半包围结构汉字汉字的编码规则为:

(1)在大字优先取码的前提下,当汉字能分解成三个或多个块时,按照由上到下、由左到 右、由外向里的顺序依次取汉字结构的首块代码、次块代码和末块代码;

如:层 尸二厶  CSEY    同 竖一口    TSHK    倔 亻尸出 JRSC    匈 勹乂凶 XBYX

    匿 匚艹右  NQCY    凰  白王 HJBW    魔 广林鬼 MGLG    周 撇土口 ZPTK

    居 尸十口  JSSK    瘕 疒折又    XBZY    癌 疒品山 ABPS    励 厂万力 LCWL

    麇 比禾 MLBH    鹰 广亻鸟    YGRN    廓 广享阝 KGXE    癃 疒阝生 LBES

    瘾 疒阝急 YBEJ    癣 疒鱼羊 XBUY   匐 勹横田 FBHT  腐 广付肉 FGFR

(2)由两个块组成的半包围结构汉字的编码规则是:按照汉字各个结构块的书写顺序分 别取各个块的代码和补足码。

如:区 匚乂     QQY    廉 广兼     LGDJ    氘 气撇竖 DQPS    庸 广折  YGZ

    厉 厂万     LCW    店 广占       DGZ     序 广予   XGY     向 撇口  XPK

      乂  FJY    凤  又折  FJYZ     匍 勹甫   PBF     肉 内人  RNR

    包 勹巳     BBS    皮 折又       PZY     尾 尸毛   WSM      眉 折目  MZM

(3)当由两个块组成的半包围结构的汉字中,含有可用拆首(或末)笔画法进行拆码的字 形块时,应使用拆首(朱)笔画法对该字形块进行拆码,汉字的编码规则是:按照书写顺序分 别取各个块的拆码后的代码。

如:病 疒横内 BBHN     气兰竖   YQLS    厌 厂大点 YCDD    庆 广横人 QGHR

    房 户点万 FHDW    夙  横夕 SJHX    医 匚撇天 YQPT    庄 广十横 ZGSH

说明:由于“方”字形块的读音与整体字“房”的读音相同,故在这里不对“户”字 形块拆码,而是优先对“方”字形块进行拆码。

15.大写数字快速输入码的设置:

对于大写数字“壹、贰、叁、肆、伍、陆、柒、捌、玖、拾”,除可按照上面的编码 规则进行输入外,为方便财会人员经常对大写数字的使用,写字码还设置了大写数字的快速 输入编码,就是用字母“O”作为这十个大写数字的一级简码。

即:O=壹 贰 叁 肆 伍 陆 柒 捌 玖 拾。

使用时只要输入“字母O+数字键(1、2、…、9、0)中的某一个数字,就可以分别快速 输入大写数字“壹、贰、叁、肆、伍、陆、柒、捌、玖、拾”。

此外,对于财会人员经常使用的“元、角、分、佰、仟、万、亿、零”也设置了快速 输入码,即:字母O+(元、角、分、佰、仟、万、亿、零)中的某个汉字读音的首字母。

在这一编码中,只有“元”和“亿”两个字会出现重码,在输入代码“OY”时,选择 数字键1可输入“元”字,选择数字键2可输入“亿”字。

16.对于容易读错或不知道其读音的汉字编码的约定

本发明对国标字库中的4000个非常用汉字进行了双重编码,一种是取汉字读音的首字 母作为汉字编码的首声码,另一种是取字母“U”作为其首位编码,汉字结构的特征码都是 按照以上编码规则进行编码;设置双重编码的目的就是对于不认识的汉字,可直接用字母 “U”代替其首声码,从而克服了因使用通用代码键而产生很多重码的问题。

如:瘛 疒丰心 UBFX或CBFX    蛊 虫下皿 UCXM或GCXM    罂 贝贝缶   UBBF或YBBF

    葩 艹白巴 UCBB或PCBB    钓 钅勹点 UJBD或DJBD    谬 讠羽彡   UYYP或MYYP

    琛 冖木 UWBM或CWBM    酵 酉孝子 UYXZ或JYXZ    墅 里予土   ULYT或SLYT

    狙 犭且   UQQ或JQQ      倜 亻口周 URZK或TRZK    傥 亻 兄 URSX或TRSX

17.标点符号和一些常用符号的编码方法

标点符号和一些常用符号的编码规则是取字母“I”作为其编码的首码,然后取人们日 常对其习惯性叫法的读音的首字母。

如:顿号“、”=i+d;如果输入代码“idh”,提示行上将会出现逗号“,”和顿号 “、”供选择。

写字码提供的常用标点符号和特殊符号的编码列表如下:   符号名称 代码     可  输  入  的  符  号  内  容     说  明 顿号、逗号 感叹号 分号 冒号 句号 问号 单引号 双引号 书名号 省略号 破折号 代字号 各种括号 分节号 百分号 千分号 序号     罗马数字 运算符 温度符号 欧姆符号 无穷大符号 各种符号 各种字母  idh  ig  if  im  ij  iw  idy  isy  ism  isl  ipz  idz  ik  ifj  ibf  iq  ix      il  iy  iwd  io  iwq  i  iz   、,   !   ;   :   。   ?   ‘ ’   “”   《》   ……   ——   ~  ()〔〕《》〖〗【】{ } < >  §  %  ‰  ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩  ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽  ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩  ⅠⅡ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ  ±  ×  ÷  +  -  =  *  ℃  Ω  ∞∝  * ~ & £ # ※ § № @ $ 等  α β γ λ μ π ρ σ δ ε 等 对于不同括号的 编码可直接用字 母i加上括号的 读音,如:小括号 的编码为:ixkh

18.词组编码

字、词混合输入是写字码的主要特点之一,写字码提供了50000多条词组,因此在使用 词组输入时将会大大提高汉字的输入速度。

(1)两字词的取码原则是:分别取每个字的前两位编码。

如:说明=S(说)+Y(讠)+M(明)+R(日)    问题=W(问)+M(门)+T(题)+R(日)

    集体=J(集)+R(亻)+T(体)+R(亻)     岁月=S(岁)+S(山)+Y(月)+P(丿)

    理论=L(理)+W( )+L(论)+Y(讠)    心情=X(心)+D(丶)+Q(情)+X(忄)

(2)三字词的取码原则是:分别取每个字的首声码加上末位字的第二位编码。

如:新中国=XZG+K(口)    工程部=GCB+L(立)    阴雨天=YYT+H(一)

    不好看=BHK+S()    转折点=ZZD+Z(占)    突破口=TPK+S(竖)

(3)多字词的取码原则是:取前三个字的首声码加上末位字的首声码。

如:社会主义=SHZY    市场经济=SCJJ        发展中国家=FZZ+J(家)

身体健康=STJK        精神愉快=JSYK        生活幸福=SHXF

艰苦奋斗=JKFD        项目经理=XMJL        项目经理部=XMJ+B(部)

自强不息=ZQBX        中华人民共和国=ZHR+G(国) 五.简码的设置

设置简码的目的就是为了提高常用汉字的输入速度,写字码提供的简码包括:

(1)一级简码:写字码提供的一级筒码汉字有23个,它们是:

奥 北 成 的 儿 非 工 火 就 口 领 马 能 皮 起 日 世 同 鱼 为 小 业 质

A  B  C  D  E  F  G  H  J  K  L  M  N  P  Q  R  S  T  U  W  X  Y  Z

(2)二级简码

二级简码汉字共有485个,对于一些常用汉字还提供了与其经常连用的联想词组;

如:BH 不 不会    BJ 编 编辑    BL 办 办理    BZ 步 步骤    EH 而 而后

    EY 恶 恶意    FD 奋 奋斗    FN 妇 妇女    FZ 发 发展    GH 更 更换

    GJ  钢筋    GN 姑 姑娘    GS 骨 骨髓    JB 疾 疾病    MZ 民 民主

    JJ 经 经济    JX 举 举行    KH 开 开会    LZ 录 录制    SH 事 事后

    PH 平 平衡    QP 气 气魄    SD 商 商店    WR 伟 伟人    WX 惋 惋惜

    TJ 统 统计    TY 通 通用    OR 偶 偶然    WD  文文档    YG 应 应该

(3)三级简码

写字码提供的三级简码汉字有2380多个。 六.容错码的设置

对一些拆码容易出错的汉字,写字码提供了大量的容错码。

如:交 六下乂   JLXY或亠父    JDF     我 撇横点 WPHD或撇扌戈 WPTG

    欲 谷欠人   YGQR或八人欠  YBRQ    雇 户亻点 GHRD或点尸隹 GDSZ

    避 尸口辶   BSKZ或尸辛辶  BSXZ    燕 廿北灬 YEBD或艹北灬 YCBD

    湃 氵 湃  PDSB或氵 丰PDSF    首 撇目 SDPM或自    SDZ

    真 直下八   ZZXB或十下具  ZSXJ    赳 走钩竖 JZLS或走折竖 JZZS

    走 横竖捺   ZHSN或土竖捺  ZTSN    缶 午下山 FWXS或撇横竖 FPHS

因为在字典中有“走”字旁,因此在“土”字旁中找不到“走”字,故“走”字的正确 编码是按照对独体字的编码规则进行编码的。 七.把写字码挂接在不同汉字操作系统上的方法

1.把写字码电脑汉字输入法挂接在UCDOS5.0操作系统上的方法:

①按照写字码编码方案中对不同结构汉字的编码规则和对部分汉字编码的实施例,对 国标字库中的全部汉字进行编码。

②按照UCDOS5.0中的“万能输入法管理器”所要求的编码源文件的格式,利用字处理 软件(如CCED、Word等)把每个汉字及其编码编辑成相应格式的汉字编码源文件XZMUC.TXT; 挂接在UCDOS5.0操作系统上的写字码编码源文件(XZMUC.TXT)的格式如下:

名称=[写字码]

功能键号=9

码元表=abcdefghijklmnopqrstuwxyz

万能键=V

最大码长=4

是否自动选择输入=N

是否执行模糊搜索=Y

是否使用自定义词组=Y

自定义词组编码方案=O

奥    a

遨    aa

安    ab

安    abn

蔼    ac

    acy

蔼    acyh

.     .

.     .

③利用UCDOS5.0系统本身所提供的万能输入法编码字典管理器(IMDMNG),把写字码的 码表文件XZMUC.TXT编译成写字码的编码字典XZMUC.IMD,命令格式为:

IMDMNG XZMUC.TXT XZMUC.IMD

把编译好的XZMUC.IMD拷贝至UCDOS的DRV子目录下。

④然后运行UCDOS5.0系统本身所提供的万能输入法加载程序来实现写字码的挂接,命 令格式为:Limd XZMUC

⑤按组合键ALT+F9,提示行上将会显示[写字码],此时即可使用写字码编码方案中的编 码规则进行输入汉字了。

2.把写字码电脑汉字输入法挂接在Windows95操作系统上的方法:

①按照写字码编码方案中对不同结构汉字的编码规则和对部分汉字编码的实施例,对 国标字库中的全部汉字进行编码。

②按照Windows95中的“输入法管理器”所要求的编码源文件的格式,利用字处理软件 把每个汉字及其编码编辑成相应格式的写字码编码源文件XzmWin.txt,挂接Windows95中文 操作系统上的写字码编码源文件的格式如下:

[Description]

Name=写字码

MaxCodes=4

MaxElement=2

UsedCodes=abcdefghijklmnopqrstuwxyz

WildChar=v

NumRules=3

[Rule]

ce2=p11+p12+p21+p22

ce3=p11+p21+p31+p32

ce4=p11+p21+p31+p41

[Text]

奥a

遨aa

安ab

安abn

蔼ac

艾acy

蔼acyh

.

.

③把写字码的编码源文件XzmWin.txt复制到Windows95中的System子目录下,打开并运 行Windows95附件窗口中的“输入法生成器”,在“输入法生成器”窗口,单击“浏览”,选 择System目录下的XzmWin.TXT文件,并在“浏览”窗口中选择“确认”,接着单击“输入法 生成器”窗口中的“转换”按钮,转换结束后选“确认”,随后单击“输入法生成器”中的 “创建”按钮,对后面出现的提示窗口选择“确认”;最后关闭“输入法生成器”。

④打开Word或“写字板刀后,单击屏幕右下角的“EN”,屏幕的右下角将会显示“写字 码输入法”,用鼠标选择后,就可以使用写字码输入汉字了。

本发明写明了对组成方块汉字的四种基本结构“块”的定义及其取码的方法,以及对 不同结构类型汉字的编码方案。

本发明提出的拆首(或末)笔画法的拆码规则和把人们在日常生活中对汉字结构的描述 方式溶入编码方案的思想,使得每个汉字的音形编码更直观、易懂;同时对于不认识的汉字 进行了双重编码,写字码的单字输入重码率低于6.5%,并且提供了5万多条词组,因此写字码 既适合于广大电脑爱好者使用也适合于广大中小学生使用。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈