首页 / 专利库 / 人工智能 / 词性标注 / 汉字属性分类码输入法

汉字属性分类码输入法

阅读:704发布:2021-10-25

专利汇可以提供汉字属性分类码输入法专利检索,专利查询,专利分析的服务。并且一种汉字属性分类码输入法,根据汉字的音、形、意、性进行分类标识的 键盘 代码系统,系由以“音”标“形”的部首音码代码系统,以“意”、“性”的属性分类代码识别系统,汉字、词组的编码方法和改进的标准键盘构成。尤其在键盘中设立生僻字专用代码键和部首专用代码键,方便地解决了生僻字和部首字的输入。适用于各类中文信息处理系统。提供的快捷编码和输入方法,重码少、规则简易无需特别强记、符合汉字常规标识思维和习惯。,下面是汉字属性分类码输入法专利的具体信息内容。

1.一种汉字属性分类码输入法,其特征是根据汉字的音、形、意、性进行分类 标识的键盘代码系统,主要由:
(1)以“音”标“形”的部首音码代码系统,
(2)以“意”、“性”的属性分类代码标识系统,
(3)汉字、词组的编码方法,和
(4)改进的标准键盘构成。
2.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的以“音”标 “形”的部首音码代码系统,是指对汉字取两个标识单位,以其部首音码或第一音 码为标记,字的部首,取大不取小,凡能分成两个单位的,不分成更多单位,对于 不能以两个部首表示的字,则以首、末两部首为第一、第二标识单位,用部首音码 或第一音码标记,标记时分别用全拼法、简拼法和双拼法标注。
3.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的以“意”、 “性”的属性分类代码识别系统,是指根据汉字或词组的“词意”和“词性”分别 纳入根据学科分类、语法分类和实用分类划分的属性分类代码识别系统,分类时取 分类名称的音码作为代码,标记时分别用全拼法、简拼法和双拼法标注。
4.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的汉字、词组 的编码方法是指对GB-23l2(80)中全部汉字和常用词组的编码方法,其中:
单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构成的 部首音码法,或取该字的音码+该字的属性代码构成的分类码法,
生僻字取生僻字专用代码键+该字的第一标识单位、第二标识单位的部首音码,
部首字取部首字专用代码键+该字的音码或部首字专用代码键+该部首的笔画 代码,
双字词组用分别取两个汉字的第一标识单位、第二标识单位的部首音码相加构 成的部首音码法,或对可按属性分类的词组,取两字的第一音码+词组的两位属性 分类代码构成的分类码法,
三字词组用分别取三个汉字的第一标识单位的部首音码+词组一位属性分类代 码,或对可按属性分类的词组,取三字的第一音码+词组的一位属性分类代码构成 的分类码法,
四字及四字以上词组用分别取前三个汉字和末字的第一标识单位的部首音码相
加构成的部首音码法,或用分别取前三个汉字和末字的第一音码相加构成的音 码法,都不加分类代码。
5.按照权利要求1所述的汉字属性分类码输入法,其特征是所述的改进的标准 键盘是指根据前述规则,分别制备正面标记有部首读音代码,汉语拼音的声母、韵 母和标准键盘原位置的英语字母的标签,粘贴在原英语字母键处,成为汉字属性分 类码输入法的键盘。

说明书全文

本中发明属于计算机应用领域,涉及一种适用于各种汉字信息处理技术软件、硬 件系统中(包括电脑系统、汉字电传机、汉字电脑打印机、汉字终端机和通讯系统) 提供快捷的编码和输入方法的汉字属性分类码输入法

多年来,人们养成一套用音、形、意、性各种属性来标识汉字的习惯。

例如,询问:“尊姓大名”?最符合习惯的回答是:“吴美一,口天吴,美丽 的美,一二三的一”。此处,“口天吴”是字形、字音标识,“美丽的美”是词意 标识,“一二三的一”是词性(数)标识,规则简单、明了、直接、富有成效。

目前,汉字编码大体分为形码、音码和音形码三种类型。音码虽易学,但同音 字多,重码率高;形码大多有各异的复杂的编码规则,未经专训练很难推广应用; 音形码又需要掌握读音与字形两种因素,操作不便。

例如,《拼音输入法》(包括全拼、简拼、双拼码)分辨率低,重码字多,如 “bi”音汉字有60个、“fu”音汉字有80多个、“ji”音汉字有110多个,需要逐 屏选择,影响输入速度。《五笔字形输入法》拆字取码方法不符合常人的汉字识别 规则,130种字根的编码方案过于复杂,难学难用。《自然码》以音为主的输入方 法,但另配一套双音编码的方案,对原用拼音的用户甚为不便,对构成汉字的二、 三百个部件用象音、象形、变体方法编码,规则复杂,缺少统一记忆方法。《普通 码》“音”和“形”结合的的方法,对部首既有见“形”取码,也有按“音”取码, 有的代码需特别强记,缺乏统一规则。

仅以“吴”姓为例,《音码》要从60多个“wu”音字中选择;《五笔字形输入 法》的回答是:“口一大吴”;《自然码》、《普通码》的回答是“口大吴”;这 些显然不符合人们识别汉字的思维方法和习惯。

因而以上备现有方法,或重码多、或规则复杂,不符合人们对汉字的思维和识 别习惯,都不甚理想。

本发明的目的是改进现有技术的上述缺陷,设计一种重码少、规则简单易学无 需特别强记、符合汉字常规标识思维和习惯的,改进的汉字快捷编码和输入方法, 即汉字属性分类码输入法。

本发明的构思是通过如下技术方案实施的: 提供一种汉字属性分类码输入法,其特征是根据汉字的音、形、意、性进行分类标 识的键盘编码系统,主要由(1)以“音”标“形”的部首音码代码系统,(2)以“意”、 “性”的属性分类代码标识系统,(3)汉字、词组的编码方法和(4)改进的标准键盘构 成。

1.上述的汉字属性分类码输入法,其特征是所述的以“音”标“形”的部首音 码代码系统,是指对汉字取两个标识单位。

(1)本发明所述的“标识单位”,既有字典部首也有非字典部首。

①字典部首包括成字部首如“口、、木、月、八、弓、虫…”等,和非 成字部首如“丨、丿、刂、亻、讠、廴、艹、彡、犭、彳…”等;

②非字典部首如 嗷——第一标识单位“口(部首)”,

第二标识单位“敖”(字)。

(2)字的部首,取大不取小,凡能分成两个单位的,不分成更多单位,如 蔼——取“艹、谒”,不分“艹、讠、曷”, 吴——取“口、天”,不分“口、一、大”, 蓓——取“艹、倍”,不分“艹、亻、立、口”。

(3)对于不能以两个部首表示的字,则以首、末两部首为第一、第二标识单位, 如倍——第一标识单位是“亻”(首部首),第二标识单位是“口”(末部首),   凹——第一标识单位是“丨”(首部首),第二标识单位是“一”(末部首),   岸——第一标识单位是“山”(首部首),第二标识单位是“干”(末部首)。

(4)根据字型规则,对汉字以其构成部分的上下、左右、外内为序分别取部首, 如帮——第一标识单位是“邦”,第二标识单位是“巾”(上下型),   杯——第一标识单位是“木”,第二标识单位是“不”(左右型),   闭——第一标识单位是“门”,第二标识单位是“才”(外内型)。

(5)对字或部首标记时用部首音码或第一音码标记。

①音码指汉字或部首的读音编码,含声母和韵母(如张zhang,声母zh+ 韵母ang),不含声母的只取韵母(如阿a),不含韵母的只取声母(如嗯n)。

②第一音码指汉字(部首)整个音码的首位码(如王wang的首位码w)。

(6)标记时分别用全拼法、简拼法和双拼法标注,以适应使用拼音码中全拼、 简拼或双拼的不同习惯。如

部首巛(读“川”)——全拼音码chuan,第一音码c;

              简拼音码iuj,第一音码i;

              双拼音码uuf,第一音码u。

2.本发明创建了部首代码系统和属性代码系统

(1)部首代码系统(简称部首音码),取部首读声的第一音码为代码,采用以 “音”表“形”的统一编码规则,简单好记,无须背诵王码的字根口诀表、自然码 的部件代码表、普通码的字根键位表,打破了各种形码不规则编码的束缚,较好地 解决了难学难用问题。

①部首代码中成字部首取其第一音码为代码,如

口——代码取“k”,马——代码取“m”;

②非成字部首取其习惯读音的第一音码为代码,如

亻——代码取“r”(人旁),忄——代码取“x”(心旁);宀——代码取 “b”(宝头)。

本发明创建的部首代码键盘分布见附表2~4;本发明创建的分类代码键盘分 布见附表5。

(2)以“意”、“性”的属性分类代码识别系统(分类码),汉字、词组具备 词意和词性,用词意和词性的属性分类码识别汉字和词组,简单明了,直接达意, 也是减少重码的有效方法。

(3)根据汉字或词组的“词意”和“词性”分别纳入根据

①学科分类,如政治,经济,文化,历史,地理,天文,气象,物理,化 学,生物,农业,医药,科技,工业,交通,军事等;

②语法分类,如代词,数词,量词,副词,介词,连词,象声词,表色词, 表形态,表情,感词等;

③实用分类,如姓氏,机构,称谓,食用,衣着等识别划分的属性分类代 码识别系统。

(4)分类时取分类名称的读音作为代码,标记时分别用全拼法、简拼法和双拼 法标注。如生物——sw或s(全拼代码);uw或u(简拼代码);iw或i(双拼 代码)。

3.上述的汉字属性分类码输入法,其特征是所述的汉字、词组的编码方法是:

(1)单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构 成的部首音码法;

(2)或取该字的音码+该字的两位属性代码构成的分类码法。

(3)对不知读音的生僻字取生僻字专用代码键+该字的第一标识单位、第二标 识单位的部首音码,

(4)对部首字取部首字专用代码键+该字的音码或部首字专用代码键+该部首 的笔画代码,

(5)双字词组用分别取两个汉字的第一标识单位、第二标识单位的部首音码相 加构成的部首音码法;或对可按属性分类的词组,取两字的第一音码+词组的两位 属性分类代码构成的分类码法。

(6)三字词组用分别取三个汉字的第一标识单位的部首音码+词组一位属性分 类代码;或对可按属性分类的词组,取三字的第一音码+词组的一位属性分类代码。

(7)四字及四字以上词组用分别取前三个汉字和末字的第一标识单位的部首音 码相加构成的部首音码法;或用分别取前三个汉字和末字的第一音码相加构成的音 码法,都不加分类代码。

4.上述的汉字属性分类码输入法,其特征是所述的改进的标准键盘是指根据前 述规则,分别制备正面标记有部首读音代码,汉语拼音的声母、韵母和标准键盘原 位置的英语字母的标签,粘贴在原英语字母键处,成为汉字属性分类码输入法的键 盘。键盘上特别设置了生僻字专用代码键和部首字专用代码键,方便地解决了生僻 字和部首字的输入问题。

本发明的应用效果令人满意,达到了预期的发明目的。

1.观测指标

(1)分辨率  指编码系统对两级字库中汉字的分辨能

           计算公式:分辨率=编码分类数/汉字数×100

(2)重码率  指重码字数与总字数的比例。

(3)单码率  指无重码字数与汉字总字数的比例。

           计算公式:单码率=(100-重码率)×100

2.观测结果 观测指标           本发明     对照组   全拼法  简拼法  双拼法    (拼音码) 分辨率% 重码率% 单码率%     84      86      86     17      13      13     73      77      77     6.4     99.7     0.3

以下结合实例和附表对本发明作进一步阐述:

【例一】有的汉字用部首音码标识举例

单个汉字取其第一标识单位、第二标识单位的部首音码+该汉字的音码构成的 部首音码法,如安、按、案、、胺、鞍、桉、铵诸重码同音字,因取得的不同部 音码而得到完全分辨,如:

安——b(宀)+n(女)+an bnan(全拼),bnj(简拼),bnf(双拼);

按——t(扌)+a(安)+an taan(全拼),tjj(简拼),tff(双拼);

案——a(安)+m(木)+an aman(全拼),jmj(简拼),fmf(双拼);

氨——q(气)+a(安)+an qaan(全拼),qjj(简拼),qff(双拼);

胺——y(月)+a(安)+an yaan(全拼),yjj(简拼),yff(双拼);

鞍——g(革)+a(安)+an gaan(全拼),gjj(简拼),gff(双拼);

桉——m(木)+a(安)+an maan(全拼),mjj(简拼),mff(双拼);

铵——j(钅)+a(安)+an jaan(全拼),jjj(简拼),jff(双拼)。

【例二】有的汉字用属性分类码标识举例

单个汉字取该字的音码+该字的两位属性代码构成的分类码法,如:

冯——全拼fengxs  取冯的全拼音码“feng”+分类码“xs”(姓氏);

      简拼fgxu    取冯的简拼音码“fg”  +分类码“xu”(姓氏);

      双拼ftxi    取冯的双拼音码“ft”  +分类码“xi”(姓氏)。

沪——全拼hudl    取沪的全拼音码“hu”  +分类码“dl”(地理);

      简拼hudl    取沪的简拼音码“hu”  +分类码“dl”(地理);

      双拼hudl    取沪的双拼音码“hu”  +分类码“dl”(地理)。

苯——全拼benhx   取苯的全拼音码“ben” +分类码“hx”(化学);

      简拼bfhx    取苯的简拼音码“bf”  +分类码“hx”(化学);

      双拼brhx    取苯的双拼音码“br”  +分类码“hx”(化学)。

不再考虑字形拆分取码,对于方便输入,加快速度,减少重码,收到良好效果。

【例三】生僻字标识举例

生僻字读音较难掌握,本发明特设生僻字专用代码键“v”。标识时,取生僻 字专用代码键+该字的第一标识单位、第二标识单位的部首音码,如:

鞔(音man)——vgm取生僻字专用代码键“v”+该字的第一标识单位的部 首音码“g(革)”+该字的第二标识单位的部首音码“m(免)”;

黠(音xia)——vhj取生僻字专用代码键“v”+该字的第一标识单位的部 首音码“h(黑)”+该字的第二标识单位的部首音码“j(吉)”。

【例四】部首字标识举例

有的部首字除用区位码外,很难有其他方法输入,本发明另辟蹊径,特设部首 字专用代码键“o”。标识时,取部首字专用代码键+该字的音码或部首字专用代 码键+该部首的笔画代码,如:

丿(音撇)——opie取部首字专用代码键“o”+部首字的音码“pie(撇的 音码pie)”;或

丿(音撇)——oa取部首字专用代码键“o”+该部首的笔画代码“a(一 画的代码)”,此时提示行显示“一、丨、丿、乙”供选择。

【附表1 】笔画代码键举例 笔  画   代码 笔  画  代码 笔  画   代码 笔  画  代码 一  画    a 二  画    b 三  画     c 四  画   d 五  画    e 六  画    f 七  画     g 八  画   h 九  画    i 十  画    j 十一画     k 十二画   l 十三画    m 十四画    n 十五画     o 十六画   p 十七画    q 十八画    r 十九画     s 二十画   t ……。

【例五】双音词组用部首音码标识举例

双音词组分别取两个汉字的拆分单位作第一标识单位、第二标识单位,它们的 部首音码相加,使在拼音法编码同为“zhishi”的重码词组“只是、指使、支使、 致使、知事、指示、知识”,按本发明的部首音码标识,得到完全分辨,如:

只是——kbrp两字的拆分单位k(口)+b(八)+r(日)+p(丿);

指使——tzrl两字的拆分单位t(扌)+z(旨)+r(亻)+l(吏);

支使——syrl两字的拆分单位s(十)+y(又)+r(亻)+l(吏);

致使——zwrl两字的拆分单位z(至)+w(文)+r(亻)+l(吏);

知事——ukhs两字的拆分单位s(矢)+k(口)+h(一)+s(丨);

指示——tzex两字的拆分单位t(扌)+z(旨)+e(二)+x(小);

知识——skyz两字的拆分单位s(矢)+k(口)+y(讠)+z(只)。

【例六】双音词组用属性分类码标识举例

双音词组取两字的第一音码+词组的两位属性代码构成的分类码法,如:

上海——shdl上海两字的第一音码“sh”+分类码“dl”(地理);

一个——yglc一个两字的第一音码“yg”+分类码“lc”(量词);

爱情——aqqg爱情两字的第一音码“aq”+分类码“qg”(情感词)。

【例七】三字词组举例

三字词组分别取三个汉字的第一标识单位的部首音码+一位分类代码,如:

计算机——yzmk三字的部首码y(讠)+z(竹)+m(木)+一位分类码 “k(科技)”;或分别取三个汉字的第一音码+一位分类代码,如:

计算机——jsjk计算机三字的声码“jsj”+一位分类码“k(科技)”;

共产党——gcdz共产党三字的声码“gcd”+一位分类码“z(政治)”。

【例八】四字及四字以上词组举例

四字及四字以上词组,分别取四个汉字的第一标识单位的部首音码,如:

中华民族——khzf四字的部首码k(口)+h(化)+z(乙——读折zhe)+ f(方);

中央委员会——kphr前三字和末字的部首码k(口)+p(丿)+h(禾)+r (人);或取前三个和末位汉字的第一音码,如:

中华民族——zhmz“中华民族”四字的声母;

中央委员会——zywh前三字“中央委”和末字“会”的声母。

【例九】改进的标准键盘,在原键位增加部首键名,键位仍按原标准键盘次序 排列。

附表2~4分别按全拼、简拼、双拼提供了三种部首代码键盘举例。

附表5提供了分类代码键盘举例。 B  卜八勹宀比贝疒白 鼻                  O  [部首字专用代码键] C  寸艹采隹厂彳屮巛车臣虫赤辰              P  丿攴片爿疋皮 D  丶刂刀大斗歹豆                          Q  犭犬气欠青其 E  二卩阝廾儿                            R  人亻日 F  方父缶                                S  厶氵彡纟四 丨十士山饣尸手殳礻示石矢舌豕 G  亠冖广工弓戈瓜艮谷革骨鬼                   身食鼠 H  一灬火户禾黑                            T  冂扌土田夂 J  几巾己见斤钅臼戋金                    V  [生擗字专用代码键] K  匚凵口                                  W  囗文王韦瓦攵 L  冫力立龙来老囟里鹿                    X  小夕彐心忄肀穴西血辛 M  门马木毛母目皿矛米麦黾麻皿毛麦木目母    Y  讠又尢弋幺礻示日月衤业用衣羊页羽言酉西鱼音 N  女                                  Z  廴辶子自走足乙爪竹舟豸齿止                    【附表2】         全拼法部首代码键盘分布 A(zh)  Z爪竹舟豸齿止                         O         [部首字专用代码健] B      卜八勹宀比贝疒白 鼻                P         丿攴片爿疋皮 C      寸艹采隹                              Q         犭犬气欠青其 D      丶刂刀大斗歹豆                        R         人亻日 E      二卩 阝廾耳儿                         S         厶氵彡纟四 F      方父风缶                              T         冂扌土田夂 G      亠冖广工弓戈瓜艮谷革骨鬼              U(sh)     丨十士山饣尸水手殳礻示石矢舌豕身食鼠 H      一灬火户禾黑                          V         [生擗字专用代码键] I(ch)  厂彳屮巛车臣虫赤辰                    W         囗文王韦瓦攵 J      几巾己见斤钅臼戋角金                  X         小夕彐心忄肀穴西血辛 K      匚 凵口                               Y         讠又尢弋幺礻示日月衤业用衣羊页羽言酉 L      冫力立龙来老囟里鹿                            西鱼音 M      门马木毛母目皿矛米麦黾麻皿毛麦木目母  Z         廴辶子自走足 N      女牛鸟                             【附表3】    简拼法部首代码键盘分布 A(zh)  Z爪竹舟豸齿止                           O      [部首字专用代码键] B      卜八勹宀比贝疒白 鼻                  P      丿攴片爿疋皮 C      寸艹采隹                                Q      犭犬气欠青其 D      丶刂刀大斗歹豆                          R      人亻日 E      二卩 阝廾耳儿                           S      厶氵彡纟四 F      方父风缶                                T      冂扌土田夂 G      亠冖广工弓戈瓜艮谷革骨鬼                U(ch)  厂彳屮巛车臣虫赤辰 H      一灬火户禾黑                            V      [生擗字专用代码健] I(sb)  丨十士山饣尸水手殳礻示石矢舌豕身食鼠    W      囗文王韦瓦攵 J      几巾己见斤钅臼戋角金                    X      小夕彐心忄肀穴西血辛 K      匚凵口                                  Y      讠又尢弋幺礻示日月衤业用衣羊页 L      冫力立龙来老囟里鹿                           羽言酉西鱼音 M      门马术毛母目皿矛米麦黾麻皿毛麦木目母    Z      廴辶子自走足 N      女牛鸟                             【附表4】    双拼法部首代码键盘分布 A  政治类、[表]状态词、助词、指示代词、[表]重复词     M  (草)木类、[表]命令词 B  部门机构类                                         N  农业类、鸟类 C  财经类、[表]存在变化词                             P  [表]判断词 D  地理类、[表]动作词、大(写数)字                     Q  气象类、[表]趋向词、[表]情感、心理活动词 F  房建类、[表]方位词、[表]范围词、[表]否定词         R  人名类、人称代词 G  工矿类                                             S  [表]色词 H  化学类、花类、[表}环境词                           T  天文类、体育运动类、叹词、特殊代词 I  虫类、称谓类、[表]程度词                           U  数学类、(饮)食类、数(序)词、[表]时间词 J  军事类、计算机类、交通运输类、介词                 W  文教类、物理类 K  科学技术类、[表]可能、意愿词、[表]肯定词           X  姓氏类、虚词、[表]行为动作词、[表]性质词 L  历史类、量词、连词                                 Y  医药类、鱼类、衣着类、疑问代词                            【附表5】         分类代码键盘分布

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈