首页 / 专利库 / 动物学 / 羽毛 / 羽轴 / 一种汉字无重码快捷输入法及其中文键盘

一种汉字无重码快捷输入法及其中文键盘

阅读:256发布:2022-04-03

专利汇可以提供一种汉字无重码快捷输入法及其中文键盘专利检索,专利查询,专利分析的服务。并且一种汉字无重码快捷输入法及其中文 键盘 ,适用于CJK超大字符集七万表意汉字。本 发明 首创“多列简码、多路输入”高效录入方式和“声形形序、形形形序”三实一虚制编码,利用“序码”的去重码标识功能,不但使所有汉字均能以并列简码形式通过本发明“多通道并列输入中文键盘”快捷录入,而且简便有效的根除了所有单字重码和字词混列重码。高频先见、常用字优先的多字库分级编码、声形码和纯形码互为补充的双重检索、简繁体独立编码的输入界面、声形归码好学易用的“快捷码字根集”、以表义字元为界分区取码等简明准确的取码规则,以及30万条海量智能词库的口语化录入方式等编码新技术的组合应用,将中文录入效率和操作便利性提高到了极致。,下面是一种汉字无重码快捷输入法及其中文键盘专利的具体信息内容。

1.一种汉字无重码快捷输入法及其中文键盘,特别是一种适用于所有CJK国际表 意汉字的无重码快捷输入法,其特征在于:采用“三实一虚”编码制,以“序码”为 末位标识码、以“多列简码、多路输入”为主体编录模式,以及相应的多通道并列输 入中文键盘,通过一系列编码新技窍的组合应用,在当屏列示的前提下,实现所有 GB18030标准汉字基于常用字(声形码)优先的无重码简码录入,所有CJK表意汉字基于 纯形码编码的无重码快捷录入;可以通过以下相辅相成的技术方案及其组合加以实现, 其特征是
1.1字根集:适用于所有七万多CJK表意汉字无重码编码的《快捷码字根集》, 它由基本字根、归类字根、笔画码和二义字根四部分组成,并按音似或形似的特征与 键符字母对应归码;如下表所示:

附表说明:表中并列于归码字母后面的为一级简码字,可根据需要调整;为含折笔的 笔画组码集合;“ㄑ”代表所有折笔笔画,如:“亅乛_乚_ㄋ”等等;粗体字为二义字根;
1.1.1基本字根:由130余个字典规范部件和自定义字根如“我也丑了見○”等 组成,除少数象形字根如“八业羊(V),○(O),十木(I)”等按形似特点归码外,其 余均按拼音或英文谐音归码;
1.1.2归类字根:包括与基本字根同名的偏旁部首,特殊定义的类同字根以及类 归的笔画组码(如:“ㄑ”代表折笔笔画“乛_乚_”)等;
1.1.3笔画码:由五种单笔画及其两两组合的十五种笔画组码构成,并按音似或 形似特征归码为:[一]→H,[丨]→I,[丶]→D,[丿]→P,[ㄑ]→Z;同组笔画不 分先后,折笔“亅乚ㄋ”单独归码Z,结构关系固定的双笔字元“冫厶亠冂勹凵刂丩” 等不宜拆散;含折笔的笔画组以集合形式表示;
1.1.4二义字根:双字元字根“殳攴見用隹”在双字根字中分拆成二码,在多元字 中不分拆;字根“羽”在字右部时不分拆,在字下部时分拆成二码;
1.1.5等同字根:字根“韦页乌贝长车亚”简繁体等同适用;
1.1.6乖戾字元:对于CJK超大字符集中不符合汉字书写规范的乖戾字元如“○ ”等,除“○”归码○,其余都按“难”的谐音归码N;
1.2编码制式:
1.2.1编码方案:词组编码采用四位制字母编码;单字编码先将汉字按使用频度 编排成多字并列简码,再以同组简码字的排列序位即“序码”进行去重码标识;即对 于GB2312常用字采取“声形形序(声码+形1+形2+序码)”编码,对于余外的生僻字 采取“形形形序(形1+形2+形3+序码)”编码;
1.2.2序码:按同组编码字的排列序号作为末位标识码;序码可使用任意键盘符 号,最好是非字母键符“’,./;[\]`”,超出十列的并列简码字用字母码标识;每组编 码最多可有36个同码字;
1.2.3编码字库:按照GB2312、GBK、GB18030和CJK超大字符集的顺序,根 据“高频先见,常用字优先”原则,依次组装成积木式编码词库,以GBK/GB18030 作为标准字库,并通过中文输入法平台软件加载30万多条140余万字超级大词库;对 于CJK国际表意汉字,采用纯形码单字编码,并独立安装于相关中文操作系统,作为 古文等特殊文档的查遗补漏之用;
1.2.4编码版本:根据不同操作界面和汉语使用区域分设GBK、GB18030、CJK 三级输入平台,并设简、繁体两种版本,简体版“快捷码输入法”以简体字(声形码) 优先,繁体字和生僻字(纯形码)从后,繁体版则反之;
1.3编码规则:
1.3.1取码规则:1)、独体字按书写顺序依次取首次末三码;合体字以汉字表义 字元结构间隙为界,按上下、左右或内外的组合类型,区划为“字头+字身”两部,字 头部取一个首形码(形1),字身取首、末二码(形2、形3),字身只能取到一码时,返取 字头部一个末形码作补码(形3);2)、双字根字只取2码、不取补码;3)、双笔画字按 单笔画分解取码;4)、对称结构组合字先取居中的字元(形1),次取左上、右下的字 根(形2、形3);5)、与前后字元都能组合成字的双向字元,归入字身部取码;6)、形 码有字根时取字根码,无字根时取笔画码;
1.3.2编码细则:1)、在不拆散相邻成字字元前提下,当前字根能取大不取小, 能取离不取交;2)、“十大木夫”以及在轴对称字中居中的字元优先取码;3)、合体字 中竖笔串字元不分割,横笔串起的字元可分割;4)、品字形合体字取三角部位字根归 码,品字形重叠字元视为单字元;5)、闭合字元末码取外,开放字元末码取内,收笔 右上角的丶不取返码;6)、嵌套字元先外后内、末码取内;7)、偏旁部首从特殊编 码“b,a~b,z”检录;拆码疑难字从特殊编码“n,a~n,z”检录;
1.4简码输入:
1.4.1通过一字三拆、最多取三位实码的“声形形序/形形形序”编码,将简码 适用范围扩展到所有七万多个CJK表意汉字;
1.4.2根据常用字优先原则,将所有汉字按使用频度编排成多字并列简码,同组 简码以GB常用字居先,生僻字从后;通过本发明“多通道并列输入”中文键盘完成 多列简码多路输入;
1.4.3利用二码简码的可编辑性,将高频常用字、双字根字、拆码疑难字和三码 重码字都整合为二码简码,形成一个机动编辑区;
1.4.4 GB18030以下字符集每组并列简码限于当屏列示的10字以内,CJK超大 字符集每组并列简码限于30字以内,GB常用字限于每组简码前3位;
1.4.5对于每组简码前3位的GB常用字采用本发明中文键盘进行“三通道并列 输入”,对于排列在第4位之后的生僻字,采用序码或数字键输入,
1.5、词组输入:
通过非字母键符“序码”作为末码标识,使单字编码与词组编码完全隔离,三码 打字、四码录词,词库容量不受单字编码制约;在此基础上,收集整理成近30万条、 140余万字的现代汉语词汇,组成《快捷码大词库》,通过智能化的词组编辑管理软件 和“四声码一词”的口语化录入方式,进行高效率词组录入;并为《汉语大字典》中 数万个通用汉字配置近五万条释义词组,使输入法与字典功能融合为一体;
1.6、中文键盘:
通过在常规键盘[空格键]右侧或两侧增加一个或多个、最好是2个候选字快捷[输 入键],与[空格键]并列操作,形成多个快捷输入通道,以“三输入键并列”作为中文 键盘主体方案,其实施方案可以是、但不限于以下的一种或几种:
1.6.1将[空格]键一分为二,分别作为第1、2候选字的录入键,[左空格]键保 留原空格键的连线和功能,[右空格]键与数选键[2]的距阵线路相连;同时将右[WIN] 键与数字键[3]距阵线路相连,作为第3候选字的输入键,经改制后的键盘最下方顺次 排
列以下各键:Ctrl键、WIN键、Alt键、空格键(SR1)、右空格键(SR2)、右WIN键(SR3)、 属性键(图中未标)、右Alt键、右Ctrl;
1.6.2保留[空格]键连线和功能不变,利用键盘定义软件或输入法软件将[右WIN] 键和[属性]键映射至数字键[2]、[3],或将其直接定义为第2、3候选字的输入键;各 输入键外形和布局;
1.6.3利用输入法软件将序码“’,./;[\]`”定义为第2-10候选字输入键;并将 符号键[’]映射或连接至右[空格]键,将符号键[,]映射或连接至右WIN键,各输入键 外形和布局;
1.6.4  1)、将数字键[2]、[3]分别复制并取代右[WIN]键和[属性]键;2)、将数字键 [2]移至字母[B]键位,数字键[3]移至字母[H]键位,字母“BNM”依次右移至符号[.], 符号键[,]、[.]下移并取代右[WIN]和[属性]键;字母“HJKL;”依次右移至[‘]键,[‘] 键下移至空格键左侧,由此形成与空格键纵向并列的三个输入键(SR1、2、3);
1.6.5在保留现有键盘布局不变或方案1-4的基础上,将增设的输入键控制线路 经由键盘微处理器或键盘电路板引出至脚控输入键,由双脚配合进行中文录入操作; 即:双手打字,双脚输入,[脚键]可以是一组类似于汽车油门踏板或工艺拖之类的 内藏式开关装置,其功用与上述快捷输入键同;
1.6.6根据输入法编码调整字母布局,组成既便于双手十指操作、又能显著提高 录入效率的中文键盘;经字母布局调整后的一种“快捷码中文键盘”,上排左起字母: QWERTYIPU0(读如:‘苛蒂’挨批有偶);中排左起:AFGDSHKJL(读如:发哥的是很克 己了);下排左起:VXCZBNM(读如:八小车子比马);
2.根据权利要求1所说的一种汉字无重码快捷输入法及其中文键盘,其特征在于: 所说的“三实一虚”编码制是:先将汉字按使用频度编排成多字并列简码(一字只多 取三位字母码编码,即“三实”),再以同组简码字的排列序位作为末位标识码(即“序 码”,一般为非字母编码,即“一虚”)以去除重码;在当屏列示的前提下,实现所有 GB18030标准汉字基于常用字(声形码)优先的无重码简码录入,所有CJK表意汉字基于 纯形码编码的无重码快捷录入;
3.根据权利要求1所说的一种汉字无重码快捷输入法及其中文键盘,其特征是: 以“三通道并列输入”作为最佳实施模式,以“三输入键并列”作为中文键盘主体方 案;
4.根据权利要求1所说的一种汉字无重码快捷输入法及其中文键盘,其特征是: 序码最好是非字母键符“’,./;[\]`”.

说明书全文

技术领域

发明涉及一种计算机汉字输入法,特别是一种适用于所有CJK国际表意汉字的无 重码快捷输入法及其中文键盘

背景技术

汉字输入法是一种利用键盘符号进行排序/检序的中文电脑检索方法,与“查字典” 原理相通。由于计算机字库中的汉字以十六进制内码排列,与汉字音形义特征没有关联, 不具备打字操作的实用性,故需要由输入法提供一种实用的检序方法,通过对汉字音、 形、义特征的提取和归简,完成从平面图形到线性数码编序的抽象变换,实现中文电脑 打字。而汉字经过编码变换,事实上已成为一种新型的计算机数码文字。
几十年来,随着信息交换量和应用领域的激增,计算机汉字库已由初期的6千多字 增加到ISO/IEC-10646 Unicode3.1版CJK Ext-A,Ext-B的70195个国际表意汉字(下 称“CJK表意汉字”),汉字编码任务也随之而扩大了10倍。汉字输入法作为我国特有 的群众性科研项目,素有“万(码)奔腾”之称,但由于缺乏坚实的研究基础和正确的 理论指导,大多只是在字根集定义的层面上折腾,没有根本性的突破方案。泱泱十五亿 华人世界,迄今没有一款公认科学易用的输入法成为国家标准输入法,也没有适用的高 效率中文键盘。国家权威部只对2万字的GBK字符集颁布了500多个编码部件,而对 于7万余字的CJK超大字符集,并没有适用的编码标准;对于严重制约录入效率的重码 问题,也没有有效的解决方案。而不具备编码惟一性、科学规范性和好学易用性的输入 法,就不成其为完善的汉字输入法。
为此,笔者在CN00112137.5号专利申请中提出了一种“双重简码、双路输入”的 编码方案,通过增加一个与空格键并列操作的快捷键,在“形形声形”编码的基础上, 第一次实现了2万多GBK字符的无重码快捷输入。其缺点是:“声码”对于3000余个常 用字以外的生僻字并不实用,其字根集和编码规则更无法实现对七万多CJK表意汉字的 无重码快捷编码输入:只增加一个输入键的“双路输入”,于规避重码、提高录入效率 的效果有限。另外一份题为“一种便于快速选取重码的汉字输入法”的专利申请(申请 号200510037057)提出,用“SDFGHJKL”8个字母作为重码录入键,但该方法的目的并 不在于减少或消除重码,而仅仅是为了改善重码字的录入方便性。而用“S、D”输入第 2、3位重码候选字,较之用数字键2、3选录,并无明显改进,且S先于D的录入方式, 有悖于字母排序常规。上述二份专利申请还因为单字与词组编码制式相同,与现有输入 法同样存在大量极为有害的字、词重码,词组容量被限制在三、五万条之内,严重影响 了录入效率。
一个好的输入法应当是各种编码要素的优化集合,必须从编码规则、字根集设计、 键盘布局、录入方式等方面通盘考虑,择优组合,才能解决问题。从根本意义上说,只 有字根集设计合理,取码规则好学易用,码长短、字码惟一对应,字词编码独立,词库 容量足够大,并且适于所有国际表意汉字的无重码快捷输入法,才是中文编码输入方法 的最终解决。

发明内容

本发明的任务是,通过一系列编码新技窍的组合应用,特别是基于以“序码”为末 位标识码、以“多列简码、多路输入”为主体编录模式,以及相应的多通道并列输入中 文键盘,提供一种适用于所有CJK国际表意汉字的无重码快捷输入法。
发明人经多年研究发现:尽管所有的输入法都以消除重码、方便汉字输入为编码宗 旨,但几乎没有一款能如愿以偿。原因在于:常规输入法编码由汉字本身的音义形特征 所决定,四码皆“实”,不具备规避重码的可编辑性。虽重码率高达35%以上却没有任 何回旋余地,只能任其重码严重影响汉字录入效率。而增加编码码符或码位并不能根本 解决问题。如某知名输入法,将编码增加到五位乃至六位,动用了3亿条编码源,在 CJK超大字符集中仍有40%以上的重码!其次,现有输入法都将英文Qwerty键盘作为标 准输入键盘,而该种键盘对于中文输入无论字母布局或键盘输入方式,都是极不相宜的。 中文字词数量浩繁、重码极多,需频繁使用数字键选录,但最常用的数字键“2、3”却 处于很不易操作的键盘左上,好比把出入口设到了楼顶上,以致人们宁可多打几码也 不愿数字键选录;而最便于双手大拇指操作的“底楼”却只有一只空格键“独守空闺”, 用一只空格键“单路输入单列简码”,只能产生600来个一、二级简码,远不能满足数 千个GB常用字的快捷录入之需,也无法用简码方式规避重码、减少取码难度。
对此,本发明的解决办法是:采用“三实一虚”编码制,多列简码、多路输入的编 录方法。即:先将汉字按使用频度编排成多字并列简码(一字只多取三位字母码编码, 即“三实”),再以同组简码字的排列序位作为末位标识码(即“序码”,一般为非字母 编码,即“一虚”)以去除重码;其后通过本发明的多通道并列输入中文键盘,进行多 列简码字的快捷“多路输入”;在当屏列示的前提下,实现了所有GB18030标准汉字基 于常用字(声形码)优先的无重码简码录入,所有CJK表意汉字基于纯形码编码的无重码 快捷录入,由此圆满完成了本发明的任务。
本发明所称的“多列简码”是指编码相同的一组并列简码字,它们既具有少拆一码 或几码的简码特征和输入便利性,又能通过序码标识,消除重码。经以“多列简码”编 排方式,将简码字数量扩大了N倍(N=序码数,可以有36个以上的并列简码),又利用序 码标识简单有效的去除了重码,并足以实现所有汉字的无重码简码输入。故而本发明具 有普适性,原则上适用于所有汉字输入法的无重码编码和快捷简码输入。
本发明所称的“序码”是指:按同一组编码的简码(或同码)字的排列序号作为末位 标识码的编码方法。由于序码与字义特征无关,无需识记、也没有任何的编码难度,实 属“虚码”。序码的使用,不但少拆一码,减轻了拆码工作量和取码难度,将简码适用 范围扩展至全部七万多个CJK表意汉字;而且避实于虚,简单有效的去除了所有重码, 大大便利了录入操作;序码可使用非字母键符,有利于字、词编码的相互隔离,并从根 本上消除字、词混列重码,使词库容量无限量扩增到30万条以上,一举解决了当今汉 字编码中诸多老大难问题。如不加序码、直接以数字键输入,虽也可行,但随机产生的 数字序位,不具备编码确定性和惟一性,不能从形式上改变汉字的重码状况,也不利于 码表编辑和转换(会打乱原有词序),重码翻页找字忒麻烦,选录时要多打一键,尤其是 使用最多的数字键[2]和[3]位处键盘左上角,操作不方便,形同虚设。与本发明“多列 简码多路输入”的编码理念本质不同。
本发明所称的“多路输入”主要是指:在现有键盘[空格键]右侧增加N个并列输入 键,形成N个候选字并列输入通道,由此完成对多个“多列简码”字特别是对2500多 个GB常用字的快捷输入。在此之前,虽也有输入法软件把符号键[;][‘]或[,][.]等定义 为第2、3候选字输入键的,但这些符号键位置也很偏,不能与空格键形成并列输入关 系,故并不适用。
按目前的中文输入方式,并列候选字默认每屏十个,由1-0十个数字键选录,本已 具备了“多路输入功能”。只是由于最常用的数选键1-3位置太偏,不能与空格键形成 并列输入状态,而未得到利用。本发明把这些被冷落的“数选键”安置到空格键旁边, 或将冗余的右[WIN键]和[属性]键直接定义为第2、3候选字输入键,则情况就完全不同 了。这时相当于在“底楼”增设了一排3个输入通道,可以有3个并列简码字得到与空 格键同样方便的快捷输入。而三通道输入方式,理论上可有78个一级简码,2028个二 级简码,35152个三级简码,对于2500多个GB常用字而言,已足敷使用。另据本发 明编码码表统计,有85%的单字是通过同组编码前3位录入的,也即是说,利用三键并 列输入方式可完成85%的单字和几乎全部GB常用字的快捷录入。而三通道输入模式, 无论键盘设置和操作上都最为便利。故此本发明以常用字“三通道并列输入”作为最佳 方案。即对于每组编码前3位的GB常用字,采用双手大拇指并列操作的“左、右空格 键”和一个辅助输入键实施三通道多路输入。对于排列在第4位之后的生僻字,可采用 序码或数字键输入,操作也很方便。
本发明的目的可以通过以下相辅相成的技术方案及其组合加以实现,其特征是:
1、适用于所有七万多CJK表意汉字无重码编码的《快捷码字根集》,它由基本字 根、归类字根、笔画码和二义字根四部分组成,并按音似或形似的特征与键符字母对应 归码;
2、字词分列的“三实一虚”编码制,词组编码使用四位制字母编码;GB2312常 用字(下称GB常用字)采取“声形形序”编码,余外生僻字采用“形形形序”编码; 根据常用字优先原则,依次组装成积木式编码词库,并设简、繁体两种版本;
3、旨在确保汉字编码准确性和惟一性的取码规则和编码细则,如:以汉字表义字 元为界分区取码;“十大木夫”及轴对称字中居中字元优先取码;品形字取三角,重叠 字元不分拆:偏旁部首和拆码疑难字从特殊编码“b,X”、“n,X”检录等等;
4、简码输入:所有CJK表意汉字均适用以并列简码形式的快捷输入;同组简码 GB常用字优先,生僻字从后;利用二码简码的可编辑性,将高频常用字、双字根字、 拆码疑难字和三码重码字都整合为二码简码;排列前3位的GB简码字采用最优化三通 道并行输入;
5、词组输入:在字词编码相互隔离的基础上,采编近30万条、140余万字的现代 汉语词汇组成本发明《超大词库》,并为《汉语大字典》中数万个通用汉字配置近五万 条释义词组,使输入法与字典功能融合为一体;通过智能化的词组编辑管理软件和“四 声码一词”的口语化录入方式,进行高效率词组录入。
6、中文键盘:通过在常规键盘[空格键]右侧或两侧增加一个或多个、最好是2个 候选字词快捷[输入键],与[空格键]并列操作实现多列简码多路输入,特别是以“三通 道并列输入”作为最佳方案;同时,根据输入法编码调整字母布局,组成既便于双手十 指操作、又能显著提高录入效率的本发明多路输入中文键盘。
下面就本发明的技术方案进行详细说明。
一、《快捷码字根集》
字根集合是决定输入法性能的技术核心。一个好的字根集设计应当规范易用,好学 易记,且能最大限度的离散重码;归码字根与键符字母的音形对应,规律有序,显而易 见;既要涵盖全部汉字字符集、做到字字取码有据,又不能生造和拆破基本部首。据此 确定适用于所有七万多CJK表意汉字无重码编码的《快捷码字根集》,见表1。
如表1所示,本发明《快捷码字根集》由基本字根、归类字根、笔画码和二义字根 四部分组成,并按音似或形似的特征与键符字母对应归码,各键字根自成口诀、声形归 码、联想识记,好学易用。通过对笔画码、等同字根、二义字元和CJK乖戾字元的规 范化归码定义,解决了CJK超大字符集七万汉字的字根归类和重码离散问题,并具有 良好的编码字母均衡性(未列入归码字根的构字部件按单字拆码)。
表1《快捷码字根集》

附表说明:表中并列于归码字母后面的为一级简码字,可根据需要调整;为含折笔的 笔画组码集合;“”代表所有折笔笔画,如:“亅乛_乚_”等等;粗体字为二义字根。
l、基本字根  由130余个字典规范部件和自定义字根如“我也丑了見○”等组成。 除少数象形字根如“八业羊(V),○(O),十木(I)”等按形似特点归码外,其余均按拼 音或英文谐音归码。如:Q:且欠气七犬,w:我王文五瓦韦,A(z,zh)走之中虫止,U(sh): 由又山石氏……等等。
2、归类字根 包括与基本字根同名的偏旁部首(如:犭乑豸→犬,亻彳→人,夂 攵夊→文等),特殊定义的类同字根(如:土→工、日→口、攴→卜,殳→几等)以及 类归的笔画组码(如:“”代表所有折笔笔画“亅乛_乚_”)等。
3、笔画码  由五种单笔画及其两两组合的十五种笔画组码构成,并按音似或形似 特征归码为:[一]→H,[丨]→I,[丶]→D,[丿]→P,→Z。同组笔画不分先 后(如[丶丨]或[丨丶]归码同为E),折笔“亅乚”单独归码Z,结构关系固定的双笔 字元“冫厶亠冂勹凵刂丩”等不宜拆散。鉴于汉字中折笔笔形变化最多,其笔画码组合 也最复杂,故本发明将含折笔的笔画组以集合形式表示,如表示“丂”等一 系列“横折”类笔画组码的集合,构形简单的笔画组元则直接列示于字根表中。
4、二义字根双字元字根“殳攴見用隹”在双字根字中分拆成二码,在多元字中 不分拆;字根“羽”在字右部时不分拆,在字下部时分拆成二码。
5、等同字根  字根“门韦页乌贝长车马亚”简繁体等同适用:门=門(M)、韦= 韋(w)、页=頁(Y)、鸟=鳥(N)、贝=貝(B)、长=長(C)、车=車(C)、马=馬(M)、亚=亞(Y);
6、乖戾字元  对于CJK超大字符集中不符合汉字书写规范的乖戾字元如“○ 等,除“○”归码0,其余都按“难”的谐音归码N。
特别声明:鉴于字根表组合方案的无穷性,上述公示的本发明《快捷码字根集》在 实际使用中还可能有少量的调整和增删,所有根据本发明《快捷码字根集》字根组成原 则引伸或局部修改而得的字根集定义,都在本发明技术特征的权利范畴之内。
上述《快捷码字根集》在GBK(21003字)、GB18030(27533字)和CJK(70195字) 各类字符集中的字母使用率如表2(图5)所示,图中KJM=快捷码,WB=五笔;CJM=仓 颉码。
由图5可知,本发明《快捷码字根集》以及相应的“快捷码输入法”字母使用率最 低(对应于码长短),字母使用率不均衡性最小(对应于重码几率最低)。
二、编码制式
A、编码方案
汉字总分单体字和合体字两类,单体字是指笔画组件相互嵌套、不具分割界面的单 字,如“女我也凸”等;合体字是指由两个或多个相对独立的形声表义字元按上下、 左右或内外的分割界面组成的复合字,如“李吴明回幕幾”等。汉字拆分取码是其书写 过程的逆形式,但由于汉字构形复杂,很容易产生歧义和重码。
根据汉字构形规律,发明人认为:当前将汉字一字四拆的做法是错误的。多取一位 编码看似对减少重码有利,但多一次拆码多一次麻烦和出错机会,对于诸如“汉字”之 类的双元字,其组成字根都是基本构字部件,仅有二码可拆,追加补码已属多余,如硬 拆成四码,势必把成字部件拆解成散笔,造成“无尾鱼、无头羊”之类的乖戾字根,非 但拗口难记,更有违于汉字识读教育规范。一字四拆不仅增加拆码工作量和难度,更且 字、词编码制相同,造成大量字词混列重码,只能装载数万条词组,严重影响了录入效 率。而对于“彀毂轂榖穀觳糓殻殼嗀嗀瞉瑴縠”等同形系列字,常规输入法四码都是“士 冖几又”,造成无法规避的重码,打足四码后还要用数字键选录,倒不如只取三码,末 码用序码标识,既消除了重码,又少拆一码、实现了简码编录。
据此,本发明规定:词组编码一律采用四位制字母编码:单字编码根据方便实用和 高频先见的原则,先将汉字按使用频度编排成多字并列简码,再以同组简码字的排列序 位即“序码”进行去重码标识。即:对于GB2312常用字采取“声形形序(声码+形1+形 2+序码)”编码,对于余外的生僻字采取“形形形序(形1+形2+形3+序码)”编码;这种因 字制宜的编码制式,既便于GB常用字按读音取码和口语化的词句输入,充分发挥音码 的通俗易用之利,又便于生僻字的快捷录入。
B、序码
本发明所称的“序码”是指按同组编码字的排列序号作为末位标识码的编码方法。 序码可使用任意键盘符号,但对于GB18030以下字词混编的标准字符集,最好是非字 母键符“’,./;[\]`”,超出十列的并列简码字用字母码标识。以“’,./;[\]`”+26个 字母作为全部序码标识符(适用于CJK超大字符集),每组编码最多可有36个同码字。
例如:本发明编码为“JJ”的GBK字有“近键斦凧釩釚釿鈒鍂”九个。为首两字“近 键”为并列二级简码,可用本发明中文键盘的左、右[空格键]双路输入,其余“斦凧釠釚 釿鈒鍂”7个双字根字经尾缀序码“‘,./;[\]”标识后消除了重码,并可用数字键或序码 直接输入。与二级简码输入击键数相同,等效于将二简码字增加了N倍。
C、编码字库
鉴于汉字常用字只有2500多字,在CJK超大字符集中仅占0.3%,如不加优先的编 码混排,势必将这些常用字淹没在99.7%的荒词废字中而不便于搜检录入。为此本发明 按照GB2312、GBK、GB18030和CJK超大字符集的顺序,根据“高频先见,常用字优先” 原则,依次组装成积木式编码词库,以GBK/GB18030作为标准字库,并通过中文输入法 平台软件加载30万多条140余万字超级大词库,编码字词总量300万余字,极大地提 高了中文录入效率;对于平常极少用到的CJK国际表意汉字,采用纯形码单字编码,并 独立安装于相关中文操作系统,作为古文等特殊文档的查遗补漏之用。
D、编码版本
根据不同操作界面和汉语使用区域分设GBK、GB18030、CJK三级输入平台,并设简、 繁体两种版本,简体版“快捷码输入法”以简体字(声形码)优先,繁体字和生僻字(纯 形码)从后,繁体版则反之;本发明通过将简体与繁体,单字与词组,生僻字和常用字 分级编码、独立输入;声形/纯形编码双重检索互为补充;以及“字带词”释义词组等 编码技窍组合应用,大大提高了码源利用率和录入效率,也提供了最大的操作自由度, 无论简体繁体,生字熟字,看打想打,都能得心应手。双手并列录入汉字弹琴般的美感 更有助于煅炼手脑协调机能,为中文录入增添乐趣。按此发明生产的多路输入高效中文 键盘,也为键盘厂商带来了新的商机。
三、编码规则
汉字构成字元一般赋予汉字以特定的音义内涵,比如“墨=黑土,意=心音”属表意 组合;“幕=莫巾、鹕=胡鸟”,属音义组合。而以现有输入法按字根顺序的取码法,取码 位置集中在汉字浅表部位,很易造成在同一字元中重复取码,如:“莫墓幕慕暮摹募蓦” 等字,其前三码“艹日大”,字元“莫”被重复取码三次,拆到第四码才能离散字元重 码。对于CJK字库中大量多元复合字,此类重复取码和冗余重码不计其数。
鉴于此,本着忠于汉字本义的原则,本发明规定了以下旨在确保汉字编码准确性和 惟一性的取码规则和编码细则:
A、取码规则  1)、独体字按书写顺序依次取首次末三码:合体字以汉字表义字元 结构间隙为界,按上下、左右或内外的组合类型,区划为“字头+字身”两部,字头部 取一个首形码(形1),字身取首、末二码(形2、形3),字身只能取到一码时,返取字头部 一个末形码作补码(形3);2)、双字根字只取2码、不取补码;3)、双笔画字按单笔画 分解取码;4)、对称结构组合字先取居中的字元(形1),次取左上、右下角的字根(形2、 形3);  5)、与前后字元都能组合成字的双向字元,归入字身部取码;6)、形码有字根 时取字根码,无字根时取笔画码。例如:
也(LZ)=乜/乚  手(PHZ)=丿/二亅    我(PTG)=丿/扌戈  (独体字按书写顺序取码)
十(HI)=一/丨    叵(KK)=匸/口    贵(AB)=虫/贝    (双字根字只取2个形码)
非(IHH)=||/三三  辩(VLI)=讠/立十  樊(VDI)=乂木/大    (对称结构字,首码取中)
吴(KHD)=口/天(一大)    缋(SAB)=“纟/贵(虫贝)    (合体字按字形分区取码)
暮(CFD)=莫(艹大)/日    鹕(INY)=胡(十月)/鸟”    (成字为界,末码取补码) 克(IKE)=十/兄;  倒(RwD)=亻/到;    儲(RYF)=亻/諸    (双向字元,从字身归码)
本发明“以表义字元分区取码”,定义明确,定位精准、取码直观,避免了在字头 字元中重复取码,有效的消除了冗余重码,也廓清了多数输入法在界定汉字分割层面时 的概念混乱。如上述“墓幕慕”等字,本发明按“莫/土,莫/巾,莫/小、”分区取“艹 土、艹巾、艹小…”,不但二码离散重码,保全了字义,还省用一个字根“莫”又如“彀 毂轂榖穀觳…”等类同字型在CJK字集中计达60余个,按常规方法四码同为“土冖几 又”,造成无法规避的大量重码。经本发明分区取码后,得到第1、2码为“士殳”,第 3码返取补码“弓、车、車、禾…小”,则告三码离散所有重码。
B、编码细则
1、在不拆散相邻成字字元前提下,当前字根能取大不取小,能取离不取交。如:
主(EG)=亠/土    急(PXK)=刍/心    鸿(DNG)=江/鸟    幕(CJD)=莫/巾
慧(FXK)=彗/心    夹(JFV)=夫/丷    百(0F)=丆/日    乘(HIV)=禾/丬八
朱(Nv)=/八    耒(Fv)=丰/八    啬(GFK)=土/回    隆(LWG)=阝/夂_
2、“十大木夫’’以及在轴对称字中居中的字元优先取码。例如:
妻(INl)=十彐/女    惠(IXE)=十(亠)/心  甫(IYD)=十/月、    夷(DG)=大/弓
爽(Dw)=大/乂乂    束(IK)=木/口    夹(FV)=夫/丷    春(FF)=夫/日
燕(cKH)=廿/口灬    辨(VLI)=丷/立十    晕(VZB)=爻冖/子    渊(Dv0)=氵/米丿丨
3、串笔字元,竖连横断 合体字中竖笔串字元不分割,横笔串起的字元可分割。如:
患(AxK)=串/心    宴(FNK)=日口/女    黑(SH)=/灬 戊(PG)=丿/戈
我(FIG)=丿扌/戈    哉(LFG)=立戈/日    栽(GIG)=土戈/木    戢(KGL)=咠/戈
4、品字形合体字取三角部位字根归码,品字形重叠字元视为单字元。例如:
俞(RYD)=人/月刂    矗(IIQ)=直/十且    舞(OXI)=_*/舛    薨(COP)=艹/歹匕
桑(uIu)=又*/木    贲(IBC)=十*/贝    叠(TBQ)=田*/冖且
5、闭合字元末码取外,开放字元末码取内,收笔右上角的、不取返码。例:
封闭型字元“回,叉,母,酉,卤,甘,卪”等处末码位时,取其外围字根“口,又,巜,西,口,廿,卩” 为末形码;
开放型字元“丸,凡,卂,巫,臣”处于末码位时,取其字元内的收笔笔画或字元“丶,丶,十, 人。I”为末形码:
含有收笔在右上角“丶”的字元,如“弋,求,发,甫”等,其末码应取右下角部分字元“七, 又,,又,月”,不返取右上角的“丶”为末码;
6、嵌套字元先外后内、末码取内。例如:
涑(DIK)=氵束(**口)    秉(HK)=禾彐(**彐)    乘(HIP)=禾北八(**匕)
7、二义字根 双元字根“殳攴兄用隹”在双字根字中分拆成二码,在多元复合字 中不拆分:字根“羽”在字右部时不拆分,在字下部时应分拆成二码。例:
軙(cEU)=車/卜又    寇(BHE)=宀/元攴  佣(RYI)=亻/月丨    响(KPY)=口/_用
鈠(JJU)=釒/几又    觳(GJY)=士用/殳  硯(UME)=石/目儿    寛(BCM)=宀/見
翱(BXI)=白十/羽    翥(GxX)=者/习习    雕(URK)=冂口/隹    誰(YRT)=言/亻_
8、特殊编码偏旁部首从特殊编码“b,a~b,z”检录;拆码疑难字从特殊编码 “n,a~n,z”检录。例如:
键入“b.a”可得归码a的偏旁部首“辶厶_癶”,键入“b.z”得到归码z的部首偏旁“亅乛 L巜_彑_”等等。键入“n,a”可得“乄孒凢卍卐卂芈开丯”十个拆码疑难字等等。
四、简码输入
简码是编码小于额定码长的快录形式,是减少拆码次数、提高汉字录入效率的有效 方法,也是输入法优劣的标准之一。汉语常用字有2500多个,如“我是一个大小子” 等,人们希望这些常用字都能以最少的编码进行快捷录入。
本发明通过一字三拆、最多取三位实码的“声形形序/形形形序”编码,将简码 适用范围扩展到所有七万多个CJK表意汉字。在此基础上,根据常用字优先原则,将所 有汉字按使用频度编排成多字并列简码,同组简码以GB常用字居先,生僻字从后;通 过本发明“多通道并列输入中文键盘”完成“多列简码多路输入”。
上述“多列简码”并非越多越好,超过十列的同码字需要翻页检索,也就失去了快 录的优越性,过多的并列输入键于操作不利,也无此必要。故此本发明规定:GBl8030 以下字符集每组并列简码限于当屏列示的10字以内,CJK(超大字符集每组并列简码限 于30字以内(可通过优选字根集组合和制定适用的编码规则加以实现),GB常用字限 于每组简码前3位(可通过编辑编码码表加以实现),并以“三通道并列输入”作为本 发明最佳实施模式。
除此之外,本发明利用二码简码的可编辑性,将高频常用字、双字根字、拆码疑难 字和三码重码字都整合为二码简码,形成一个机动编辑区,相当于增加了6000-18000 个可编辑码源,从而大大减轻了三位码的编码压,也为减少取码难度和规避重码提供 了很大的编辑自由度。
五、词组输入
词组编码输入是实现中文高效率录入的最佳方法。词组录入的关键在于便捷性和命 中率,词组编码应当尽量使用口语化的声码编码,在当屏列示(重码词条≤10)的前提下, 输入法词库越大越好。
本发明通过以非字母键符的“序码”作为末码标识,使单字编码与词组编码完全隔 离,三码打字、四码录词,词库容量不受单字编码制约。在此基础上,收集整理成近 30万条、140余万字的现代汉语词汇,组成《快捷码大词库》,并首创填空式语句输入 格式,诸如“不但要...而且要”,“并不仅仅是...的原因”等格式化联句,以及公式化词 组短语、成语等所有汉语词汇,都能以四声码一词为主的口语化输入方式录入(单字码 长0.7,较常规输入法减短3倍);还为《汉语大字典》中数万个通用汉字配置了近五万 条释义词组,通过打字以词组联想形式提示释义,见字识义,将输入法与字典功能融合 为一体。辅之以“高频先见,智能适配,屏幕取词,在线造词,交互编辑”等强大的输 入法软件管理功能,造词撰稿犹如说话般直白,50字以内的语句输录只在弹指一挥间。
六、中文键盘
现有汉字输入法多以英文Qwerty键盘作为输入键盘,由于中西文文体格式及其对 键盘输入功能和字母使用率的要求不同,造成中文输入方式和录入效率严重受制于该标 准键盘的状况。
鉴于此,本发明通过在常规键盘[空格键]右侧或两侧增加一个或多个、最好是2 个候选字快捷[输入键],与[空格键]并列操作,形成多个快捷输入通道,以期实现“多 列简码”字的“多路输入”和所有七万多个CJK表意汉字的无重码快捷输入。
根据本发明编码码表重码字的指数律递减特征,汉字总数85%单字和几乎所有的GB 常用字都可在汉字编码的前3位内完成输入,而采用“左、右空格键”外加一个辅助输 入键的“三通道输入”模式,无论键盘设置和操作上都最为便利。综合以上考虑,本发 明以“三通道并列输入”作为最佳实施模式。以“三输入键并列”作为中文键盘主体方 案,其实施方案可以是、但不限于以下的一种或几种:
方案一:将[空格]键一分为二,分别作为第1、2候选字的录入键。[左空格]键保 留原空格键的连线和功能,[右空格]键与数选键[2]的距阵线路相连;同时将右[WIN]键 与数字键[3]距阵线路相连,作为第3候选字的输入键。经改制后的键盘最下方顺次排 列以下各键:Ctrl键、WIN键、Alt键、空格键(SR1)、右空格键(SR2)、右WIN键(SR3)、 属性键(图中未标)、右Alt键、右Ctrl,如附图1所示。
方案二:保留[空格]键连线和功能不变,  利用键盘定义软件或输入法软件将[右 WIN]键和[属性]键映射至数字键[2]、[3],或将其直接定义为第2、3候选字的输入键; 各输入键外形和布局如附图1所示。
方案三:利用输入法软件将序码“’,./;[\]`”定义为第2-10候选字输入键;并 将符号键[’]映射或连接至右[空格]键,将符号键[,]映射或连接至右WIN键,各输入 键外形和布局如附图1所示。
方案四:1)、将数字键[2]、[3]分别复制并取代右[WIN]键和[属性]键;2)、将数 字键[2]移至字母[B]键位,数字键[3]移至字母[H]键位,字母“BNM”依次右移至符号 键[.],符号键[,]、[.]下移并取代右[WIN]和[属性]键;字母“HJKL;”依次右移至[‘] 键,[‘]键下移至空格键左侧,由此形成与空格键纵向并列的三个输入键(SR1、2、3)。
方案五:在保留现有键盘布局不变或方案1-4的基础上,将增设的输入键控制线路 经由键盘微处理器或键盘电路板引出至脚控输入键,由双脚配合进行中文录入操作;即: 双手打字,双脚输入。[脚键]可以是一组类似于汽车油门踏板或工艺拖之类的内藏式 开关装置,其功用与上述快捷输入键同,如图3。
鉴于现有键盘字母布局于中文输入很不适用,如:汉字拼音使用最多的字母 I(11429)、N(11326)、A(9928)和使用最少的字母V(103)、R(475)、F(750)在键盘中主 次颠倒,于操作非常不便,严重制约了中文录入效率的提高。对此本发明根据输入法编 码调整字母布局,组成既便于双手十指操作、又能显著提高录入效率的中文键盘。
经字母布局调整后的一种本发明“快捷码中文键盘”。上排左起字母:QWERTYIPUO(读 如:‘苛蒂’挨批有偶);中排左起:AFGDSHKJL(读如:发哥的是很克己了);下排左 起:VXCZBNM(读如:八小车子比牛马),如图1。
对于习惯于使用现有键盘的使用者,也可保留Qwerty键盘的字母布局不作调整。

附图说明

本发明有5个附图,图1-4是本发明技术方案示意图。
图1是本发明中文键盘方案1-4的外观效果图。它有三个输入键,输入键1和输 入键2由[空格]键分割而成。输入键3由右WIN改制而成。键盘字母布局按方案5“快 捷码中文键盘”标示,也可保留使用现有键盘布局;实用键盘产品可以根据需要在外观 和布局上进行适当调整。
图2是本发明方案4的一种键盘方案特例。数字输入键[2]、[3]移至键盘中轴位 置,与空格键形成纵向的并列输入格局,与此同时字母BNM和HJKL:依次右移,符号 键[,][.]分别下移至并取代右[WIN]键和[属性]位置,符号键[‘]下移至空格键左侧。
图3是本发明“多路输入中文键盘”配置脚键的组装示意图。也可对现有键盘不 作变更,只是从键盘中引出多路输入键或数字键[2]、[3]的控制信号至脚键。
图4是本发明快捷码字根集键位图,其字母布局可根据《快捷码中文键盘》进行 调整或不作调整。
图5是几种常用输入法的字母使用率统计表。

具体实施方式

实施例一  本发明编码词库实例(节选):
组织专家学者进行论证zzzz这种做法不失为一种好的选择zzzz这种做法与…毫无 二致zzzz在这种极端的困境中zzzz在这整个过程中zzzz载舟之水也覆舟zzzz自作 主张zzzz专制政治zzzz捉贼捉赃zzzz重中之重zzzz吱吱喳喳zzzz在政治经济文 化各个领域zzzy这在中外都一样zzzy最最重要zzzy折中主义zzzy暂住证zzzy种 族主义zzzy政治指导员zzzy最终只能由zzzy自主择业zzzy专制主义zzzy自斟自 饮zzzy这种做法严重挫伤了群众积极性zzzx  在这种思想影响下zzzx在这种观念 的支配下zzzx在这种严峻的形势下zzzx在战争条件下zzzx在这种情况下zzzx在种 种压力之下zzzx吱吱作响zzzx沾沾自喜zzzx中止执行zzzx遵照执行zzzx只争朝 夕zzzx......
实施例二 本发明GB18030字符集编码实例,如附表3
附表3:GBl8030字符集《快捷码》编码码表(节选)

实施例三 本发明CJK超大字符集编码实例,如附表4。
附表4:cJK超大字符集《快捷码》编码码表(节选)

以上本发明公告了一种适用于CJK超大字符集七万汉字的无重码快捷输入法及其 多通道输入中文键盘。
本发明通过以“序码”为末位标识码、以“多列简码、多路输入”为主体编录模式, 以及相应的多通道并列输入中文键盘,多种编码技窍组合应用,园满完成了发明的任 务。本发明首创“多列简码、多路输入”高效录入方式和“声形形序、形形形序”三实 一虚制编码,不但使所有汉字均能以并列简码形式通过本发明中文键盘进行多通道快捷 录入,而且简便有效的根除了所有单字和字词的混列重码。按声形特征归码的《字根集》 和适用于CJK超大字符集的编码规则使每组编码的重码字数降低到30个(实际为23 个)以内,继而通过序码的末位标识功能进一步实现了所有汉字的无重码简码录入。 GB18030以下的实用字库所有编码字当屏列示,并以本发明中文键盘实现多通道并列的 “多列简码、多路输入”,使中文难打和重码难除的问题从此成为了历史。高频先见、 常用字优先的多字库分级编码、声形码和纯形码互为补充的双重检索、简繁体独立编码 的输入界面、声形归码、好学易用的“快捷码字根集”、以表义字元为界分区取码等简 明准确的取码规则,以及30万条海量智能词库的口语化录入方式,融输入法和字典功 能于一体的释义词组,等编码技窍组合应用,大大提高了码源利用率和录入效率,无论 简体繁体,生字熟字,看打想打,都能得心应手快捷录入。双手并录弹琴般的美感更有 助于煅炼手脑协调机能,为中文录入增添无穷乐趣。按此发明生产的多路输入高效率中 文键盘,也为键盘厂商带来了新的商机。
表3:    输入法编码性能
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈