首页 / 专利库 / 电脑图像 / 字体微调 / 一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法

一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法

阅读:419发布:2020-06-02

专利汇可以提供一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,属于 自然语言处理 技术领域。本发明包括如下步骤:A、制作纳西象形文字体;B、根据步骤A的结果,构建纳西象形文字体库;C、根据步骤B的结果,构建纳西语、汉语、英语 电子 词典库;D、根据步骤C的结果,从纳西语、汉语、英语电子词典库 抽取 数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。本发明实现了纳西象形文输入法的实用性、可扩展性、灵活性,降低纳西象形文输入法开发的难度和复杂度、缩短开发周期。,下面是一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法专利的具体信息内容。

1.一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述方法的步骤如下:
A、制作纳西象形文字体;
B、根据步骤A的结果,构建纳西象形文字体库;
C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;
D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。
2.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤A中,制作纳西象形文字体的具体步骤为:
A1、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料;
A2、将收集的参考资料进行扫描,并以图片的格式储存;
A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片;
A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。
3.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。
4.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。
5.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤D中,制作码表的具体步骤为:
D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表;
D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。
6.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为:
E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E2、设置基本参数;
E3、设置IME;
E4、设置输入法的安装参数;
E5、加载纳西象形文字体库,进行字体打包安装;
E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。
7.根据权利要求6所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。
8.根据权利要求6所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。
9.根据权利要求6所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤

说明书全文

一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入

法的实现方法

技术领域

背景技术

[0002] 南丽江是联合国科教文组织确认的“世界文化遗产”之一,它具有悠久的历史文化,蕴含了浓厚的纳西民族文化。纳西象形文是一种“专象形,人则图人,物则图物,以为书契”的古老文字,被誉为“目前世界上唯一存活着的象形文字”,纳西象形文不仅是中华文明的瑰宝,也是世界文化发展史上的宝贵财产,受到了世界各地研究学者的广泛的关注。但是如今的纳西象形文在各种外来文化和现代文明的渗透和影响下,正在迅速地变异和消亡。许多学者担忧,为数不多的精通者百年之后,纳西象形文字将成为历史。
[0003] 针对纳西象形文字进行计算机信息化处理,以达到历史文化的保护,促进文化的发展、传播,仍然是目前纳西象形文的研究发展方向。
[0004] 目前,输入法的实现主要有两种方式,一、通过调用系统接口,自己编程实现;二、通过输入法编辑器实现。第一种方法主要实现特定功能的输入法,缺点在于实现难度较大、可扩展性、灵活性差。本发明在采用第二种方法的基础上,通过对TrueType字体技术、纳西语料库建设和Windows环境下IME技术的深入研究,针对纳西象形文输入法尚未公开这一现状,并结合纳西象形文字的独有特点,设计并实现了在Windows环境下纳西象形文三语即纳西-英语、纳西-汉语、纳西语拼音输入法。

发明内容

[0005] 本发明提供了一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,以用于解决现有针对纳西象形文的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现问题。
[0006] 本发明的技术方案是:一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,所述方法的步骤如下:A、制作纳西象形文字体;
B、根据步骤A的结果,构建纳西象形文字体库;
C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;
D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。
[0007] 所述步骤A中,制作纳西象形文字体的具体步骤为:A1、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料;
A2、将收集的参考资料进行扫描,并以图片的格式储存;
A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片;
A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。
[0008] 所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。
[0009] 所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。
[0010] 所述步骤D中,制作码表的具体步骤为:D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表;
D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。
[0011] 所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为:E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E2、设置基本参数;
E3、设置IME;
E4、设置输入法的安装参数;
E5、加载纳西象形文字体库,进行字体打包安装;
E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。
[0012] 所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。
[0013] 所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。
[0014] 所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤
[0015] 本发明的有益效果是:实现了纳西象形文输入法的实用性、可扩展性、灵活性,降低纳西象形文输入法开发的难度和复杂度、缩短开发周期。附图说明
[0016] 图1为本发明的流程图

具体实施方式

[0017] 实施例1:如图1所示,一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,所述方法的步骤如下:A、制作纳西象形文字体;
B、根据步骤A的结果,构建纳西象形文字体库;
C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;
D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。
[0018] 所述步骤A中,制作纳西象形文字体的具体步骤为:A1、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料;
A2、将收集的参考资料进行扫描,并以图片的格式储存;
A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片;
A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。
[0019] 所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。
[0020] 所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。
[0021] 所述步骤D中,制作码表的具体步骤为:D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表;
D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。
[0022] 所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为:E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E2、设置基本参数;
E3、设置IME;
E4、设置输入法的安装参数;
E5、加载纳西象形文字体库,进行字体打包安装;
E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。
[0023] 所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。
[0024] 所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。
[0025] 所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤。 [0026] 实施例2:如图1所示,一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,所述方法的步骤如下:A、制作纳西象形文字体;
B、根据步骤A的结果,构建纳西象形文字体库;
C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;
D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。
[0027] 所述步骤A中,制作纳西象形文字体的具体步骤为:A1、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料;
A2、将收集的参考资料进行扫描,并以图片的格式储存;
A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片;
A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。
[0028] 所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。
[0029] 所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。
[0030] 所述步骤D中,制作码表的具体步骤为:D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表;
D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。
[0031] 所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为:E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
E2、设置基本参数;
E3、设置IME;
E4、设置输入法的安装参数;
E5、加载纳西象形文字体库,进行字体打包安装;
E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。
[0032] 所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。
[0033] 所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。
[0034] 所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤。
[0035] 所述方法的具体实施步骤为:S1,制作纳西象形文字体。
[0036] 一,搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料:纳西象形文字的字符收集主要是通过搜集国内外学者研究纳西族象形文字著述,东巴经书、图报、对联以及木雕、墙体绘画的拍摄图片等信息资料。其中有李霖灿先生《么些象形文字字典》、《么些标音文字字典》、《么些经典译注九种》、傅懋先生《丽江么些象形文(古事记)研究》、《纳西图画文字(白蝙蝠取经记)研究》、美国人洛克《纳西语-英语百科辞典》,特别是纳西族学者方国瑜编撰、和志武参订的《纳西象形文字谱》已具有较高的学术平。
[0037] 二,将收集的参考资料进行扫描,并以图片的格式储存:如以“.jpg”格式储存扫描文件。
[0038] 三,将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片:去色处理:使图片对比分明;
裁剪处理:均采用100*100像素大小进行单个裁剪;
提取边缘处理:对单个纳西文字去杂后,提取图形边框;
使用图像处理边缘检测算法去噪处理:对单个图像进行分析比对。
[0039] 四,将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。
[0040] S2,构建纳西象形文字体库。
[0041] 根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库:针对已有的基于单字级别的纳西语-汉语双语翻译字典语料库,利用True Type字体技术在原有的2120纳西象形文字基础上,新增了2066纳西象形文字,并完善了纳西象形文的其他数据项的信息并对字符进行Unicode编码,例如:天- (E001)。字符的编码范围E000-E848,E8D0-EDE0,EF00-EF7F。最后把做好的纳西字库生成naxi.ttf字库。
[0042] S3,构建纳西语、汉语、英语电子词典库。
[0043] 电子词典是语言信息处理的基础资源,目前已经构建了一个包含2120个纳西—汉语—英语对照的纳西象形文词典,并且通过人工和机器辅助的方式扩展假借字、异体字、及多字组合等词汇1780多个,从而建立一个相对完备的纳西—汉语—英语电子词典库,为机器理解纳西语言提供词语级知识资源的支撑。主要实现思想如下:采用数据库技术建立纳西语—汉语—英语三语词汇关联对应词库表,实现数据规范化管理,词汇表中共有XH(序号)、NXW(纳西文)、NXFY(纳西拼音)、HZ(汉语)、YW(英语)、CX(词性)、HYFY(汉语拼音)等,从而实现纳西语、汉语、英语三语相互关联查询。具体的纳西语—汉语—英语三语词库表1所示:表1 部分具体的纳西语—汉语—英语三语词库表
S4,制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。
[0044] 码表是生成输入法的主要依据文件,该文件是一个扩展名为txt的文本文件,包含了生成输入法全部的特征信息和编码规则信息,是对生成输入法的完整描述。首先从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的纳西语-纳西拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表;将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。纳西象形文纳西语-纳西拼音、纳西语-英语、纳西语-汉语的码表中的部分编码如表2:
S5,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法:
纳西象形文纳西语、汉语、英语输入法采用输入法编辑器来制作生成,它是在传统输入法编辑器(Input Method Editor,IME)的所有功能基础上,完善了各类编码方案的实际需求,根据提供的文本码表以及编码规则来自动生成一个独立的输入法,并且将制作的输入法打包成一个安装程序。纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法制作过程如下:
第一步:运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;
第二步:设置基本参数:输入法发布者名称、输入法软件版本号、输入法帮助链接;
第三步:设置IME:候选词列表的排序设置、候选列表的显示、习惯设定;
第四步:设置输入法的安装参数:输入法注册码密钥、输入法的默认皮肤;
第五步:加载纳西象形文字体库,进行字体打包安装;
第六步:程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。
[0045] 另外,可以编写构词规则,主要是根据编写的规则来创建词条的相应编码。
[0046] 上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈