专利汇可以提供新型电脑专利检索,专利查询,专利分析的服务。并且一种以第五代计算机为 基础 的新型电脑、能在用户级终端上对信息流智能捕获、并联处理,该功能是通过对信息流的系统优化,建立信息网络拓朴图的数学模型和“全息 覆盖 分类”技术来实现的,不但或数量级的提高信息流的输入、输出速度,提高传输效率,还可压缩信息流在机内处理的存储量,使外设速度向主机速度不断靠近。汉字识别可达以下技术指标:速度至少100字/秒,字钟7000汉字(多字体)误识、拒识率不低于传统指标。,下面是新型电脑专利的具体信息内容。
1、一种新型电脑,包括计算机,外围设备、传输系统三部分。其特征在于:“全息复盖分类”技术在终端上能实现对信息流的智能捕获、并联处理。可成数量级的提高输入、输出速度,并能压缩信息流在机内处理时时存储量,使主机能与外围设备协调工作,还可提高信息流在计算机网络中的传输效率。
2、根据权利要求1所述的系统,“全息复盖分类”技术在输入方面如图1,3所示,其特征在于,信息流接收面输出接点(按时序分路)构成的模板再按信息流基本元(如汉字笔划等)特征进行复盖分类,若分为K类,则分路模板又派生出K个子模板,对信息流一段中的基本元进行并联匹配、接数据处理模块(可为传统识别法等)后给门电路赋命题,根据信息流的不同特征而设计了各级组合模块及相应软件可达到在用户级的终端上智能捕获、并联处理信息流的目的。综合各级组合模块的模型构成接点网络,每级点(门电路)和边(线路)的关系都构成笛卡尔乘积的一个子集,可用一个集合到另一个集合上的一个K元关系描述如图7所示,或用拓朴图的接点矩阵描述(见分案专利C11)。
在输出方面,只存基本元,用门电路(赋命题)网络判断基本元间的结构关系,接重排模块,即可用各种方法输出信息流而取代传统信息库(如汉字库)即可提高输出速度又可压缩信息流在机内的存储量如图2所示。
在传输方面,由于信息流是经过时序分路和K级组合模块而成串编码,所以不但可以压缩信息流在机内存储量,还可提高传输效率(详见分案C11)以“全息复盖分类”技术为基础可建立分案专利Cij,其中i=1、2、……K1,j=1、2、……K2,K1、K2均为自然数。
3、根据权利要求2所述的系统“全息复盖分类”技术在汉字识别方面系统框图如图4.2,4.3所示,多体汉字识别装置系统框图如图5,5.1-5.7多体汉字输出装置系统框图如图6所示。
4、根据权利要求3所述的系统,新型电脑汉字处理部分(包括输入、输出、传输)的技术指标、工艺流程图、传输部分框图等请见分案专利C11。
5、根据权利要求4所述的系统新型电脑是以词码为单位进行传输的如图8、9、10、11、12、13。
根据权利要求1所述的新型电脑传输系统,其特征在于编码的革新,如图9所示,4字节编码32位分配如下:从高位算起,1-5位放输入词拼音字母头一个字母编码(其中a对应十进位数1,b对应十进位数2,…z对应十进位数26,其中十进位数又均用五位二进制数表示)5-10位放输入词拼音字母尾字母编码,10-15位放输入词特征字母〔位置在词中汉字数(或拼音字母数)×0.618处的汉(文)字拼音的头一个字母〕编码,15-20位放输入词字数编码,20-24位放词汇序号(序号指具有同字头,同字尾,同特征字母,同字数的词汇集合中元素的(十进位)顺序号)编码,文字控制字由一字节8位组成31个控制字如1可表示中国汉字…等这种字、词、句特征编码四字节可传输261500880个中西文字、词、句,由于电脑自动对文字信息流分段编码,所以可提高输入、输出、处理速度压缩信息存储量、提高传输效率。
6、“门电路赋命题”技术可扩大到广泛的计算机硬软件系统。
本发明的目的:建立新型电脑,能成数量级的提高信息在电脑中的输入、输出、传输速度,压缩信息在电脑中处理的存储容量。
本发明的优点:
系统研究计算机的发展,可以发现当前计算机技术的突出矛盾是外围设备与主机速度不匹配,尤其1972年大规模集成电路出现以后,例如美国TRW公司正在研制的超级芯片,能集成三千五百万个晶体管。这种芯片的计算功能相当于一台超级计算机。该公司在芯片上设置了一些备用电路,并利用一种专用软件程序使芯片上的损坏元件能自动转到备用电路上。又如日本电公社最近宣布该公司已研制成功十六兆位动态随机存取存储器(DRAM)这种存储器是在一块一平方厘米左右的硅片上,集成了约三千五百万个电子元件,电路线线宽为零点五至零点八微米。超大规模集成电路的出现成数量级缩小了体积;成几个数量级的提高了速度,对一般中、小型机运算速度可达每秒几十万次左右,巨型机的速度可达每秒一亿次以上,例如美国在1973年已制成了一台每秒运算速度为一亿五千万次的巨型机,由于信息与光学技术的结合产生的光盘机成几个数量级的扩大存储量,如台湾光速公司与美国光速公司合作,已经开发出世界第一部五十英寸的光盘机,可读可写,容量400兆字节,一张单面的直径四点七二英寸的光盘,其存储量约等于一千五百张直径五点二英寸的软磁盘,或可储存十六开图形10000张,然而信息的捕捉获(如输入)速度与之相比太悬殊了,尤其是汉字的输入就更明显了,商品化的实用输入设备虽有各种键盘都要几秒钟才能键入一个字,所以“诺曼”型计算机速度再快,容量再大,体积再小也只是解决信息爆炸危机的一种潜在条件而不能 充分发挥作用,正象一个很聪明的人,耳聋眼瞎,听不到看不见任何课题,也解决不了任何课题,所以外设的改革与智能化使外设与主机协调工作可能是第五代计算机主攻方向之一。也是本发明的突出优点,“非诺曼”型计算机有各种方式,但目前世界上正在开发的是数据流型。这种计算机的工作方式是把程序中表示计算内容的命令和数据作为一束流来控制,并列起来加以处理。
在“非诺曼”型计算机的基础上,笔者从汉字识别开始探讨了一般信息的捕获,加工、处理问题,发明了一种“全息复盖分类”技术,是用软、硬件结合的办法,实现了一种以“全息复盖分类”模块为主的奇特构思与设计,分以下几部分:1、信息接收面分路模块,如图7所示,它是根据信息的基本单元为单位(如汉字是一篇文章的一个基本单元)对信息接收面上的信息输出接点进行分路而构成的模块。
2、“全息复盖分类”硬模块:将接受信息的分路模块全体输出接点按判别信息的处理要求进行“复盖分类”以达到并列捕捉信息的目的,现举汉字识别为例说明该硬模块优于传统识别之处,传统识别如图1所示,有许多种不同的方法,但不论何种方法,归纳起来,其模式均为:在计算机内建立标准文字的辞书用适当的识别准则,将输入的未知文字与辞书中的标准文字一个个地串联配比,最后根据识别准则判断未知文字为何字,为克服串联匹配中识别速度随字数的增加明显降低之不足而设计的,“全息复盖分类”硬模块可达到未知文字与全部辞书中的标准文字同时并联匹配的目的,将接受信息的变换元件(如光电元件)全体输出接点,按汉字的基本笔划复盖分类,即在笔划附近的空白点(ai)也分在该笔划类A,(aieA),而另一笔划附近的空白点也分在B类(aieB),这样在某些空点处就出现多次复盖现象,故称“复盖分类”然后将同类接点接到一块模板上,有多少基本笔划就有多少复盖分类硬模块,由于光电元件输出接点接了全体汉字集合的基本笔划,而这些基本笔划又可组成基本构 件和全体汉字集,其匹配是并联的。全体标准文字辞书构成模板通道、并联接在摄象管点阵的输出线上,当一未知文字被信息接收面接受后马上走自己的通道,即可达到汉字识别字数与速度无关的目的。
3、线路组合模块
“全息复盖分类”模块,在文(如汉)字识别系统中相当于叠放了许多传统标准文字辞书模板,每块模板与信息接受面相接,形成很多个并联的接收信息通道当一未知文字经光电元件转换成电信号集后,就有很多与辞书模板相联通道将未知电信号集信息接受,在传统识别中识别准则是判明未知文字归属的依据如相似度准则、距离准则等,基本上是软件实现。我的识别准则是各级组合模块及其相应软件,例如在汉字识别中一级组合模块是信息接收面分路模块,组合原则是将接受面的n个字的点阵压缩到一个字的点阵位置上,二级组合模块是将一个字的点阵坐标按汉字集的基本笔划复盖分类,分为K类,每类点阵接点均接到一区,形成K个组合(模块)区,经预处理,统计决策,模糊处理(数据处理)后即可判断未知文字的笔划,三级组合,根据每个汉字的基本笔划组成基本构件,经数据处理模块可判断未知文字的基本构件,四级组合,根据每个汉字的基本构件组成汉字集,经数据处理模块可判断未知文(汉)字。五级组合,根据单个文(汉)字组合词,经数据处理软件、编码模块后可输出词的编码,组合模块网络示意如图7所示,不难看出,示意图的数学模型,每级点与边的关系都构成笛卡尔乘积的一个子集,其特征涉及到K层点集合及边集合的序偶关系,一般图论中所述集合A到集合B上的一个二元关系远远不能满足要求,该网络须用集合A到集合B上的一个K元关系描述,并建立K级阶矩阵、度矩阵及接点矩阵等概念。
定义1、若笛卡尔积的一个子集称集合A1到集合A2的一个二元关系,记为B1,则B1到集合A3的一个二元关系定义为A1到A3的三元关系。
定义2、若笛卡尔积的一个子集B2为集合A1到集合A3的一个三元关系,则B2到集合A4的一个二元关系定义为A1到A4的四元关系,依此类推……。
定义3、笛卡尔积的一个子集Bn-2为A1到An-1的一个n-1元关系,则Bn-2到An的一个二元关系为A1到An的一个n元关系。(n可以是任何自然数)。
定义4、拓朴图;一个图定义为一个偶对(U、F),记作W=(U、F),其中(1)U是一个集合,它的元素仍为集合。
(2)F是无序积U&U的一个子集合,其元素为边的集合。
我们分别用U(W)和F(W)表示拓朴图的顶点集合与边集合,如果U(W)和F(W)都是有限集合,则W称为有限拓朴图;否则称为无限拓朴图,在我们的新型电脑组合网络中只涉及有限拓朴图。
在我们建立了笛卡尔积的(K层)子集合、集合A1到集合Ak的一个K元关系、及拓朴图的定义后可对组合网络的特征用矩阵(K级阶矩阵、度矩阵及接点矩阵等)来描述(详细材料见分案专利C11),并记A为网络矩阵,对组合网络矩阵A有如下优点:
1、A可视为未知文字与标准(可为辞书)模板并联匹配的结构模型(框图)在文(如汉)字识别中是解决识别速度与汉字字数无关的技术关键之一。
2、该模型A可成数量级压缩门电路的数量,(详细计算见分案专利C11)。
3、该模型A中的门电路可赋命题如1(基本笔划等)而与之相应的边做为载体,经过高一级组合(可以是逻辑运算、数值计算等)后的门电路自动赋有命题2(如汉字中的基本构件集)与之相通的边做为载体经过再一级组合后的门电路自动赋有命题3(汉字集),对一般识别(包括声音识别,图象识别等)据须要而设置K后,经K级组合后的门电路就自动赋有命题K的意义,这样对一个信息集合的识别,就不必把全部信息(包 括结构信息)都送到计算中去处理,而是只送识别信息的基元信息(如汉字的基本笔划信息)用组合网络流判断基元间的结构特征(如汉字结构特征)可成数量级提高单个汉字的识别速度,加上基本笔划存储模块,可成几个数量级压缩汉字库的容量与提高输出速度。
以上三部分为新型电脑的硬件主要组成部分,该技术还涉及到各种数学模型如模糊数字处理技术,决策理论方法,句法分析方法等,和各种处理软件、系统软件等,组成所谓“全息复盖分类”技术,由于该电脑与传统外围设备的主要区别是数据流的并联处理是通过“全息复盖分类”来实现的,从信息的捕获开始就是智能化的。直到信息的处理,一种门电路赋命题的办法用组合网络做抽象的信息载体而判别全息的结构来压缩信息量的,具有较强的信息压缩能力,有较快的输入、输出速度,有丰富的智能处理能力,根据这种构思和设计不久会有以下几种分案专利Cij,其中i=1、2、……K1,j=1、2、……K2,K1、K2均为自然数。
本发明其特征之一,根据85109039号专利的总体构思,是光学系统光接收部分(微光摄象,光分路技术:光纤型分路,CRT型分路技术)另一“全息复盖分类”技术装置。
图1、信息流输入装置系统框图:
1、各种换能器,
2、放大电路,
3、时间序列分路模块,
4、全息复盖分类模块,
5、3→i,
6、i级组合模块,
7、数据处理模块,
8、门电路赋命题模块,
9、i=K?,
10、i+l→i,
11、编码模块,
12、CPU。
图2、信息流输出系统框图:
1、CPU,
2、编码模块,
3、K→i,
4、与i级组合模块并行的独立线路,
5、i=l?,
6、K-1→i,
7、与全息复盖分类相应的基本元点阵存贮器,
8、基本元点阵重排模块,
9、各种输出。
图3、图形识别系统框图:
1、被识图形,
2、光电转换器如CCD等,
3、放大,
4、时间序列分路模板,
5、1→i,
6、i级组合模块,
7、数据处理模块,
8、数块并联的被识图形i级子图输出,
9、i=K?
10、i+l→i,
11、数据处理模块,
12、编码模块。
图4、1.传统汉字识别框图,原则上是经分类串联配比,
(1)汉字原稿,
(2)检测,
(3)分类,
(4)判别,
图4、2.新型识别框图原则上是不分类,并联配比,
(1)汉字原稿,
(2)检测,
(3)判别。
图4、3.汉字识别系统框图,
(1)被识文章,
(2)检测,
(3)未知汉字影象信息点阵二值输出,
(4)放大,
(5)时间序列分路模块,
(6)全息复盖分类模块,
(7)数据处理模块,
(8)基本笔划判断输出,门电路赋命题,
(9)构件(偏旁字首)组合模块,
(10)数据处理模块,
(11)汉字构件判断输出,门电路赋命题,
(12)汉字集组合模块,
(13)数据处理模块,
(14)汉字集判断输出,门电路赋命题,
(15)汉字集组合模块,
(16)数据处理模块,
(17)汉词判断输出门电路赋命题,
(18)汉词编码模块,
(19)CPD。
图5、汉字识别及输出装置框图:
1、未知文字点阵信息二值输出如图5.1,
(1)被识别文章,
(2)CCD转换器,
(3)信息流二值输出,
(4)灯泡,
(5)光线,
(6)支架。
2、被识别文(汉)字信息放大(图5.2)
(1)时间程序开关,
M存贮器,
N时序控制器,
aii=1、2……24080经放大的信号输出。
3、多体汉字开关。
4、多种外文、数字开关。
5、全息点阵分路模块如图5.3。
该模块功能是将100个汉字点阵的输出接点都接到一个汉字点阵的位置上,如每个字的第1点均接分路模块的第1点……。
(1)表示第1区,
(2)表示第11区一第81,
(3)表示第91区,
(4)表示第10区。
(5)表示第20区一第90区,
(6)表示100区,
(7)表示分路模板,ai表示输入线,i=1、2、…K1,bi输出线。
6、多体汉字集全息复盖分类模块如图5.4,
b1…bk2来自图5.3的输出线,当i=K时,可能在图5.4的模板中bk重复(或称复盖)多次,所以图5.4的接点数远大于图5.3的接点数。
(1)表示第一区,E:数据处理模块,
(2)表示第2-19区,
(3)表示第20区……,
(6)表示第240区,每区的接点数由基本笔划决定。
A、B、C为三总线。
7、多体汉字数据处理模块,判断后输出基本笔划C1、C2、…Ck3,
8、多体外文数据处理模块判断后输出外文。
9、多体数字数据处理模块判断后输出数字。
10、基本构件组合模块如图5.5对来自赋基本笔划的门电路信号C1,C2…Ck3根据基本构件特征组合成新的模板,分为240个区,
A、B、C为三总线。E数据处理模块。
11、数据处理模块判断后输出汉字构件d1、d2、…dk4,
(1)表示第一区,……(6)表示240区。该模板有输入、输出两种线。
12、基本构件组合模块如图5.6,
来自赋有基本构件命题的门电路,根据汉字基本构件组字的特征组合成若干区(根据须要而定)每区都与数据处理模块相接。
A、B、C为三总线。
13、数据处理模块判断后输出汉字集,e1、e2、…ek5。
14、赋有汉字命题的门电路。
15、字编码模块。
16、词编码模块,(将f1、f2…fk6编码词组合模块见图5.7)
17、键盘。
18、词码传输控制。
19、词码传输线。
20、词输入控制
21、CPU。
22、字输出控制。
23、词输出控制。A、地址总线 B、数据总线 C、控制总线
24、字输入控制。
28、与各级组合网络并行独立的线路。
29、多体汉字基本笔划存储器。
30、重排模块,是将基本笔划的点阵坐标、按行、列次序从小到大排列。
31、打印机控制。
32、CRT控制。
33、激光打印控制。
图6、多体汉字输出系统框图:
(1)与赋有基本笔划命题的门电路相应之独立并行线路,M为与之相应笔划存储器。
(2)与赋有基本构件命题的门电路相应之独立并行线路,
(3)与赋有汉字命题的门电路相应独立并行之线路,
(4)字编码模块,
(5)基本笔划点阵坐标,
(6)重排模块,将构成汉字的基本笔划点阵坐标按行列从小到大依次排列,
(7)打字机控制,
(8)CRT控制,
(9)激光输出控制,
(10)数据总线,
(11)控制总线,
(12)地址总线。
图7、多体汉字各级门电路赋命题及组合网络示意图:
a1……ak1表示光电元件输出接点,
(1)表示一级组合网络,其目标函数为多体字点阵分路压缩在一个字的点阵(b1……bk2)模板上。
(2)为二级组合网络,将分路模板b1……bk2点阵接点按汉字集的基本笔划进行复盖分类,每类接点均接到一区,C1……Ck3个区,经数据处理即可输出基本笔划,C1……Ck3个。
(3)为三级组合网络,将赋基本笔划的门电路组合为基本构件d1……dk4,
(4)为四级组合网络,将赋基本构件的门电路组合为汉字集e1……ek5经数据处理即输出汉字集e1……ek5,
(5)为五级组合网络,将赋汉字集的门电路组合为汉词集f1……fk6,经数据处理即打开赋有汉词命题f1……fk6的门电路到
(6)所示的编码模块输出汉词编码
(7)或传输编码均可。“门电路赋命题”技术可扩大到广泛的计算机软硬件系统。
图8、新型电脑传输系统框图,分发送、传输、接收三部分。
1、键盘,
2、编码转换装置如图11所示,
3、键入编码模块,
4、用户级上的CPU,
5、外设(CRT等),
6、CCU,
7、发送装置(或接收装置),
8、传输装置,
9、接收装置(或发送装置),
10、控制字输入编码生成如图9其中
(1)表示输入词字头编码,26个十进位数表示的字母均用5位二进制数表示。
(2)输入词字尾字母编码,26个十进位数表示的字母均用5位二进制数表示。
(3)输入词特征字母编码,26个十进位数表示的字母均用5位二进制数表示。
(4)表示输入词字(节)数编码,32个(十进位)数用5位二进制数表示。
(5)表示输入词序号编码,15个(十进位)数用4位二进制数表示。
(6)表示输入词代有(1)(2)(3)(4)特征的汉(文)词集合。
4字节编码32位分配如下:从高位算起,1-5位放输入词拼音字母头一个字母编码(其中a对应十进位数1,b对应十进位数2,……Z对应十进位数26,其中十进位数又均用五位二进制数表示)5-10位放输入词拼音字母尾字母编码,10-15位放输入词特征字母(位置在词中汉字数(或拼音字母数)乘0.618处的字母或(汉)(文)字拼音的头 一个字母)编码,15-20位放输入词字母(或字)数编码,20-24位放词汇序号(指具有同字头,同字尾,同特征字母,同字数的词汇集中元素的(十进位)顺号)编码。
(7)文字控制字由一字节8位组成31个控制字,如1可表示中国汉字,…等这种字、词、句特征编码四字节可传输261500880个中西文字、词、句,由于电脑自动对文字信息流分段编码,所以可提高输入、输出、处理速度,压缩信息存储量、提高传输效率。
图11、编码生成模块
M编码寄存器:A、B、C三总线。e1,e2,…ek5为赋有汉字命题的门电路
D:3字节编码输入 10如图8所示,
图10、键入编码模块系统框图
1、键盘,
2、寄存器,
3、词组编码子模块,(取出M中有(1)(2)(3)(4)特征的编码,)
4、符合电路,
5、CPU,
6、汉词序号(5)输出,
7、CRT,
8、词编码(1)(2)(3)(4)(5),D:3字节编码输出。
9、输出系统。
图12、数据通讯系统的组成
1、数据终端,
2、终端子系统,
3、交换机,
4、交换线路,
5、专用线路,
6、线路子系统,
7、CPU,
8、计算机主机,
9、计算机子系统
10、CCU。
图13、新型电脑通信控制器CCU功能
1、业务处理
2、报文编辑管理
3、报文传输控制
4、通信处理
5、词符处理控制 6、词符装配控制
7、通信处理 8、计算机 9、通信线路。
参考文献
(1)(1)上海交通大学唐保兴、国新以及清华大学陆中等所使用的“结构分析法”、“句法分析法”。
(2)M·Yoshide等1973年提出的a-b-s法(Analysis-by-syn-thesis)主要是抽取笔划序列、查划笔字典来识别。
(3)K·Yannamoto,1980年提出的识别法。
(4)P·Biswas 1981年提出的模糊判定法。
(5)A·K·Ray 1981年提出的识别法。
(6)M·shiono 1981年提出的识别方法。
(7)隆1983年提出的识别法。
(8)获田博1983年提出的识别法。
(9)中野等1973年提出的识别法Tou和Gonzalez 1974年著的“决策理论方法”(包括确定性的方法和统计的方法)。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种紧凑的阀门控制机械手 | 2020-05-11 | 700 |
一种基于智能车联网的数据传输实现方法 | 2020-05-11 | 517 |
一种安全与智能化的实验数据管理系统及方法 | 2020-05-08 | 523 |
基于人工智能的多场景消化道内镜图像识别方法及系统 | 2020-05-08 | 126 |
一种基于VR技术的记忆提升检测方法及系统 | 2020-05-08 | 745 |
一种多功能智能复合凝胶材料、制备方法及其应用 | 2020-05-11 | 259 |
一种组合深度学习和概念图谱的电力故障事件抽取方法 | 2020-05-11 | 926 |
一种多功能吸尘器 | 2020-05-12 | 330 |
一种新型林业工程用育苗床 | 2020-05-12 | 523 |
一种用于智能眼镜的可调结构镜架 | 2020-05-11 | 560 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。