首页 / 专利库 / 人工智能 / 图灵测试 / 实现机器智能的方法和装置

实现机器智能的方法和装置

阅读:233发布:2020-05-14

专利汇可以提供实现机器智能的方法和装置专利检索,专利查询,专利分析的服务。并且实现机器智能(Machine Intelligence)的方法和装置MI(Machine Intelligence)是机器自身具有智能,具有解决问题的能 力 。MI之前,机器所体现出的智能,都是AI;离开AI,机器本身什么智能也没有。 牛 顿定律激发了机械革命,解放了人的体力。 图灵测试 的误导,使人深陷AI的囹圄;AI让机器貌似有智能,MI让机器真有智能;AI将人变为机器的奴隶;MI能激发机器革命,解放人的脑力,将人变回主人。MI时代来了,世界IT大反转、大洗牌的时刻到了;许多理论和技术都要消亡或重生、各种程序序言、标记性语言等将消亡……。真正科学是简单的;MI比AI简单百倍;它能让你在大反转、大洗牌中,具有超强的竞争力;处于遥遥领先地位。,下面是实现机器智能的方法和装置专利的具体信息内容。

1.一种二进制比特序列数字数据的处理方法,在一个二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于至少包含以下步骤之一:
1)建立标记比特与字节组相关联的步骤:
设字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
2)区分字节组步骤;通过扫描字节序列的标记比特区分字节组,根据三种不同情况,选择以下扫描区分字节组步骤:
[1]从左向右扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[2]从右向左扫描字节序列的标记比特区分字节组步骤;
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[3]从字节序列某一个中间比特标记区分字节组的步骤:
A.区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,改为向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
B.区分第1个字节组右边的字节组,按从左向右扫描区分字节组步骤区分;
C.区分第1个字节组左边的字节组,按从右向左扫描区分字节组步骤区分。
2.一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于:该装置包含以下装置之一:
1) 建立标记比特与字节组相关联装置;
设该装置字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
如果n=0;则将这个字节的标记比特置为0;
2) 区分字节组装置;该装置通过扫描字节序列的标记比特区分字节组;根据三种不同情况,该装置至少含有以下三种装置之一:
[1]从左向右区分字节组装置;
该装置从左向右扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至某个字节组;
[2]从右向左区分字节组装置;
该装置从右向左扫描字节序列的标记比特,含有以下操作步骤:
如果第1个标记比特为1,继续扫描,直到为0的标记比特;
继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[3]从字节序列中间的某个比特标记区分字节组装置;
该装置含有以下操作步骤:
A.区分第1个字节组的步骤如下:
如果这个中间标记比特为1,则从这个标记比特向左扫描:
如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
然后,改为向右扫描,直到为0的标记比特;
则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
如果这个中间标记比特为0,则从这个标记比特向左扫描:
如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
B.区分第1个字节组右边的字节组,用从左向右扫描区分字节组装置区分;
C.区分第1个字节组左边的字节组,用从右向左扫描区分字节组装置区分。
3.一种二进制比特序列数字数据的处理方法,其特征在于:二进制比特字节序列为超编码序列;其特征还在于:至少包含以下步骤之一:
1)建立对象或对象属性与超编码的关联步骤;
A.建立对象与超编码相关联;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
2)解析对象或对象属性包含以下步骤:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
4.一种二进制比特序列数字数据的处理装置,其特征在于:该装置含有超编码序列;其特征还在于:至少包含以下装置之一:
1)建立对象或对象属性关联装置,该装置用于将对象或对象属性与超编码相关联;该装置包含以下装置:
A.建立对象与超编码相关联装置;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联装置,该装置含有对象属性与超编码的关联关系;
2)解析对象属性装置,该装置包含:
A.通过区分超编码区分对象的装置;该装置通过扫描字节序列的超比特,区分超编码,区分对象;
B.解析对象属性装置:根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
5.一种二进制比特序列数字数据的处理方法,其特征在于:比特字节序列为超编码序列,其特征还在于:至少包含以下步骤之一:
1)建立算法或程序的对象或对象属性与超编码的关联步骤;
A.建立对象与超编码相关联步骤;一个对象与一个超编码相关联;
B.建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
2)解析算法或程序的对象或对象属性包含以下步骤:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性步骤;
3)机器边解析边运行步骤;该步骤包含以下步骤;
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并运行算法或程序;
4)生成可执行文件步骤;包括:
A.通过扫描字节序列的超比特,区分超编码,区分对象;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并生成可执行文件。
6.一种二进制比特序列数字数据的处理装置,其特征在于:比特字节序列为超编码序列;其特征还在于:至少包含以下装置之一:
1)算法或程序的对象或对象属性与超编码的关联装置;包括:
A.建立对象与超编码相关联装置;一个对象与一个超编码相关联;
B.建立对象属性与超编码或超编码的部分相关联装置;
2)机器运行装置;该装置包含以下装置之一;
1)边解析边运行装置;该装置包括:
A.通过区分超编码区分对象装置;
B.根据对象属性与超编码的关联关系,解析对象或对象属性,并运行的装置;
2)生成可执行文件装置;该装置包括以下装置:
A.通过区分超编码区分对象装置;
B.可执行文件装置:根据对象属性与超编码的关联关系,解析对象属性,并生成可执行文件。
7.一种二进制比特序列数字数据的处理方法,设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下步骤之一:
1)建立汉字编码与字形属性和语音属性相关联步骤;
通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
2)解析汉字属性步骤,该步骤包含以下步骤:
[1]根据汉字编码的值与字形属性的关联关系,解析汉字编码字形属性的步骤;
[2]根据汉字编码的值与语音属性的关联关系,解析汉字编码语音属性的步骤。
8.一种二进制比特序列数字数据的处理装置,其特征在于:设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下装置之一:
1)建立汉字编码与字形属性和语音属性相关联的装置;
该装置通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
2)根据汉字编码与汉字属性的关联关系,解析汉字属性的装置;该装置包括:
A.根据汉字编码与汉字属性的关联关系,解析汉字编码字形属性的装置;
B.根据汉字编码与汉字属性的关联关系,解析汉字编码语音属性的装置。

说明书全文

实现机器智能的方法和装置

技术领域

[0001] 本发明涉及数字数据处理领域。

背景技术

[0001] 从计算机诞生以来,机器所体现出的智能,都是人工智能。离开人工智能,机器本身什么智能也没有,什么事情也干不了。
[0002] 例如:如果没有人工智能为机器做自然语言理解,中文信息就无法处理;如果没有人工智能为机器做网页解析,就没有互联网;如果没有人工智能为机器做源程序解释或编译,所有的程序都无法运行。本文人工智能,是指:用人的智能为机器做翻译:如自然语言理解、网页解析和源程序解释或编译等。
[0003] 机器智能,MI(Machine Intelligence),不同于人工智能,AI(Artificial Intelligence)。

发明内容

[0004] 数字数据实质上是比特序列;机器没有智能的根本原因在于:比特序列中不含机器区分对象的语义,也不含机器解析对象属性的语义;机器不懂得如何处理数据,即机器没有智能。
[0005] 本发明的目的在于:让比特序列含有让机器能区分对象的语义;让比特序列含有机器能解析对象属性的语义;从而实现机器智能。
[0006] 发明内容和具体实施方式
[0007] 什么是机器智能;什么是智能
[0008] 机器智能是机器自身具有的智能,即机器自身具有解决问题的能;也就是,离开人工智能,机器自身所体现的智能。
[0009] 机器之所以没有智能,是因为机器不懂得数据,不具有区分和解析数据的能力。
[0010] 人具有区分和解析数据的能力,人有智能
[0011] 例如:“会计师去行开会”
[0012] 数据对人来说,这是一个汉字串,是一个汉字字形串,人懂得字形,即认识汉字,人依据自己的知识、经验;人具有区分和解析能力,这就是人的智能,人的智能具有将这个汉字串区分为词对象的能力,具有解析汉字语音的能力。
[0013] 例如:人能将上面汉字串区分为以下词对象:
[0014] “会计师去银行开会”
[0015] 对机器来说,数据是一个比特串,一个字节序列。这句话是一个汉字编码序列。
[0016] 对“会计师去银行开会”,机器不具有将一个字节序列区分为字节组的能力;即不具有分词能力,也不具有解析汉字语音的能力。
[0017] 从计算机诞生以来,机器具有存、取和计算数据的能力;但是,没有区分和解析数据的能力;机器没有智能。因此,必须借助于人工智能为机器理解和翻译。
[0018] 以下介绍,如何让机器具有记忆语义、关联、区分和解析能力,如何实现机器智能。
[0019] (一)如何让机器具有区分对象和解析对象的智能
[0020] 个汉字编码(GB2312)为2字节,每个字节的最左一位用作标记位,均置为1;ASCHII码是1字节,最左一位也用作标记位,置为0。
[0021] 这种用作标记的比特,称作标记比特。标记比特的取值也为0或1;但是,0或1不用作数值,仅用作标记。
[0022] 这里的标记比特,使机器具有了区分汉字编码与SCHII编码的能力。但是,不具有将一个字节序列区分为字节组的能力。
[0023] 通过标记比特与字节组相关联,字节组与对象相关联,让机器具有区分对象的能力;标记比特能使字节序列关联作者的语义,让机器能将作者的语义解析出来。
[0024] 一种二进制比特序列数字数据的处理方法,在一个二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于至少包含以下步骤之一:
[0025] 建立标记比特与字节组相关联的步骤:
[0026] 设字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
[0027] 如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
[0028] 如果n=0;则将这个字节的标记比特置为0;
[0029] 区分字节组步骤;通过扫描字节序列的标记比特区分字节组,根据三种不同情况,选择以下扫描区分字节组步骤:
[0030] 从左向右扫描字节序列的标记比特区分字节组步骤;
[0031] 如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
[0032] 如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
[0033] 从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[0034] 从右向左扫描字节序列的标记比特区分字节组步骤;
[0035] 如果第1个标记比特为1,继续扫描,直到为0的标记比特;
[0036] 继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
[0037] 如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
[0038] 从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[0039] 从字节序列某一个中间比特标记区分字节组的步骤:
[0040] 区分第1个字节组的步骤如下:
[0041] 如果这个中间标记比特为1,则从这个标记比特向左扫描:
[0042] 如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
[0043] 然后,向右扫描,直到为0的标记比特;
[0044] 则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
[0045] 如果这个中间标记比特为0,则从这个标记比特向左扫描:
[0046] 如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
[0047] 如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
[0048] 区分第1个字节组右边的字节组,按从左向右扫描区分字节组步骤区分;
[0049] 区分第1个字节组左边的字节组,按从右向左扫描区分字节组步骤区分。
[0050] 上述方法以装置方式描述如下。
[0051] 一种二进制比特序列数字数据的处理的装置, 该装置的二进制比特字节序列中,一个或多个字节对应一个对象;与对象相对应的字节称为字节组;由于字节序列中不含区分字节组的信息,对象难以区分;其特征在于:每个字节的最左比特,用作标记比特,标记比特的0或1用作标记;其特征还在于:该装置包含以下装置之一:
[0052] 建立标记比特与字节组相关联装置;
[0053] 设该装置字节序列的字节组含有(n+1)字节,n=0,或正整数;通过标记比特关联字节组的步骤如下;
[0054] 如果n不等于0,则将最右字节的标记比特置为0;其余n字节的标记比特置为1;
[0055] 如果n=0;则将这个字节的标记比特置为0;
[0056] 区分字节组装置;该装置通过扫描字节序列的标记比特区分字节组;根据三种不同情况,该装置至少含有以下三种装置之一:
[0057] 从左向右区分字节组装置;
[0058] 该装置从左向右扫描字节序列的标记比特,含有以下操作步骤:
[0059] 如果第1个标记比特为1,继续扫描,直到为0的标记比特,则从第一个为1的标记比特的字节,到为0的标记比特字节,被区分为1个字节组;
[0060] 如果第1个标记比特为0,则标记比特为0的字节被区分为1个字节组;
[0061] 从区分出的字节组的右边字节,按上述规则,继续扫描和区分,直至序列结束,或至某个字节组;
[0062] 从右向左区分字节组装置;
[0063] 该装置从右向左扫描字节序列的标记比特,含有以下操作步骤:
[0064] 如果第1个标记比特为1,继续扫描,直到为0的标记比特;
[0065] 继续扫描,如果下一个标记比特为0;则上一个标记比特为0的字节,被区分为一个字节组;
[0066] 如果下一个标记比特为1,继续扫描,直到为0的标记比特;则从上一个为0的标记比特的字节,到下一个为0的标记比特的右边字节,被区分为1个字节组;
[0067] 从区分出的字节组的左边字节,按上述规则,继续扫描和区分,直至序列结束,或至字节序列的某个字节组;
[0068] 从字节序列中间的某个比特标记区分字节组装置;
[0069] 该装置含有以下操作步骤:
[0070] 区分第1个字节组的步骤如下:
[0071] 如果这个中间标记比特为1,则从这个标记比特向左扫描:
[0072] 如果下一个标记比特为1,继续向左扫描,直到为0的标记比特,
[0073] 然后,向右扫描,直到为0的标记比特;
[0074] 则将左边为0标记比特的字节的右边字节,到右边为0标记比特的字节,被区分为第1个字节组;
[0075] 如果这个中间标记比特为0,则从这个标记比特向左扫描:
[0076] 如果左边标记比特为0,则这个中间标记比特为0的字节,被区分为第1个字节组;
[0077] 如果左边标记比特为1,继续向左扫描,直到为0的标记比特;则将左边为0标记比特的字节的右边字节,到右边第一个为0标记比特的字节,被区分为第1个字节组;
[0078] 区分第1个字节组右边的字节组,用从左向右扫描区分字节组装置区分;
[0079] 区分第1个字节组左边的字节组,用从右向左扫描区分字节组装置区分。
[0080] 一个字节组对应一个对象,区分字节组,就是区分对象。
[0081] 上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”
[0082] ;因为,保护范围会缩小。
[0083] 一个中文词对象是一个2字节、4字节、6字节,……,的字节组,由于字节序列中不含区分字节组的比特信息,词对象难以区分,即机器本身没有能力区分词对象,以下是机器智能中文分词实例。
[0084] “乒乓球拍卖完了”,假定作者的分词意图为:“乒乓球,拍卖,完,了”[0085] 作者按词输入(或编辑)时,机器按照标记比特标注规则,根据作者的分词意图,对字节组作标注,让机器记住作者的意图。
[0086] “乒乓球拍卖完了”,这个字节串为14字节。作者按照分词意图:“乒乓球,拍卖,完,了”,分别输入4个词。1个词为1个字节组。机器按照标记比特标注规则,对每1个字节组的标记比特,标注如下:
[0087] 对第1个字节组,6个字节的标记比特,分别标注为:1,1,1,1,1,0;
[0088] 对第2个字节组,4个字节的标记比特,分别标注为:1,1,1,0;
[0089] 对第3个字节组,2个字节的标记比特,分别标注为: 1,0;
[0090] 对第4个字节组,2个字节的标记比特,分别标注为: 1,0。
[0091] 标注前后的字节序列如图1(a)所示。
[0092] 标注后的字节串和对应的标记比特如图1(b)所示;实验实例如图2所示。
[0093] 机器根据标记比特扫描规则,区分字节组,将作者的意图解析出来
[0094] 用户获取数据时,机器根据标记比特扫描规则,区分出每个字节组,1个字节组对应1个词对象。
[0095] 根据标记比特扫描规则,扫描图2标记比特:0号标记比特为1,继续扫描, 1号标记比特为1,继续扫描,2号标记比特为1,继续扫描,3号标记比特为1,继续扫描,4号标记比特为1,继续扫描,5号标记比特为0;因此,0、1、2、3、4、5号字节被区分为1个字节组;这个字节组,对应词对象“乒乓球”;
[0096] 继续扫描:6号标记比特为1,继续扫描, 7号标记比特为1,继续扫描,8号标记比特为1,继续扫描,9号标记比特为0;因此,6、7、8、9字节被区分为1个字节组;这个字节组,对应词对象“拍卖”;
[0097] 继续扫描:a号标记比特为1,继续扫描, b号标记比特为0;因此,a、b字节被区分为1个字节组;这个字节组,对应词对象“完”;
[0098] 继续扫描:c号标记比特为1,继续扫描, d号标记比特为0;因此,c、d字节被区分为1个字节组;这个字节组,对应词对象“了”。
[0099] 扫描完毕,机器分词结果与作者输入的分词意图:“乒乓球,拍卖,完,了”,完全一样。[00100] 通过标记比特扫描,让机器具有将一个字节序列区分为字节组的能力,具有区分词的能力;机器具有了区分对象的能力,所以机器有了智能。
[00101] 实例中,朗读这句话时,机器在两个词对象之间,增加了停顿,用户通过时间间隔,能区分词对象。
[00102] 作者在创建文档(如输入或编辑)时,根据标记比特标注规则,标注比特标记:让机器将作者表达的精确分词意图存储起来,让机器具有了对作者意图的记忆能力。
[00103] 用户获取数据时,根据标记比特扫描区分规则,扫描含有标记比特的字节串,让机器具有了获取作者意图的能力。
[00104] 符合字节组标记比特标注规则的比特标记,称作Ubit(Ultra-bit,超比特)。超比特能使机器具有将一个字节序列区分为字节组的能力。
[00105] 含有超比特的字节组;称作Ucode(Ultra-code,超编码)。区分字节组的扫描步骤,又称作超比特扫描区分规则。超编码是机器可区分的编码。一个超编码的长度为n个字节,n为正整数,即每个编码可以任意长。
[00106] 标记比特与字节组相关联,即超比特与超编码相关联;通过扫描字节序列的标记比特区分字节组,即通过扫描超比特区分超编码。
[00107] 在一个超编码序列中,超比特使得机器具有了区分不同长度编码的能力。上例,将“乒乓球拍卖完了”的汉字编码序列,通过超比特,将作者的分词意图:“乒乓球,拍卖,完,了”与超编码相关联。这里,超编码序列的4个超编码长度分别为6,4,2,2字节。实验实例如图2所示。
[00108] 以上用超编码关联词对象;以下介绍如何关联对象或对象属性,机器如何区分对象和解析对象的属性。
[00109] (二)如何让机器具有区分对象和解析对象属性的智能
[00110] 以HTML语言为例,网页的图形对象的三个基本属性,在网页上用标签和字符串标记和描述如下:
[00111] ”红棕.jpg” ALT=”¤红棕马¤”>
[00112] 由于机器不懂得这些标签,不懂得如何区分对象,也不懂得如何解析对象的属性,因为对象的属性没有与机器懂的编码相关联。
[00113] 以下通过对象或对象属性与超编码的关联,使得机器具有了区分对象和解析对象的能力。具体方法和装置如下:
[00114] 一种二进制比特序列数字数据的处理方法,其特征在于:二进制比特字节序列为超编码序列;其特征还在于:至少包含以下步骤之一:
[00115] 建立对象或对象属性与超编码的关联步骤;
[00116] 建立对象与超编码相关联;一个对象与一个超编码相关联;
[00117] 建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
[00118] 解析对象或对象属性包含以下步骤:
[00119] 通过扫描字节序列的超比特,区分超编码,区分对象;
[00120] 根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
[00121] 上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”
[00122] ;因为,保护范围会缩小。
[00123] 上述方法以装置方式描述如下。
[00124] 一种二进制比特序列数字数据的处理装置,其特征在于:该装置含有超编码序列;其特征还在于:至少包含以下装置之一:
[00125] 建立对象或对象属性关联装置,该装置用于将对象或对象属性与超编码相关联;
该装置包含以下装置:
[00126] 建立对象与超编码相关联装置;一个对象与一个超编码相关联;
[00127] 建立对象属性与超编码或部分超编码相关联装置,该装置含有对象属性与超编码的关联关系;
[00128] 解析对象属性装置,该装置包含:
[00129] 通过区分超编码区分对象的装置;该装置通过扫描字节序列的超比特,区分超编码,区分对象;
[00130] 解析对象属性装置:根据对象属性与超编码或部分超编码的关联关系,解析对象的属性。
[00131] 上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
[00132] 这里的“关联”有多种方式,例如:
[00133] 第一,将对象或对象属性存储或嵌入到超编码;例如词对象中汉字的显示属性和语音属性;超编码或部分超编码直接指向对象或对象属性;这是一种直接关联方式;
[00134] 第二,超编码或部分超编码存储的是指针,指向对象或对象属性的关联关系,由关联关系,机器能解析对象属性;这是间接关联关系。
[00135] 这里的部分超编码是指:超编码中的1个或多个比特,一个或多个字节。
[00136] 这里对象属性包含:
[00137] 机器能懂得属性,机器能翻译给人的语义:如汉字的字形和语音;
[00138] 机器能懂的属性,但无需翻译给人的语义。
[00139] 实验实例:机器智能互联网实验网页实例
[00140] 对象或对象属性的关联步骤
[00141] 对象或对象属性与超编码或部分超编码相关联步骤的实例;
[00142] 图像对象具有三个属性,将图像用1个3字节超编码“F1 A2 7C”相关联,第1字节,存储对象种类属性,这里的“F1”存储的是图像对象。这个超编码关联图像的显示属性。超编码的 2、3字节,关联图像的超链接为:”红棕马.jpg”。
[00143] 图像、音频和视频对象与超编码的关联关系,如图3所示;图像、音频和视频对象,用3个字节的超编码关联或存储。超编码关联对象的显示属性,显示属性是为了让人懂的属性。例如:类似五线谱的符号∮表示音频;如:∮致爱丽丝∮;类似放映机的符号♂表示视频;如:
♂猫和老鼠10♂;符号¤表示图像,如:¤红棕马¤。注意:这些符号,仅用来帮助人区分不同对象。
[00144] 字节超编码分为两部份,第1字节用来关联对象的种类属性,例如:F1、F2、F3分别关联图像、音频和视频对象;它具有区分128种对象的能力。第2、3字节用来关联超链接属性。
[00145] 机器解析对象或对象属性的步骤
[00146] 根据对象或对象属性与超编码或部分超编码的的关联关系,机器区分对象和解析对象属性的步骤如下。
[00147] 仍以图像为例,图3中,3字节超编码为,F1 A2 7C
[00148] 机器根据图3的关联关系,根据该超编码关联的显示属性:¤红棕马¤;机器将该超编码在网页上显示为:¤红棕马¤;
[00149] 该超编码的第1字节为F1,机器懂得该超编码对象的种类属性为图像对象;
[00150] 该超编码的第2、3字节,关联的是对象的超链接属性,机器从服务器调取文件,显示该图像。
[00151] 一个机器智能互联网实验网页
[00152] 对象创建时,机器将作者的意图与超编码相关联
[00153] 各种对象均通过一个输入法接口输入或编辑,将作者分词和语音意图与超编码相关联, 将图像、音频和视频等对象以及对象的属性与超编码相关联。
[00154] 部分图像、音频和视频对象的超编码如图4(a)的第一行所示;超编码的关联关系如图3所示。
[00155] 关联关系的建立有多种方式:
[00156] 如,静态方式,由创建人事先建立。
[00157] 又如:动态建立:,在创建过程中,自动建立。
[00158] 网页输入或编辑完毕,生成超编码文件,一个超编码序列,如图4(a)所示。
[00159] 在图4(a)的超编码中,偶数字节,如2字节为1字词,4字节为2字词,6字节为3字词,以此类推;其中的汉字编码与GB2312兼容(也可与日、韩、Unicode等各种语言字符兼容)。1字节超编码是ASCHII码字符,超编码与ASCHII码相同。图4(a)的超编码中,含有1、2、
3、4、6字节不同长度的编码,机器具有区分不同长度超编码的能力;不同对象的编码相互兼容,互不冲突。机器还具有区分不同种类对象及对象属性的能力。5、7、9字节等长度的超编码可用于其他对象,例如:IP地址。
[00160] 机器根据标记比特扫描规则,扫描图4网页(a) 超编码序列的标记比特, 区分超编码,解析超编码所关联的显示属性,显示网页。
[00161] 机器将超编码序列对象的显示属性显示出来,看上去是一个字符串,实际是一个对象串,如图4(b)所示。
[00162] 当用户访问网页时,将网页超编码文件下载到客户端。机器根据标记比特扫描规则,扫描超编码文件,00行:0-2为1个3字节的超编码;查询关联关系表(图3),查得该超编码关联的显示属性为:∮致爱丽丝∮;机器将此显示在客户端;同理,00行:3-5为1个3字节的超编码,查得该超编码关联的显示属性为:♂黑虎1♂;00行:6-8为1个3字节的超编码,查得该超编码关联的显示属性为:♂猫和老鼠10♂;00行:9-b 为1个3字节的超编码,查得该超编码关联的显示属性为:¤红棕马¤;00行:e-f为1个4字节的超编码,这是1个中文2字词,根据汉字编码,将字形显示为“乒乓”,00行显示完毕;其余省略。整个文件扫描完毕,机器智能将文件在客户端显示出来,如图4(b)所示。
[00163] 当用户获取网页的对象时,机器根据标记比特扫描规则,扫描图4网页(a) 超编码序列的标记比特,识别和解析超编码,根据所关联的属性,解析网页;根据不同对象,以不同的方式“播放”。
[00164] 实验实例中,如果用户选择“播放”网页所有的对象,机器扫描过程与上面类似,简述如下:
[00165] 机器根据标记比特扫描规则,扫描该文件,00行:0-2为1个3字节的超编码,根据关联关系表,查得该超编码的种类字节为:F2,为音频对象;超编码的第2、3字节关联超链接为:“致爱丽丝.mp3”;机器从服务器调取该音频文件,用音频播放器播放该文件; 00行:3-5为1个3字节的超编码,查得该超编码的种类字节为:F3,为视频对象;超编码的第2、3字节关联超链接为:“黑虎1.mp4”;机器从服务器调取文件,用视频播放器播放该文件; 00行:6-8 为1个3字节的超编码,为视频对象,机器从服务器调取文件,用视频播放器播放该文件;00行:9-b 为1个3字节的超编码,为图像对象,机器从服务器调取文件,显示该图像;00行:e-f为1个4字节的超编码,这是1个中文2字词,根据组成超编码的汉字编码与汉字语音的关联关系,机器解析其语音,播放语音;以此类推。
[00166] (三)如何让机器具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能
[00167] 现有的算法或程序都是用字符描述的,机器不懂得如何区分其中的对象,不懂得如何解析对象的语义,也不懂得如何执行;因此必须经过人工智能帮助机器翻译,这里的翻译称作编译或解释。
[00168] 以下是机器智能如何能具有区分算法或程序的对象、解析算法或程序的对象和运行算法或程序的智能。
[00169] 一种二进制比特序列数字数据的处理方法,其特征在于:比特字节序列为超编码序列,其特征还在于:至少包含以下步骤之一:
[00170] 建立算法或程序的对象或对象属性与超编码的关联步骤;
[00171] 建立对象与超编码相关联步骤;一个对象与一个超编码相关联;
[00172] 建立对象属性与超编码或部分超编码相关联,生成对象和属性与超编码的关联关系;
[00173] 解析算法或程序的对象或对象属性包含以下步骤:
[00174] 通过扫描字节序列的超比特,区分超编码,区分对象;
[00175] 根据对象属性与超编码的关联关系,解析对象或对象属性步骤。
[00176] 机器边解析边运行步骤;该步骤包含以下步骤;
[00177] 通过扫描字节序列的超比特,区分超编码,区分对象;
[00178] 根据对象属性与超编码的关联关系,解析对象或对象属性,并运行算法或程序;
[00179] 生成可执行文件步骤;包括:
[00180] 通过扫描字节序列的超比特,区分超编码,区分对象;
[00181] 根据对象属性与超编码的关联关系,解析对象或对象属性,并生成可执行文件。
[00182] 上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
[00184] 以下是上述方法描述为装置方式。
[00185] 一种二进制比特序列数字数据的处理装置,其特征在于:比特字节序列为超编码序列;其特征还在于:至少包含以下装置之一:
[00186] 算法或程序的对象或对象属性与超编码的关联装置;包括:
[00187] 建立对象与超编码相关联装置;一个对象与一个超编码相关联;
[00188] 建立对象属性与超编码或超编码的部分相关联装置;
[00189] 机器运行装置;该装置包含以下装置之一;
[00190] 边解析边运行装置;该装置包括:
[00191] 通过区分超编码区分对象装置;
[00192] 根据对象属性与超编码的关联关系,解析对象或对象属性,并运行的装置;
[00193] 生成可执行文件装置;该装置包括以下装置:
[00194] 通过区分超编码区分对象装置;
[00195] 可执行文件装置:根据对象属性与超编码的关联关系,解析对象属性,并生成可执行文件。
[00196] 上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
[00197] 一个机器智能算法或程序示例:程序的创建和运行
[00198] 机器智能程序的创建
[00199] 假定作者输入以下程序: y = a+ b * c
[00200] 在创建过程,机器提示输入变量名称(即显示属性),选择变量的类型;在算法或程序的创建过程中,机器将对象或对象属性与超编码相关联。关联步骤如下:
[00201] 程序含4个变量,设置一临时变量: buffer。
[00202] 每一个变量用1个超编码存储,创建过程根据人机交互,生成一个变量与变量属性与超编码的关联关系,如图5所示。这里12表示变量类型为长整型(4字节)
[00203] 程序含3个运算符,一个运算符对应1个超编码,运算符与运算符属性与超编码的关联关系由系统定义,如图6所示。
[00204] 对象或对象属性与超编码相关联关系,如图5-6所示。
[00205] 程序创建完毕,生成一个机器懂得如何运行的程序,一个超编码序列,如下:
[00206]
[00207] 机器智能程序的运行
[00208] 机器运行方式有两种:
[00209] 第一,边解析边运行的方式;这类似现有的解释运行
[00210] 第二,解析超编码序列所有的对象或对象属性,生成执行文件运行;这类似现有的编译运行。
[00211] 机器运行程序,即运行一个Ucode序列。以下是边解析边运行的方式的说明。
[00212] 机器区分Ucode,并根据对象或对象属性与Ucode的关联关系,解析对象或对象属性,运行程序。
[00213] 程序创建完毕,机器解析对象的显示属性,程序显示如下:
[00214]
[00215] 下面说明程序的执行过程。
[00216] 对于变量对象,根据其种类配置存储空间,如图5所示。
[00217] 图5的存储地址,也可在运行时,根据变量的类型,动态配置。
[00218] 根据对象的种类,机器区分出运算符对象,并比较运算符的优先级;
[00219] ,Ucode22 ,Ucode23 分别对应运算符 = ,+ ,* ;Ucode23 ( * ) 优先级为3,最高; 其前后变量分别为Ucode13 ,Ucode14 ;机器分别从地址:0x0008,0x000C 取出4个字节,根据对应的机器指令,做乘法运算,将结果存入临时变量buffer,地址:0x000F;然后,比较剩下的运算符Ucode21 , Ucode22 ( = ,+)的优先级;Ucode22 ( +)的优先级高,因此,机器将buffer的运算结果与Ucode12(地址:0x0004)的数值做加法运算。剩下的运算符Ucode21 ( = );机器将前面的运算结果存储到变量Ucode11 的地址:0x0000。然后,机器根据变量Ucode11和运算符 Ucode21的显示属性,将计算结果显示出来。
[00220] 假定各个变量的初始值如图7所示,则机器的显示结果为:
[00221]
[00222] (四)如何实现让机器具有处理中文语音的智能
[00223] 这里,汉字属性主要指:字形和语音。
[00224] 汉字语音的表达方法分为三种:
[00225] • 语音编码
[00226] 汉字语音编码为2字节,11比特为拼音编码,3比特为音调编码。见图8。
[00227] • 拼音
[00228] 拼音可有以下显示方式:只显示拼音字母,拼音字母中含带声调的字符,拼音字母中含表示声调的数字等
[00229] • 发音
[00230] 发音指用音频表示的语音。
[00231] 现有中文数据的处理过程中,只将编码与字形相关联,机器根据汉字编码的值,能够将字形显示出来;但是,机器不懂得汉字的语音。
[00232] 以下机器在处理中文过程中,不仅将汉字编码与其字形相关联,而且,还要与语音相关联;因此,机器不仅懂得汉字对象的字形,还懂得汉字对象的语音。
[00233] 一种二进制比特序列数字数据的处理方法,设一个汉字多音字含n+1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理方法中含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:至少包含以下步骤之一:
[00234] 建立汉字编码与字形属性和语音属性相关联步骤;
[00235] 通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
[00236] 解析汉字属性步骤,该步骤包含以下步骤:
[00237] 根据汉字编码的值与字形属性的关联关系,解析汉字编码字形属性的步骤;
[00238] 根据汉字编码的值与语音属性的关联关系,解析汉字编码语音属性的步骤。
[00239] 汉字语音编码库、语音编码拼音库和语音编码发音库;或汉字拼音库和汉字发音库;见:图8汉字语音编码示意图;图9汉字编码与字形关系示意图;图10汉字编码与语音编码关系示意图:图11汉字语音编码与拼音关系示意图;图12 汉字语音编码与音频关系示意图;图13汉字编码与拼音关系示意图;图14汉字编码与音频关系示意图。
[00240] 上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
[00242] 具体解析步骤如下:
[00243] 解析汉字字形步骤;
[00244] 机器根据汉字编码的值,从汉字字形库中提取汉字的字形;
[00245] 解析汉字拼音步骤1;
[00246] 机器根据汉字编码的值,从语音编码库中提取语音编码;根据语音编码的拼音编码部分,从语音编码拼音库中提取汉字的拼音;根据语音编码的声调编码部分,解析汉字拼音的声调;
[00247] 解析汉字发音步骤1;
[00248] 机器根据汉字编码的值,从汉字语音编码库中提取汉字语音编码;根据语音编码的值,从语音编码发音库中提取汉字的发音;
[00249] 解析汉字拼音步骤2;
[00250] 机器根据汉字编码的值,从汉字拼音库中提取汉字的拼音;
[00251] 解析汉字发音步骤2;
[00252] 机器根据汉字编码的值,从汉字发音库中提取汉字的发音。
[00253] 上面的“其特征还在于至少包含以下步骤之一:”,不是:“其特征还在于包含以下步骤:”;因为,保护范围会缩小。
[00254] 以下是装置描述方式
[00255] 一种二进制比特序列数字数据的处理装置,其特征在于:设一个汉字多音字含n+
1个语音,n为正整数,将多音字的编码增加n个,其特征在于:该处理装置含有汉字语音编码库、语音编码拼音库和语音编码发音库;或含有汉字拼音库和汉字发音库;其特征还在于:
至少包含以下装置之一:
[00256] 建立汉字编码与字形属性和语音属性相关联的装置;
[00257] 该装置通过选择正确语音所对应的汉字,使汉字编码的值与汉字的字形和汉字的语音相关联;
[00258] 根据汉字编码与汉字属性的关联关系,解析汉字属性的装置;该装置包括:
[00259] 根据汉字编码与汉字属性的关联关系,解析汉字编码字形属性的装置;
[00260] 根据汉字编码与汉字属性的关联关系,解析汉字编码语音属性的装置。
[00261] 具体解析装置如下:
[00262] 解析汉字字形装置;
[00263] 机器根据汉字编码的值,从汉字字形库中提取汉字的字形;
[00264] 解析汉字拼音装置1;
[00265] 机器根据汉字编码的值,从语音编码库中提取语音编码;根据语音编码的拼音编码部分,从语音编码拼音库中提取汉字的拼音;根据语音编码的声调编码部分,解析汉字拼音的声调;
[00266] 解析汉字发音装置1;
[00267] 机器根据汉字编码的值,从汉字语音编码库中提取汉字语音编码;根据语音编码的值,从语音编码发音库中提取汉字的发音;
[00268] 解析汉字拼音装置2;
[00269] 机器根据汉字编码的值,从汉字拼音库中提取汉字的拼音;
[00270] 解析汉字发音装置2;
[00271] 机器根据汉字编码的值,从汉字发音库中提取汉字的发音。
[00272] 上面的“其特征还在于该装置至少包含以下装置之一:”,不是:“其特征还在于包含以下装置:”;因为,保护范围会缩小。
[00273] 实验实例:
[00274] 图15为“好事又读好事”,汉字编码与语音属性和字形属性相关联实验实例。
[00275] 输入第一个“好”,是4声,选择“3”的“好事” (a,b,c,d,e分别对应于1,2,3,4声和轻声)。输入第2个“好事”,“好”是3声,选择“2”的“好事”。
[00276] 图16 是图15实验实例的解析结果。
[00277] 当用户获取数据时,机器根据汉字编码关联的语音属性和字形属性,解析字形和语音,解析的结果与作者的意图一致。
[00278] 机器靠自身智能自动标注汉字的拼音,自动朗读,解析结果与作者的意图完全相同。
[00279] 图17 实验实例:让机器具有区分中文词和解析汉字语音属性的能力
[00280] “会计师骑自行车去银行开会”
[00281] 作者按词输入(或编辑),机器将作者分词和语音意图,与超编码相关联,让机器记住作者的意图
[00282] 作者用拼音输入:“kuaijishi qi zixingche qu yinhang kaihui”
[00283] 这里,即输入了分词信息,又输入了语音信息。
[00284] 输入完毕,虽然显示的是:“会计师骑自行车去银行开会”;仍然是12个汉字(24个字节),却存储了作者正确的分词信息和语音信息。
[00285] 这句话存储为6个超编码,每个超编码由组成词的汉字编码组成。
[00286] 本实例中,每一个汉字的语音与相应的编码相关联,本例多音字“会,行,行,会”的正确语音与相应的编码相关联:“kuai, xing, hang, hui”(实际上,包含正确的音调)[00287] 例如:图17中,第一个“会”和最后一个“会”,对应的编码不同;关联的字形属性相同,但关联的语音属性不同。第一个编码“AD F0”关联的语音为“kuai”,而最后一个编码“BB 
61”关联的语音为“hui”。同理,图中第一个“行”和最后一个“行”的编码不同,关联的字形属性相同,但关联的语音属性不同。
[00288] 图17中:“会计师骑自行车去银行开会”,超比特标注后存储的字节串,仍然是24个字节。
[00289] 机器根据超编码,解析的分词为:“会计师骑自行车去银行开会”,与作者的意图一致。
[00290] 机器根据超编码的汉字编码与语音的关联关系,解析的语音与作者的意图也一致。
[00291] 如果,用户输入“hui”查询,查到的是“开会”;但是,查不到“会计师”,因为“会计师”中没有“hui”的语音。
附图说明
[00292]
[00293] 图1. 标注字节组和区分字节组示意图
[00294] 根据作者的意图将字节序列标注为字节组序列示意图
[00295] 通过标注,建立标记比特与字节组相关联。
[00296] 通过扫描标记比特区分字节组,区分中文词对象示意图
[00297] 图2 通过超编码与词对象及属性相关联实例
[00298] 这里的词对象为:“乒乓球,拍卖,完,了”,每个词对象与一个超编码相关联,超编码中两个字节为一个汉字编码,关联了汉字的字形属性和语音属性。
[00299] 根据超编码和词对象的关联关系,机器能区分词对象,能解析词对象的显示属性和语音属性。
[00300] 机器具有区分超编码的能力,因此,具有了区分词的能力,其分词结果用不同颜色标注出来,
[00301] 机器的区分和解析,与作者的意图一致。
[00302] 图3 图像、音频和视频对象与超编码的关联关系示意图
[00303] 网页的图像、音频和视频对象,用3个字节的超编码关联。超编码关联对象显示属性,例如:类似五线谱的符号∮表示音频;如:∮致爱丽丝∮;类似放映机的符号♂表示视频;如:
♂猫和老鼠10♂;符号¤表示图像,如:¤红棕马¤。注意:这些符号,仅用来帮助人区分不同对象的。
[00304] 字节超编码分为两部份,第1字节和第2、3字节,用来关联对象的种类属性,例如:
F1、F2、F3分别关联图像、音频和视频对象。它具有区分128种对象的能力。第2、3字节,用来关联超链接属性。
[00305] 图4 一个机器智能互联网实验网页
[00306] 网页对应的超编码序列: 含有1、2、3、4、6字节不同长度的编码
[00307] 网页的显示:对象的显示属性表示的对象串:包括音频、视频、图像,中文词对象、英文字符对象。
[00308] 图5 变量与变量属性与超编码的关联关系示意图
[00309] 图6 系统定义的运算符与运算符属性与超编码的关联关系示意图
[00310] 程序含3个运算符,一个运算符对应1个超编码,运算符属性与超编码的关联关系由系统定义。
[00311] 图7 变量的超编码,地址、初始值和最终值示意图
[00312] 图 8. 汉字语音编码示意图
[00313] 汉字语音编码为2字节,11比特为拼音编码,3比特为音调编码。要使语音编码与现有汉字编码能兼容,则每个字节的0比特可为1;要使语音编码与超编码能兼容,则第一个字节的0比特为1;第二个字节的0比特为0。要使语音编码与现有控制字符不冲突,则每个字节的1比特可置为1。
[00314] 图9 汉字编码与字形关系示意图
[00315] 每个汉字编码对应字形库的一个字形,通过汉字编码的值,机器能提取汉字的字形。其中扩展汉字编码为新增汉字编码。
[00316] 图10 汉字编码与语音编码关系示意图
[00317] 每个汉字编码对应语音编码库的一个2字节的语音编码;通过汉字编码的值,机器能提取汉字的语音编码,通过语音编码的值,借助于汉字语音编码与拼音关系;汉字语音编码与音频关系;机器能解析汉字的语音:生成拼音加声调,或者生成发音。其中扩展汉字编码为新增汉字编码。
[00318] 图11 汉字语音编码与拼音关系示意图
[00319] 每个语音编码对应相应拼音库中相应的拼音字母,通过汉字语音编码的值,机器能提取汉字的拼音;根据语音编码关联的3比特声调值,生成声调。
[00320] 图12 汉字语音编码与音频关系示意图
[00321] 每个汉字语音编码对应发音库的一个音频,通过汉字语音编码的值,机器能提取汉字的发音。
[00322] 图13 汉字编码与拼音关系示意图
[00323] 每个汉字编码对应拼音库的相应汉字的拼音字母和声调;通过汉字编码的值,机器能提取汉字的拼音字母和声调。其中扩展汉字编码为新增汉字编码。
[00324] 图14 汉字编码与发音音频关系示意图
[00325] 每个汉字编码对应发音库的一个音频;通过汉字编码的值,机器能提取汉字的音频。其中扩展汉字编码为新增汉字编码。
[00326] 图15实验实例:汉字的语音和字形与汉字编码相关联
[00327] 输入第一个“好”,是4声,选择“3”的“好事” (a,b,c,d,e分别对应于1,2,3,4声和轻声)。输入第2个“好事”,“好”是3声,选择“2”的“好事”。
[00328] 图16图15实验实例中:机器解析汉字编码的语音属性,自动标注拼音
[00329] 图17实验实例:让机器具有区分中文词和汉字语音属性的超编码
[00330] 超编码与词对象及属性相关联;超编码中的汉字编码与汉字的语音和字形属性相关联
[00331] 这里的词对象为:“会计师骑自行车去银行开会”,每个词对象与一个超编码相关联,其中两个字节为一个汉字编码,关联了汉字的字形属性和语音属性。
[00332] 根据超编码和词对象的关联关系,机器能区分词对象,能解析词对象的显示属性(字形属性)和语音属性。
[00333] 机器的区分和解析,与作者的意图一致。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈