首页 / 专利库 / 电脑零配件 / 接口 / 智能平台管理接口 / 提取数据(基因)特征模板方法与应用模板的方法和系统

提取数据(基因)特征模板方法与应用模板的方法和系统

阅读:1014发布:2020-12-14

专利汇可以提供提取数据(基因)特征模板方法与应用模板的方法和系统专利检索,专利查询,专利分析的服务。并且提取数据关联特征值模式或模板方法:一:对数据资源进行判定语种预处理, 词性标注 ,标注出每个句子的名词、动词;并进行语法分析,标注出每个句子的主语、谓语、宾语;二:提取句子集合中重叠标注为主语和名词的词组,重叠标注为谓语和动词的词组,重叠标注为宾语和名词的词组,分别获得作为主语的名词集合,作为谓语的动词集合,和作为宾语的名词集合,以及他们分别在句子中的主语-谓语/谓语-宾语对应的关联特征关系,三:分别统计主语名词、谓语动词和宾语动词的累计词频,标注出来作为度量主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词含有关联关系的词组权重特征值大小,名词∶动词≈词频比n∶v动词∶名词≈词频比v∶2n。,下面是提取数据(基因)特征模板方法与应用模板的方法和系统专利的具体信息内容。

1.一种基于自然语言处理技术,提取制作数据关联特征值模式或模板的方法,其特征在于制作动词-名词(价值)链数据关联模式或模板执行如下步骤:
(a)步骤一:对(主体的)数据资源的文本数据进行判定语种预处理,词性标注,标注出每个句子的名词、动词;
并对文本数据进行语法分析,标注出每个句子的主语、谓语、宾语;
其中,可以将被动语态主语标注为宾语;
其中,进行主语名词或宾语名词的指代消解处理;
(b)步骤二:提取句子集合中重叠标注为主语和名词的词组,提取句子集合中重叠标注为谓语和动词的词组,提取重叠标注为宾语和名词的词组,分别获得作为主语的名词集合,作为谓语的动词集合,和作为宾语的名词集合,以及他们分别在句子中的主语-谓语/谓语-宾语对应的关联特征关系,主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合,即,名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语(一对一)关联特征关系;
(c)步骤三:分别统计主语名词、谓语动词和宾语动词的累计词频,标注出来作为度量主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合含有(一对一)关联关系的词组权重特征值大小,即,
主语名词词频n∶谓语动词词频v/
谓语动词词频v∶宾语名词词频n2(词频v,n,n2是正整数),
获得关联关系权重的所述(主体的)数据资源的:
名词∶动词≈词频比n∶v集合以及
动词∶名词≈词频比v∶2n集合,
集合中选取高频的词频词组成为动词-名词(价值)链数据关联模式或模板(词组集
合)。
2.根据权利要求1所述的基于自然语言处理技术,制作动词-名词(价值)链数据关联模式或模板的方法,其特征在于:
其中,步骤四:合并名词∶动词的(一对一)关联词组和动诃∶名词的(一对一)关联词组前后同名重复的名词词组和词频:
...
...∶动词∶相同名词
相同名词∶动词∶...
...
连接同名名词两词组成多环节关联词组链条,得到...∶动词∶(合并相同)名词∶动词∶(合并相同)名词∶动词∶...的多环节词组链条,从而将部分一对一的词组链条(集合)串联形成以动词/名词词组交替为链接节点的...∶动词∶名词∶动词∶名词∶...多环节多维度的动词/名词交替词组链条,甚至可能形成首尾相互链接的闭环的动词/名词交替词组的多环节闭环关联词组链;
合并主语名词和宾语名词的词频n+n2,获得交替循环往复的...∶动词∶名词∶...链接关联词组权重的...∶动词∶名词∶...≈词频比...∶v∶(n+n2)∶...动词-名词(价值)链数据关联模式或模板(词组集合,词频v,n,n2是正整数),
也就是说,动词-名词(价值)链数据关联模式或模板(词组集合),既可以是一对一的词组链条(名词∶动词≈词频比n∶v或动词∶名词≈词频比v∶n2)也可以是多环节的词组链条(...∶动词∶名词∶动词...≈词频比...∶v∶(n+n2)∶v∶...)两种形式。
3.根据权利要求1或2所述的基于自然语言处理技术,制作获取动词-名词(价值)链数据关联模式或模板的方法,其特征在于:
其中,可以利用语料库、数字字典、知识本体库等自然语言处理辅助工具综合分析,进行针对每个句子的谓语动词的副词标注,提取副词时候还累计统计其词频,得到:
副词∶动词∶名词的关联权重的副词∶动词∶名词≈词频比a∶v∶n2或名词∶副词∶动词≈词频比n∶a∶v的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数可以为0);
或者获得多环节的词组链条:
交替循环往复...∶副词∶动词∶名词∶副词∶...词组的关联权重的...∶副词∶动词∶名词∶...≈词频比...∶a∶v∶(n+n2)∶a∶...的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数并可以为0);其中,副词可以为空。
4.一种动词-名词(价值)链数据关联模式或模板(词组集合)的比对方法,其特征在于执行如下步骤:
(a)步骤一:两个不同(主体的)数据资源制作的动词-名词(价值)链数据关联模式或模板(词组链集合),相互进行词组的比对,
(b)步骤二:如果比对结果得到:
相同动词、
相同名词、
相同动词及相同名词、
相同名词及相同动词、
或相同的动词/名词交替多环节词组链条,
其中,如果有副词还可以加入相同副词的比对,即,
相同名词、相同副词及相同动词,
相同副词、相同动词及相同名词,
进入下一步;
(c)步骤三:相同词组进行词频比的比对;
(d)步骤四:输出结果:
一,词频比相等的结果:
相同动词及相同名词∶词频比v∶n2相等,模板成功匹配;
相同名词及相同动词∶词频比n∶v相等,模板成功匹配;
相同动词/名词交替多环节词组:词频比...∶v∶(n+n2)∶v∶...,
1(n、n2)分量全相等;
2(n+n2)总量相等;
模板成功匹配;
二,词频比不等的结果:
相同动词:
显示相关高频名词排序;
相同名词:
显示相关高频动词排序;
相同动词及相同名词:
两个模板名词词频分别在动词词频的比重与他们词频比成反比例关系,显示词频比差异值;
相同名词及相同动词:
两个模板名词词频在动词词频的比重与他们词频比成正比例关系,显示词频比差异值;
相同动词/名词交替多环节词组:
名词、动词词频比差异值;
其中,可以从单位(部)数据资源制作的动词-名词(价值)链数据关联模板中,选定词频高的名词词组(集合),比对从个人群体样本数据资源的动词-名词(价值)链数据关联模板(集合);匹配成功的相同名词所在动词-名词(价值)链数据关联模板可以作为所述单位(部门)的(高频)名词为主题的单位供给与个人群体需求之间的匹配关系的动词-名词(价值)链数据关联模板;
其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板,选定词频高的名词词组,比对从众多单位集合的办公综合样本数据资源或者从所有数据资源制作获取的动词-名词(价值)链数据关联模板,可以得到所述单位(部门)在办公综合样本数据资源整体或所有数据资源整体的(高频)名词-动词动作(价值)链环节上的动词词频程度中的相对比较的差异值定位情况和态势。
5.一种使用动词-名词(价值)链数据关联模板制作类别模板,以及类别模板的比对方法,
其特征在于,
一,类别模板(数据线索+处理规则+特征值集合)的提取制作执行如下步骤:
(a)步骤一:借助语料库、知识本体库等自然语言处理工具,对一个(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分(包括同类名词)组成的动词-名词(价值)链数据关联模板片断,划分出同类别的动词-名词(价值)链片断(集合),组成分类/聚类模板,即,每个类别模板可能包括较少词组链条的动词-名词(价值)链片断(集合),并对类别命名:
别名称a{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...动词-名词(价值)链片断(词频v,n,n2是正整数)}
其中,同样方法,也可以用动词词组相同相近的同义词近义词,划分同类动词的类别模板:
(b)步骤二:分类相同的动词-名词(价值)链片断集合,以原始词组(片断所有动词、名词)作为一部分线索,组合线索(第一)集合,
以同类名词左右各保留至少一个动词词组的(相同)原则获取和匹配动词-名词(价值)链片断排序规则作为一部分规则,组合规则(第二)集合,
同类名词的动词-名词(价值)链片断的词频比作为一部分统计特征值,组合特征值(第三)集合,
简化表示和详细展开分别为:
类别模板(数据线索+处理规则+特征值集合)=类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
其中,还可以设定其他分类规则,与动词-名词(价值)链数据关联模板分类规则一起,组成类别模板规则;
其中,可以针对单位(部门)数据资源的动词-名词(价值)链数据关联模板制作单位(部门)类别模板;
其中,可以针对个人群体数据资源的动词-名词(价值)链数据关联模板提取制作个人群体类别模板;
其中,可以针对办公综合样本数据资源的动词-名词(价值)链数据关联模板提取制作办公综合类别模板;
二,类别模板(数据线索+处理规则+特征值集合)的比对执行如下步骤:
原类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
比对的对象类别模板(数据线索+处理规则+特征值集合);
(a)步骤一:按照原类别模板相同的规则,从要比对的对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取原类别模板数据线索中的同名词组;
如果没有提取到完全相同的同名词组,返回开始;
如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)数据线索匹配成功,进入下一步;
(b)步骤二:按照原类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断排序规则:
对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分出同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
对象类别名称A的词组排序处理规则(词组链片断){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
比对
原类别名称a的词组片断排序处理规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)
中的词组链片断排序;
如果处理规则的词组链片断排序...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推处理规则词组链片断排序都匹配一致,进入下一步;
如果词组链片断排序处理规则不匹配,则返回开始;
(c)步骤三:按照原类别模板相同的处理规则,比对两个类别模板中同类的包括相同名称和相同词组链片断排序的的词频比:
比对对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}

原类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
进行比对;
如果:
...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,处理规则的词组链片断排序一致,特征值集合的词频比相等,结果是两个类别模板匹配成功;
如果:特征值词频比不等即为类别模板匹配失败;
其中,如果还采用其他分类规则,按照其他规则确定匹配比对成功与否,全部匹配成功才可以为整个模板匹配成功,任何一个局部匹配失败都可导致整个模板匹配失败。
6.一种使用动词-名词(价值)链数据关联模板制作定制模板的方法,其特征在于执行如下步骤:
(a)步骤一:在主题(第一)数据资源的动词-名词(价值)链数据关联模板集合中,选取高词频的名词列表(例如,名词甲、名词乙...);
(b)步骤二:用所述高频名词列表的名词,与目标(第二)数据资源的动词-名词(价值)链数据关联模板集合中的名词匹配比对;
(例如,名词甲与...∶动词丙∶名词丙∶动词甲∶名词甲∶动词丁∶名词丁∶...≈词频比...∶v∶(n+n2)∶v∶(n+n2)∶v∶(n+n2)∶...的名词丙、名词甲、名词丙比对;)(c)步骤三:在目标(第二)数据资源的动词-名词(价值)链数据关联模板上匹配成功的同名名词位置(例如,同名名词甲在动词-名词(价值)链数据关联模板上...∶名词丙∶动词甲∶同名名词甲位置∶动词丁∶名词丁∶..≈词频比...∶(n+n2)∶v∶(n+n2)∶v∶(n+n2)∶...),向左、向右或向左右两边动词/名词词交替词组链上选取至少一个动词和一个名词;
所述位置(不包括同名名词)的向左、向右或向左右两边选取的动词-名词交替词组关联链条(例如,名词丙∶动词甲≈词频比(n+n2)∶v和动词丁∶名词丁≈词频比v∶(n+n2))成为主题(第一)数据资源与目标(第二)数据资源的数据关联定制模板(集合);
其中,用可以作为主题(第一)数据资源的单位(部门)数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的个人群体数据资源的动词-名词(价值)链数据关联模板,制作单位供给-个人群体需求定制模板;
其中,用可以作为主题(第一)数据资源的单位(部门)数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的办公综合样本数据资源的动词-名词(价值)链数据关联模板,制作单位供给-办公综合价值链供应链定制模板;
其中,用可以作为主题(第一)数据资源的个人数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的个人群体数据资源的动词-名词(价值)链数据关联模板,制作个人-群体学习交往定制模板。
7.一种基于个人移动设备进行数据挖掘的智能系统,包括有语料库、知识本体库等,其特征在于,个人移动设备包括有个人移动设备输出\输入同步模,模板特征提取模块,其中:
(1)个人移动设备输出\输入同步模块,用于将对个人移动设备上的输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源同步异步复制收集,提供给模板特征提取制作模块使用,其中,可以预处理对同步数据进行数据脱敏漂白或图象提取特征值;
(2)模板特征提取制作模块,对个人移动设备上同步的个人数据资源进行数据挖掘,特征值提取,制作个人数据模型、模式或模板;
其中,可以在个人移动设备上制作个人数据资源的数据模型、模式或模板;
其中,可以制作动词-名词(价值)链数据关联模板以及类别模板;
执行如下步骤制作动词-名词(价值)链数据关联模板:
(a)步骤一:对文本数据进行判定语种预处理分析,词性标注,标注出来每个句子的名词、动词;
并进行语法分析,标注出来每个句子的主语、谓语、宾语;
其中,可以将被动语态主语标注为宾语;
其中,根据数据资源的不同类型主体,进行主语名词或宾语名词的指代消解处理;
(b)步骤二:提取重叠标注为主语和名词的词组,提取重叠标注为谓语和动词的词组,提取重叠标注为宾语和名词的词组,以及他们分别在各自句子中的主语-谓语和谓语-宾语对应的关联关系:
分别获得作为主语的名词的词组集合,作为谓语的动词的词组集合,和作为宾语的名词的词组集合--主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合,即,名词∶动词/
动词∶名词的词组组合和他们之间的主语-谓语/谓语-宾语(一对一)关联关系;
(c)步骤三:(提取时)词频统计每个词组的词频并标注出来,作为度量有一对一链条关联关系的词组权重大小的指标,
名词n∶动词v和
动词v∶名词n2(词频v,n,n2是正整数);
(d)步骤四:合并名词∶动词的一对一链条关联词组和动词∶名词的一对一链条关联词组前后重复的名词词组和词频,并连接两词组成多环节关联链条:
...
...∶动词∶相同名词
相同名词∶动词∶...
...
得到...∶动词∶(合并相同)名词∶动词∶...的多环节词组链条,形成以动词-名词交替为链接词组节点,即...∶动词∶名词∶动词∶名词∶...的多环节多维度的动词/名词交替的词组链,从而将动词∶名词和名词∶动词关联词组链接循环往复串联起来,甚至形成首尾相互链接的闭环的动词/名词交替的多环节闭环关联词组链,
获得交替循环往复的...∶动词∶名词∶...链接关联词组权重指标的...∶动词∶名词∶...≈词频比...∶v∶(n+n2)∶...动词-名词(价值)链数据关联模板(词频v,n,n2是正整数);
其中,继续执行如下步骤制作获得类别模板(数据线索+处理规则+特征值集合):
(a)步骤一:借助语料库、知识本体库等自然语言处理工具,对个人(群体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分(包括同类名词)组成的动词-名词(价值)链数据关联模板片断,划分出同类别的动词-名词(价值)链片断(集合),组成分类/聚类模板,并对类别命名:
类别名称a{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...动词-名词(价值)链片断(词频v,n,n2是正整数)}
其中,同样方法,也可以用动词词组相同相近的同义词近义词,划分同类动词的类别模板:
(b)步骤二:分类相同的动词-名词(价值)链片断集合,以原始词组(片断所有动词、名词)作为一部分线索,组成线索(第一)集合,
以同类名词所在模板位置左右相邻各保留至少一个动词词组的(相同)原则获取和匹配动词-名词(价值)链片断排序规则作为一部分规则,组成规则(第二)集合,
和同类名词的动词-名词(价值)链片断的词频比作为一部分统计特征值,组成特征值(第三)集合;
简化表示和详细展开表示分别为:
类别模板(数据线索+处理规则+特征值集合)=类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
其中,还可以提取地理位置、时间等其他同类特征数据,与动词-名词(价值)链数据关联模板分类数据一起,组成如下格式更复杂的类别模板:
类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...;A<北纬N1”,东经E1”>、B<北纬N2”,东经E2”>、C<北纬N3”,东经E3”>、D<北纬N4”,东经E4”>...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;地点排序规则A∶B∶C∶D...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数);地点时间特征值A:time1,B:time2,C:
time3,D:time4...)};
其中,也可以用动词词组相同相近(同义词近义词),划分出同类动词的类别模板;
个人移动设备同步的个人样本数据资源,获得动词-名词(价值)链数据关联模板组成的个人类别模板(数据线索+处理规则+特征值集合);其中,由于是第一人称,默认缺省主语名词。
8.根据权利要求7所述的一种基于个人移动设备进行数据挖掘的智能系统,其特征在于,数据挖掘公共平台服务器包括有:模板特征提取模块、模板比对模块、模板库、匹配结果反馈及消息通信模块,其中,可以根据输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源与个人主体相关性不同的程度,设置提取的词频的不同权重;其中,单位的服务器或PC包括有公共数据挖掘共享伴侣模块:
(1)公共数据挖掘共享伴侣模块,用于将单位(部门)的服务器或PC上的单位(部门)电子文档数据资源,特别是文本数据,以手动或自动方式汇聚共享到数据挖掘公共平台服务器,众多单位数据资源汇聚组成办公综合样本数据资源;
其中,共享之前进行数据预处理,排除内容相同或内容相似且时间相同的电子文档,可以预处理对同步数据进行数据脱敏;
(2)数据挖掘公共平台服务器上的模板特征提取制作模块,用于数据资源进行数据挖掘,制作数据模型、模式或模板;
其中,将众多个人移动设备上同步下载的个人数据资源汇集一起形成个人群体数据进行数据挖掘,特征值提取,制作个人群体数据模型、模式或模板;个人移动设备汇聚的个人群体样本数据资源,获得众多系列化动词-名词(价值)链数据关联模板组成的个人群体类别模板(数据线索+处理规则+特征值集合);
其中,对单位(部门)数据资源、众多单位汇聚的办公综合样本数据资源、移动设备同步的个人数据资源、移动设备汇聚的个人群体样本数据资源、个人群体样本数据资源与单位(部门)数据资源的混合数据资源(用于单位供给模板与个人需求模板匹配)、个人数据资源与单位数据资源的混合数据资源(用于个人特长模板与单位岗位模板匹配)、全部数据资源,进行数据挖掘,制作数据模式或模板;
其中,可以制作动词-名词(价值)链数据关联模板以及类别模板,获得动词-名词(价值)链数据关联模板及类别模板;
其中,执行如下步骤可以制作单位供给-个人群体需求的类别模板:
(d)步骤一:用单位(部门)数据资源的单位(部门)类别模板(片断)集合的类别名称,比对作为比对对象的个人群体样本数据资源的个人群体类别模板(片断)集合中的类别名称;
(e)步骤二:如果类别名称匹配成功,获得同名的类别名称和分属单位(部门)类别模板(片断)和个人群体类别模板(片断)的两个集合;
选择直接引用上述同名的类别名称和所属比对对象的个人群体类别模板(片断)集合,构成单位供给-个人群体需求类别模板;
结果是单位供给-个人群体需求类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成;
(3)模板比对模块,用于不同主体数据资源的数据模板的特征值比对;
其中,进行其动词-名词(价值)链数据关联模板以及类别模板的特征值比对方法,可以用于单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板之间的特征值相互对应的匹配比对;
其中,动词-名词(价值)链数据关联模板比对执行如下步骤:
(a)步骤一:两个不同(主体的)数据资源制作的动词-名词(价值)链数据关联模式或模板(词组集合),相互进行词组的比对,
(b)步骤二:如果词组相同比对结果得到:相同动词、相同名词、相同动词及相同名词、相同名词及相同动词、或相同的动词/名词交替多环节词组链,其中,如果有副词还可以加入相同副词的比对,即,相同名词、相同副词及相同动词,相同副词、相同动词及相同名词;
(c)步骤三:相同词组进行词频比的比对;
(d)步骤四:输出结果:
一,相同词组词频比相等的结果:
相同动词及相同名词∶词频比v∶n2相等;
相同名词及相同动词∶词频比n∶v相等;
相同动词/名词交替多环节词组:词频比...∶v∶(n+n2)∶v∶...,
1(n、n2)分量全相等;
2(n+n2)总量相等;
动词-名词(价值)链数据关联模板比对匹配成功;
二,相同词组词频比不等的结果:
相同动词:
显示相关高频名词排序;
相同名词:
显示相关高频动词排序;
相同动词及相同名词:
名词词频在动词词频比重与词频比成反比,显示词频比差异值;
相同名词及相同动词:
名词词频在动词词频比重与词频比成正比,显示词频比差异值;
相同动词/名词交替多环节词组:
名词、动词词频比差异值;
其中,个人数据资源制作的动词-名词(价值)链数据关联模板,可以选择一定主题的名词(例如,兴趣,爱好,特长等)相互比对,匹配得到个人匹配主题近似的动词-名词价值链关联关系;
或可以根据给定的名词,在个人数据资源制作的动词-名词(价值)链数据关联模板上,与个人的群体样本数据资源制作的动词-名词(价值)链数据关联模板比对,获得个人在群体数据资源整体中的(给定)名词-动词动作(价值)链环节中的(兴趣,爱好,特长等)动词词频程度比较的差异值定位情况和态势;
其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板,选定词频高的名词词组,比对从众多单位集合的办公综合样本数据资源或者从所有数据资源制作获取的动词-名词(价值)链数据关联模板,可以得到所述单位(部门)在办公综合样本数据资源整体或所有数据资源整体的(高频)名词-动词动作(价值)链环节上的动词词频程度比较的差异值定位情况和态势;
其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板中,选定词频高的名词词组,比对从个人群体样本数据资源的动词-名词(价值)链数据关联模板;匹配成功的名词所在动词-名词(价值)链数据关联模板可以作为所述单位(部门)的(高频)名词为主题供给与个人群体需求之间的匹配关系的动词-名词(价值)链数据关联模板;
其中,
原类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
比对的对象类别模板(数据线索+处理规则+特征值集合);
类别模板(数据线索+处理规则+特征值集合)比对执行如下步骤:
(a)步骤一:按照原类别模板相同的规则,对要比对的对象(主体)对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取比对原类别模板数据线索中的同名词组;
如果没有提取到完全相同的同名词组,返回开始;
如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)数据线索匹配成功,进入下一步;
(b)步骤二:按照原类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断排序:
对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分为同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
对象类别名称A的处理规则(词组链片断){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
比对
原类别名称a的处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)
中的词组链片断排序处理规则;
如果词组链片断排序处理规则的...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推词组链片断排序处理规则都匹配一致,进入下一步;
如果处理规则的词组链片断有不匹配的,则返回开始;
(c)步骤三:按照原类别模板相同的排序处理规则,比对两个类别模板中同类的包括相同名称相同词组链片断排序的词频比:
比对的对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}

原类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
进行比对;
如果:
...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,词组链片断排序处理规则一致,特征值集合的词频比相等,最终结果是两个类别模板匹配成功;
如果:特征值词频比不等即为类别模板匹配失败;
其中,如果设置其他分类规则提取其他特征数据,按照其他规则确定匹配比对成功与否,全部匹配成功才可以为整个模板匹配成功,任何一个局部匹配失败都可导致整个模板匹配失败;
其中,个人移动设备上也可以包含模板比对模块;
(4)模板库,用于保存各种主体的数据资源的模板,
其中,保存单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板、单位(部门)与个人群体混合数据资源的动词-名词(价值)链数据关联模板、个人与单位(部门岗位)混合数据资源的动词-名词(价值)链数据关联模板、等模板集合;
(5)匹配结果反馈及消息通信模块,用于各模板比对匹配成功的消息数据反馈给对应的各个数据资源主体设备,并且用于他们之间的互动消息通信;其中,也用于将动词-名词(价值)链数据关联模板或类别模板(数据线索+处理规则+特征值集合)比对模块中匹配成功的消息数据反馈给对应的各个数据资源主体设备;
其中,可以在个人移动设备上采用单独的(安全芯片)处理器上运行个人移动设备输出\输入同步模块和模板特征提取制作模块。
9.一种基于个人移动设备,应用动词-名词(价值)链数据关联模板的定制模板或类别模板(数据线索+处理规则+特征值集合)的智能系统,其特征在于个人移动设备包括有:输出\输入数据同步模块、模板线索过滤模块、模板匹配比对模块、个人线索库、模板库、输出显示对应主体服务内容模块;其中,
(1)输出\输入数据同步模块,用于将对个人移动设备上的输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入数据同步复制收集;
其中,可以预处理对同步数据进行数据脱敏漂白或图象提取特征值;
(2)模板线索过滤模块,用于上述输出\输入数据同步模块收集到的数据,逐个依次过滤比对模板库中的动词-名词(价值)链数据关联模板制作的定制模板中的所有动词、名词等词组或类别模板(数据线索+处理规则+特征值集合)中的线索数据,匹配成功结果数据记录到得个人线索库,并记录累计匹配次数;
其中,可以根据输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源与个人主体相关性不同的程度,设置过滤的数据的不同权重来累计词频或记录;
(3)模板匹配比对模块,用于模板库的模板与个人线索库提取的模板的比对;
其中,模板库中包括但不限于单位供给-个人群体需求定制模板的动词-名词(价值)链数据关联模板的定制模板(例如,名词丙∶动词甲≈词频比n∶v和动词丁∶名词丁≈词频比v∶n2),比对从个人线索库提取制作的同名的动词-名词(价值)链数据关联模板(例如,名词丙∶动词甲≈词频比n∶v′和动词丁∶名词丁≈词频比v∶n2);如果同名词组的词频比相同或约等于,即为单位供给-个人群体需求定制模板匹配成功,否则即为匹配失败;
其中,鉴于单位供给-个人群体需求的类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成,用模板库中的单位供给-个人群体需求类别模板,比对从个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合),
单位供给-个人群体需求的类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
比对的对象个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合);
执行如下类别模板比对步骤:
(a)步骤一:按照单位供给-个人群体需求的类别模板相同的规则,对要比对的对象(主体)对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取比对单位供给-个人群体需求的类别模板的数据线索中的同名词组;
如果没有提取到完全相同的同名词组,返回开始;
如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)数据线索匹配成功,进入下一步;
(b)步骤二:按照单位供给-个人群体需求的类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断:
对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分为同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
对象类别名称A的处理规则(词组链片断){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
比对
单位供给-个人群体需求的类别模板a的处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)中的词组链片断排序处理规则;
如果处理规则的词组链片断排序...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推处理规则词组链片断排序都匹配一致,进入下一步;
如果处理规则的词组链片断排序有不匹配的,则返回开始;
(c)步骤三:按照单位供给-个人群体需求的类别模板相同的处理规则,比对两个类别模板中同类的包括相同名称相同词组链片断排序的词频比:
比对的对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}

单位供给-个人群体需求的类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
进行比对;
如果:
...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,处理规则的词组链片断排序一致,特征值集合的词频比相等,最终结果是两个类别模板匹配成功;
如果:特征值词频比不等即为类别模板匹配失败;
单位供给-个人群体需求定制模板匹配成功或个人群体同名类别模板匹配成功都构成模板匹配比对成功;
(4)输出显示对应数据服务内容模块,用于在模板匹配比对模块中的模板比对匹配成功后,则在个人移动设备上输出显示所设定对应的数据服务内容;
(5)模板库,用于保存动词-名词(价值)链数据关联模板制作的单位供给-个人群体需求定制模板集合和单位供给-个人群体需求类别模板集合;
其中,经个人移动设备允许,可以下载更新单位供给-个人群体需求定制模板、个人-群体学习交往定制模板等模板到模板库;
(6)个人线索库,用于输出\输入数据同步模块的同步数据过滤动词-名词(价值)链数据关联模板的定制模板的所有动词、名词等词组以及类别模板中线索数据后获得的数据组成个人线索库。
10.一种基于个人移动设备进行数据挖掘,应用动词-名词(价值)链数据关联模板的智能系统,其特征在于个人移动设备包括有:输入法软件数据同步模块、动词过滤及模板生成模块、模板发送管理及匹配结果反馈互动通信模块、个性模板库、动词库;
数据挖掘公共平台服务器包括:模板接受管理及匹配结果反馈互动通信模块、模板比对模块、模板库;
其中,个人移动设备包括有:
(1)输入法软件数据同步模块,用于将对个人移动设备上的输入法输入数据同步复制收集;
(2)动词过滤及模板生成模块,用于上述输入法软件数据同步模块收集到的数据,依次比对过滤动词库中的动词,执行如下步骤生成个性模板:
(a)步骤一:用动词库中的所有常用动词集合,依次过滤输入法软件数据同步模块收集到的文本数据;
(b)步骤二:对过滤匹配成功的动词所在句子进行词性标注,标注出来句子中的名词;
还对过滤匹配成功的动词所在句子语法分析,(尽量)标注出来句子的主语、谓语和宾语;
判断过滤到的动词是否是谓语动词;
其中,也可以为合理时间间隔的输入法收集到的文本数据自动加配标点符号,进行主语名词或宾语名词的指代消解处理;
(c)步骤三:如果过滤到的动词是谓语动词,提取所述句子重叠标注为谓语和动词的词组,提取重叠标注为主语和名词,提取重叠标注为宾语和名词的词组,以及他们分别在各自句子中对应的主语-谓语/谓语-宾语的一对一关联关系:主语名词∶谓语动词/谓语动词∶宾语名词;
(d)步骤四:如果提取到步骤三名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语(一对一)关联关系,保存到个性模板库;
输入法软件数据同步模块收集到的数据,依次比对过滤个性模板库中的所述动词∶名词/名词∶动词词组组合,记录每个词组的匹配词频并标注出来,作为度量两个有一对一链条关联关系的词组权重大小的指标,动词词频v∶名词词频n2/名词词频n∶动词词频v(词频v,n,n2是正整数),获得动词∶名词≈词频比v∶n2/名词∶动词≈词频比n∶v的动词-名词(价值)链数据关联模板(集合);
(3)模板发送管理及匹配结果反馈互动通信模块,用于个人移动设备的用户管理个性模板库显示和管理发送模板到数据挖掘公共平台服务器与指定主体数据资源的模板进行比对,并管理用户与对应主体互动通信;
(4)个性模板库,用于保存动词过滤及模板生成模块生成的个性模板集合;
(5)动词库,用于保存常用动词;
其中,汉语常用动词包括,但不限于如下:
表示动作行为:说、看、走、听、笑、拿、飞翔、跑、吃、唱、喝、敲、坐、吆喝、盯、踢、闻、摸、批评、宣传、保卫、学习、研究、进行、开始、停止、禁止表示存在变化消失:在、死、有、等于、发生、演变、发展、生长、死亡、存在、消灭
表示心理活动:想、爱、恨、伯、想念、打算、喜欢、希望、害伯、担心、讨厌、觉的、思考表示判断:是、为、乃
表示可能意愿必要(助动词):能、能够、会、可以、愿、愿意、肯、敢、要、应当、应该、配、值得、宁可
表示趋向(趋向动词):上、下、进、出、回、开、过、起、来、上来、下来、进来、出来、回来、开来、过来、起来、去、上去、下去、进去、出主、回去,开去、过去
表示发展动词:如生长、枯萎、发芽、结果、产卵;
针对计划、制度、方案、文件等:
编制、制订、拟定、起草、审定、审核、审查、转呈、转交、提交、呈报、下达、备案、存档、提出意见
针对信息、资料:
调查、研究、收集、整理、分析、归纳、分析、总结、提供、汇报、反馈、转达、通知、发布、维护管理
关于某项工作(上级):
主持、组织、指导、安排、协调、指示、监督、管理、分配、控制、牵头负责、审批、审定、签发、批准、评估
思考行为:
研究、分析、评估、发展、建议、倡议、参与、推荐、计划
直接行动:
组织、实行、执行、指导、带领、控制、监管、采用、生产、参加、阐明、解释、提供、协助上级行为:
许可、批准、定义、确定、指导、确立、规划、监督、决定
管理行为:
达到、评估、控制、协调、确保、鉴定、保持、监督
专家行为:
分析、协助、促使、联络、建议、推荐、支持、评估、评价
下级行为:
检查、核对、收集、获得、提交、制作
其他:
维持、保持、建立、开发、准备、处理、执行、接待、安排、监控、汇报、经营、确认、概念化、合作、协作、获得、核对、检查、联络、设计、测试、建造、修改、执笔、起草、引导、传递、翻译、操作、保证、预防、解决、介绍、支付、计算、修订、承担、谈判、商议、面谈、拒绝、否决、监视、预测、比较、删除、运用
其中,数据挖掘公共平台服务器包括有:
(1)模板接受管理及匹配结果反馈互动通信模块,用于接受个人移动设备上发送过来的个性模板,转发模板比对模块,与模板库的指定模板进行比对;
匹配结果数据反馈个人设备,并可以进行个人设备与比对模板主体设备互动通信;
(2)模板比对模块,用于接受个性模板与从模板库指定的主体数据资源的模板比对;并将匹配结果通过模板接受管理及匹配结果反馈互动通信模块反馈给个人设备;
(3)模板库,用于保存各种主体数据资源的模板库;
其中,模板包括但不限于,单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板等模板集合。

说明书全文

提取数据(基因)特征模板方法与应用模板的方法和系统

技术领域

[0001] 本发明涉及数据挖掘文本挖掘自然语言处理人工智能等领域,特别涉及到一种基于自然语言处理、文本挖掘制作使用数据关联特征模式或模板的方法,以及利用应用该模板的智能商业、智能社交的方法和系统。

背景技术

[0002] “数据是爆炸了,信息却很贫乏”。简单的说,数据就是符号。数据本身没有任何意义,数据的含义就是语义(semantic)。只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,数据的含义就是语义。语义是用来联系计算机表示和现实世界的途径。
[0003] 网络资源环境本身也向语义化、结构化和智能化方向发展。
[0004] 人类发展到今天大量信息用电子文档的方式进行存储且近一二十年来这些电子文档的数量呈现出爆炸式的增长。据美林公司(Merrill Lynch)和高德纳公司(Gartner)联合进行的一项调查表明,85%的企业数据或多或少是以无序的方式收集储存的。同时,调查声称这些杂乱无章的数据每18个月增长一倍。文本是最基本、最常用的信息载体,包含着人类知识积累加工进步过程以及涉及人们日常社会活动、政务活动、公共服务、商业活动、社交活动的核心价值。在计算机语言处理工作中文本的加工与处理技术显得尤为重要。当今各界奉行“知识就是量”,知识来源于数据和信息,若社会、政府、企业和个人能够高效且有效地挖掘文本数据背后的价值,就能够做出更好的决策,提高工作效率,提升生活品质。
[0005] 自然语言处理技术在词法和句法上的研究已经取得了重大进展。相比较而言,对语义、语用和语境知识的研究一直是一个难以跨越的瓶颈,难点集中在消除句子甚至是整篇文章级别的语义歧义。可能是受到最初机器翻译应用(该应用至今仍然不算成功)思维视野的影响,人们在自然语言处理过程中对信息颗粒度的认识和把握存有一定的偏差。需要说明的是对于文本中的诸多句子并非每一个句子都可以形成有价值、有意义的素材。

发明内容

[0006] 本发明虽然以句子的词组为信息颗粒度抽取文本中的关键数据要素特征,但是是以社会功能主体的功能和价值颗粒度作为数据挖掘的认识对象,认为人类(包括创造经济价值活动和个人收入的单位)的思维/行为产生信息源,与人们日常生产科研商务活动和消费消遣文化等活动映射着正相关的价值关系,只不过手段和结果是通过数字化手段生成符号化的对应数据量,现代社会已经极少用纸质书写文字进行信息活动了,在电子商务和移动互联网环境下人们几乎全部数字化进行社会信息交流活动;反过来,应该可以通过对人的原始原创文本数据(并非二次统计数据)的价值形成特征要素和行为的物联网数据挖掘,找到与人们日常生产科研商务活动和数字化消费消遣文化等活动有对应关系的社会思维/行为价值驱动数据(基因)信息。
[0007] 经济的本质上是一套价值体系,文化本质是一套价值观体系,数据是基于思维行为的记录或同步:信息源→自然语言电子文档数据资源。
[0008] 图1显示信息源产生的社会主体及其数据资源示意图,
[0009] 各主要社会主体的功能和价值分别是:
[0010] 1,个人具有思维劳动功能和价值;
[0011] 2,个人群体具有学习消费功能和价值;
[0012] 3,单位具有制造生产/生活资源/服务资源功能和价值;
[0013] 4,办公具有制造从生产资源到生活资源的综合功能和价值。
[0014] 人类的日常活动和动作是受价值和价值观驱动,思维行为在信息上和数据上主要是用动词的语义表现出来:思维/行为价值(观)驱动→信息源→动词(价值驱动)→自然语言电子文档数据资源。这些社会主体之间功能和价值信息传递关系在数据上体现为:不同使用强度(频度)的动词为主(价值)的动词-名词关联词组,通过自然语言句子的主语,谓语,宾语语的法结构实现传递动词-名词链,描绘数据价值链(基因)信息。
[0015] 社会主体的信息活动产生如下数据资源:
[0016] 1,个人数据资源;
[0017] 2,个人的群体样本数据资源;
[0018] 3,单位(部)数据资源;
[0019] 4,办公综合样本数据资源;
[0020] 其中,众多个人数据资源汇集一起成为个人的群体样本数据资源--数据共产;众多单位(部门)数据资源汇集一起组成办公综合样本数据资源--数据共享。文本挖掘是从大量文本的集合C中发现隐含的模式p。如果将C看作输入,将p看作输出,那么文本挖掘的过程就是从输入到输出的一个映射:C-p。信息提取技术就是利用计算机技术从这些社会主体海量的电子文档和行为物联网数据中找到符合社会主体需求或满足社会主体价值需求的特征值(数据价值基因),而将涉及个人(隐私)数据进行脱敏漂白,例如将个人email:embbiz@126.com脱敏为:e***iz@126.com。
[0021] 基于以上认识,为实现上述发明目的,按照本发明的第一方面,
[0022] ①提供一种基于自然语言处理技术,提取制作数据关联特征模式或模板的方法,其特征在于制作动词-名词(价值)链数据关联模式或模板执行如下步骤:
[0023] (a)步骤一:对(主体的)数据资源的文本数据进行语种判定预处理,词性标注,标注出每个句子的名词、动词;
[0024] 并对文本数据进行语法分析,标注出每个句子的主语、谓语、宾语其中,可以将被动语态主语标注为宾语;
[0025] 其中,进行主语名词或宾语名词的指代消解处理;
[0026] (b)步骤二:提取句子集合中重叠标注为主语和名词的词组,提取句子集合中重叠标注为谓语和动词的词组,提取重叠标注为宾语和名词的词组,分别获得作为主语的名词集合,作为谓语的动词集合,和作为宾语的名词集合,以及他们分别在句子中的主语-谓语/谓语-宾语对应的关联特征关系,主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合,即,名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语(一对一)关联特征关系;
[0027] (c)步骤三:分别统计主语名词、谓语动词和宾语动词的累计词频,标注出来作为度量主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合含有(一对一)关联关系的词组权重特征值大小,即,
[0028] 主语名词词频n∶谓语动词词频v/
[0029] 谓语动词词频v∶宾语名词词频n2(词频v,n,n2是正整数),
[0030] 获得关联关系权重的所述(主体的)数据资源的:
[0031] 名词∶动词≈词频比n∶v集合以及
[0032] 动词∶名词≈词频比v∶2n集合,
[0033] 集合中选取高频的词频词组成为动词-名词(价值)链数据关联模式或模板(词组集合)。
[0034] ②基于上述方法提供了一个优选方案,其特征在于:
[0035] 其中,步骤四:合并名词∶动词的(一对一)关联词组和动词∶名词的(一对一)关联词组前后同名重复的名词词组和词频:
[0036] ...
[0037] ...∶动词∶相同名词
[0038] 相同名词∶动词∶...
[0039] ...
[0040] 连接同名名词两词组成多环节关联词组链条,得到...∶动词∶(合并相同)名词∶动词∶(合并相同)名词∶动词∶...的多环节词组链条,从而将部分一对一的词组链条(集合)串联形成以动词/名词词组交替为链接节点的...∶动词∶名词∶动词∶名词∶...多环节多维度的动词/名词交替词组链条,甚至可能形成首尾相互链接的闭环的动词/名词交替词组的多环节闭环关联词组链;
[0041] 合并主语名词和宾语名词的词频n+n2,获得交替循环往复的...∶动词∶名词∶...链接关联词组权重的...∶动词∶名词∶...≈词频比...∶v∶(n+n2)∶...动词-名词(价值)链数据关联模式或模板(词组集合,词频v,n,n2是正整数),
[0042] 也就是说,动词-名词(价值)链数据关联模式或模板(词组集合),既可以是一对一的词组链条(名词∶动词≈词频比n∶v或动词∶名词≈词频比v∶n2)也可以是多环节的词组链条(...∶动词∶名词∶动词...≈词频比...∶v∶(n+n2)∶v∶...)两种形式。
[0043] ③基于上述方法进一步提供了一个优选方案,其特征在于:
[0044] 其中,可以利用语料库、数字字典、知识本体库等自然语言处理辅助工具综合分析,进行针对每个句子的谓语动词的副词标注,提取副词时候还累计统计其词频,得到:
[0045] 副词∶动词∶名词的关联权重的副词∶动词∶名词≈词频比a∶v∶n2或名词∶副词∶动词≈词频比n∶a∶v的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数可以为0);
[0046] 或者获得多环节的词组链条:
[0047] 交替循环往复...∶副词∶动词∶名词∶副词∶...词组的关联权重的...∶副词∶动词∶名词∶...≈词频比...∶a∶v∶(n+n2)∶a∶...的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数并可以为0);其中,副词可以为空。
[0048] ④按照本发明的第二方面,提供一种动词-名词(价值)链数据关联模式或模板(词组集合)的比对方法,其特征在于执行如下步骤:
[0049] (a)步骤一:两个不同(主体的)数据资源制作的动词-名词(价值)链数据关联模式或模板(词组链集合),相互进行词组的比对,
[0050] (b)步骤二:如果比对结果得到:
[0051] 相同动词、
[0052] 相同名词、
[0053] 相同动词及相同名词、
[0054] 相同名词及相同动词、
[0055] 或相同的动词/名词交替多环节词组链条,
[0056] 其中,如果有副词还可以加入相同副词的比对,即,
[0057] 相同名词、相同副词及相同动词,
[0058] 相同副词、相同动词及相同名词,
[0059] 进入下一步;
[0060] (c)步骤三:相同词组进行词频比的比对;
[0061] (d)步骤四:输出结果:
[0062] 一,词频比相等的结果:
[0063] 相同动词及相同名词∶词频比v∶n2相等,模板成功匹配;
[0064] 相同名词及相同动词∶词频比n∶v相等,模板成功匹配;
[0065] 相同动词/名词交替多环节词组∶词频比...∶v∶(n+n2)∶v∶...,
[0066] 1(n、n2)分量全相等;
[0067] 2(n+n2)总量相等;
[0068] ,模板成功匹配;
[0069] 二,词频比不等的结果:
[0070] 相同动词:
[0071] 显示相关高频名词排序;
[0072] 相同名词:
[0073] 显示相关高频动词排序;
[0074] 相同动词及相同名词:
[0075] 两个模板名词词频分别在动词词频的比重与他们词频比成反比例关系,显示词频比差异值;
[0076] 相同名词及相同动词:
[0077] 两个模板名词词频在动词词频的比重与他们词频比成正比例关系,
[0078] 显示词频比差异值;
[0079] 相同动词/名词交替多环节词组:
[0080] 名词、动词词频比差异值;
[0081] 其中,可以从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板中,选定词频高的名词词组(集合),比对从个人群体样本数据资源的动词-名词(价值)链数据关联模板(集合);匹配成功的相同名词所在动词-名词(价值)链数据关联模板可以作为所述单位(部门)的(高频)名词为主题的单位供给与个人群体需求之间的匹配关系的动词-名词(价值)链数据关联模板;
[0082] 其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板,选定词频高的名词词组,比对从众多单位集合的办公综合样本数据资源或者从所有数据资源制作获取的动词-名词(价值)链数据关联模板,可以得到所述单位(部门)在办公综合样本数据资源整体或所有数据资源整体的(高频)名词-动词动作(价值)链环节上的动词词频程度中的相对比较的差异值定位情况和态势。
[0083] ⑤按照本发明的第三方面,提供一种使用动词-名词(价值)链数据关联模板制作类别模板,以及类别模板的比对方法,其特征在于:
[0084] 一,类别模板(数据线索+处理规则+特征值集合)的提取制作执行如下步骤:
[0085] (a)步骤一:借助语料库、知识本体库等自然语言处理工具,对一个(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分(包括同类名词)组成的动词-名词(价值)链数据关联模板片断,划分出同类别的动词-名词(价值)链片断(集合),组成分类/聚类模板,即,每个类别模板可能包括较少词组链条的动词-名词(价值)链片断(集合),并对类别命名:
[0086] 类别名称a{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...动词-名词(价值)链片断(词频v,n,n2是正整数)}
[0087] 其中,同样方法,也可以用动词词组相同相近的同义词近义词,划分同类动词的类别模板:
[0088] (b)步骤二:分类相同的动词-名词(价值)链片断集合,以原始词组(片断所有动词、名词)作为一部分线索,组合线索(第一)集合,
[0089] 以同类名词左右各保留至少一个动词词组的(相同)原则获取和匹配动词-名词(价值)链片断排序规则作为一部分规则,组合规则(第二)集合,
[0090] 同类名词的动词-名词(价值)链片断的词频比作为一部分统计特征值,组合特征值(第三)集合,
[0091] 简化表示和详细展开分别为:
[0092] 类别模板(数据线索+处理规则+特征值集合)=类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
[0093] 其中,还可以设定其他分类规则,与动词-名词(价值)链数据关联模板分类规则一起,组成类别模板规则;
[0094] 其中,可以针对单位(部门)数据资源的动词-名词(价值)链数据关联模板制作单位(部门)类别模板;
[0095] 其中,可以针对个人群体数据资源的动词-名词(价值)链数据关联模板提取制作个人群体类别模板;
[0096] 其中,可以针对办公综合样本数据资源的动词-名词(价值)链数据关联模板提取制作办公综合类别模板;
[0097] 二,类别模板(数据线索+处理规则+特征值集合)的比对执行如下步骤:
[0098] 原类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
[0099] 比对的对象类别模板(数据线索+处理规则+特征值集合);
[0100] (a)步骤一:按照原类别模板相同的规则,从要比对的对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取原类别模板数据线索中的同名词组;
[0101] 如果没有提取到完全相同的同名词组,返回开始;
[0102] 如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...),数据线索匹配成功,进入下一步;
[0103] (b)步骤二:按照原类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断排序规则:
[0104] 对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分出同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
[0105] 对象类别名称A的词组排序处理规则(词组链片断排序){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
[0106] 比对
[0107] 原类别名称a的词组片断排序处理规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)
[0108] 中的词组链片断排序;
[0109] 如果处理规则的词组链片断排序...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推处理规则词组链片断排序都匹配一致,进入下一步;
[0110] 如果词组链片断排序处理规则不匹配,则返回开始;
[0111] (c)步骤三:按照原类别模板相同的处理规则,比对两个类别模板中同类的包括相同名称和相同词组链片断排序的的词频比:
[0112] 比对对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0113] 与
[0114] 原类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0115] 进行比对;如果:
[0116] ...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
[0117] ...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
[0118] ...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
[0119] 类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,处理规则的词组链片断排序一致,特征值集合的词频比相等,结果是两个类别模板匹配成功;
[0120] 如果:特征值词频比不等即为类别模板匹配失败;
[0121] 其中,如果还采用其他分类规则,按照其他规则确定匹配比对成功与否,全部匹配成功才可以为整个模板匹配成功,任何一个局部匹配失败都可导致整个模板匹配失败。
[0122] ⑥按照本发明的第四方面,提供一种使用动词-名词(价值)链数据关联模板制作定制模板的方法,其特征在于执行如下步骤:
[0123] (a)步骤一:在主题(第一)数据资源的动词-名词(价值)链数据关联模板集合中,选取高词频的名词列表(例如,名词甲、名词乙...);
[0124] (b)步骤二:用所述高频名词列表的名词,与目标(第二)数据资源的动词-名词(价值)链数据关联模板集合中的名词匹配比对;
[0125] (例如,名词甲与...∶动词丙∶名词丙∶动词甲∶名词甲∶动词丁∶名词丁∶...≈词频比...∶v∶(n+n2)∶v∶(n+n2)∶v∶(n+n2)∶...的名词丙、名词甲、名词丙比对;)[0126] (c)步骤三:在目标(第二)数据资源的动词-名词(价值)链数据关联模板上匹配成功的同名名词位置(例如,同名名词甲在动词-名词(价值)链数据关联模板上...∶名词丙∶动词甲∶同名名词甲位置∶动词丁∶名词丁∶..≈词频比...∶(n+n2)∶v∶(n+n2)∶v∶(n+n2)∶...),向左、向右或向左右两边动词/名词词交替词组链上选取至少一个动词和一个名词;
[0127] 所述位置(不包括同名名词)的向左、向右或向左右两边选取的动词-名词交替词组关联链条(例如,名词丙∶动词甲≈词频比(n+n2)∶v和动词丁∶名词丁≈词频比v∶(n+n2))成为主题(第一)数据资源与目标(第二)数据资源的数据关联定制模板(集合);
[0128] 其中,用可以作为主题(第一)数据资源的单位(部门)数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的个人群体数据资源的动词-名词(价值)链数据关联模板,制作单位供给-个人群体需求定制模板;
[0129] 其中,用可以作为主题(第一)数据资源的单位(部门)数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的办公综合样本数据资源的动词-名词(价值)链数据关联模板,制作单位供给-办公综合价值链供应链定制模板;
[0130] 其中,用可以作为主题(第一)数据资源的个人数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的个人群体数据资源的动词-名词(价值)链数据关联模板,制作个人-群体学习交往定制模板。
[0131] ⑦按照本发明的第五方面,提供一种基于个人移动设备进行数据挖掘的智能系统,包括有语料库、知识本体库等,其特征在于,个人移动设备包括有个人移动设备输出\输入同步模,模板特征提取模块,其中:
[0132] (1)个人移动设备输出\输入同步模块,用于将对个人移动设备上的输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源同步异步复制收集,提供给模板特征提取制作模块使用,其中,可以预处理对同步数据进行数据脱敏漂白或图象提取特征值;
[0133] (2)模板特征提取制作模块,对个人移动设备上同步的个人数据资源进行数据挖掘,特征值提取,制作个人数据模型、模式或模板;
[0134] 其中,可以在个人移动设备上提取制作个人数据资源的数据模型、模式或模板;
[0135] 其中,可以提取制作动词-名词(价值)链数据关联模板以及类别模板;
[0136] 执行如下步骤制作动词-名词(价值)链数据关联模板:
[0137] (a)步骤一:对文本数据进行判定语种预处理分析,词性标注,标注出来每个句子的名词、动词;
[0138] 并进行语法分析,标注出来每个句子的主语、谓语、宾语;
[0139] 其中,可以将被动语态主语标注为宾语;
[0140] 其中,根据数据资源的不同类型主体,进行主语名词或宾语名词的指代消解处理;
[0141] (b)步骤二:提取重叠标注为主语和名词的词组,提取重叠标注为谓语和动词的词组,提取重叠标注为宾语和名词的词组,以及他们分别在各自句子中的主语-谓语和谓语-宾语对应的关联关系:
[0142] 分别获得作为主语的名词的词组集合,作为谓语的动词的词组集合,和作为宾语的名词的词组集合一主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合,即,[0143] 名词∶动词/
[0144] 动词∶名词
[0145] 的词组组合和他们之间的主语-谓语/谓语-宾语(一对一)关联关系;
[0146] (c)步骤三:(提取时)词频统计每个词组的词频并标注出来,作为度量有一对一链条关联关系的词组权重大小的指标,
[0147] 名词n∶动词v和
[0148] 动词v∶名词n2(词频v,n,n2是正整数);
[0149] (d)步骤四:合并名词∶动词的一对一链条关联词组和动词∶名词的一对一链条关联词组前后重复的名词词组和词频,并连接两词组成多环节关联链条:
[0150] ...
[0151] ...∶动词∶相同名词
[0152] 相同名词∶动词∶...
[0153] ...
[0154] 得到...∶动词∶(合并相同)名词∶动词∶...的多环节词组链条,形成以动词-名词交替为链接词组节点,即...∶动词∶名词∶动词∶名词∶...的多环节多维度的动词/名词交替的词组链,从而将动词∶名词和名词∶动词关联词组链接循环往复串联起来,甚至形成首尾相互链接的闭环的动词/名词交替的多环节闭环关联词组链,
[0155] 获得交替循环往复的...∶动词∶名词∶...链接关联词组权重指标的...∶动词∶名词∶...≈词频比...∶v∶(n+n2)∶...动词-名词(价值)链数据关联模板(词频v,n,n2是正整数);
[0156] 其中,继续执行如下步骤制作获得类别模板(数据线索+处理规则+特征值集合):
[0157] (a)步骤一:借助语料库、知识本体库等自然语言处理工具,对个人(群体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分(包括同类名词)组成的动词-名词(价值)链数据关联模板片断,划分出同类别的动词-名词(价值)链片断(集合),组成分类/聚类模板,并对类别命名:
[0158] 类别名称a{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...动词-名词(价值)链片断(词频v,n,n2是正整数)}
[0159] 其中,同样方法,也可以用动词词组相同相近的同义词近义词,划分同类动词的类别模板:
[0160] (b)步骤二:分类相同的动词-名词(价值)链片断集合,以原始词组(片断所有动词、名词)作为一部分线索,组成线索(第一)集合,
[0161] 以同类名词所在模板位置左右相邻各保留至少一个动词词组的(相同)原则获取和匹配动词-名词(价值)链片断排序规则作为一部分规则,组成规则(第二)集合,
[0162] 和同类名词的动词-名词(价值)链片断的词频比作为一部分统计特征值,组成特征值(第三)集合;
[0163] 简化表示和详细展开表示分别为:
[0164] 类别模板(数据线索+处理规则+特征值集合)=类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序规则(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
[0165] 其中,还可以提取地理位置、时间等其他同类特征数据,与动词-名词(价值)链数据关联模板分类数据一起,组成如下格式更复杂的类别模板:
[0166] 类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...;A<北纬N1”,东经E1”>、B<北纬N2”,东经E2”>、C<北纬N3”,东经E3”>、D<北纬N4”,东经E4”>...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;地点排序规则A∶B∶C∶D...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数);地点时间特征值A:time1,B:time2,C:time3,D:time4...)};
[0167] 其中,也可以用动词词组相同相近(同义词近义词),划分出同类动词的类别模板;
[0168] 个人移动设备同步的个人样本数据资源,获得动词-名词(价值)链数据关联模板组成的个人类别模板(数据线索+处理规则+特征值集合);其中,由于是第一人称,默认缺省主语名词。
[0169] ⑧基于上述身份属性匹配比对系统,进一步提供了一个优选方案,其特征在于,数据挖掘公共平台服务器包括有:模板特征提取模块、模板比对模块、模板库、匹配结果反馈及消息通信模块,其中,可以根据输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源与个人主体相关性不同的程度,设置提取的词频的不同权重;其中,单位的服务器或PC包括有公共数据挖掘共享伴侣模块:
[0170] (1)公共数据挖掘共享伴侣模块,用于将单位(部门)的服务器或PC上的单位(部门)电子文档数据资源,特别是文本数据,以手动或自动方式汇聚共享到数据挖掘公共平台服务器,众多单位数据资源汇聚组成办公综合样本数据资源;
[0171] 其中,共享之前进行数据预处理,排除内容相同或内容相似且时间相同的电子文档,也可以预处理对同步数据进行数据脱敏;
[0172] (2)数据挖掘公共平台服务器的模板特征提取制作模块,用于数据资源进行数据挖掘,制作数据模型、模式或模板;
[0173] 其中,将众多个人移动设备上同步下载的个人数据资源汇集一起形成个人群体数据进行数据挖掘,特征值提取,制作个人群体数据模型、模式或模板;个人移动设备汇聚的个人群体样本数据资源,获得众多系列化动词-名词(价值)链数据关联模板组成的个人群体类别模板(数据线索+处理规则+特征值集合);
[0174] 其中,对单位(部门)数据资源、众多单位汇聚的办公综合样本数据资源、移动设备同步的个人数据资源、移动设备汇聚的个人群体样本数据资源、个人群体样本数据资源与单位(部门)数据资源的混合数据资源(用于单位供给模板与个人需求模板匹配)、个人数据资源与单位数据资源的混合数据资源(用于个人特长模板与单位岗位模板匹配)、全部数据资源,进行数据挖掘,制作数据模式或模板;
[0175] 其中,可以制作动词-名词(价值)链数据关联模板以及类别模板,获得动词-名词(价值)链数据关联模板及类别模板;
[0176] 其中,执行如下步骤可以制作单位供给-个人群体需求的类别模板:
[0177] (d)步骤一:用单位(部门)数据资源的单位(部门)类别模板(片断)集合的类别名称,比对作为比对对象的个人群体样本数据资源的个人群体类别模板(片断)集合中的类别名称;
[0178] (e)步骤二:如果类别名称匹配成功,获得同名的类别名称和分属单位(部门)类别模板(片断)和个人群体类别模板(片断)的两个集合;选择直接引用上述同名的类别名称和所属比对对象的个人群体类别模板(片断)集合,构成单位供给-个人群体需求类别模板;
[0179] 结果是单位供给-个人群体需求类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成;
[0180] (3)模板比对模块,用于不同主体数据资源的数据模板的特征值比对;
[0181] 其中,进行其动词-名词(价值)链数据关联模板以及类别模板的特征值比对方法,可以用于单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板之间的特征值相互对应的匹配比对;
[0182] 其中,动词-名词(价值)链数据关联模板比对执行如下步骤:
[0183] (a)步骤一:两个不同(主体的)数据资源制作的动词-名词(价值)链数据关联模式或模板(词组集合),相互进行词组的比对,
[0184] (b)步骤二:如果词组相同比对结果得到:相同动词、相同名词、相同动词及相同名词、相同名词及相同动词、或相同的动词/名词交替多环节词组链,其中,如果有副词还可以加入相同副词的比对,即,相同名词、相同副词及相同动词,相同副词、相同动词及相同名词;
[0185] (c)步骤三:相同词组进行词频比的比对;
[0186] (d)步骤四:输出结果:
[0187] 一,相同词组词频比相等的结果:
[0188] 相同动词及相同名词∶词频比v∶n2相等;
[0189] 相同名词及相同动词∶词频比n∶v相等;
[0190] 相同动词/名词交替多环节词组∶词频比...∶v∶(n+n2)∶v∶...,
[0191] 1(n、n2)分量全相等;
[0192] 2(n+n2)总量相等;
[0193] 动词-名词(价值)链数据关联模板比对匹配成功;
[0194] 二,相同词组词频比不等的结果:
[0195] 相同动词:
[0196] 显示相关高频名词排序;
[0197] 相同名词:
[0198] 显示相关高频动词排序;
[0199] 相同动词及相同名词:
[0200] 名词词频在动词词频比重与词频比成反比,显示词频比差异值;
[0201] 相同名词及相同动词:
[0202] 名词词频在动词词频比重与词频比成正比,显示词频比差异值;
[0203] 相同动词/名词交替多环节词组:
[0204] 名词、动词词频比差异值;
[0205] 其中,个人数据资源制作的动词-名词(价值)链数据关联模板,可以选择一定主题的名词(例如,兴趣,爱好,特长等)相互比对,匹配得到个人匹配主题近似的动词-名词价值链关联关系;
[0206] 或可以根据给定的名词,在个人数据资源制作的动词-名词(价值)链数据关联模板上,与个人的群体样本数据资源制作的动词-名词(价值)链数据关联模板比对,获得个人在群体数据资源整体中的(给定)名词-动词动作(价值)链环节中的(兴趣,爱好,特长等)动词词频程度比较的差异值定位情况和态势;
[0207] 其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板,选定词频高的名词词组,比对从众多单位集合的办公综合样本数据资源或者从所有数据资源制作获取的动词-名词(价值)链数据关联模板,可以得到所述单位(部门)在办公综合样本数据资源整体或所有数据资源整体的(高频)名词-动词动作(价值)链环节上的动词词频程度比较的差异值定位情况和态势;
[0208] 其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板中,选定词频高的名词词组,比对从个人群体样本数据资源的动词-名词(价值)链数据关联模板;匹配成功的名词所在动词-名词(价值)链数据关联模板可以作为所述单位(部门)的(高频)名词为主题供给与个人群体需求之间的匹配关系的动词-名词(价值)链数据关联模板;
[0209] 其中,原类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
[0210] 比对的对象类别模板(数据线索+处理规则+特征值集合);
[0211] 类别模板(数据线索+处理规则+特征值集合)比对执行如下步骤:
[0212] (a)步骤一:按照原类别模板相同的规则,对要比对的对象(主体)对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取比对原类别模板数据线索中的同名词组;
[0213] 如果没有提取到完全相同的同名词组,返回开始;
[0214] 如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)数据线索匹配成功,进入下一步;
[0215] (b)步骤二:按照原类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断排序:
[0216] 对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分为同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
[0217] 对象类别名称A的处理规则(词组链片断){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
[0218] 比对
[0219] 原类别名称a的处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)
[0220] 中的词组链片断排序处理规则;
[0221] 如果词组链片断排序处理规则的...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推词组链片断排序处理规则都匹配一致,进入下一步;
[0222] 如果处理规则的词组链片断有不匹配的,则返回开始;
[0223] (c)步骤三:按照原类别模板相同的排序处理规则,比对两个类别模板中同类的包括相同名称相同词组链片断排序的词频比:
[0224] 比对的对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0225] 与
[0226] 原类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0227] 进行比对;如果:
[0228] ...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
[0229] ...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
[0230] ...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
[0231] 类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,词组链片断排序处理规则一致,特征值集合的词频比相等,最终结果是两个类别模板匹配成功;
[0232] 如果:特征值词频比不等即为类别模板匹配失败;
[0233] 其中,如果设置其他分类规则提取其他特征数据,按照其他规则确定匹配比对成功与否,全部匹配成功才可以为整个模板匹配成功,任何一个局部匹配失败都可导致整个模板匹配失败;
[0234] 其中,个人移动设备上也可以包含模板比对模块;
[0235] (4)模板库,用于保存各种主体的数据资源的模板,
[0236] 其中,保存单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板、单位(部门)与个人群体混合数据资源的动词-名词(价值)链数据关联模板、个人与单位(部门岗位)混合数据资源的动词-名词(价值)链数据关联模板、等模板集合;
[0237] (5)匹配结果反馈及消息通信模块,用于各模板比对匹配成功的消息数据反馈给对应的各个数据资源主体设备,并且用于他们之间的互动消息通信;其中,也用于将动词-名词(价值)链数据关联模板或类别模板(数据线索+处理规则+特征值集合)比对模块中匹配成功的消息数据反馈给对应的各个数据资源主体设备;
[0238] 其中,可以在个人移动设备上采用独立的(安全)芯片处理器上运行个人移动设备输出\输入同步模块和模板特征提取制作模块。
[0239] ⑨按照本发明的第六方面,提供一种基于个人移动设备,应用动词-名词(价值)链数据关联模板的定制模板或类别模板(数据线索+处理规则+特征值集合)的智能系统,其特征在于个人移动设备包括有:输出\输入数据同步模块、模板线索过滤模块、模板匹配比对模块、个人线索库、模板库、输出显示对应主体服务内容模块;其中,
[0240] (1)输出\输入数据同步模块,用于将对个人移动设备上的输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入数据同步复制收集;
[0241] 其中,可以预处理对同步数据进行数据脱敏漂白或图象提取特征值;
[0242] (2)模板线索过滤模块,用于上述输出\输入数据同步模块收集到的数据,逐个依次过滤比对模板库中的动词-名词(价值)链数据关联模板制作的定制模板中的所有动词、名词等词组或类别模板(数据线索+处理规则+特征值集合)中的线索数据,匹配成功结果数据记录到得个人线索库,并记录累计匹配次数;
[0243] 其中,可以根据输入法、摄像头、共享内存、缓存、临时文件缓存、应用程序APP记录保存到本地的临时文件、网络开放接口、导航API等输出\输入个人数据资源与个人主体相关性不同的程度,设置过滤的数据的不同权重累计词频或记录;
[0244] (3)模板匹配比对模块,用于模板库的模板与个人线索库提取的模板的比对;
[0245] 其中,模板库中包括但不限于单位供给-个人群体需求定制模板的动词-名词(价值)链数据关联模板的定制模板(例如,名词丙∶动词甲≈词频比n∶v和动词丁∶名词丁≈词频比v∶n2),比对从个人线索库提取制作的同名的动词-名词(价值)链数据关联模板(例如,名词丙∶动词甲≈词频比n∶v和动词丁∶名词丁≈词频比v∶n2);如果同名词组的词频比相同或约等于,即为单位供给-个人群体需求定制模板匹配成功,否则即为匹配失败;
[0246] 其中,鉴于单位供给-个人群体需求的类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成,用模板库中的单位供给-个人群体需求类别模板,比对从个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合),
[0247] 单位供给-个人群体需求的类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则:词组链片断排序(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数))}
[0248] 比对的对象个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合);
[0249] 执行如下类别模板比对步骤∶
[0250] (a)步骤一:按照单位供给-个人群体需求的类别模板相同的规则,对要比对的对象(主体)对象类别模板(数据线索+处理规则+特征值集合)的数据线索中,提取比对单位供给-个人群体需求的类别模板的数据线索中的同名词组;
[0251] 如果没有提取到完全相同的同名词组,返回开始;
[0252] 如果提取到上述全部同名词组,数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)数据线索匹配成功,进入下一步;
[0253] (b)步骤二:按照单位供给-个人群体需求的类别模板同样分类/聚类规则进行分类,获得相同分类词组链片断:
[0254] 对要比对的对象(主体)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链片断,划分为同类别的动词-名词(价值)链片断集合,组成分类/聚类模板,对类别命名,得到:
[0255] 对象类别名称A的处理规则(词组链片断){...∶动词11∶同类名词11∶动词11∶...;...∶动词22∶同类名词22∶动词22∶...;...词组链片断}
[0256] 比对
[0257] 单位供给-个人群体需求的类别模板a的处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)[0258] 中的词组链片断排序处理规则;
[0259] 如果处理规则的词组链片断排序...∶动词11∶同类名词11∶动词11∶...与...∶动词1∶同类名词1∶动词1∶...匹配一致;...∶动词22∶同类名词22∶动词22∶...与...∶动词2∶同类名词2∶动词2∶...匹配一致;...以此类推处理规则词组链片断排序都匹配一致,进入下一步;
[0260] 如果处理规则的词组链片断排序有不匹配的,则返回开始;
[0261] (c)步骤三:按照单位供给-个人群体需求的类别模板相同的处理规则,比对两个类别模板中同类的包括相同名称相同词组链片断排序的词频比:
[0262] 比对的对象类别模板特征值集合{...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0263] 与
[0264] 单位供给-个人群体需求的类别模板特征值集合{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数)}
[0265] 进行比对;
[0266] 如果:
[0267] ...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词1∶同类名词1∶动词1∶...;
[0268] ...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈...∶动词2∶同类名词2∶动词2∶...
[0269] ...以此类推特征值词频比都相同或约等于,即为特征值集合匹配成功,
[0270] 个人线索库提取制作的同名类别模板(数据线索+处理规则+特征值集合)中的数据线索匹配成功,处理规则的词组链片断排序一致,特征值集合的词频比相等,最终结果是两个类别模板匹配成功;
[0271] 如果:特征值词频比不等即为类别模板匹配失败;
[0272] 单位供给-个人群体需求定制模板匹配成功或个人群体同名类别模板匹配成功都构成模板匹配比对成功;
[0273] (4)输出显示对应数据服务内容模块,用于在模板匹配比对模块中的模板比对匹配成功后,则在个人移动设备上输出显示所设定对应的数据服务内容;
[0274] (5)模板库,用于保存动词-名词(价值)链数据关联模板制作的单位供给-个人群体需求定制模板集合和单位供给-个人群体需求类别模板集合;
[0275] 其中,经个人移动设备允许,可以下载更新单位供给-个人群体需求定制模板、个人-群体学习交往定制模板等模板到模板库;
[0276] (6)个人线索库,用于输出\输入数据同步模块的同步数据过滤动词-名词(价值)链数据关联模板的定制模板的所有动词、名词等词组以及类别模板中线索数据后获得的数据组成个人线索库。
[0277] ⑩按照本发明的第七方面,提供一种基于个人移动设备进行数据挖掘,应用动词-名词(价值)链数据关联模板的智能系统,其特征在于个人移动设备包括有:输入法软件数据同步模块、动词过滤及模板生成模块、模板发送管理及匹配结果反馈互动通信模块、个性模板库、动词库;
[0278] 数据挖掘公共平台服务器包括:模板接受管理及匹配结果反馈互动通信模块、模板比对模块、模板库;
[0279] 其中,个人移动设备包括有:
[0280] (1)输入法软件数据同步模块,用于将对个人移动设备上的输入法输入数据同步复制收集;
[0281] (2)动词过滤及模板生成模块,用于上述输入法软件数据同步模块收集到的数据,依次比对过滤动词库中的动词,执行如下步骤生成个性模板:
[0282] (a)步骤一:用动词库中的所有常用动词集合,依次过滤输入法软件数据同步模块收集到的文本数据;
[0283] (b)步骤二:对过滤匹配成功的动词所在句子进行词性标注,标注出来句子中的名词;
[0284] 还对过滤匹配成功的动词所在句子语法分析,(尽量)标注出来句子的主语、谓语和宾语;
[0285] 判断过滤到的动词是否是谓语动词;
[0286] 其中,也可以为合理时间间隔的输入法收集到的文本数据自动加配标点符号,进行主语名词或宾语名词的指代消解处理;
[0287] (c)步骤三:如果过滤到的动词是谓语动词,提取所述句子重叠标注为谓语和动词的词组,提取重叠标注为主语和名词,提取重叠标注为宾语和名词的词组,以及他们分别在各自句子中对应的主语-谓语/谓语-宾语的一对一关联关系:主语名词∶谓语动词/谓语动词∶宾语名词;
[0288] (d)步骤四:如果提取到步骤三名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语(一对一)关联关系,保存到个性模板库;
[0289] 输入法软件数据同步模块收集到的数据,依次比对过滤个性模板库中的所述动词∶名词/名词∶动词词组组合,记录每个词组的匹配词频并标注出来,作为度量两个有一对一链条关联关系的词组权重大小的指标,动词词频v∶名词词频n2/名词词频n∶动词词频v(词频v,n,n2是正整数),获得动词∶名词≈词频比v∶n2/名词∶动词≈词频比n∶v的动词-名词(价值)链数据关联模板(集合);
[0290] (3)模板发送管理及匹配结果反馈互动通信模块,用于个人移动设备的用户管理个性模板库显示和管理发送模板到数据挖掘公共平台服务器与指定主体数据资源的模板进行比对,并管理用户与对应主体互动通信;
[0291] (4)个性模板库,用于保存动词过滤及模板生成模块生成的个性模板集合;
[0292] (5)动词库,用于保存常用动词;
[0293] 其中,汉语常用动词包括,但不限于如下:
[0294] 表示动作行为:说、看、走、听、笑、拿、飞翔、跑、吃、唱、喝、敲、坐、吆喝、盯、踢、闻、摸、批评、宣传、保卫、学习、研究、进行、开始、停止、禁止
[0295] 表示存在变化消失:在、死、有、等于、发生、演变、发展、生长、死亡、存在、消灭[0296] 表示心理活动:想、爱、恨、伯、想念、打算、喜欢、希望、害伯、担心、讨厌、觉的、思考[0297] 表示判断:是、为、乃
[0298] 表示可能意愿必要(助动词):能、能够、会、可以、愿、愿意、肯、敢、要、应当、应该、配、值得、宁可
[0299] 表示趋向(趋向动词):上、下、进、出、回、开、过、起、来、上来、下来、进来、出来、回来、开来、过来、起来、去、上去、下去、进去、出主、回去,开去、过去
[0300] 表示发展动词:如生长、枯萎、发芽、结果、产卵;
[0301] 针对计划、制度、方案、文件等:
[0302] 编制、制订、拟定、起草、审定、审核、审查、转呈、转交、提交、呈报、下达、备案、存档、提出意见
[0303] 针对信息、资料:
[0304] 调查、研究、收集、整理、分析、归纳、分析、总结、提供、汇报、反馈、转达、通知、发布、维护管理
[0305] 关于某项工作(上级):
[0306] 主持、组织、指导、安排、协调、指示、监督、管理、分配、控制、牵头负责、审批、审定、签发、批准、评估
[0307] 思考行为:
[0308] 研究、分析、评估、发展、建议、倡议、参与、推荐、计划
[0309] 直接行动:
[0310] 组织、实行、执行、指导、带领、控制、监管、采用、生产、参加、阐明、解释、提供、协助[0311] 上级行为:
[0312] 许可、批准、定义、确定、指导、确立、规划、监督、决定
[0313] 管理行为:
[0314] 达到、评估、控制、协调、确保、鉴定、保持、监督
[0315] 专家行为:
[0316] 分析、协助、促使、联络、建议、推荐、支持、评估、评价
[0317] 下级行为:
[0318] 检查、核对、收集、获得、提交、制作
[0319] 其他:维持、保持、建立、开发、准备、处理、执行、接待、安排、监控、汇报、经营、确认、概念化、合作、协作、获得、核对、检查、联络、设计、测试、建造、修改、执笔、起草、引导、传递、翻译、操作、保证、预防、解决、介绍、支付、计算、修订、承担、谈判、商议、面谈、拒绝、否决、监视、预测、比较、删除、运用
[0320] 其中,数据挖掘公共平台服务器包括有:
[0321] (1)模板接受管理及匹配结果反馈互动通信模块,用于接受个人移动设备上发送过来的个性模板,转发模板比对模块,与模板库的指定模板进行比对;
[0322] 匹配结果数据反馈个人设备,并可以进行个人设备与比对模板主体设备互动通信;
[0323] (2)模板比对模块,用于接受个性模板与从模板库指定的主体数据资源的模板比对;并将匹配结果通过模板接受管理及匹配结果反馈互动通信模块反馈给个人设备;
[0324] (3)模板库,用于保存各种主体数据资源的模板库;
[0325] 其中,模板包括但不限于,单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板等模板集合。
[0326] 本发明的效果是:数据价值化,信息智能化。
[0327] 1,商业和机构大量无结构的数据(比如Word、PDF、本文文档摘录、XML文件等)汇集提炼出模式(也就是有价值的信息和知识),建立上下游及周边供应链和延伸价值链的分布模型、模式、模板,以便指导商业或机构进行互联网思维的战略转型提供简单方便的数据支撑
[0328] 2,对于非专业的中小企业人员和双创的创客,一般需要进行专业知识的培训,学习专业市场调研,产品分析相关知识,进一步延长了把握市场需求的时间。而以中小商业或机构需求为主题,对其用户或服务对象进行数据挖掘,获取用户或服务的单位供给-个人群体需求特征模板,以便在更大范围进行智能情报分析和有针对性推荐消费过程的产品和服务,起到市场营销专家数据支撑系统的作用。
[0329] 3,信息源本体与消费需求创造主体一体化的个人智能移动终端提取自己的数据模式,与相关机构或其他个人进行社会化的海量共享匹配,实现获取准确特长、兴趣、爱好、价值、服务或学习、社交、协同协作对象,并在海量个人″共产数据″价值链支撑下,智能化提升学习社交生活文化品质和提高工作协同交易经济效益。附图说明
[0330] 结合附图,本发明的其它特点和优点,可以通过下面举例来对本发明的原理进行解释,并从优选具体实施方式的说明中变得更清楚。
[0331] 图1显示信息源产生的社会功能主体及其数据资源示意图;
[0332] 图2显示了提取制作数据关联特征值模式或模板方法发明的一个实施方式的流程图
[0333] 图3显示了提取制作数据关联特征值模式或模板发明方法的另一个实施方式流程图;
[0334] 图4显示了数据关联特征值模式或模板的比对方法发明的一个实施方式的流程图;
[0335] 图5显示了使用动词-名词(价值)链数据关联模板制作类别模板方法发明的一个实施方式的流程图;
[0336] 图6显示了类别模板的比对方法发明的一个实施方式流程图;
[0337] 图7显示了本发明一个实施方式使用动词-名词(价值)链数据关联模板制作定制模板的方法流程图;
[0338] 图8显示了一种基于个人移动设备进行数据挖掘的智能系统发明的一个实施方式的系统结构示意图;
[0339] 图9显示了一种基于个人移动设备进行数据挖掘的智能系统发明的另一个实施方式的系统结构示意图;
[0340] 图10显示了一种基于个人移动设备进行数据挖掘的智能系统发明的另一个实施方式制作单位供给-个人群体需求的类别模板方法流程图;
[0341] 图11显示了一种基于个人移动设备,应用动词-名词(价值)链数据关联模板的定制模板或类别模板(数据线索+处理规则+特征值集合)的智能系统发明的一个实施方式的系统结构示意图;
[0342] 图12显示了一种基于个人移动设备进行数据挖掘,应用动词-名词(价值)链数据关联模板的智能系统发明的一个实施方式的系统结构示意图;
[0343] 图13显示了一种基于个人移动设备进行数据挖掘,应用动词-名词(价值)链数据关联模板的智能系统发明的一个实施方式的动词过滤及个性模板生成方法流程图;
[0344] 图14显示通用计算机或微型控制器硬件和系统结构示意图;
[0345] 具体实施
[0346] 为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而应该了解在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。还需要说明的一点是为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的设备结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
[0347] 按照提取制作数据关联特征值模式或模板的方法发明的一个汉语的具体实施方式,结合图2所示,板执行如下步骤来具体说明制作动词-名词(价值)链数据关联模式或模:
[0348] S201步骤一:判定语种,句子标注名词、动词,句子标注主、谓、宾
[0349] 可以使用中科院计算所研制的基于多层隐模型的汉语词法分析系统ICTCLAS对输入文档进行分词及词性标注每个句子的名词、动词。
[0350] 语法分析 工具并对文本数据进行语法分析,标注出每个句子的主语、谓语、宾语。
[0351] 输入的文本进行分词、词性标注、命名实体识别和依存句法分析等操作。其中依存句法分析指的是将一个句子解析成这样一个树状结构,句子中核心动词处于支配其它词的中心位置,其它词直接依存于某一词,任何一个词都不同时依存于两个或两个以上的其他词。命名实体识别指的是识别出文本中代表现实生活中的实体概念的词语。采用指代消解方法,对代词等对象实体进行还原,根据数据资源的不同类型主体,进行主语名词或宾语名词的指代消解处理。
[0352] 其中,可以将被动语态主语标注为宾语;
[0353] 由于这些操作与本发明的主旨并不密切相关且可以采用已有技术进行,在此不再详细描述。
[0354] S202步骤二:提取重叠主语名词,谓语动词,宾语名词,及主-谓/谓-宾关系。
[0355] 提取句子集合中重叠标注为主语和名词的词组,提取句子集合中重叠标注为谓语和动词的词组,提取重叠标注为宾语和名词的词组,分别获得作为主语的名词集合,谓语的动词集合,和作为宾语的名词集合,以及他们分别在句子中的主语-谓语/谓语-宾语对应的关联关系,主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合,即,名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语(一对一)关联特征关系;
[0356] 可获得如下表1表2表3实例数据:
[0357]
[0358] 表1
[0359]
[0360] 表2
[0361]
[0362]
[0363] 表3
[0364] S203步骤三:词频累计统计,高频获得模式/模板
[0365] 分别累计统计主语名词,谓语动词和宾语动词的词频,标注出来作为度量主语名词集合∶谓语动词集合/谓语动词集合∶宾语名词集合有(一对一)关联关系的词组权重特征值大小,
[0366] 即,主语名词词频n∶谓语动词词频v
[0367] 谓语动词词频v∶宾语名词词频n2(词频v,n,n2是正整数),
[0368] 获得关联关系权重的所述(主体的)数据资源的
[0369] 名词∶动词≈词频比n∶v集合以及
[0370] 动词∶名词≈词频比v∶2n集合,
[0371] 集合中选取高频词组为动词-名词(价值)链数据关联模式或模板(集合)。
[0372] 词频标注实例数据表1、表2、表3可以得到下表4、表5、表6的词组词频数据(集合),其中,v代表动词累计词频,n代表主语名词累计词频,n2代表宾语名词累计词频。
[0373]词性 主语名词 谓语动词 宾语名词
词组 老师 教育 男学生
词频 n=120 v=2000 n2=150
语法 主语 谓语  
    谓语 宾语
[0374] 表4
[0375]词性 主语名词 谓语动词 宾语名词
词组 男学生 喜欢 功夫
词频 n=130 v=1万 n2=200
语法 主语 谓语  
    谓语 宾语
[0376] 表5
[0377]词性 主语名词 谓语动词 宾语名词
词组 老师 喜欢 功夫
词频 n=120 v=1万 n2=200
语法 主语 谓语  
    谓语 宾语
[0378] 表6
[0379] 可以获得关联关系权重的所述(主体的)数据资源实例数据表4的动词-名词(价值)链数据关联模式或模板:
[0380]
[0381] 表7
[0382]
[0383] 表8
[0384] 表7表8展开动词-名词(价值)链数据关联模式或模板(集合)实例表示为:
[0385] 名词∶动词=老师∶教育≈词频比n∶v≈120∶2000
[0386] 动词∶名词=教育∶男学生≈词频比n∶v≈2000∶150
[0387] 同样方法可以获得其他动词-名词(价值)链数据关联模式或模板实例数据,集合中选取高频词组为动词-名词(价值)链数据关联模式或模板(词组集合)。
[0388] 按照提取制作数据关联特征值模式或模板的方法发明另一个汉语的具体实施方式,结合图3所示,制作动词-名词(价值)链数据关联模式或模板执行如下步骤来具体说明:
[0389] 其中,步骤S301与图2的S201,步骤S302与图2的S202,步骤S303与图2的S203的相同;
[0390] S304步骤四:合并同名名词
[0391] 合并名词∶动词的固定(一对一)关联词组和动词∶名词的固定(一对一)关联词组前后重复的名词词组,并连接两词组成多环节关联词组链条:
[0392] ...
[0393] ...∶动词∶相同名词
[0394] 相同名词∶动词∶...
[0395] ...
[0396] 合并表4、表5、表6的同名名词和词频:
[0397]动词 词频 名词 词频(主+宾)
喜欢 v=1万 功夫 n+n2=100+200
教育 v=2000 老师 n+n2=120+300
    男学生 n+n2=130+150
       
... ... ... ...
[0398] 表9
[0399] 合并连接同名名词,得到...∶动词∶(合并相同)名词∶动词∶(合并相同)名词∶动词∶...的多环节词组链条,从而将部分一对一的词组链条(集合)串联形成以动词/名词词组交替为链接节点...∶动词∶名词∶动词∶名词∶...的多环节多维度空间的动词/名词交替词组链条,甚至可能形成首尾相互链接的闭环的动词/名词交替词组的多环节闭环关联词组链条,
[0400] 获得交替循环往复的...∶动词∶名词∶...链接关联词组权重≈词频比...∶v∶(n+n2)∶...
[0401] 动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数)
[0402] 表9合并为表10
[0403]
[0404]
[0405] 表10
[0406] 其中,可以利用语料库、数字字典、知识本体库等自然语言处理辅助工具综合分析,进行针对每个句子的谓语动词的副词标注,提取副词时候还统计累计词频,得到:
[0407] 副词∶动词∶名词的关联权重的副词∶动词∶名词≈词频比a∶v∶n2
[0408] 可获得的实例数据为:
[0409] 严格∶教育∶男学生≈词频比1500∶2000∶150
[0410]
[0411] 表11
[0412] 或
[0413] 名词∶副词∶动词≈词频比n∶a∶v的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数可以为0);
[0414] 可获得的实例数据为:
[0415] 老师∶严格∶教育≈词频比120∶1500∶2000
[0416]
[0417] 表12
[0418] 或者获得多环节的词组链条:
[0419] 交替循环往复...∶副词∶动词∶名词∶...词组的关联权重的...∶副词∶动词∶名词∶...≈词频比...∶a∶v∶(n+n2)∶...的动词-名词(价值)链数据关联模式或模板(词频v,n,n2是正整数a是自然数可以为0);其中,副词可以为空。
[0420] 实例数据为:
[0421] ...∶严格∶教育∶男学生∶...≈词频比1500∶2000∶(130+150)
[0422]
[0423]
[0424] 表13
[0425] 按照动词-名词(价值)链数据关联模式或模板的比对方法发明的一个汉语的具体实施方式,结合图4所示,执行如下步骤来具体说明:
[0426] S401步骤一:相互比对模板(比对词组组合或词组链集合)
[0427] 甲、乙、丙、丁不同(主体的)数据资源制作的动词-名词(价值)链数据关联模式或模板(词组集合或词组链集合),相互进行词组的比对,
[0428] 如果没有相同词组,返回开始;
[0429] S402步骤二:如果有相同词组或词组链,
[0430] 得到:
[0431] 相同动词、
[0432] 相同名词、
[0433] 相同动词及相同名词、
[0434] 相同名词及相同动词、
[0435] 或相同的动词/名词交替多环节词组链条,
[0436] 其中,如果有副词还可以加入相同副词的比对,即,相同名词、相同副词及相同动词,和相同副词、相同动词及相同名词;
[0437] S403步骤三:比对词频比;
[0438] 相同词组或词组链进行词频比的比对。
[0439] S404步骤四:如果相同词组或词组链的词频比相等:
[0440] 相同动词及相同名词∶词频比v∶n2相等
[0441] 实例数据:喜欢∶功夫=词频比v∶n2的比对
[0442]
[0443]
[0444] 表14
[0445] 实例结果数据:
[0446] 1,模板甲:动词喜欢∶名词功夫≈词频比v∶n2≈1万∶200≈50∶1
[0447] 模板乙:动词喜欢∶名词功夫≈词频比v∶n2≈12万∶1000≈120∶1
[0448] 模板丙:动词喜欢∶名词功夫≈词频比v∶n2≈100万∶2万≈50∶1
[0449] 2,模板甲与模板丙词频比一样,喜欢功夫程度一样,模板成功匹配。
[0450] 相同名词及相同动词∶词频比n∶v相等
[0451] 实例数据:老师∶教育=词频比n∶v
[0452]
[0453] 表15
[0454] 实例结果数据:
[0455] 1,模板甲:
[0456] 名词老师∶动词教育≈词频比n∶v≈120∶2000≈3∶25
[0457] 模板乙:
[0458] 名词老师∶动词教育≈词频比n∶v≈2万∶30万≈1∶15
[0459] 模板丙:
[0460] 名词老师∶动词教育≈词频比n∶v≈4800∶4万≈3∶25
[0461] 2,模板甲与模板丙词频比一样,喜欢功夫程度一样,模板成功匹配。
[0462] 相同动词/名词交替多环节词组,词频比相同:
[0463] 相同多环节的动词/名词交替词组链条,词频比...∶v∶(n+n2)∶v∶..
[0464] 实例数据:...∶老师∶教育∶男学生∶喜欢∶功夫∶...=词频比...∶v∶(n+n2)∶v∶..[0465]
[0466] 表16
[0467] 实例结果数据:
[0468] 1,模板甲:
[0469] 老师∶教育∶男学生∶喜欢≈词频比n+n2∶v∶n+n2∶v≈120+300∶2000∶130+150∶1万∶100+200≈420∶2000∶280∶10000∶300≈21∶100∶14∶500∶15
[0470] 模板乙:
[0471] 老师∶教育∶男学生∶喜欢≈词频比n+n2∶v∶n+n2∶v≈150+350∶1000∶120+130∶9000∶140+170≈500∶1000∶250∶9000∶310≈50∶100∶25∶900∶31
[0472] 模板丙:
[0473] 老师∶教育∶男学生∶喜欢≈词频比n+n2∶v∶n+n2∶v≈440+400∶4000∶210+350∶2万∶400+200≈840∶4000∶560∶2万∶600≈21∶100∶14∶500∶15
[0474] 模板丁:
[0475] 老师∶教育∶男学生∶喜欢≈词频比n+n2∶v∶n+n2∶v≈360+900∶6000∶390+450∶3万∶300+600≈1260∶6000∶840∶3万∶900≈21∶100∶14∶500∶15
[0476] 结果:
[0477] 模板甲与模板丙(n+n2)总量匹配
[0478] 模板甲与模板丁(n、n2)分量全匹配
[0479] 模板成功匹配。
[0480] S405:同名词组的词频比不等,结果是:
[0481] 相同动词,词频比不等:
[0482] 实施例数据:相同动词“喜欢”的比对
[0483]
[0484] 表17
[0485] 实例结果数据:
[0486] 1,模板甲与模板乙没有共同″喜欢″的宾语名词,也没有″喜欢″的主语名词;
[0487] 2,模板乙比模板甲词频多100倍;
[0488] 3,模板甲动词″喜欢″相关的高频名词是:
[0489] 老师(120+300=420)/功夫(100+200=300)
[0490] 男学生(130+150=280)/艺术(n+n2)...
[0491] 4,模板乙动词″喜欢″相关的高频名词是:
[0492] 公务员(2000+2000=4000)/电影(3000+1300=4300)
[0493] 白领(1500+2000=3500)/网购(n+n2)...
[0494] 相同名词,词频比不等:
[0495] 实施例数据:相同名词“男学生”的比对
[0496]
[0497] 表18
[0498] 实例结果数据:
[0499] 1,模板甲与模板乙没有针对″男学生″的相同的动词;
[0500] 2,模板乙比模板甲″男学生″词频多10倍;
[0501] 3,模板甲的名词″男学生″相关的高频动词分别是:
[0502] 教育(2000)/喜欢(1万)开导(v)/擅长(v)..
[0503] 4,模板乙的名词″男学生″相关的高频动词分别是:
[0504] 锻炼(18000)/学习(14万)爱护(v)/热爱(v)...
[0505] 相同动词及相同名词,词频比不等:
[0506] 表11实例数据:喜欢∶功夫=词频比v∶n2的比对
[0507] 结果:模板甲与模板乙
[0508] 词频比是50∶1(50个喜欢里面1个是功夫)与120∶1(120个喜欢里面1个是功夫),说明模板甲的“喜欢”里面,“功夫”占比更大;
[0509] 即:两个模板名词词频分别在动词词频的比重与他们词频比成反比例关系
[0510] 显示实例数据词频比差异值
[0511]模板甲 词频比: 50 1
词组链 喜欢 功夫
模板乙 词频比: 120 1
[0512] 表19
[0513] 相同名词及相同动词,词频比不等:
[0514] 表12实施例数据,老师∶教育=词频比n∶v
[0515] 模板甲与模板乙
[0516] 词频比是3∶25(25个教育里面3个是老师)与1∶15(15个教育里面1个是老师),说明模板甲教育里面,老师占比更大;
[0517] 即:两个模板名词词频在动词词频的比重与他们词频比成正比例关系
[0518] 显示实例数据词频比差异值
[0519]模板甲 词频比: 3 25
词组链 老师 教育
模板乙 词频比: 1 15
[0520] 表17
[0521] 相同动词/名词交替多环节词组,词频比不等:
[0522] 表13实施例数据,
[0523] 相同多环节的动词/名词交替词组链条,词频比...∶v∶(n+n2)∶v∶..
[0524] 实例:
[0525] ...∶老师∶教育∶男学生∶喜欢∶功夫∶...=词频比...∶v∶(n+n2)∶v∶..[0526] 模板甲与模板乙不匹配:
[0527] 模板甲:老师∶教育∶男学生∶喜欢∶功夫≈21∶100∶14∶500∶15
[0528] 模板乙:老师∶教育∶男学生∶喜欢∶功夫≈50∶100∶25∶900∶31
[0529] 显示实例数据词频比差异值:
[0530]
[0531] 表20
[0532] 按照使用动词-名词(价值)链数据关联模板制作类别模板方法发明的一个汉语的具体实施方式,结合图5所示,执行如下步骤来具体说明:
[0533] S501步骤一:(分类/聚类同类名词,左右相邻各保留一个动词,得到模板片断)[0534] 借助语料库、知识本体库等自然语言处理工具,对一个(主体甲)数据资源的动词-名词(价值)链数据关联模板集合(可以包括模板a、模板b、模板c、模板d、模板e...)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分动词-名词(价值)链数据关联模板片断,具体地说,对同类名词所在模板位置左右相邻各保留几个词组都可以,但至少要保留一个相邻的动词词组,划分出同类别的动词-名词(价值)链数据关联模板片断集合,组成更高层次的分类/聚类模板,即,每个类别模板可能包括较少链条的动词-名词(价值)链数据关联模板(片断)集合,并对类别命名:
[0535] 类别名称a{...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...数据关联模板片断(词频v,n,n2是正整数)}
[0536]
[0537] 表21
[0538] 其中,同类名词1=男学生和同类名词2=女学生的共同类别为:学生
[0539] 在表19,学生同类名词(男学生和女学生)左右相邻各保留至少一个词组(即相邻动词)的原则,选取一部分动词-名词(价值)链数据关联模板片:
[0540]
[0541] 表22
[0542] 处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)
[0543] 特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数))
[0544] 依据表20实例数据从而获得:
[0545] 学生类别模板过程数据{教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万}[0546] 其中,同样方法,也可以用动词词组相同相近的同义词近义词,划分同类动词的类别模板,即,动词类别模板包括多个同类动词的动词-名词(价值)链数据关联模板集合。
[0547] S502步骤二:组成类别模板(数据线索+处理规则+特征值集合)
[0548] 分类相同的动词-名词(价值)链数据关联模板片断集合,以原始(动词、名词或副词)词组作为一部分线索组合线索(第一)集合,以同类名词所在模板位置左右相邻各保留至少一个动词词组的原则获取和匹配模板片断方法作为一部分规则组合规则(第二)集合,和以同类动词-名词(价值)链数据关联模板片断的词频比作为一部分统计特征值参数组合特征值(第三)集合,
[0549] 简化表示为:类别模板(数据线索+处理规则+特征值集合),展开表示为:
[0550] 类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...)+处理规则词组片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;...数据关联模板词组链片断)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词频比(词频v,n,n2是正整数))}
[0551]
[0552] 表23
[0553] 用表20,表21的数据制作学生类别模板:
[0554] 线索(第一)集合:{教育、男学生、喜欢、爱护、女学生、网购}
[0555] 规则(第二)集合:{以同类名词(男学生、女学生)左右各保留和匹配一个动词(教育∶男学生∶喜欢;爱护∶女学生∶网购)的原则获取和比对模板片断作为规则}
[0556] 特征值(第三)集合∶{教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万}
[0557] 简化表示为:类别模板(数据线索+处理规则+特征值集合)
[0558] 最终制作出来:学生类别模板{数据线索(教育、男学生、喜欢、爱护、女学生、网购)+处理规则(教育∶男学生∶喜欢;爱护∶女学生∶网购)+特征值集合(教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}
[0559] 同样方法,(主体甲)数据资源的其他模板c、模板d、模板e...还可以制作更多其他的类别模板,从而共同组成(主体甲)数据资源的类别模板(集合)。
[0560] 其中,还可以使用地理位置信息,时间信息等其他分类数据,与动词-名词(价值)链数据关联模板分类规则一起,共同组成类别模板规则,例如,设定接受地理位置信息和时间信息:
[0561] 类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...;A<北纬N1”,东经E1”>、B<北纬N2”,东经E2”>、C<北纬N3”,东经E3”>、D<北纬N4”,东经E4”>)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;地点秩序规则A∶D∶C∶B)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数);地点时间值A:time1,B:time2,C:time3,D:time4)}
[0562] 实施例数据:
[0563] 北工大通州分校学生类别模板{数据线索(教育、男学生、喜欢、爱护、女学生、网购A<北纬39.8N1”,东经116.6E1”>、B<北纬39.8N2”,东经116.6E2”>、C<北纬39.8N3”,东经116.6E3”>、D<北纬39.8N4”,东经116.6E4”>)+处理规则(教育∶男学生∶喜欢;爱护∶女学生∶网购;地点秩序规则A∶B∶C∶D)+特征值集合(教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈
2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万;地点时间值A:am8:00-pm16:30,B:pm16:30-18:30,C:pm18:30-17:30,D:pm22:00-am8:00)}[0564] 其中,A<北纬39.8N1”,东经116.6E1”>、B<北纬39.8N2”,东经116.6E2”>、C<北纬
39.8N3”,东经116.6E3”>、D<北纬39.8N4”,东经116.6E4”>分别是北工大通州分校的教学楼、运动场、校园休闲场、和宿舍的地理位置经纬度;地点秩序规则A∶B∶C∶D,学生地点转换的流程排序规则;地点的时间值A:am8:00-pm16:30,B:pm16:30-18:30,C:pm18:30-17:30,D:pm22:00-am8:00)是在相关地点停留时间统计;
[0565] 其中,可以针对单位(部门)数据资源的动词-名词(价值)链数据关联模板制作单位(部门)的类别模板;
[0566] 其中,可以针对个人群体数据资源的动词-名词(价值)链数据关联模板提取制作个人群体的类别模板;
[0567] 其中,可以针对办公综合样本数据资源的动词-名词(价值)链数据关联模板提取制作办公综合的类别模板;
[0568] 进一步,结合图6所示类别模板的比对方法,执行如下步骤来具体说明:
[0569] 开始比对之前:
[0570] (主体甲)数据资源的学生类别模板{(教育、男学生、喜欢、爱护、女学生、网购)+(教育∶男学生∶喜欢;爱护∶女学生∶网购)+教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}[0571] 比对对象(主体乙)数据资源的学生类模板内容为未知:学生类别模板(数据线索+处理规则+特征值集合)。
[0572] 开始:
[0573] S601步骤一:按照原类别模板相同的规则,对比对的对象(主体乙)数据资源类别模板的动词-名词(价值)链数据关联模板(集合),提取原类别模板的数据线索中同名称词组;即(教育、男学生、喜欢、爱护、女学生、网购)词组;
[0574] 如果没有提取到完全相同的词组,返回开始;
[0575] 如果比对成功提取到了上述全部同名词组,比对对象(主体乙)数据资源的学生类模板{数据线索=(教育、男学生、喜欢、爱护、女学生、网购+处理规则+特征值集合}[0576] 进入下一步;
[0577] S602步骤二:按照原类别模板相同同样分类/聚类规则进行分类,获得相同分类词组链片断:
[0578] 对比对的对象(主体乙)数据资源的动词-名词(价值)链数据关联模板(集合)中,所有名词词组进行分类/聚类,并对同类名词所在模板位置左右相邻各保留相同个词组原则,选取相同一部分动词-名词(价值)链数据关联模板片断,划分出同类别的动词-名词(价值)链数据关联模板片断集合,组成更高层次的分类/聚类模板,即,每个类别模板可能包括较少链条的动词-名词(价值)链数据关联模板(片断)集合,并对类别命名:
[0579] 比对对象(主体乙)数据资源:
[0580] 对象类别名称A规则{动词11∶同类名词11∶动词11;动词22∶同类名词22∶动词22}[0581] 比对原(主体甲)数据资源:
[0582] (主体甲)数据资源的学生类别模板{(教育、男学生、喜欢、爱护、女学生、网购)+(教育∶男学生∶喜欢;爱护∶女学生∶网购)+教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}[0583] 中的规则数据关联模板(词组链)片断排序;
[0584] 如果数据关联模板(词组链)片断动词11∶同类名词11∶动词11.与教育∶男学生∶喜欢一致;动词22∶同类名词22∶动词22与爱护∶女学生∶网购一致,处理规则一致相等;
[0585] 比对对象(主体乙)数据资源的学生类模板{数据线索=(教育、男学生、喜欢、爱护、女学生、网购+处理规则=(类别名称:学生;模板(词组链)片断排序:动词11∶同类名词11∶动词11=教育∶男学生∶喜欢;动词22∶同类名词22∶动词22=爱护∶女学生∶网购)+特征值集合}
[0586] 进入下一步;
[0587] 如果其中有不匹配的词组,则返回开始;
[0588] S603步骤三:比对提取词频比是否相等
[0589] 按照原类别模板相同的处理规则,比对两个类别模板中同类的包括相同名称相同词组链片断排序的词频比:
[0590] 进行词频比特征值的比对:
[0591] 比对对象(主体乙)类别名称A特征值集合{动词11∶同类名词11∶动词11≈词频比v∶(n+n2)∶v;动词22∶同类名词22∶动词22≈词频比v∶(n+n2)∶v}
[0592] 与
[0593] 原(主体甲)数据资源的学生类别模板{(教育、男学生、喜欢、爱护、女学生、网购)+(教育∶男学生∶喜欢;爱护∶女学生∶网购)+教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}[0594] 进行比对;如果
[0595] ...∶动词11∶同类名词11∶动词11∶...≈词频比...∶v∶(n+n2)∶v∶...≈男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;
[0596] ...∶动词22∶同类名词22∶动词22∶...≈词频比...∶v∶(n+n2)∶v∶...≈爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万
[0597] 词频比相同或约等于,即为类别模板匹配成功,
[0598] 简而言之:
[0599] 比对对象(主体乙)数据资源的
[0600] 学生类模板{数据线索=(教育、男学生、喜欢、爱护、女学生、网购)+处理规则=(模板(词组链)片断排序:动词11∶同类名词11∶动词11=教育∶男学生∶喜欢;动词22∶同类名词22∶动词22=爱护∶女学生∶网购)+特征值集合=(动词11∶同类名词11∶动词11≈词频比v∶(n+n2)∶v≈动词1∶同类名词1∶动词1≈教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;
[0601] 动词22∶同类名词22∶动词22∶≈词频比v∶(n+n2)∶v≈动词2∶同类名词2∶动词2≈爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万))}
[0602] 两个(主体甲乙)学生类别模板的比对匹配成功;
[0603] 否则词频比不等即为两个类别模板匹配失败,返回开始;
[0604] 其中,如果设定其他分类规则,按照其他规则确定匹配比对成功与否,全部匹配成功才可以为整个模板匹配成功,任何一个局部匹配失败都可导致整个模板匹配失败。
[0605] 按照使用动词-名词(价值)链数据关联模板制作定制模板的方法发明的一个汉语的具体实施方式,结合图7所示,执行如下步骤来具体说明:
[0606] 用可以作为主题(第一)数据资源的单位(部门)数据资源的动词-名词(价值)链数据关联模板,与可以作为目标(第二)数据资源的个人群体数据资源的动词-名词(价值)链数据关联模板,制作单位供给-个人群体需求定制模板:
[0607] (d)S701步骤一:在单位(部门)数据资源的动词-名词(价值)链数据关联模板集合中,选取高词频的名词列表;
[0608] 实例数据为:男学生、男青年...
[0609] (e)S702步骤二:用所述高频名词列表的名词“男学生”,与实例表24的个人群体数据资源的动词-名词(价值)链数据关联模板集合中的名词匹配比对;
[0610]
[0611] 表24
[0612] (f)S703步骤三:在个人群体数据资源的动词-名词(价值)链数据关联模板上匹配成功的同名名词位置,实施例男学生在动词-名词(价值)链数据关联模板上...∶轮训∶老师∶教育∶同名名词男学生∶喜欢∶功夫∶...≈词频比...∶3000∶(120+300)∶2000∶(130+150)∶1万∶(100+200)∶...),向左、向右或向左右两边动词/名词词交替词组链上选取一个动词及一个名词;
[0613] 老师∶教育≈词频比(120+300)∶2000
[0614] 喜欢∶功夫≈词频比1万∶(100+200)
[0615] 所述位置(不包括同名名词男学生)向左、向右或向左右两边选取的动词-名词交替词组关联链条:
[0616] 老师∶教育≈词频比(120+300)∶2000
[0617] 喜欢∶功夫≈词频比1万∶(100+200)成为单位(部门)数据资源与个人群体数据资源的数据关联定制模板(集合)。
[0618] 按照一种基于个人移动设备进行数据挖掘的智能系统发明,的一个汉语的具体实施方式,结合图8所示的示意图,来具体说明智能系统:
[0619] 智能系统包括有语料库、知识本体库等,其特征在于,个人移动设备还包括有个人移动设备输出\输入同步模块,模板特征提取模块,
[0620] (1)个人移动设备输出\输入同步模块,具体为包括智能手机1的输入法软件数据同步模块1-1和地理位置信息同步模块1-3,用于将对智能手机1上的输入文本个人数据资源和智能手机的地理位置信息导航API等输出数据同步复制收集,提供给2-1模板特征提取制作模块使用;
[0621] 其中,可以用预处理模块1-2,用于对同步数据进行数据脱敏,过滤无用和重复数据;
[0622] (2)模板特征提取制作模块2-1,利用自然语言处理技术,对智能手机1上输入法软件数据同步模块1-1同步的个人数据资源进行数据挖掘,特征值提取,制作个人数据模式或模板;
[0623] 其中,可以在智能手机1制作个人数据资源的数据模式或模板;
[0624] 其中,可以制作动词-名词(价值)链数据关联模板以及类别模板,
[0625] 执行如图2图3所示的步骤,制作动词-名词(价值)链数据关联模板,已经在第28页至第33页进行了详细说明,可以直接引用过来,不再重复叙述。
[0626] 继续执行如图5所示的步骤,制作获得类别模板(数据线索+处理规则+特征值集合),已经在第40页至第44页进行了详细说明,可以直接引用过来,不再重复叙述。
[0627] 其中,也可以用动词词组相同相近(同义词近义词),划分为同类动词的类别模板;
[0628] 其中,还可以提取地理位置、时间等其他同类特征数据,与动词-名词(价值)链数据关联模板分类数据一起,组成如下格式更复杂的类别模板:
[0629] 类别模板{数据线索(...动词1、同类名词1、动词1、动词2、同类名词2、动词2...;A<北纬N1”,东经E1”>、B<北纬N2”,东经E2”>、C<北纬N3”,东经E3”>、D<北纬N4”,东经E4”>)+处理规则:词组链片断(...∶动词1∶同类名词1∶动词1∶...;...∶动词2∶同类名词2∶动词2∶...;地点秩序规则A∶D∶C∶B)+特征值集合(...∶动词1∶同类名词1∶动词1∶...≈词频比...∶v∶(n+n2)∶v∶...;...∶动词2∶同类名词2∶动词2∶...≈词频比...∶v∶(n+n2)∶v∶...;...词组链片断词频比(词频v,n,n2是正整数);地点时间值A:time1,B:time2,C:time3,D:time4)}
[0630] 实施例数据:
[0631] 北工大通州分校学生类别模板{数据线索(教育、男学生、喜欢、爱护、女学生、网购A<北纬39.8N1”,东经116.6E1”>、B<北纬39.8N2”,东经116.6E2”>、C<北纬39.8N3”,东经116.6E3”>、D<北纬39.8N4”,东经116.6E4”>)+处理规则(教育∶男学生∶喜欢;爱护∶女学生∶网购;地点秩序规则A∶B∶C∶D)+特征值集合(教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈
2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万;地点时间值A:am8:00-pm16:30,B:pm16:30-18:30,C:pm18:30-17:30,D:pm22:00-am8:00)}[0632] 其中,A<北纬39.8N1”,东经116.6E1”>、B<北纬39.8N2”,东经116.6E2”>、C<北纬
39.8N3”,东经116.6E3”>、D<北纬39.8N4”,东经116.6E4”>分别是北工大通州分校的教学楼、运动场、校园休闲场、和宿舍;地点秩序规则A∶B∶C∶D,学生地点转换的流程规则;
[0633] 地点时间值A:am8:00-pm16:30,B:pm16:30-18:30,C:pm18:30-17:30,D:pm22:00-am8:00)是在相关地点停留时间统计;
[0634] 个人移动设备同步的个人样本数据资源,获得动词-名词(价值)链数据关联模板组成的个人类别模板(数据线索+处理规则+特征值集合);其中,由于是第一人称,默认缺省主语名词;
[0635] 个人移动设备汇聚的个人群体样本数据资源,获得众多系列化动词-名词(价值)链数据关联模板组成的个人群体类别模板(数据线索+处理规则+特征值集合)。
[0636] 按照一种基于个人移动设备,进行数据挖掘的智能系统发明的一个汉语的具体实施方式,结合图9所示的示意图,来具体说明智能系统:
[0637] 单位的服务器或PC 3包括有公共数据挖掘共享伴侣模块3-1,数据挖掘公共平台服务器2包括有:模板特征提取模块2-1、模板比对模块2-2、模板库2-3、匹配结果反馈及消息通信模块2-4,其中:
[0638] (1)输出\输入个人数据的同步数据模块,具体为输入法软件数据同步模块1-1,用于将对个人移动设备(即智能手机1)上的输入法等输入个人数据资源同步异步复制收集,(或经过预处理模块1-2对同步数据进行数据脱敏预处理后)下载到数据挖掘公共平台服务器2;
[0639] (2)公共数据挖掘共享伴侣模块3-1,用于将单位(部门)的服务器或PC 3上的单位(部门)电子文档数据资源,特别是文本数据,以手动或自动方式汇聚共享到数据挖掘公共平台服务器2,众多单位数据资源汇聚组成办公综合样本数据资源;
[0640] 其中,共享之前通过预处理模块3-2进行数据预处理,排除内容相同或内容相似且时间相同的电子文档;
[0641] (3)模板特征提取制作模块2-1,用于对数据资源进行数据挖掘,制作数据模式或模板;
[0642] 其中,将众多个人移动设备上同步下载的个人数据资源汇集一起形成个人群体数据进行数据挖掘,特征值提取,制作个人群体数据模型、模式或模板;个人移动设备汇聚的个人群体样本数据资源,获得众多系列化动词-名词(价值)链数据关联模板组成的个人群体类别模板(数据线索+处理规则+特征值集合);
[0643] 其中,对从单位(部门)数据资源、众多单位汇聚的办公综合样本数据资源、移动设备同步的个人数据资源、移动设备汇聚的个人群体样本数据资源、个人群体样本数据资源与单位(部门)数据资源的混合数据资源(用于单位供给模板与个人需求模板匹配)、个人数据资源与单位数据资源的混合数据资源(用于个人特长模板与单位岗位模板匹配)、全部数据资源进行数据挖掘,制作数据模式或模板;
[0644] 其中,可以制作动词-名词(价值)链数据关联模板以及类别模板,获得动词-名词(价值)链数据关联模板及类别模板;
[0645] 执行如图10的步骤可以制作单位供给-个人群体需求的类别模板:比对对象个人群体数据的学生类别模板{数据线索(教育、男学生、喜欢、爱护、女学生、网购)+处理规则(教育∶男学生∶喜欢;爱护∶女学生∶网购)+特征值集合(教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}
[0646] (f)S1001步骤一:类别模板-类别名称的比对:
[0647] 用单位(部门)数据资源的单位(部门)类别模板(片断)集合的类别名称“学生”类别,比对个人群体样本数据资源的个人群体类别模板(片断)集合中的类别名称;
[0648] (g)S1002步骤二:类别名称有相同,直接引用比对对象的类别模板内容,获得单位供给-个人群体需求名类别模板:
[0649] “学生”类别名称匹配成功,获得“学生”同名的类别名称和分属单位(部门)类别模板(片断)和个人群体类别模板(片断)的两个集合;
[0650] 选择直接引用上述同名“学生”的类别名称和所属的比对对象个人群体类别模板(片断)集合,构成单位供给-个人群体需求类别模板;结果是单位供给-个人群体需求类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成;″学生″类别模板{数据线索(教育、男学生、喜欢、爱护、女学生、网购)+处理规则(教育∶男学生∶喜欢;爱护∶女学生∶网购)+特征值集合(教育∶男学生∶喜欢≈词频比v∶(n+n2)∶v∶≈2000∶130+150∶1万;爱护∶女学生∶网购≈词频比v∶(n+n2)∶v∶≈1900∶190+200∶1.3万)}[0651] (4)模板比对模块2-2,用于不同主体数据资源的数据模板的特征值比对;
[0652] 其中,进行其动词-名词(价值)链数据关联模板以及类别模板的特征值比对方法,可以用于单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板之间的特征值相互对应的匹配比对;
[0653] 其中,动词-名词(价值)链数据关联模板比对执行如图4所示的步骤,已经在第34页第1行至第40页第7页进行了详细说明,可以直接引用过来,不再重复叙述。
[0654] 其中,根据数据资源不同类型主体,可以通过自然语言处理统计主题词获得作为主语的名词或半人工选定主语名词;
[0655] 其中,个人数据资源制作的动词-名词(价值)链数据关联模板,可以选择一定的名词词组(例如,兴趣,爱好,特长等)相互比对,匹配得到个人匹配近似的动词-名词价值链关联关系;或可以根据给定的名词,在个人数据资源制作的动词-名词(价值)链数据关联模板上,与个人的群体样本数据资源制作的动词-名词(价值)链数据关联模板比对,获得个人在群体数据资源整体中的(给定)名词-动词动作(价值)链环节中的(兴趣,爱好,特长等)动词词频程度比对的差异值定位情况和态势;
[0656] 其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板,选定词频高的名词词组,比对从众多单位集合的办公综合样本数据资源或者从所有数据资源制作获取的动词-名词(价值)链数据关联模板,可以得到所述单位(部门)在办公综合样本数据资源整体或所有数据资源整体的(高频)名词-动词动作(价值)链环节上的动词词频程度比对的差异值定位情况和态势;
[0657] 其中,从单位(部门)数据资源制作的动词-名词(价值)链数据关联模板中,选定词频高的名词词组,比对从个人群体样本数据资源的动词-名词(价值)链数据关联模板;匹配成功的名词所在动词-名词(价值)链数据关联模板可以作为所述单位(部门)的(高频)名词为主题供给与个人群体需求之间的匹配关系的动词-名词(价值)链数据关联模板;
[0658] 其中,类别模板(数据线索+处理规则+特征值集合)比对执行如图6所示步骤,已经在第44页至第47页进行了详细说明,可以直接引用过来,不再重复叙述。
[0659] 其中,个人移动设备上也可以包含模板比对模块,用于个人移动设备与个人移动设备之间进行点对点的模板比对,而不必通过服务器上进行;
[0660] (5)模板库2-3,用于保存各种主体的数据资源的模板,
[0661] 其中,保存单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板、单位(部门)与个人群体混合数据资源的动词-名词(价值)链数据关联模板、个人与单位(部门岗位)混合数据资源的动词-名词(价值)链数据关联模板、等模板集合;
[0662] (6)匹配结果反馈及消息通信模块2-4,用于各模板比对匹配成功的消息数据反馈给对应的各个数据资源主体设备,并且用于他们之间的互动消息通信;
[0663] 其中,也用于将动词-名词(价值)链数据关联模板或类别模板(数据线索+处理规则+特征值集合)比对模块中匹配成功的消息数据反馈给对应的各个数据资源主体设备,特别是与智能手机1对应的匹配结果反馈及消息通信模块1-4互动通信。
[0664] 按照一种基于个人移动设备,应用动词-名词(价值)链数据关联模板的定制模板或类别模板(数据线索+处理规则+特征值集合)的智能系统发明的一个汉语的具体实施方式,结合图11所示的示意图,来具体说明该智能系统:
[0665] 特征在于个人移动设备智能手机1包括有:输出\输入数据同步模块,即,输入法软件数据同步模块1-1、模板线索过滤模块1-2、模板匹配比对模块1-3、个人线索库1-6、模板库1-5、输出显示对应主体服务内容模块1-5;其中,
[0666] (1)输入法软件数据同步模块1-1,用于将对智能手机1上的输入法输入数据同步复制收集;
[0667] (2)模板线索过滤模块1-2,用于上述输入法软件数据同步模块1-1收集到的数据,逐个依次过滤比对模板库1-5中的动词-名词(价值)链数据关联模板制作的定制模板中的所有动词、名词等词组或类别模板(数据线索+处理规则+特征值集合)中的线索数据,匹配成功结果数据记录到得个人线索库1-6,并记录累计匹配次数;
[0668] (3)模板匹配比对模块1-3,用于模板库1-5的模板与个人线索库1-6提取的模板的比对;
[0669] 其中,模板库1-5中的动词-名词(价值)链数据关联模板的定制模板,实施例数据为:名词丙∶动词甲≈词频比n∶v≈老师∶教育≈词频比(120+300)∶2000和动词丁∶名词丁≈词频比v∶n2≈喜欢∶功夫≈词频比1万∶(100+200),分别比对从个人线索库1-6直接提取制作的同名的动词-名词(价值)链数据关联模板:名词丙∶动词甲≈老师∶教育词≈频比n∶v和动词丁∶名词丁≈喜欢∶功夫≈词频比v∶n2;
[0670] 如果同名词组的词频比相同或约等于,即为单位供给-个人群体需求定制模板匹配成功,否则即为匹配失败;
[0671] 其中,制作动词-名词(价值)链数据关联模板的定制模板的方法,图7所示使用动词-名词(价值)链数据关联模板制作定制模板的步骤已经详细描述过。
[0672] 类别模板(数据线索+处理规则+特征值集合)比对执行如图6所示步骤,已经在第44页第18行至第47页第9页进行了详细说明,可以直接引用过来,不再重复叙述。
[0673] 其中,鉴于单位供给-个人群体需求的类别模板=单位同名类别名称+个人群体同名类别模板(数据线索+处理规则+特征值集合)集合组成,用模板库1-5中的单位供给-个人群体需求类别模板,比对从个人线索库1-6提取制作的同名类别模板(数据线索+处理规则+特征值集合)。
[0674] 从个人线索库1-6提取制作的同名类别模板(数据线索+处理规则+特征值集合)如图5所示的步骤,制作获得类别模板(数据线索+处理规则+特征值集合),已经在第40页第8行至第44页第17页进行了详细说明,可以直接引用过来,不再重复叙述。
[0675] (4)输出显示对应数据服务内容模块1-4,用于在模板匹配比对模块1-3中的模板比对匹配成功后,则在智能手机1上输出显示所设定对应的数据服务内容,一般为单位的供给数据;
[0676] (5)模板库1-5,用于保存动词-名词(价值)链数据关联模板制作的单位供给-个人群体需求定制模板集合和单位供给-个人群体需求类别模板集合;
[0677] 其中,经智能手机1允许,可以下载更新单位供给-个人群体需求定制模板、个人-群体学习交往定制模板等模板到模板库1-5;
[0678] (6)个人线索库1-6,用于输出\输入数据同步模块的同步数据过滤动词-名词(价值)链数据关联模板的定制模板的所有动词、名词等词组以及类别模板中线索数据后获得的数据组成个人线索库1-6。
[0679] 按照一种基于个人移动设备进行数据挖掘,应用动词-名词(价值)链数据关联模板的智能系统发明的一个汉语的具体实施方式,结合图12所示的示意图,来具体说明智能系统:
[0680] 特征在于个人移动设备智能手机1包括有:输入法软件数据同步模块1-1、动词过滤及模板生成模块1-2、模板发送管理及匹配结果反馈互动通信模块1-3、个性模板库1-4、动词库1-5;
[0681] 数据挖掘公共平台服务器2包括:模板接受管理及匹配结果反馈互动通信模块2-1、模板比对模块2-2、模板库2-3;
[0682] 其中,个人移动设备智能手机1包括有:
[0683] (1)输入法软件数据同步模块1-1,用于将对智能手机1上的输入法输入的数据同步复制收集;
[0684] (2)动词过滤及模板生成模块1-2,用于上述输入法软件数据同步模块1-1收集到的数据,依次比对过滤动词库1-5中的动词,结合图13所示执行如下步骤,详细说明生成个性模板:
[0685] (e)S1301步骤一:动词库过滤同步数据
[0686] 用动词库中1-5的所有常用动词集合,包括“喜欢”,依次过滤输入法软件数据同步模块1-1收集到的文本数据;
[0687] (f)S1302步骤二:匹配动词“喜欢”标注语法所在句子谓语动词?
[0688] 对过滤匹配成功的动词“喜欢”所在句子进行词性标注,标注出来句子中的名词;
[0689] 还对过滤匹配成功的动词“喜欢”所在句子语法分析,(尽量)标注出来句子的主语、谓语和宾语;
[0690] 判断过滤到的动词“喜欢”是否是谓语动词;也就是标注为谓语的过滤动词;
[0691] 其中,也可以为合理时间间隔的输入法收集到的文本数据自动加配标点符号,进行主语名词或宾语名词的指代消解处理;
[0692] (g)S1303步骤三:如果过滤到的动词“喜欢”是谓语动词,提取所述句子重叠标注为谓语和动词的词组,提取重叠标注为主语和名词,提取重叠标注为宾语和名词的词组,以及他们分别在各自句子中对应的主语-谓语/谓语-宾语的一对一关联关系:主语名词∶谓语动词/谓语动词∶宾语名词;见下表25
[0693]
[0694] 表25
[0695] (h)S1304步骤四:如果提取到步骤三的名词∶动词/动词∶名词的词组组合以及他们之间的主语-谓语/谓语-宾语固定(一对一)关联关系,保存到个性模板库1-4;
[0696] 输入法数据同步模块1-1收集到的数据,依次比对过滤个性模板库1-4中的所述动词∶名词/名词∶动词词组组合,记录每个词组的匹配词频并标注出来,作为度量两个有一对一链条关联关系的词组权重大小的指标,动词词频v∶名词词频n2/名词词频n∶动词词频v(词频v,n,n2是正整数),
[0697] 获得动词∶名词≈词频比v∶n2/名词∶动词≈词频比n∶v的动词-名词(价值)链数据关联模板(集合);
[0698] 根据表25实例数据为:
[0699] 男学生∶喜欢≈词频比130∶1万/喜欢∶功夫≈词频比1万∶200
[0700] (3)模板发送管理及匹配结果反馈互动通信模块1-3,用于智能手机1的用户管理个性模板库1-4显示和发送模板到数据挖掘公共平台服务器2,通过模板接受管理及匹配结果反馈互动通信模块2-1,与指定主体数据资源的模板进行比对,并管理用户与对应主体互动通信;
[0701] (4)个性模板库1-4,用于保存动词过滤及模板生成模块1-2生成的个性模板集合;
[0702] (5)动词库1-5,用于保存常用动词;
[0703] 其中,汉语常用动词包括,但不限于如下:
[0704] 表示动作行为:说、看、走、听、笑、拿、飞翔、跑、吃、唱、喝、敲、坐、吆喝、盯、踢、闻、摸、批评、宣传、保卫、学习、研究、进行、开始、停止、禁止
[0705] 表示存在变化消失:在、死、有、等于、发生、演变、发展、生长、死亡、存在、消灭[0706] 表示心理活动:想、爱、恨、伯、想念、打算、喜欢、希望、害伯、担心、讨厌、觉的、思考[0707] 表示判断:是、为、乃
[0708] 表示可能意愿必要(助动词):能、能够、会、可以、愿、愿意、肯、敢、要、应当、应该、配、值得、宁可
[0709] 表示趋向(趋向动词):上、下、进、出、回、开、过、起、来、上来、下来、进来、出来、回来、开来、过来、起来、去、上去、下去、进去、出主、回去,开去、过去
[0710] 表示发展动词:如生长、枯萎、发芽、结果、产卵;
[0711] 针对计划、制度、方案、文件等:
[0712] 编制、制订、拟定、起草、审定、审核、审查、转呈、转交、提交、呈报、下达、备案、存档、提出意见
[0713] 针对信息、资料:
[0714] 调查、研究、收集、整理、分析、归纳、分析、总结、提供、汇报、反馈、转达、通知、发布、维护管理
[0715] 关于某项工作(上级):
[0716] 主持、组织、指导、安排、协调、指示、监督、管理、分配、控制、牵头负责、审批、审定、签发、批准、评估
[0717] 思考行为:
[0718] 研究、分析、评估、发展、建议、倡议、参与、推荐、计划
[0719] 直接行动:
[0720] 组织、实行、执行、指导、带领、控制、监管、采用、生产、参加、阐明、解释、提供、协助[0721] 上级行为:
[0722] 许可、批准、定义、确定、指导、确立、规划、监督、决定
[0723] 管理行为:
[0724] 达到、评估、控制、协调、确保、鉴定、保持、监督
[0725] 专家行为:
[0726] 分析、协助、促使、联络、建议、推荐、支持、评估、评价
[0727] 下级行为:
[0728] 检查、核对、收集、获得、提交、制作
[0729] 其他:
[0730] 维持、保持、建立、开发、准备、处理、执行、接待、安排、监控、汇报、经营、确认、概念化、合作、协作、获得、核对、检查、联络、设计、测试、建造、修改、执笔、起草、引导、传递、翻译、操作、保证、预防、解决、介绍、支付、计算、修订、承担、谈判、商议、面谈、拒绝、否决、监视、预测、比较、删除、运用
[0731] 其中,数据挖掘公共平台服务器2包括有:
[0732] (1)模板接受管理及匹配结果反馈互动通信模块2-1,用于接受智能手机1上模板发送管理及匹配结果反馈互动通信模块1-3发送过来的个性模板,转发模板比对模块,与模板库的指定模板进行比对;
[0733] 匹配结果数据反馈智能手机1,并可以进行智能手机1与比对模板主体设备互动通信;
[0734] (2)模板比对模块2-2,用于接受个性模板与从模板库指定的主体数据资源的模板比对;并将匹配结果通过模板接受管理及匹配结果反馈互动通信模块2-1反馈给智能手机1;
[0735] (3)模板库2-3,用于保存各种主体数据资源的模板库;
[0736] 其中,模板包括但不限于,单位(部门)的动词-名词(价值)链数据关联模板以及类别模板、办公综合样本的动词-名词(价值)链数据关联模板以及类别模板、个人的动词-名词(价值)链数据关联模板以及类别模板、个人群体的动词-名词(价值)链数据关联模板以及类别模板、全息的动词-名词(价值)链数据关联模板以及类别模板等模板集合。
[0737] 虽然结合附图描述了本发明的几个具体实施方式,但是本领域普通技术人员可以在所附权利要求的范围内作出各种变形或修改。例如,可以变换其他个人移动设备,包括智能手机、导航设备、车联网设备、物联网移动设备等。
[0738] 个人移动设备、智能手机、导航设备、车联网设备、物联网移动设备、数据挖掘公共平台服务器、单位服务器及PC、服务器、语料库本体知识库服务等,它们都是包括系统总线、CPU、存储器和输入/输出接口的常规计算机系统微控制器系统或嵌入系统结构,如图14所显示。
[0739] 说明书中所描述的只是该发明的具体实施方式,各种举例说明不对发明的实质内容构成限制,所属技术领域的普通技术人员在阅读了说明书后可以对以上所叙述的具体实施方式做修改或变形,而不背离发明的实质和范围。
[0740] 以上结合具体实施例描述了本发明的基本原理但是需要指出的是对本领域的技术人员而言能够理解本发明的方法和装置的全部或者任何步骤或部件可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中以硬件、固件、软件或者其组合的形式实现,这是本领域的技术人员在阅读了本发明的描述的情况下利用其基本电路设计知识或者基本编程技能就能实现的。而且本发明还提出了几种存储有机器可读取的指令代码的程序系统产品。所述指令代码由机器读取并执行时可执行上述根据本发明实施例的方法。相应地用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。在通过软件或固件实现本发明的情况下从存储介质或网络向具有专用硬件结构的计算机(例如图14所示的通用计算机)安装构成该软件的程序该计算机在安装有各种程序时能够执行各种功能等。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈