专利汇可以提供一种基于信用大数据的标签分类和定量分析方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于信用 大数据 的标签分类和定量分析方法,涉及企业信用评价技术领域。该基于信用大数据的标签分类和定量分析方法,包括以下步骤:S1、获取和整合信用记录数据;S2、清洗数据;S3、筛选并区分身份类信用信息、能 力 类信用信息和意愿类信用信息;S4、根据信用数据类型,确定特征类型。本发明,使用到 决策树 等传统 机器学习 模型;jieba分词、word2vec模型等 自然语言处理 方法以及LSTM神经网络等 深度学习 模型;并加入信用研究成果、身份类信用信息、能力类信用信息和意愿类信用信息的分类方法,以形成一套完整建立社会信用标签的方法,从而使得企业信用评价指标无需依靠相关工作人员 指定 ,定义信用的标准一致。,下面是一种基于信用大数据的标签分类和定量分析方法专利的具体信息内容。
1.一种基于信用大数据的标签分类和定量分析方法,其特征在于:包括以下步骤:
S1、获取和整合信用记录数据;
S2、清洗数据;
S3、筛选并区分身份类信用信息、能力类信用信息和意愿类信用信息;
S4、根据信用数据类型,确定特征类型;
S5、根据特征类型,使用特征提取和分箱工程处理信用数据;
S6、根据上一步结果,形成信用身份类标签、信用能力类标签和信用意愿类标签,最后,存入标签库以备后续分析使用。
2.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤1中获取和整合信用记录数据,具体内容如下:
1)设置一个时间段;
2)收集和整合该时间段内,信用主体的社会身份和行为记录数据。
3.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤2中清洗数据,具体内容如下:
1)将原始数据转化为结构化数据;
2)对特征变量缺失值单独建立类别。
4.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤3中筛选并区分身份类信用信息、能力类信用信息和意愿类信用信息,具体内容如下:
1)信用身份:指在企业成立时就具备的特征,且短期不会改变,如,行业,企业类型,公司注册地等;
2)信用能力:指企业在进入经济活动前,是否满足相关要求的信息,如,行业许可证,注册资金;贷款时,企业现金流量,资产负债等信息;
3)信用意愿:指企业在进入某经济活动后,是否履行相关义务的信息,如,是否按时还款,是否欠税,是否产品存在质量问题等。
5.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤4中根据信用数据类型,确定特征类型,具体内容如下:
1)表示类别名称的特征,为分类特征;
2)可以数数或是测量出来,并且可以进行加、减、乘、除运算的特征,为数值特征;
3)数据是一段文字内容,为文本型特征。
6.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤5中根据特征类型,使用特征提取,具体内容如下:
1)jieba中文分词:
精确模式:试图将句子最精确地切开;
搜索引擎模式:在精确模式的基础上,对长词再次切分;
2)通过停用词表,去停用词;
3)向量化:出现过该词的次数n,标记n;未出现,标记0;
4)使用word2vec训练模型,其中使用LSTM神经网络确定每个文本的向量值;
5)确定该文本所属的特征。
7.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤5中分箱工程处理信用数据,具体内容如下:
1)对于数值特征,使用等频分箱;
2)箱数选择,根据数据量,在业务和硬件允许的情况下,箱数选取最大;
3)之后可以使用卡方分箱或决策树等有监督分箱,实施进一步处理。
8.根据权利要求1所述的一种基于信用大数据的标签分类和定量分析方法,其特征在于:所述步骤6中将标签结果根据步骤3分别划到身份类标签、能力类标签和意愿类标签中,最后将上述三类标签规则存入标签库当中。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
自然语言处理模型训练方法、任务执行方法、设备及系统 | 2020-05-11 | 867 |
问答阅读理解模型获取方法、装置、电子设备及存储介质 | 2020-05-11 | 12 |
一种基于多种实体注意力和改进预训练语言模型的药物间关系抽取方法 | 2020-05-12 | 729 |
基于画像的医学科普文章推荐方法及系统 | 2020-05-11 | 302 |
基于大数据的职业兴趣预测方法、装置、设备及存储介质 | 2020-05-14 | 475 |
一种基于句法模式和机器学习的开放式关系的抽取方法 | 2020-05-14 | 806 |
一种基于信用大数据的标签分类和定量分析方法 | 2020-05-11 | 914 |
基于中文小说文本的阅读器信息抽取方法及系统 | 2020-05-13 | 70 |
数据处理方法和装置 | 2020-05-14 | 430 |
基于多模态注意力机制的视频内容描述方法、系统、装置 | 2020-05-11 | 738 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。