首页 / 专利库 / 银行与财务事项 / 加密货币 / 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法

一种基于链的加密货币用户特征挖掘、异常用户检测方法

阅读:519发布:2020-05-21

专利汇可以提供一种基于链的加密货币用户特征挖掘、异常用户检测方法专利检索,专利查询,专利分析的服务。并且本 发明 属于 区 块 链 的特征挖掘技术领域,公开了一种基于区块链的 加密 货币 用户特征挖掘、异常用户检测方法,获取区块链 加密货币 的交易数据,对交易数据进行处理,得到交易id、发送方 假名 、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;采用基于启发式的 加密货币地址 聚类方法将用户的假名进行聚类,同时将用户进行编号;然后提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。本发明针对区块链加密货币的匿名性,从区块链中提取有价值的结果,检测用户的异常交易,有助于对加密货币洗钱等违法事件的监管。,下面是一种基于链的加密货币用户特征挖掘、异常用户检测方法专利的具体信息内容。

1.一种基于链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述基于区块链的加密货币用户特征挖掘、异常用户检测方法包括以下步骤:
步骤一,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳;
步骤二,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
步骤三,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
步骤四,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
2.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤一获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳具体包括:
首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;
然后,将三个部分的原始数据进行处理整合;
最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
3.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤二采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号具体包括:
首先,判断交易类型是否为产量交易;
然后,识别非产量交易输出地址中的找零地址;
最后,更新用户地址集合。
4.如权利要求3所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述找零地址的特征有:
特征一:作为输出地址的情况通常只有一次;
特征二:不会同时出现在一笔交易的输入地址和输出地址;
特征三:一笔交易的输出地址不能只有找零地址;
识别交易t的找零地址a的算法如下:
1)地址a只作为一次交易t的输出;
2)交易t不是产量交易;
3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足;
其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
5.如权利要求3所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述更新用户地址集合方法具体包括:
若交易为产量交易:
1)若 且Outputs(t)≠Addr(u),则继续遍历交易;
2)若 则新建Addr(u),使Addr(u)=Outputs(t);
若交易为非产量交易:
1)若 且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=
Addr(u)∪Inputs(t)∪ChangeAddr(t);
2)若 则新建Addr(u),使Addr(u)=Inputs(t)∪
ChangeAddr(t);
其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
6.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤三的提取用户特征、用户特征分类,用户特征具体包括:
特征一:地址数,表示用户拥有的地址数量;
特征二:交易数,表示用户出现的交易数量;
特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
特征五:用户入度,表示用户作为接收方,其发送方的数量;
特征六:用户出度,表示用户作为发送方,其接收方的数量;
特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔;
用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
短期投资者:交易数应该较高;地址平均活跃时间范围较短;
早期采用者:很长的用户活跃时间范围;交易量接近中值;
洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
7.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤四使用高斯混合模型对用户进行聚类:
其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵;
从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集;
最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
8.一种如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法的基于区块链的特征挖掘及异常检测系统,其特征在于,所述基于区块链的特征挖掘及异常检测系统包括:
预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
特征提取模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
9.一种应用权利要求1~7任意一项所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的信息数据处理终端。
10.一种应用权利要求1~7任意一项所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的异常用户检测系统。

说明书全文

一种基于链的加密货币用户特征挖掘、异常用户检测

方法

技术领域

[0001] 本发明属于区块链的特征挖掘技术领域,尤其涉及一种基于区块链的加密货币用户特征挖掘、异常用户检测方法

背景技术

[0002] 目前,最接近的现有技术:大多是基于无监督机器学习的加密货币交易匿名性分析,包括使用K-means聚类、无监督支持向量机算法,对真实的数据进行异常检测。这些方法的缺陷在于:首先,没有对原始的交易数据进行启发式用户地址聚类,没有完全将用户所持有的地址划分到用户地址集合当中,因而导致用户集群范围的精确度降低;其次,这些方法没有对用户进行详细的特征挖掘,没有明确给出正常用户与异常用户的划分条件;然后,这些方法使用的算法缺乏估计密度的能;最后,这些方法异常交易的检测效果不佳,成功率在10%左右,并且是在不考虑混币服务的前提下。
[0003] 使用本发明所述一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,首先,使用了启发式用户地址聚类方法,能够全面的将用户持有地址划分到其地址集合中,提高了后续建模的精确性;其次,对用户特征进行了详细的挖掘,包括十个方面的特征,丰富的描述了用户存在的各种特点,并且给出正常用户与异常用户的6个划分条件,对后续用户聚类得到的集群分类起关键作用;然后,使用高斯混合模型对用户进行聚类,该算法是基于概率的算法,从密度估计度进行聚类;最后,在考虑混币服务的情况下,异常交易检测成功率提高到30%左右。
[0004] 近年来,政府和其他政治机构也对加密货币的不可追溯性非常关切,因为缺乏一个监督和监管加密货币的中央机构,会给社会带来洗钱等非法活动的险。2018年3月26日,欧洲刑警组织破获一超大规模涉及加密货币洗钱的网络犯罪团伙,在5年时间里,他们总计盗取全球行约10亿欧元,并将非法收益转化为加密货币。由此可见,建立对加密货币洗钱的监管是非常迫切和重要的。
[0005] 综上所述,现有技术存在的问题是:对加密货币用户特征挖掘不全面的问题,异常交易检测的效果不佳的问题。
[0006] 解决上述技术问题的难度和意义:针对加密货币的匿名性,基于区块链的特征挖掘及异常检测,其实是极富挑战性的。第一,加密货币是分布式的,没有任何中央机构对其进行管制,交易数据复杂、不易解析。第二,每个用户拥有任意数量的地址,找出用户的所有地址难度极高,对算力的要求也非常高,因此需要优良的用户地址聚类方法。第三,目前加密货币用户特征类别模糊,需要大量数据统计分析,区分正常用户与异常用户特征,从而进行异常检测。因此,研究区块链的用户特征挖掘以及异常用户检测具有深远的实践意义。

发明内容

[0007] 针对现有技术存在的问题,本发明提供了一种基于区块链的加密货币用户特征挖掘、异常用户检测方法。
[0008] 本发明是这样实现的,一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,所述基于区块链的加密货币用户特征挖掘、异常用户检测方法括以下步骤:
[0009] 步骤一,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳;
[0010] 步骤二,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
[0011] 步骤三,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
[0012] 步骤四,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
[0013] 进一步,所述步骤一获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳具体包括:
[0014] 首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;
[0015] 然后,将三个部分的原始数据进行处理整合;
[0016] 最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
[0017] 进一步,所述步骤二采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号具体包括:
[0018] 首先,判断交易类型是否为产量交易;
[0019] 然后,识别非产量交易输出地址中的找零地址;
[0020] 最后,更新用户地址集合。
[0021] 进一步,所述找零地址的特征有:
[0022] 特征一:作为输出地址的情况通常只有一次;
[0023] 特征二:不会同时出现在一笔交易的输入地址和输出地址;
[0024] 特征三:一笔交易的输出地址不能只有找零地址。
[0025] 识别交易t的找零地址a的算法如下:
[0026] 1)地址a只作为一次交易t的输出;
[0027] 2)交易t不是产量交易;
[0028] 3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
[0029] 4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足。
[0030] 其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
[0031] 进一步,所述更新用户地址集合方法具体包括:
[0032] 若交易为产量交易:
[0033] 1)若 且Outputs(t)≠Addr(u),则继续遍历交易;
[0034] 2)若 则新建Addr(u),使Addr(u)=Outputs(t);
[0035] 若交易为非产量交易:
[0036] 1)若 且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=Addr(u)∪Inputs(t)∪ChangeAddr(t);
[0037] 2)若 则新建Addr(u),使Addr(u)=Inputs(t)∪ChangeAddr(t)。
[0038] 其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
[0039] 进一步,所述步骤三的提取用户特征、用户特征分类,用户特征具体包括:
[0040] 特征一:地址数,表示用户拥有的地址数量;
[0041] 特征二:交易数,表示用户出现的交易数量;
[0042] 特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
[0043] 特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
[0044] 特征五:用户入度,表示用户作为接收方,其发送方的数量;
[0045] 特征六:用户出度,表示用户作为发送方,其接收方的数量;
[0046] 特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
[0047] 特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
[0048] 特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
[0049] 特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔。
[0050] 用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
[0051] 消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
[0052] 长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
[0053] 短期投资者:交易数应该较高;地址平均活跃时间范围较短;
[0054] 早期采用者:很长的用户活跃时间范围;交易量接近中值;
[0055] 洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
[0056] 盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
[0057] 进一步,所述步骤四使用高斯混合模型对用户进行聚类:
[0058]
[0059] 其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵。
[0060] 从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集。
[0061] 最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
[0062] 本发明的另一目的在于提供一种基于所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法的基于区块链的特征挖掘及异常检测系统,所述基于区块链的特征挖掘及异常检测系统包括:
[0063] 预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
[0064] 用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
[0065] 特征提取模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
[0066] 异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
[0067] 本发明的另一目的在于提供一种应用所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的信息数据处理终端。
[0068] 本发明的另一目的在于提供一种应用所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的异常用户检测系统。
[0069] 综上所述,本发明的优点及积极效果为:本发明通过对加密货币区块链交易数据的处理,得到特征挖掘所需的基本交易信息;提供了一种启发式用户地址聚类方法,能够尽可能地将用户拥有的地址与用户id对应。本发明使用高斯混合模型对用户进行聚类,根据用户分类的特征,成功找出疑似异常的用户。本发明的部分实验结果如图6所示,包括了2012年3月第一周的51482个用户的降维后聚类情况,图(a)为每个集群的用户数量柱状图,图(b)可以看出左上角3个蓝色圆点与其他点偏离程度很大,根据用户分类特征归为可疑用户,最后成功找到一个用户为异常用户。本发明提供基于区块链的加密货币用户特征挖掘、异常用户检测方法,有助于检测加密货币洗钱等非法事件以及监管,对缺乏中心机构管理的加密货币市场的维护具有深远的实践意义。
附图说明
[0070] 图1是本发明实施例提供的基于区块链的加密货币用户特征挖掘、异常用户检测方法流程图
[0071] 图2是本发明实施例提供的数据预处理阶段示意图。
[0072] 图3是本发明实施例提供的用户处理阶段示意图。
[0073] 图4是本发明实施例提供的特征挖掘阶段示意图。
[0074] 图5是本发明实施例提供的异常检测阶段示意图。
[0075] 图6是本发明实施例提供的用户聚类结果图。

具体实施方式

[0076] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0077] 下面结合附图对本发明的应用原理作详细的描述。
[0078] 如图1所示,本发明实施例提供的基于区块链的加密货币用户特征挖掘、异常用户检测方法包括以下步骤:
[0079] S101:预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
[0080] S102:用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
[0081] S103:特征挖掘模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
[0082] S104:异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
[0083] 下面结合附图对本发明的应用原理作详细的描述。
[0084] 如图2-图5所示,本发明包括数据预处理阶段、用户处理阶段、特征挖掘阶段以及异常检测四个阶段。
[0085] (1)数据预处理阶段:
[0086] 如图2,在预处理阶段,首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;然后,将三个部分的原始数据进行处理整合;最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
[0087] (2)用户处理阶段:
[0088] 如图3,描述了本发明的数据处理阶段。首先,判断交易类型是否为产量交易;然后,识别非产量交易输出地址中的找零地址;最后,更新用户地址集合。
[0089] 其中,找零地址的特征,具体如下:
[0090] 特征一:作为输出地址的情况通常只有一次;
[0091] 特征二:不会同时出现在一笔交易的输入地址和输出地址(不需考虑“自我找零”的情况);
[0092] 特征三:一笔交易的输出地址不能只有找零地址。
[0093] 其中,识别交易t的找零地址a的算法如下:
[0094] 1)地址a只作为一次交易t的输出;
[0095] 2)交易t不是产量交易;
[0096] 3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
[0097] 4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足。
[0098] 其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
[0099] 其中,更新用户地址集合方法具体包括:
[0100] 若交易为产量交易:
[0101] 1)若 且Outputs(t)≠Addr(u),则继续遍历交易;
[0102] 2)若 则新建Addr(u),使Addr(u)=Outputs(t);
[0103] 若交易为非产量交易:
[0104] 1)若 且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=Addr(u)∪Inputs(t)∪ChangeAddr(t);
[0105] 2)若 则新建Addr(u),使Addr(u)=Inputs(t)∪ChangeAddr(t)。
[0106] 其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
[0107] (3)特征挖掘阶段:
[0108] 如图4,描述了用户特征挖掘阶段。包括提取用户特征、用户特征分析及数据统计、用户特征分类。
[0109] 其中,用户特征具体包括:
[0110] 特征一:地址数,表示用户拥有的地址数量;
[0111] 特征二:交易数,表示用户出现的交易数量;
[0112] 特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
[0113] 特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
[0114] 特征五:用户入度,表示用户作为接收方,其发送方的数量;
[0115] 特征六:用户出度,表示用户作为发送方,其接收方的数量;
[0116] 特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
[0117] 特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
[0118] 特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
[0119] 特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔。
[0120] 其中,用户特征数据统计包括:特征平均值、中值、最小值和最大值。
[0121] 其中,用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
[0122] 消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
[0123] 长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
[0124] 短期投资者:交易数应该较高;地址平均活跃时间范围较短;
[0125] 早期采用者:很长的用户活跃时间范围;交易量接近中值;
[0126] 洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
[0127] 盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
[0128] (4)异常检测阶段:
[0129] 如图5,描述了异常检测阶段。包括使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
[0130] 其中,使用高斯混合模型对用户进行聚类:
[0131]
[0132] 其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵。
[0133] 从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集。
[0134] 最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
[0135] 本发明通过对加密货币区块链交易数据的处理,得到特征挖掘所需的基本交易信息。本发明提供了一种启发式用户地址聚类方法,能够尽可能地将用户拥有的地址与用户id对应。本发明使用高斯混合模型对用户进行聚类,根据用户分类的特征,成功找出疑似异常的用户。本发明提供基于区块链的加密货币用户特征挖掘、异常用户检测方法,有助于检测加密货币洗钱等非法事件以及监管,对缺乏中心机构管理的加密货币市场的维护具有深远的实践意义。
[0136] 如图6,显示了用户聚类过程的部分结果,包括了2012年3月第一周的51482个用户的降维后聚类情况,图(a)为每个集群的用户数量柱状图,图(b)可以看出左上角3个蓝色圆点与其他点偏离程度很大,根据用户分类特征归为可疑用户,最后成功找到一个用户为异常用户。
[0137] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈