首页 / 专利库 / 数学与统计 / 聚类算法 / 基于电压时序数据的台区户变关系识别方法及系统

基于电压时序数据的台区户变关系识别方法及系统

阅读:581发布:2020-05-08

专利汇可以提供基于电压时序数据的台区户变关系识别方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 电压 时序数据的台区户变关系识别方法及系统,其中,该方法包括:采集和处理配电台区 变压器 侧和各用户侧的电压时序数据作为多个观测变量;采用FastICA技术对多个观测变量进行独立成分分析与特征提取,获得用于估计多个观测变量的一系列相互独立的随机变量和混合矩阵,利用K-means聚类方法对特征提取后数据即混合矩阵进行 聚类分析 ,得到聚类结果,根据聚类结果确定台区用户对应关系,该方法无需安装额外的设备和装置,也无需人工检测,能够在保证 精度 的情况下,仅需根据一定的 采样 率采集用户电压时序数据实现户变关系的智能识别。,下面是基于电压时序数据的台区户变关系识别方法及系统专利的具体信息内容。

1.一种基于电压时序数据的台区户变关系识别方法,其特征在于,包括以下步骤:
采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量;
采用FastICA算法对所述多个观测变量进行降维处理,获得所述多个观测变量的相应的独立成分及对应的混合矩阵;以及
利用K-means聚类方法对所述混合矩阵进行聚类分析,得到聚类结果,并根据所述聚类结果确定台区用户对应关系。
2.根据权利要求1所述的基于电压时序数据的台区户变关系识别方法,其特征在于,在进行所述FastICA算法的降维处理前,需对所述多个观测变量进行数据预处理,其中,所述数据预处理包括去中心化与白化变换。
3.根据权利要求2所述的基于电压时序数据的台区户变关系识别方法,其特征在于,所述去中心化过程为:
计算所述多个观测变量的平均值;
将每个观测变量的每个采样点减去所述平均值,得到去中心化的观测变量。
4.根据权利要求2所述的基于电压时序数据的台区户变关系识别方法,其特征在于,所述白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
5.根据权利要求1所述的基于电压时序数据的台区户变关系识别方法,其特征在于,所述利用K-means聚类对所述混合矩阵进行聚类分析,包括:
在所述混合矩阵中选取k个样本作为初始聚类中心;
将所述k个样本归类到距离最近的聚类中心所属一类;
重新计算聚类中心;
迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。
6.一种基于电压时序数据的台区户变关系识别系统,其特征在于,包括:
获取模,用于采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量;
降维模块,用于采用FastICA算法对所述多个观测变量进行降维处理,获得所述多个观测变量的相应的独立成分及对应的混合矩阵;以及
聚类模块,用于利用K-means聚类方法对所述混合矩阵进行聚类分析,得到聚类结果,并根据所述聚类结果确定台区用户对应关系。
7.根据权利要求6述的基于电压时序数据的台区户变关系识别系统,其特征在于,在执行所述降维模块中的降维处理前,需对所述多个观测变量进行数据预处理,其中,所述数据预处理包括去中心化与白化变换。
8.根据权利要求7的基于电压时序数据的台区户变关系识别系统,其特征在于,所述去中心化过程为:
计算所述多个观测变量的平均值;
将每个观测变量的每个采样点减去所述平均值,得到去中心化的观测变量。
9.根据权利要求7的基于电压时序数据的台区户变关系识别系统,其特征在于,所述白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
10.根据权利要求6述的基于电压时序数据的台区户变关系识别系统,其特征在于,在所述聚类模块中,利用K-means聚类方法对所述混合矩阵进行聚类分析,包括:
选取单元,用于在所述混合矩阵中选取k个样本作为初始聚类中心;
归类单元,用于将所述k个样本归类到距离最近的聚类中心所属一类;
重计算单元,用于重新计算聚类中心;
迭代单元,用于迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。

说明书全文

基于电压时序数据的台区户变关系识别方法及系统

技术领域

[0001] 本发明涉及电系统配电网管理技术领域,特别涉及一种利用基于FastICA算法和K-means聚类相结合的台区户变关系识别方法及系统。

背景技术

[0002] 随着电网的快速发展,电力用户数量持续增长,低压配电网的规模和结构愈发庞大和复杂。为了便于管理,电力公司对低压配电网用户实行分台区管理,而台户关系识别是实现营销精益化、降耗减损的基础,也是窃电检测的前提。为保证线损计算的准确性,电力部需要经常排查用户的台区信息。在低压台区,部分老旧街区的线路复杂,由于台区信息的不完善和更新不及时等原因,台区用户资料往往不准确甚至缺失。此外,由于用户接线改动或因均衡负荷分配进行线路改造导致的用户进线端和集中器归属关系记录不准确、台户关系与实际不符的问题时有发生,因此在不断电的情况下对台户关系进行有效地识别尤为重要。
[0003] 目前台户关系识别方法主要分为人工识别和使用专用台区识别设备。人工识别主要依靠电力人员到现场住户排查用户台区归属,随着用电人口与日俱增,人工识别费时费力且效率低下。专用台区识别设备主要采用脉冲电流法,脉冲电流法在变压器端发送脉冲电流信号,在识别终端接受脉冲电流信号完成识别。但该方法无法双向通讯,通常需要载波通信作为辅助通信配合使用,此外脉冲电流信号通过变压器时不会产生交变磁场,无法通过变压器,因此只能在同一台区同一相线范围内传输。
[0004] 近年来随着用户侧智能电表的大规模安装与普及,电网可获得海量的用户电压、电流等运行数据。鉴于目前研究存在的问题,亟待一种无需安装额外设备和装置,且无需人工检测的方法,来确定台户关系。

发明内容

[0005] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006] 为此,本发明的一个目的在于提出一种基于电压时序数据的台区户变关系识别方法,该方法能够在保证精度的情况下仅采用电压时序数据实现户变关系的智能识别。
[0007] 本发明的另一个目的在于提出一种基于电压时序数据的台区户变关系识别系统。
[0008] 为达到上述目的,本发明一方面实施例提出了基于电压时序数据的台区户变关系识别方法,包括以下步骤:采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量;采用FastICA算法对所述多个观测变量进行降维处理,获得所述多个观测变量的相应的独立成分及对应的混合矩阵;利用K-means聚类方法对所述混合矩阵进行聚类分析,得到聚类结果,并根据所述聚类结果确定台区用户对应关系。
[0009] 本发明实施例的基于电压时序数据的台区户变关系识别方法,依次使用FastICA算法和K-means方法进行数据降维和聚类实现户变关系识别,无需安装额外的设备和装置,也无需人工检测,只需根据一定的采样率采集用户电压时序数据,能够节约人力物力实现户变关系识别,同时,FastICA独立成分分析将电压时序数据转化为静态特征,减少利用电压时序数据相关性计算时的计算量,提高了效率。
[0010] 另外,根据本发明上述实施例的基于电压时序数据的台区户变关系识别方法还可以具有以下附加的技术特征:
[0011] 进一步地,在本发明的一个实施例中,在进行所述FastICA算法的降维处理前,需对所述多个观测变量进行数据预处理,其中,所述数据预处理包括去中心化与白化变换。
[0012] 进一步地,在本发明的一个实施例中,所述去中心化过程为:计算所述多个观测变量的平均值;将每个观测变量的每个采样点减去所述平均值,得到去中心化的观测变量。
[0013] 进一步地,在本发明的一个实施例中,所述白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
[0014] 进一步地,在本发明的一个实施例中,所述利用K-means聚类对所述混合矩阵进行聚类分析,包括:在所述混合矩阵中选取k个样本作为初始聚类中心;将所述k个样本归类到距离最近的聚类中心所属一类;重新计算聚类中心;迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。
[0015] 为达到上述目的,本发明另一方面实施例提出了基于电压时序数据的台区户变关系识别系统,包括:获取模,用于采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量;降维模块,用于采用FastICA算法对所述多个观测变量进行降维处理,获得所述多个观测变量的相应的独立成分及对应的混合矩阵;聚类模块,用于利用K-means聚类方法对所述混合矩阵进行聚类分析,得到聚类结果,并根据所述聚类结果确定台区用户对应关系。
[0016] 本发明实施例的基于电压时序数据的台区户变关系识别系统,依次使用FastICA算法和K-means方法进行数据降维和聚类实现户变关系识别,无需安装额外的设备和装置,也无需人工检测,只需根据一定的采样率采集用户电压时序数据,能够节约人力物力实现户变关系识别,同时,FastICA独立成分分析将电压时序数据转化为静态特征,减少利用电压时序数据相关性计算时的计算量,提高了效率。
[0017] 另外,根据本发明上述实施例的基于电压时序数据的台区户变关系识别系统还可以具有以下附加的技术特征:
[0018] 进一步地,在本发明的一个实施例中,在执行所述降维模块中的降维处理前,需对所述多个观测变量进行数据预处理,其中,所述数据预处理包括去中心化与白化变换。
[0019] 进一步地,在本发明的一个实施例中,所述去中心化过程为:计算所述多个观测变量的平均值;将每个观测变量的每个采样点减去所述平均值,得到去中心化的观测变量。
[0020] 进一步地,在本发明的一个实施例中,所述白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
[0021] 进一步地,在本发明的一个实施例中,在所述聚类模块中,利用K-means聚类方法对所述混合矩阵进行聚类分析,包括:选取单元,用于在所述混合矩阵中选取k个样本作为初始聚类中心;归类单元,用于将所述k个样本归类到距离最近的聚类中心所属一类;重计算单元,用于重新计算聚类中心;迭代单元,用于迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。
[0022] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明
[0023] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0024] 图1为根据本发明一个实施例的基于电压时序数据的台区户变关系识别方法流程图
[0025] 图2为根据本发明一个实施例的台区户变关系识别具体流程图;
[0026] 图3为根据本发明一个实施例的电压时序观测变量特征提取流程图;
[0027] 图4为根据本发明一个实施例的基于电压时序数据的台区户变关系识别系统结构示意图;
[0028] 图5为根据本发明一个实施例的基于电压时序数据的台区户变关系识别系统中聚类模块的结构示意图。

具体实施方式

[0029] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0030] 下面参照附图描述根据本发明实施例提出的基于电压时序数据的台区户变关系识别方法及系统,首先将参照附图描述根据本发明实施例提出的基于电压时序数据的台区户变关系识别方法。
[0031] 图1是本发明一个实施例的基于电压时序数据的台区户变关系识别方法流程图。
[0032] 如图1所示,该基于电压时序数据的台区户变关系识别方法包括以下步骤:
[0033] 在步骤S101中,采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量。
[0034] 具体而言,本发明实施例从采集系统中获取台区变压器及台区用户的时序电压数据,然后对时序电压数据进行整理清洗,得到多个观测变量;
[0035] 在步骤S102中,采用FastICA算法对多个观测变量进行降维处理,获得多个观测变量的相应的独立成分及对应的混合矩阵。
[0036] 需要说明的是,在进行FastICA算法的降维处理前,需对多个观测变量进行数据预处理,其中,数据预处理包括去中心化与白化变换。
[0037] 其中,去中心化过程为:计算多个观测变量的平均值;将每个观测变量的每个采样点减去平均值,得到去中心化的观测变量。
[0038] 如下,具体处理过程如下:
[0039] 对于采样点数为n的m个观测变量,首先利用式(1)计算观测变量的平均值,然后将每个观测变量的每个采样点减去该观测变量的均值得到去中心化的观测变量,如式(2)所示。
[0040]
[0041]
[0042] 其中,白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
[0043] 例如,如图2所示,对观测变量x1(t),x2(t),…,xm(t)进行白化变换,即:
[0044] z(t)=Bx(t)   (3)
[0045] 其中, 是白化矩阵,E是以协方差矩阵E{x(t)x(t)T}的单位正交特征向量为列的矩阵;Γ=diag(γ1,γ2,...γm)是以E{x(t)x(t)T}的特征值为对元素的对角矩阵,Γ-1/2是Γ对角元素取平方根再取倒数得到的对角矩阵。
[0046] 需要说明的是,FastICA算法的目标是找到一个分离矩阵Wz使得s(t)=WzZ(t)具有最大的非高斯性,其中,Wz是观测变量白化后对应的分离矩阵。与观测变量对应的分离矩阵W和与白化变量对应的分离矩阵Wz之间有如下关系:
[0047] W=WzB   (4)
[0048] 利用FastICA算法求解得到Wz后根据式(6)得到W,再求解W的逆矩阵或广义逆矩阵最终得到观测变量的混合矩阵A。
[0049] 进一步地,利用FastICA算法进行降维处理具体步骤为:
[0050] (1)对观测变量X(t)进行白化变换,得到具有零均值、单位方差特性的Z(t);
[0051] (2)选择随机的初始权向量Wz_p,下标p表示第p迭代,令p=1;
[0052] (3)根据式(5)对权向量Wz_p进行调整,式中E(·)为均值运算,g(·)为非线性函数;
[0053]
[0054] (4)对权向量Wz_p进行正交化操作;
[0055]
[0056] (5)对权向量Wz_p进行归一化处理;
[0057] Wz_p=Wz_p/||Wz_p||   (7)
[0058] (6)若Wz_p不收敛则返回(3)继续迭代;
[0059] (7)令p=p+1,若p≤m,返回(2);
[0060] 其中,ICA本质上可看成用一组独立随机变量的线性组合表示原始观测变量,将展开写成如下形式:
[0061]
[0062] 所有观测变量均可用随机变量线性表示,如果将这一组随机变量看作高维空间下的一组基,则混合矩阵A中的行向量ai对应一个观测变量在该高维空间下的坐标,从而实现了用静态数据对时序数据的表示。如图3所示,从时序数据特征提取的角度看可以将这一组基s(t)作为时序数据的特征,则行向量ai表示相应的特征值。
[0063] 在步骤S103中,利用K-means聚类方法对混合矩阵进行聚类分析,得到聚类结果,并根据聚类结果确定台区用户对应关系。
[0064] 根据步骤S102可知,混合矩阵的行向量ai代表相应的观测变量,因此可以用静态数据聚类的方式代替时序数据聚类,对获得的混合矩阵采用K-means聚类。
[0065] 可以理解是,从线性空间下基和坐标之间的关系看,混合矩阵A的行向量之间的相似关系反映了观测变量x(t)之间的相似关系。因此,对A的行向量进行聚类即可实现对观测变量的聚类。混合矩阵A的维度与时间t无关,从而大大降低时序数据的维度和聚类分析的复杂度。
[0066] 在台户关系识别中,需要进行聚类分析的用户用电数据的类别数是可以事先确定的,适合采用K-means算法,因此本发明实施例采用基于ICA的K-means算法对用户用电时序数据进行聚类。其中,K-means的目标函数为:
[0067]
[0068] 式中,dij为样本点到距离中心的欧式距离,k为聚类数目,ni为样本i的数目,ci是第i类样本的聚类中心。
[0069] 进一步地,在本发明的一个实施例中,利用K-means聚类对混合矩阵进行聚类分析,包括:
[0070] 在混合矩阵中选取k个样本作为初始聚类中心;
[0071] 将k个样本归类到距离最近的聚类中心所属一类;
[0072] 重新计算聚类中心;
[0073] 迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。
[0074] 也就是说,K-means的聚类过程为:
[0075] (1)选取k个样本作为初始聚类中心;
[0076] (2)将各个样本归类到距离最近的聚类中心所在的那一类;
[0077] (3)重新计算聚类中心;
[0078] (4)重复(2)和(3)直至目标函数收敛或达到最大迭代次数,获得K-means聚类的结果,每一类的用户台区相别信息由该类中已经确定的台区和相别决定,即可确定该类中用户所属的台区相别信息,从而实现台区户变关系识别。
[0079] 根据本发明实施例提出的基于电压时序数据的台区户变关系识别方法,通过首先对采集到的用户电压时序数据进行处理和FastICA独立成分分析,从而提取时序数据的静态特征;然后应用静态数据的K-means聚类方法对静态特征(即混合矩阵)进行聚类分析,从而自动地将电压时序数据分成相应的类别以实现户变关系识别,该方法无需安装额外的设备和装置,也无需人工检测,只需根据一定的采样率采集用户电压时序数据,能够节约人力物力实现户变关系识别;FastICA独立成分分析将电压时序数据转化为静态特征,减少利用电压时序数据相关性计算时的计算量,提高了效率。
[0080] 其次参照附图描述根据本发明实施例提出的基于电压时序数据的台区户变关系识别系统。
[0081] 图4是本发明一个实施例的基于电压时序数据的台区户变关系识别系统。
[0082] 如图4所示,该基于电压时序数据的台区户变关系识别系统10包括:获取模块100、降维模块200和聚类模块300。
[0083] 其中,获取模块100用于采集并处理配电台区变压器侧及台区用户侧的时序电压数据,得到多个观测变量。降维模块200用于采用FastICA算法对多个观测变量进行降维处理,获得观测变量的相应的独立成分及对应的混合矩阵。聚类模块300用于利用K-means聚类方法对混合矩阵进行聚类分析,得到聚类结果,并根据聚类结果确定台区用户对应关系。
[0084] 进一步地,在本发明的一个实施例中,在执行降维模块中的降维处理前,需对多个观测变量进行数据预处理,其中,数据预处理包括去中心化与白化变换。
[0085] 进一步地,在本发明的一个实施例中,去中心化过程为:计算多个观测变量的平均值;将每个观测变量的每个采样点减去平均值,得到去中心化的观测变量。
[0086] 进一步地,在本发明的一个实施例中,白化变换是将每个观测变量之间的相关性去除,以简化独立成分的提取过程。
[0087] 如图5所示,进一步地,在本发明的一个实施例中,在聚类模块300中,利用K-means聚类方法对混合矩阵进行聚类分析,包括:
[0088] 选取单元301,用于在混合矩阵中选取k个样本作为初始聚类中心;
[0089] 归类单元302,用于将k个样本归类到距离最近的聚类中心所属一类;
[0090] 重计算单元303,用于重新计算聚类中心;
[0091] 迭代单元304,用于迭代执行归类和重新计算过程,直至目标函数收敛或达到最大迭代次数。
[0092] 根据本发明实施例提出的基于电压时序数据的台区户变关系识别系统,依次使用FastICA算法和K-means方法进行数据降维和聚类实现户变关系识别,无需安装额外的设备和装置,也无需人工检测,只需根据一定的采样率采集用户电压时序数据,能够节约人力物力实现户变关系识别,同时,FastICA独立成分分析将电压时序数据转化为静态特征,减少利用电压时序数据相关性计算时的计算量,提高了效率。
[0093] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0094] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0095] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈