首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

清华大学 陈启鑫,郑可迪,康重庆等:异常用电的检测方法—评述与展望

提示:点击"电力系统自动化"↑关注本刊微信

原文发表在《电力系统自动化》2018年第42卷第17期,欢迎品读。

本文引文信息

陈启鑫, 郑可迪, 康重庆, 等. 异常用电的检测方法: 评述与展望 [J]. 电力系统自动化, 2018, 42(17): 189-199. DOI: 10.7500/ AEPS20171128013.

CHEN Qixin, ZHENG Kedi, KANG Chongqing, et al. Detection Methods of Abnormal Electricity Consumption Behaviors: Review and Prospects [J]. Automation of Electric Power Systems, 2018, 42(17): 189-199. DOI: 10.7500/ AEPS20171128013.

异常用电的检测方法:评述与展望

DOI: 10.7500/AEPS20171128013

陈启鑫,郑可迪,康重庆,皇甫奋宇

1

研究背景

非技术性损失(Non-technical Loss,NTL)指电网输配电损失中无法用技术解释的部分,包括窃电在内的用户异常用电行为是造成NTL的主要原因。根据美国智能电网咨询服务公司Northeast Group的报告,50个被调查的发展中国家每年合计的NTL达到647亿美元,且年增长率超过10%。随着我国新一轮电力市场化改革的不断深入,售电侧市场建设不断推进,NTL的管理将直接决定售电公司的利润,异常用电检测对独立配电、售电公司的经营尤为重要。

随着智能电网的发展,高级量测体系(Advanced Metering Infrastructure,AMI)正逐渐建立,智能电表(Smart Meter)的普及率也不断上升。AMI体系下,用户的异常用电行为检测将从以下两个方面分别带来挑战与契机。一方面,针对智能电表的攻击将使得NTL的产生更加“没有头绪”,智能电表所记录用户负荷曲线可能是经过攻击者精心伪装的,难以检测。而另一方面,相比较于传统电表的人工定期抄表,智能电表可实现每天数十次以上频度的用户用电数据记录,并自动发送给电网企业或售电公司,这些海量的用户用电数据将为异常用电行为的检测提供“证据”。

2

异常用电检测方法

2.1

基于系统状态的检测方法

电网的物理本质决定了系统电压、注入功率等物理量的量测结果应基本符合潮流计算的结果,即系统状态具有一致性。在实际中,用户可能对功率读数进行篡改,也可能篡改电压、电流等配电网量测数据,但对多数用户来说,对这些数据同时进行篡改的难度较大,即使篡改也很难实现数据间的协同。因此可以利用用户侧的智能电表数据,结合配电网中的电压、电流和节点功率等额外量测数据进行检验。

2.2

基于数据驱动的检测方法

数以百万计的智能电表每天以固定的高频收集大量的用电数据,气象和经济多样数据也被加入到用户用能行为分析中,为基于数据驱动的异常用电行为检测提供了基础。近年来应用于用户用电行为异常检测领域的数据驱动方法分为基于分类的、基于回归(负荷预测)的以及基于聚类的三个子类。

基于分类的方法:此类方法或模型根据输入的特征量将输入对应的集合划分为几类。在异常用电检测中,分类的目标则是根据用户的特征量将用户集划分为正常和异常两类。通常情况下,基于分类的方法需要大量带标签的训练集提供样本,通过训练以提高分类的精度。文献中常用的分类器包括k-邻近算法、随机森林、逻辑回归和支持向量机等。

一个分类模型的建立过程一般较为复杂,通常涉及到激活函数的选取和超参数的优化。由于使用了带标签的数据集,基于分类的方法具有较高的检测准确率,但带标签的数据集也成为了其在实际应用中的一个短板。

基于回归的方法:应用此类方法进行异常用电行为检测的通常思路为,首先对目标用户进行短期负荷预测,再根据实际耗电量与预测量的偏差进行异常判断。当用户行为严重偏离预测值时,即出现异常情况。一些有效的回归模型包括ARIMA、神经网络和外生变量周期自回归等。

由于用户用电行为的随机性,单一用户短期负荷预测的精度还不够理想。由于每个人的用电模式不同,在异常检测时通常需要对每个用户建立回归模型。另外,基于回归的方法重视的是用户本身用电行为的变化,而缺乏了用户之间的横向对比。

基于聚类的方法:聚类通过某些特定的算法将相似的对象通过静态分类的方法分成不同的组别或者更多的子集,使得在同一个子集中的对象都具有相似的一些属性。在异常检测中,可以通过聚类找出不符合多数用户用电行为的少数异常用电者。应用于用电异常行为检测的主要有基于划分(包括k-means、高斯混合模型和模糊C-均值聚类等)和基于密度(包括DBSCAN等)两类聚类算法。

由于采用了无监督学习的方法,聚类的优点是不需要带标签的数据集即可进行检测,但其检测的准确率相对较低。另外,传统的聚类方法如k-means 聚类和DBSCAN 等对参数的依赖性很强,甚至需要涉及到网格优化等手段来提升效果,使得算法的复杂程度上升了至少一个量级。

2.3

基于博弈论的检测方法

根据博弈论,每个用户的决策行为均为最大化自身效用,窃电用户的决策集与正常用户不同,最终将影响双方在付费电量分布上的不同,可以基于这种区别实现异常检测。博弈论的方法更重视存在窃电情况下配电公司和用户双方主体的决策行为分析和建模,在具体的异常用电检测方案上没有过多的讨论,只根据博弈纳什均衡的结果提出了似然比检验的方法。

2.4

对比分析

表1对比了基于系统状态、基于数据驱动和基于博弈论的NTL检测方法特点。由于各类方法对应文献较多,使用的算法各不相同,表中只给出了其总体上的定性比较结果。

表1 各异常用电行为检测方法对比

3

异常用电行为检测关键技术

3.1

适应不平衡数据集的检测

在实际数据集中,异常用电用户占全部用户的比例通常很低。为了解决数据集不平衡问题,需要通过对数据集的重构与筛选,构建一个相对平衡的数据集,或提出更契合实际问题的检测效果衡量指标。

3.2

与用电数据相适应的特征选择

用户用电数据存在漂移、波动和可分解等特性,好的特征可以捕捉到用户数据的本质特征,提高模型的在特定场景下的适用性,极大提升异常用电检测的效率。

3.3

优化检测效果的模型构建

不同模型对数据集的适用性不同,检测者需要从模型的基本原理出发,基于数据集实际的特点进行模型选取,综合考虑时间复杂度、空间复杂度和检测效果对模型进行构建。单一模型往往很难适应不同的场景,检测者可以选取多个适用场景类似的模型,使用集成学习的技术优化检测效果。

3.4

快速精确的求解技术

在基于系统状态的方法中,需要在仅掌握配电网结构和参数不完全信息的情况下确保算法快速稳定地收敛。在基于数据驱动的方法中,需要对优化迭代算法的参数进行调整或改进。在基于博弈论的方法中,需要对大量用户数据中的用户用电量分布进行准确估计以及对纳什均衡进行快速求解。

4

研究展望

与大数据和能源互联网的发展趋势结合,未来的研究方向包括但不限于以下几点。

4.1

高效数据挖掘算法应用与研究

将异常检测的研究与流式实时分布式计算平台包括Spark和Storm等结合,并研究深度学习和其他新的统计学习、聚类方法在异常用电检测中的应用。

4.2

能量双向流动下的检测算法研究

在能源互联网时代,可再生能源以高渗透率接入配电网,随着分布式电源、储能和电动汽车在需求侧的普及,电能将在智能电表两端发生双向流动。精确的异常检测需要更好地理解用户在源储车接入时用电行为的变化机理和外在表现。

4.3

综合多种方法的全场景应用研究

许多NTL检测算法的应用场景有所不同,应有所区别,也可有机结合。实际中的检测者通常拥有配电网的量测数据和一定量的用户数据,在这种情况下,可以将几种方法综合在一起,构建一个更为系统的异常用电行为检测框架。

4.4

面向不同时间尺度的检测算法研究

电网公司、配电公司等检测者在实际中还掌握了用户的日电量、月度电量等不同时间尺度数据,探索其中的行为特征与规律,有利于降低异常用户定位工作的复杂度,提升整个检测过程的效率和准确率。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180925G08ARA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券