文献标识码: A
DOI:10.16157/j.issn.0258-7998.2018.S1.058
0 引言
随着人们用电需求的不断提升和社会的快速发展,对供电企业的供电服务质量的要求越来越高。然而,目前大部分的电力企业在供电服务方面仍然存在许多不足,其中配网抢修作为影响用户用电体验的一项电力主营业务,仍然停留在传统的以用户为主要发起人的被动抢修模式。如何提前发现电网系统薄弱环节,提前精准预测配网抢修高危区域,采取相应措施有效降低配网故障率,事前做好抢修准备,是电力企业急需解决的一个问题。
为加快电网发展、全力确保电力可靠供应,本文深入研究配网故障预测理论方法,利用大数据挖掘技术,基于电力故障抢修历史数据,以特殊时期、天气、温度、设备老化情况、负荷率等作为扰动因数,研究了一套基于具扰动特性的滚动基值法的配网抢修高危区域预测体系,并应用于国网山东省电力公司,对某一区域未来3天及某一特定时期的配网抢修工单数量进行预测,实现对配网抢修的提前预测。根据预测结果指导优化配网结构和配网抢修工作的精准化管理,切实促进电网发展,提升供电服务质量。
1 样本数据预处理
从95598业务应用系统、营销业务应用系统等电力业务应用系统中获取原始数据,因原始数据存在数据缺失、数据不合规等问题,需要对数据做进一步的清洗,然后对数据进行分类与统计。
1.1 样本数据部门范围
样本数据部门包括山东省17个市级供电公司、171个区县级供电单位和394个工单数抢修部门。
1.2 样本数据时间范围
样本数据时间范围如表1所示。

因特殊时期抢修为活跃期,所以选取春节保电期间各部门的抢修单数量,时间范围选取了3年的春节前后的2~3个月。
1.3 数据列名称
原始数据中对项目研究有意义的列名称有:统计周期、上级单位、供电单位、工单数原因、处理部门、工单数排除时间、是否退单。
1.4 样本数量
(1)总样本数量:根据设定的部门范围和时间范围,满足条件的总样本数量共计357 862条。
(2)坏样本数量:将取值范围异常、工单数原因为偶发事件的数据定义为坏样本数据,这部分数据不可预测,也不应该包含在预测样本中。
①是否退单字段值为审核不通过、退单、空白;
②工单数原因字段值为盗窃、计划停限电、客户误报、鸟害等小动物、停限电、外部火灾、外部异物外力破坏、外力因素、小动物、车辆、树线矛盾、树枝搭挂、自然因素、空白;
③抢修总时长字段值在小于5 min或大于1 440 min的。
据统计,该部分数据记录共计73 343条,应该从样本数据中剔除。
(3)有效样本数量
有效样本数量=总样本数量-坏样本数量=284 519条。
1.5 分部门样本数量
(1)市级供电公司
山东省电网公司共设有17个市级供电公司,其有效样本数据量如表2所示。

(2)区县级供电公司
经统计,全省共171个区县级供电单位含有效工单数据,由于篇幅限制,其数据的具体分布不在这里展示。
(3)处理部门
经统计,全省共394个抢修部门含有效工单数据,由于篇幅限制,其数据的具体分布不在这里展示。
2 数据分析及模型算法
2.1 数据分析
在研究数据分布及特点阶段,尝试了采用多种维度、多个方向的模型技术对数据进行分析,包括大数据模型等,结果显示:部分模型由于模型本身限制不适用于该问题的解决,部分模型由于数据样本不足限制了模型性能的发挥。
通过MATLAB软件对各市级供电公司、区县级供电单位以及抢修部门抢修工单进行的数据可视化分析,各单位的抢修工单数量总是在一段时间内围绕某一基准进行小范围波动,并不时有少部分波动范围较大的点出现。
选取2015年除夕前后各7天的数据进行分析,其中部分单位数据变化情况展示如下。
(1)市级供电公司举例
济南供电公司工单数量变化曲线图如图1所示,数据统计表如表3所示。


分析得出,有70%~80%的工单数量围绕在平均工单数量上下波动,波动值在平均工单数的上下20%~30%之间,另有部分波动值超过了30%,引起这种极端波动的主要原因是天气恶劣、设备老化、用户原因。
2.2 预测模型分析
根据2.1小节的数据分析可以得出如下结论:
(1)抢修单数量在某一时间段内通常会有一固定的均值;
(2)时间段不同,均值不同;
(3)通常情况下抢修单数量都在围绕这一均值上下波动;
(4)在有恶劣天气扰动情况下,抢修工单数量值会有一个大的波动,产生一个极值;
(5)如果有设备老化问题、用户管理等问题,在遇到恶劣天气时,极值的幅度通常会更大。
由上述结论,可以用如下模型来预测某一天的工单数量:

其中,Wpre为某一天的工单数量的预测值;Wba为样本空间内剔除所有极值后的工单数量平均值;Wco为围绕基值的随机波动值;Qmax为样本空间内所有极值的最大值;Dco为扰动系数,包括恶劣天气、设备老化、用户管理等问题引起的工单数变化。
上述模型被称为具扰动特性的滚动基值法。扰动是指恶劣天气、设备老化、用户管理等扰动因素对预测结果有显著的影响;滚动是指基于在一定时期内设备的状态及管理水平等不会出现大的变化情况下始终使用前N天数据作为样本空间;基值是指在无扰动情况下抢修工单的平均值。
2.3 算法分析
为便于工程计算,需要对具扰动特性的滚动基值法公式(式(1))、参数进行必要的说明和改进。
(1)基值Wba计算方法
① 预测日的前N天数据构建样本空间,N>10。
② 计算样本空间内工单数量平均值。
③ 定义工单数量超出平均值P%的数据为极值Q,统计出Q的个数T。
④ 从样本空间中剔除这些极值数据Q,样本空间的长度变为N-T。
⑤ 向前增加T天数据,补齐长度为N的样本空间。
⑥ 返回步骤②继续,直至样本空间内不再有极值,此时的样本空间称为有效样本空间。
⑦ 基值Wba等于有效样本空间内工单数的算术平均值。
(2)随机波动值Wco计算方法
① 在有效样本空间内找出最大工单数,与基值的差记为D。
② 定义S是在[-1,1]区间上的随机数。
③ Wco=D×S。
(3)Qmax极值的最大值计算方法
计算基值Wba时剔除掉的所有极值中最大值。当没有极值时取Wba×(1+P%)作为Qmax。
(4)Dco:扰动系数计算方法
①扰动因素分析
影响抢修工单数量变化的扰动因素很多,天气、气温、设备老化、负荷率、用户设备、用户管理等都能引起工单数量的波动,有时波动幅度甚至很大。在这些扰动因素当中,天气和气温的影响最为明显,而且还会扩大其他扰动因素的作用,例如,恶劣天气会导致负荷增加,而负荷增加又会让设备老化的问题更为严重,综上分析,这里只讨论天气和温度对工单数量的影响。
根据历史天气预报数据,单独挑选出了恶劣天气时的数据,如表4~表6所示,表中的变化率是恶劣天气当天的工单数量与基值的比值,这里只列出了部分单位的统计结果。



· 市级供电公司
· 区县级供电单位
· 抢修部门
由表可见,天气变化对工单数量有着直接的影响,工单数量的变化与天气恶劣程度相对应,天气越恶劣,工单数量越多。
② 扰动系数Dco的计算
定义H为天气恶劣程度,恶劣程度是雨、雪、风、气温的综合考量,取值范围为0~100,那么扰动系数Dco的计算公式为:

3 风险预警等级划分
国家电网电力安全事故等级划分是将电网运行风险预警分为4个等级:一级红色预警、二级橙色预警、三级黄色预警和四级蓝色预警。参照这一划分原则,按照供电单位日抢修工单数量多少,对抢修工作所面临的压力进行风险预警,也可分为4个等级,分别是一级红色预警、二级橙色预警、三级黄色预警和四级蓝色预警。预警等级划分的定义可以考虑两种方式:正态分布划分和绝对值分布划分。
3.1 正态分布划分
正态分布是自然界、人类社会、心理和教育等领域连续随机变量概率分布的一种,尤其是从管理学角度来看,正态分布的两端小、中间多的规律满足人们的心理预期。根据正态分布原理,假定一级预警占比例a%、二级预警占比例b%、三级预警占比例c%、四级预警占比例d%,则17个市级供电单位预警情况如表7所示,171个区县级供电单位预警情况如表8所示,394个抢修部门预警情况如表9所示。



3.2 绝对值分布划分
绝对值分布划分是根据日抢修单数量的绝对值多少划分预警等级。表10~表12分别为地市级供电单位、区县级供电单位和抢修单位等级划分方法,其中Y为日抢修工单数量,N11、N12、N13、N21、N22、N23、N31、N32、N33为各等级区间边界值。



4 算法模型验证
为验证预测算法的准确性,选取2017年除夕前后(2016年11月27日至2017年2月27日)的有效数据进行验证。
4.1 地市级供电单位
按正态分布划分预警等级,取a=20,b=30,c=30,d=20,分别预测2017年1月1日、2017年1月10日、2017年1月27日(除夕)和2017年2月22日的抢修工单数量,表13中的正确率是各等级预测值与当日实际值的比较。

4.2 区县级供电单位
对部分区县级供电单位进行预测,选取了除夕特殊日类型和晴天、恶劣天气两种不同的天气类型,由于不是全部区县,因此不能划分预警等级,通过准确率函数来进行验证,其计算为:

预测结果如表14所示。

4.3 抢修单位
抢修单位的预测验证采用与区县级供电单位相同的方法,结果如表15所示。

5 结束语
本文利用大数据挖掘分析技术研究了一套具扰动特性的滚动基值法的配网抢修工单预测算法,该方法利用历史数据、天气数据、特定时期等特征因子,通过算法模型的不断训练与完善,实现了对未来一天的抢修工单量的预测,准确率高达80%,对实际的电力故障抢修服务工作的开展起到了强有力的指导作用,是进一步提升电网企业供电服务质量的催化剂。
参考文献
[1] 邵峰晶, 于忠清, 王金龙,等. 数据挖掘原理与算法[M]. 北京: 中国水利水电出版社,2005.
[2] 赵志刚,张文杰,安宏宇,等. 配网主动抢修关键技术研究与应用[J]. 科技创新与应用,2017(5):177.
[3] 蔡金锭,鄢仁武. 基于小波分析与随机森林算法的电力电子电路故障诊断[J].电力科学与技术学报,2011,26(2): 54-60.
[4] (美)P.M安德逊. 电力系统故障分析[M]. 王际强,胡冰清,任震,等,译. 电力工业出版社,1980.
作者信息:
刁柏青1,姚 刚1,潘 筠1,孟祥君1,于善海2,史双双2,李 剑2
(1. 国网山东省电力公司运监中心,山东 济南 250001;
2. 山东鲁能软件技术有限公司,山东 济南250001)
