《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 基于GAN和集成学习的电力系统网络入侵检测方法
基于GAN和集成学习的电力系统网络入侵检测方法
电子技术应用
张军,乔溢
国能(惠州)热电有限责任公司
摘要: 针对现有入侵检测方法在面临高维数据非线性关联和样本分布不均衡的网络监测数据时存在检测准确率低和对少数类攻击漏检率高的问题,提出一种基于生成对抗网络(GAN)与集成学习的电力系统网络入侵检测方法。首先,利用GAN生成与真实分布一致的合成攻击样本,有效缓解数据不均衡问题;其次,通过稀疏自编码器(SAE)对高维特征进行非线性降维,提取低维判别性特征以克服维度灾难;最后,构建Bagging集成学习框架,融合K-means、层次聚类和高斯混合模型(GMM)的异构基学习器,并采用DBSCAN元学习器对聚类结果进行二次分析,提升检测鲁棒性。基于KDD CUP99数据集的实验表明,所提方法在数据增强后使少数类样本占比从2.6%提升至17.7%,检测准确率达96.4%,误检率低至7.3%,尤其少数类关键攻击的召回率超过97.6%。相较于传统方法显著提升了复杂攻击场景下的检测性能,为电力系统网络安全防护提供了新思路。
中图分类号:TP309 文献标志码:A DOI: 10.16157/j.issn.0258-7998.256523
中文引用格式: 张军,乔溢. 基于GAN和集成学习的电力系统网络入侵检测方法[J]. 电子技术应用,2025,51(12):77-82.
英文引用格式: Zhang Jun,Qiao Yi. Intrusion detection for power system networks using GAN and ensemble learning[J]. Application of Electronic Technique,2025,51(12):77-82.
Intrusion detection for power system networks using GAN and ensemble learning
Zhang Jun,Qiao Yi
Guoneng (Huizhou) Thermal Power Co., Ltd.
Abstract: Current intrusion detection methods suffer from challenges such as non-linear correlations in high-dimensional data and severe class imbalance, resulting in high missed detection rates for rare attacks and poor generalization. To address these issues, this study proposes a hybrid approach combining generative adversarial networks (GAN) and ensemble learning. GAN generates synthetic attack samples aligned with real data distributions to mitigate imbalance, while a sparse autoencoder (SAE) reduces feature dimensions non-linearly, enhancing discriminative power. A Bagging ensemble framework integrates K-means, hierarchical clustering, and Gaussian mixture models (GMM), with DBSCAN meta-learning refining clustering outputs for robustness. Evaluations on the KDD CUP99 dataset demonstrate significant improvements: minority-class representation rises from 2.6% to 17.7%, achieving 96.4% accuracy, 7.3% false detection rate, and over 97.6% recall for critical attacks (e.g., U2R, R2L). This method outperforms traditional techniques, offering a novel solution for securing modern power systems against evolving cyber threats.
Key words : smart grid;intrusion detection;ensemble learning;generative adversarial network (GAN);feature selection

引言

随着电力系统智能化与网络化进程的加速,电力网络逐渐从物理隔离转向开放互联。远程监控、分布式控制等技术的应用显著提升了系统管理效率,但同时网络边界的扩展也引入了潜在的安全威胁。近年来针对电力系统的网络攻击事件频发,例如2015年乌克兰电网遭受的黑客攻击导致大规模停电,直接经济损失超千万美元;2019年巴西电力调度中心因恶意软件入侵引发区域性供电中断,暴露出电力系统网络防御的脆弱性。针对电力系统的网络攻击不仅威胁数据安全,更可能破坏电力设备、扰乱能源供应,甚至危及公共安全[1-2]。因此,构建高效、精准的网络入侵检测系统已成为保障电力系统稳定运行的关键。

目前国内外学者对网络入侵检测的研究主要可以分为无监督类方法、有监督类方法和半监督类方法三种。无监督类方法以K-means和DBSCAN等聚类算法为代表[3],通过对数据进行聚类分析实现异常检测,无需标注数据且部署便捷,但其性能受限于特征表征能力与专家经验,在实际场景中当面对异常模式动态变化时,该类方法的误检率可能超过15%[4]。有监督类方法以SVM和深度神经网络等方法为代表[5-6],通过标注样本训练分类模型,在数据充足条件下入侵检测准确率可超过90%,但是实际网络环境绝大部分时间均处于正常状态,异常样本稀缺且分布高度不均衡,在这种情况下有监督类方法由于得不到足够的异常样本进行模型训练会出现检测结果偏向多数类,对新型攻击的漏检率显著上升[7]。半监督类方法以OC-SVM和SVDD等方法为代表[8],通过正常样本训练决策边界,虽缓解了标注数据不足的问题,但仅能实现有无异常的判断,无法区分具体网络攻击类型,难以满足实际防护需求[9]。

根据上述已有研究,可以梳理出电力系统网络入侵检测面临的挑战在于三个方面:(1)高维性。单条网络数据通常包含协议类型、流量统计、主机行为等数十至数百维特征,直接建模易引发“维度灾难”,导致模型过拟合与计算效率低下[10]。(2)非线性。特征间存在复杂的交互关系(如时序依赖、协议状态转移),传统以PCA为代表的线性降维方法难以捕捉此类非线性模式,造成关键判别信息丢失[11]。(3)不均衡性。正常流量占比远远超过异常流量,攻击样本(如APT攻击、零日漏洞利用)极端稀缺,传统分类器倾向于将少数类误判为正常,严重威胁系统安全性[12]。

针对上述问题,本文提出一种基于生成对抗网络(Generative Adversarial Network, GAN)进行数据增强,联合稀疏自编码器(Sparse Auto Encoder, SAE)和Bagging集成学习的网络入侵检测方法。首先利用GAN合成少数类攻击样本,缓解数据不均衡问题;然后采用SAE通过多层非线性变换与稀疏约束,自适应挖掘高维数据中的低维判别特征从而解决非线性和高维性问题;最后设计基于Bagging的集成框架,融合K-means、层次聚类与高斯混合模型(Gaussian Mixed Model, GMM)的异构输出,通过DBSCAN元学习器进行二阶聚类分析,从而获得最终的检测结果。采用KDD CUP99数据集开展验证试验对所提方法的性能进行验证。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006880


作者信息:

张军,乔溢

(国能(惠州)热电有限责任公司,广东 惠州 516000)


subscribe.jpg

此内容为AET网站原创,未经授权禁止转载。