《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 融合深度特征与强化学习的工控协议模糊测试方法
融合深度特征与强化学习的工控协议模糊测试方法
网络安全与数据治理
宗学军1,2,孙俊辉1,2,何戡1,2,史洪岩1,2,连莲1,2,宁博伟2,3
1. 沈阳化工大学 信息工程学院; 2. 辽宁省石油化工行业信息安全重点实验室 ; 3. 沈阳工业大学 人工智能学院
摘要: 针对工业控制协议漏洞挖掘存在协议语义理解不足 、变异策略单一的问题 , 提出一种融合深度特征与 强化学习的工控协议模糊测试方法—CTARFuzz。该方法通过 CTCA-Net 模型 , 提取协议结构与上下文特征 , 并引入注意力机制强化关键字段 , 提升测试用例多样性与接收率 。结合 Actor-Critic 强化学习模型 , 以 CTCA-Net 模型的输出特征驱动 Actor 网络选变异策略生成用例 , Critic 网络依据设备反馈动态优化策略 , 实现变异策略的 自适应优化 。实验在典型能源企业工业场景的攻防演练靶场上采用 Modbus TCP、EtherNet/IP 和 S7Comm 协议进 行验证 , 结果表明CTARFuzz 异常触发率优于其他方法 , 并拥有较高的接收率与多样性 , 在靶场多个设备中触发 异常 , 验证了 CTARFuzz 的适用性与有效性。
中图分类号 : TP393 文献标志码 : A DOI :10.19358/j.issn.2097-1788.2026.02.001
中文引用格式 : 宗学军 , 孙俊辉 , 何戡 , 等. 融合深度特征与强化学习的工控协议模糊测试方法 [J]. 网络安全与数据治理 ,
2026 , 45(2) : 1 - 11.
英文引用格式 : Zong Xuejun, Sun Junhui, He Kan, et al. Fuzzing test method for industrial control protocol based on deep feature and rein- forcement learning [J]. Cyber Security and Data Governance, 2026 , 45(2) : 1 - 11.
Fuzzing test method for industrial control protocol based on deep feature and reinforcement learning
Zong Xuejun1 ,2 , Sun Junhui1 ,2 , He Kan1 ,2 , Shi Hongyan1 ,2 , Lian Lian1 ,2 , Ning Bowei2 ,3
1. College of Information Engineering, Shenyang University of Chemical Technology; 2. Liaoning Key Laboratory of Information Security for Petrochemical Industry; 3. College of Artificial Intelligence, Shenyang University of Technology
Abstract: The vulnerability mining of industrial control protocol mainly has the problems of insufficient protocol semantic understanding and single mutation strategy. A fuzzing test method of industrial control protocol-CTARFuzz based on deep feature and reinforcement learning is pro- posed. This method extracts protocol structure and context features through CTCA-Net model, and introduces attention mechanism to strengthen key fields, so as to improve test case diversity and acceptance rate. Combined with the Actor-Critic reinforcement learning model, the output characteristics of the CTCA-Net model are used to drive the Actor network to select the mutation strategy to generate use cases. The Critic net- work realizes the adaptive optimization of the mutation strategy according to the dynamic optimization strategy of the device feedback. The ex- periment is verified by Modbus TCP, EtherNet/IP and S7Comm protocols on the attack and defense drill range of typical energy enterprise in- dustrial scenes. The results show that the abnormal triggering rate of CTARFuzz is better than other methods, and has a high acceptance rate and diversity. It triggers abnormalities in multiple devices in the range, which verifies the applicability and effectiveness of CTARFuzz.
Key words : fuzzing; industrial control protocol; convolutional neural network; reinforcement learning; temporal convolutional network

引言

工业 控 制 系 统  ( Industrial Control Systems, ICS )  在现代工业自动化中至关重要 , 广泛应用于制造业、 电力系 统 等 领 域[1] 。ICS 通 常 由 可 编 程 逻 辑 控 制 器  (PLC) 、分 布 式 控 制 系 统  ( DCS ) 、远 程 终 端 单 元  (RTU) 等 [2] 工控设备组成 , 设备之间通过工业控制协  议  (Industrial Control Protocol, ICP) 进行通信和控制。 随着工业互联网的发展 , ICS 逐步向开放网络架构转  型 [3] , 虽提升了系统的互联互通能力 , 却面临网络攻  击威胁 。例如 , 2025 年 5 月 巴基斯坦对印度发动大规  模网络攻击 , 导致印度国家电网工业控制系统受到攻  击 , 使印度约 70% 的电网瘫痪[4] 。

许多 ICP 设计之初并未充分考虑网络安全问题 , 其固有的脆弱性使得漏洞挖掘成为研究的重点[5] 。模 糊测试可通过变异协议报文并观察设备响应发现未知 漏洞[6] , 然而 , 传统的模糊测试在应用于 ICP 时面临 着多样性不足和接收率低等问题[7] 。

近年来 , 深度 学 习[8] 和 强 化 学 习[9] 在 漏 洞 挖 掘 领域展现出强大潜力 。Cheng 等 [10] 提出 MSFuzz, 利 用大型语言模型  ( Large Language Models, LLM) 理 解协议语法结构 , 生成符合协议规范的测试用例 , 但 模型训练依赖有限的协议样本 。Yang 等[11] 提出 WG- GFuzz, 利 用 生 成 对 抗 网 络   ( Generative Adversarial Network , GAN) 生成测试用例 , 但过度依赖特定协 议的格式和状态特征且普适性不足 。Che 等 [12] 提出 了一种基于信息理论的模糊测试方法 , 通过协议结构 解析算法和基于遗传算法生成测试用例 , 但对训练数 据的质量和数量有一定依赖 。Wanyan 等 [13] 提出了基 于协议特征的变异方法 , 利用非关键字段的变异与测 试用例组合技术 , 减少了冗余输入的生成 , 但接收率 不足。

当前 , 针对工控协议的特征提取存在一些不足 , 单一的深度学习模型不能准确提取特征 。卷积神经网  络  (Convolutional Neural Networks, CNN) [14] 虽能捕捉  协议字段局部组合模式 , 但无法建模长距离时序依赖。 时 序 卷 积 网 络   ( Temporal  Convolutional  Network, TCN) [15] 可通过因果卷积与膨胀卷积覆盖长时序 , 但  对关键语义字段关注度不足 。因此 , 本文通过 CTCA- Net 模型提取特征 。不同于单一模型的局限性 , CTCA- Net 采用融合设计思路 , CNN 捕捉协议报文的局部结  构特征 , TCN 建立字段间的长时序依赖关系 , 再通过  注意力机制对关键语义字段进行强调 , 最终实现特征  提取性能的提升。

综上 , 本文提出了一种融合深度特征与强化学 习的工 控 协 议 模 糊 测 试 方 法 。本 文 主 要 贡 献 概 括 如下 :

(1) 提出 CTCA-Net 模型提取协议深层特征 , 解 决传统方法对协议语义理解不足的问题 , 提升测试用 例接收率与多样性。

(2) 设计 Actor-Critic 强化学习框架 , 实现变异策 略自主优化 , 解决传统变异策略单一问题 , 提升测试 效率。

(3) 采用 Modbus TCP、EtherNet/IP 和 S7Comm 协 议评估 CTARFuzz 性能 , 与现有模糊测试方法相比 , CTARFuzz 拥有较高的异常触发率 , 验证了其在不同协 议与设备中的适配性及实用性。


本文详细内容请下载:

http://www.chinaaet.com/resource/share/2000006983


作者信息:

宗学军1 ,2 , 孙俊辉1 ,2 , 何   戡1 ,2 , 史洪岩1 ,2 , 连   莲1 ,2 , 宁博伟2 ,3

(1. 沈阳化工大学    信息工程学院 , 辽宁   沈阳    110142 ; 

2. 辽宁省石油化工行业信息安全重点实验室 , 辽宁    沈阳    110142 ;

3. 沈阳工业大学   人工智能学院 , 辽宁    沈阳    110870)

2.jpg

此内容为AET网站原创,未经授权禁止转载。