融合深度特征与强化学习的工控协议模糊测试方法-AET-电子技术应用

融合深度特征与强化学习的工控协议模糊测试方法

网络安全与数据治理

宗学军1,2,孙俊辉1,2,何戡1,2,史洪岩1,2,连莲1,2,宁博伟2,3

1. 沈阳化工大学信息工程学院; 2. 辽宁省石油化工行业信息安全重点实验室 ; 3. 沈阳工业大学人工智能学院

摘要： 针对工业控制协议漏洞挖掘存在协议语义理解不足、变异策略单一的问题 , 提出一种融合深度特征与强化学习的工控协议模糊测试方法—CTARFuzz。该方法通过 CTCA-Net 模型 , 提取协议结构与上下文特征 , 并引入注意力机制强化关键字段 , 提升测试用例多样性与接收率。结合 Actor-Critic 强化学习模型 , 以 CTCA-Net 模型的输出特征驱动 Actor 网络选变异策略生成用例 , Critic 网络依据设备反馈动态优化策略 , 实现变异策略的自适应优化。实验在典型能源企业工业场景的攻防演练靶场上采用 Modbus TCP、EtherNet/IP 和 S7Comm 协议进行验证 , 结果表明CTARFuzz 异常触发率优于其他方法 , 并拥有较高的接收率与多样性 , 在靶场多个设备中触发异常 , 验证了 CTARFuzz 的适用性与有效性。

关键词： 模糊测试工业控制协议卷积神经网络强化学习时序卷积网络

中图分类号 : TP393 文献标志码 : A DOI :10.19358/j.issn.2097-1788.2026.02.001
中文引用格式 : 宗学军 , 孙俊辉 , 何戡 , 等. 融合深度特征与强化学习的工控协议模糊测试方法 [J]. 网络安全与数据治理 ,
2026 , 45(2) : 1 - 11.
英文引用格式 : Zong Xuejun, Sun Junhui, He Kan, et al. Fuzzing test method for industrial control protocol based on deep feature and rein- forcement learning [J]. Cyber Security and Data Governance, 2026 , 45(2) : 1 - 11.

Fuzzing test method for industrial control protocol based on deep feature and reinforcement learning

Zong Xuejun1 ,2 , Sun Junhui1 ,2 , He Kan1 ,2 , Shi Hongyan1 ,2 , Lian Lian1 ,2 , Ning Bowei2 ,3

1. College of Information Engineering, Shenyang University of Chemical Technology; 2. Liaoning Key Laboratory of Information Security for Petrochemical Industry; 3. College of Artificial Intelligence, Shenyang University of Technology

Abstract： The vulnerability mining of industrial control protocol mainly has the problems of insufficient protocol semantic understanding and single mutation strategy. A fuzzing test method of industrial control protocol-CTARFuzz based on deep feature and reinforcement learning is pro- posed. This method extracts protocol structure and context features through CTCA-Net model, and introduces attention mechanism to strengthen key fields, so as to improve test case diversity and acceptance rate. Combined with the Actor-Critic reinforcement learning model, the output characteristics of the CTCA-Net model are used to drive the Actor network to select the mutation strategy to generate use cases. The Critic net- work realizes the adaptive optimization of the mutation strategy according to the dynamic optimization strategy of the device feedback. The ex- periment is verified by Modbus TCP, EtherNet/IP and S7Comm protocols on the attack and defense drill range of typical energy enterprise in- dustrial scenes. The results show that the abnormal triggering rate of CTARFuzz is better than other methods, and has a high acceptance rate and diversity. It triggers abnormalities in multiple devices in the range, which verifies the applicability and effectiveness of CTARFuzz.

Key words : fuzzing; industrial control protocol; convolutional neural network; reinforcement learning; temporal convolutional network

引言

工业控制系统 ( Industrial Control Systems, ICS ) 在现代工业自动化中至关重要 , 广泛应用于制造业、电力系统等领域[1] 。ICS 通常由可编程逻辑控制器 (PLC) 、分布式控制系统 ( DCS ) 、远程终端单元 (RTU) 等 [2] 工控设备组成 , 设备之间通过工业控制协议 (Industrial Control Protocol, ICP) 进行通信和控制。随着工业互联网的发展 , ICS 逐步向开放网络架构转型 [3] , 虽提升了系统的互联互通能力 , 却面临网络攻击威胁。例如 , 2025 年 5 月巴基斯坦对印度发动大规模网络攻击 , 导致印度国家电网工业控制系统受到攻击 , 使印度约 70% 的电网瘫痪[4] 。

许多 ICP 设计之初并未充分考虑网络安全问题 , 其固有的脆弱性使得漏洞挖掘成为研究的重点[5] 。模糊测试可通过变异协议报文并观察设备响应发现未知漏洞[6] , 然而 , 传统的模糊测试在应用于 ICP 时面临着多样性不足和接收率低等问题[7] 。

近年来 , 深度学习[8] 和强化学习[9] 在漏洞挖掘领域展现出强大潜力。Cheng 等 [10] 提出 MSFuzz, 利用大型语言模型 ( Large Language Models, LLM) 理解协议语法结构 , 生成符合协议规范的测试用例 , 但模型训练依赖有限的协议样本。Yang 等[11] 提出 WG- GFuzz, 利用生成对抗网络 ( Generative Adversarial Network , GAN) 生成测试用例 , 但过度依赖特定协议的格式和状态特征且普适性不足。Che 等 [12] 提出了一种基于信息理论的模糊测试方法 , 通过协议结构解析算法和基于遗传算法生成测试用例 , 但对训练数据的质量和数量有一定依赖。Wanyan 等 [13] 提出了基于协议特征的变异方法 , 利用非关键字段的变异与测试用例组合技术 , 减少了冗余输入的生成 , 但接收率不足。

当前 , 针对工控协议的特征提取存在一些不足 , 单一的深度学习模型不能准确提取特征。卷积神经网络 (Convolutional Neural Networks, CNN) [14] 虽能捕捉协议字段局部组合模式 , 但无法建模长距离时序依赖。时序卷积网络 ( Temporal Convolutional Network, TCN) [15] 可通过因果卷积与膨胀卷积覆盖长时序 , 但对关键语义字段关注度不足。因此 , 本文通过 CTCA- Net 模型提取特征。不同于单一模型的局限性 , CTCA- Net 采用融合设计思路 , CNN 捕捉协议报文的局部结构特征 , TCN 建立字段间的长时序依赖关系 , 再通过注意力机制对关键语义字段进行强调 , 最终实现特征提取性能的提升。

综上 , 本文提出了一种融合深度特征与强化学习的工控协议模糊测试方法。本文主要贡献概括如下 :

(1) 提出 CTCA-Net 模型提取协议深层特征 , 解决传统方法对协议语义理解不足的问题 , 提升测试用例接收率与多样性。

(2) 设计 Actor-Critic 强化学习框架 , 实现变异策略自主优化 , 解决传统变异策略单一问题 , 提升测试效率。

(3) 采用 Modbus TCP、EtherNet/IP 和 S7Comm 协议评估 CTARFuzz 性能 , 与现有模糊测试方法相比 , CTARFuzz 拥有较高的异常触发率 , 验证了其在不同协议与设备中的适配性及实用性。

本文详细内容请下载：

http://www.chinaaet.com/resource/share/2000006983

作者信息：

宗学军1 ,2 , 孙俊辉1 ,2 , 何戡1 ,2 , 史洪岩1 ,2 , 连莲1 ,2 , 宁博伟2 ,3

(1. 沈阳化工大学信息工程学院 , 辽宁沈阳 110142 ;

2. 辽宁省石油化工行业信息安全重点实验室 , 辽宁沈阳 110142 ;

3. 沈阳工业大学人工智能学院 , 辽宁沈阳 110870)