《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 基于联邦学习的加密流量分析研究
基于联邦学习的加密流量分析研究
网络安全与数据治理
崔又文1,2,冯千烨1,何云华1,高健桐1,2,单伯瑜1,2,刘馨妍1
1.北方工业大学信息学院;2.文脉联坊(北京)科技有限责任公司
摘要: 当今信息化时代背景下,加密流量呈爆炸式增长,其在保障了信息传输的安全性的同时,也给了不法分子可乘之机,对流量的分类、识别提出了前所未有的挑战,尽管传统的基于规则的识别方法和流级行为特征等方案能实现较高准确率的分类、识别,但在数据隐私和安全方面仍有待提升。着重研究基于联邦学习技术的网络加密流量识别系统,针对使用SSL/TLS进行加密的流量特征,提出了一种高效加密流量识别模型,主要通过特征提取和模型训练来实现对加密流量的准确分类,可以在不接触原始数据的前提下,进行信息共享和模型训练,通过加权平均策略获得准确的加密流量分析模型,有效监测夹杂在海量数据中的高危流量。在加密数据集上的实验有效验证了该方法的可行性。
中图分类号:TP309.2文献标识码:ADOI:10.19358/j.issn.2097-1788.2025.01.002引用格式:崔又文,冯千烨,何云华,等. 基于联邦学习的加密流量分析研究[J].网络安全与数据治理,2025,44(1):9-15,36.
Research on encrypted traffic analysis based on federated learning
Cui Youwen 1, 2, Feng Qianye 1, He Yunhua 1, Gao Jiantong 1, 2, Shan Boyu 1, 2, Liu Xinyan 1
1. School of Information Science and Technology, Northern Polytechnic University; 2. Wenmai Lianfang (Beijing) Technology Co., Ltd.
Abstract: In the era of informatization, the encrypted traffic is exploding. While ensuring the security of information transmission, it also gives criminals plenty of opportunities, and poses unprecedented challenges to the classification and identification of traffic. Although traditional rule-based identification methods and flow-level behavior characteristics can achieve higher accuracy classification and identification, it still needs to be improved in data privacy and security.This paper focuses on the network encryption traffic identification system based on federated learning. Aiming at the traffic characteristics encrypted by SSL / TLS, an efficient encryption traffic identification model is proposed. The model mainly realizes the accurate classification of encrypted traffic through feature extraction and model training. The scheme can carry out information sharing and model training without touching the original data. The accurate encrypted traffic analysis model is obtained by weighted average strategy, and the high-risk traffic mixed in massive data is effectively monitored. Experiments on encrypted data sets effectively verify the feasibility of the method.
Key words : encrypting traffic; federated learning; network security; network traffic classification

引言

随着信息化的快速发展,网络流量的安全性备受关注。近年来,随着 SSL/TLS 等流量加密算法的普及,加密流量比例已超过 90%。虽然加密技术提升了信息传输的安全性,但越来越多的恶意软件通过加密技术隐藏自己,引发了更多不可控的安全隐患。《中国互联网络发展状况统计报告》显示,截至2023年6月,我国互联网普及率更是高达76.4%[1],互联网企业对加密流量识别和检测的不重视给了不法分子更多可乘之机,如何保障安全的网络环境成为了当下的挑战。SSL/TLS协议是当下主流的加密算法之一,攻击者可以通过将恶意行为嵌入被 SSL/TLS 协议加密的内容中,对公众网络安全造成威胁。传统的基于端口号和深度包检测的流量分析方法在加密流量面前显得力不从心。在加密通信时代,学界积极探索新的技术路径,如杨旭提出的基于流量统计特征的分类方法,将流量外部统计特征与机器学习相结合,有效解决了伪装端口、加密流量等问题,为加密流量分类提供了新思路[2]。仝鑫等人提出的基于机器学习的加密流量分析方法,展示了该领域在特征工程、分类器模型等方面的研究进展,在一定程度上提高了加密流量识别的准确率[3]。此外,朱蓓佳等人提出的基于对比学习的加密流量检测技术,通过设计特定的检测方案来提高检测准确率和泛化性,但仍需在保障数据安全方面进一步探索[4]。在此情形下,迫切需求一种既能有效利用数据又能保障数据安全的新技术,联邦学习等技术应运而生,其核心优势在于可在不汇聚原始数据的前提下进行分布式建模,打破数据孤岛,实现数据隐私保护与高效利用的双重目标。面对这一问题,本研究认为,根据SSL/TLS分别在客户端与服务端相互认证等技术特点,使用分布式联邦学习进行本地监测成为了一种可行的方案。联邦学习的核心理念是在保证数据隐私安全及合法合规的基础上,利用各个节点完全掌握的数据共同建模,核心优势在于原始数据无需汇聚在中央服务器,在各个终端服务器即可进行训练和计算模型梯度信息,只将参数和梯度等信息上传至中央服务器,通过加权等方式整合最终模型,下发到各个服务器终端,从而有效打破数据孤岛,提升模型的效果。该方法不仅可以有效保护用户隐私,还可以综合大量数据使得系统对加密流量更加敏感,识别率大大提高。 本文研究了基于联邦学习技术的SSL/TLS加密流量识别,通过预处理网络流量数据,提取关键特征,并利用联邦学习框架训练模型,实现了高效的加密流量分类,同时保护了数据安全和用户隐私。实验结果表明,该方法在分类准确率、实时性和隐私保护等方面均优于传统方法。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006295


作者信息:

崔又文1,2,冯千烨1,何云华1,高健桐1,2,单伯瑜1,2,刘馨妍1

(1.北方工业大学信息学院,北京100144;

2.文脉联坊(北京)科技有限责任公司,北京100143)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。