引言
随着网络信息技术快速发展,各行业数字化建设不断推进,数据将逐步从信息化资产向生产要素转变,数据流转更加频繁。在数据开发、测试、生产、管理等过程中,数据传输链路长、参与人数多等客观情况给数据安全带来挑战。因此,如何降低信息安全风险,消除敏感信息泄露的威胁成为学者广泛关注的问题。
数据脱敏技术通过预设方法对敏感信息进行数据变形,是解决上述问题的有效方法。文献[1]将RSA非对称加密标准与传统MD5方法相结合,应用于云计算的完整性校验和加密过程,有效解决信息泄露问题,但破坏了原有数据结构,导致脱敏后数据难以直接利用。文献[2]采用同态加密策略,实现了对过程工业中重要参数的脱敏,一定程度上保留了数据的原始信息,但加解密过程存在对密文数量的限制。实际上,民航领域广泛存在需要保留原有数据格式的业务处理场景。
保形加密(FormatPreserving Encryption, FPE)的提出为解决上述问题提供了思路。保形加密后的密文具有与原文相同的格式特征,能在脱敏的同时尽可能满足数据分析的需求。文献[3]针对大数据场景,以Hadoop平台为基础,设计了基于传统FPE算法的数据脱敏系统。文献[4]针对数值型数据,在此基础上改进,替换FPE中常采用的CycleWalking策略,显著提升了算法性能,使其在大规模脱敏的场景中更具优势。文献[4]将FPE算法引入特征识别领域,用于生物特征身份验证系统中的数据保护,在保留原始数据结构的同时,有效降低信息泄露风险。但民航旅客数据量大,高频、涉敏字段多,且各字段之间存在关联,如果获取到大量数据,仍存在被逆推破解的风险。
针对传统FPE的安全性问题,文献[5]将改进的FPE应用于民航领域,考虑到字段之间的关联关系,计算出各字段之间的关联度,据此筛选相关字段脱敏,增加了由密文逆推明文的难度,一定程度上提高了安全性。从本质上讲,FPE要求数据脱敏前后有唯一的对应关系,导致攻击者在没有准确FPE密钥的情况下,可以根据大量明密文对应数据将脱敏数据重标识化,这一特点限制了其安全性上限[6]。针对此问题,文献[7]提出一种基于泛化FPE的动态脱敏方法,打破了传统FPE中明密文唯一映射关系,有效提高民航旅客信息的安全性,然而对于需要解密的场景,由于同一密文可能对应多个原文,此方法无法准确还原数据。
综上,本文基于FPE技术,结合民航旅客信息的应用场景,从改变单一解密密钥角度出发,根据数据特点,筛选出非敏感的必要字段,并据此赋值调整因子T,在保留原数据格式的前提下,建立数据明密文多对一的映射关系。在提升数据安全性的同时,根据需求能够有效还原数据原值,在民航领域具备更强场景适配能力。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006861
作者信息:
杜宇浩,王保国,谭玲,胡楠
(中国航空结算有限责任公司, 北京101300)

