基于内容引导异构双解码器的息肉图像分割-AET-电子技术应用

基于内容引导异构双解码器的息肉图像分割

网络安全与数据治理

王丽黎1 ,2 , 郑益聪1 , 郭东旭1 , 王振宁1

1. 西安理工大学自动化与信息工程学院; 2. 西安市无线光通信与网络研究重点实验室

摘要： 针对结直肠图像中息肉尺寸大小不一、边界模糊以及内窥镜图像清晰度受限等问题 , 提出了一种基于内容引导异构双解码器的特征融合网络 (HCGFNet) 。HCGFNet 中编码器网络采用异构多路径自适应特征融合模块 (HAF) , 通过异构多数据流更精准地捕获复杂肠道环境中隐匿的各类小型息肉与周边特征信息。解码器网络采用内容引导特征融合注意力机制 (CGFA) , 逐层处理解码阶段特征图中干扰信息 , 细化目标边缘分割效果并辅助重建灰度图。最终分别在 KvasirSEG、CVC-ClinicDB、CVC-ColonDB 息肉数据集上进行广泛对比 , 结果表明 , 所设计的 HCGFNet 相较于目前主流模型 , 在各项性能中均有提升。引入 HAF、CGFA 模块后 , 各项性能较基准模型提升 2% ~5% , 较最先进模型提升 1% ~2% 。

关键词： 医学图像分割结肠息肉异构多路径特征融合灰度重建

中图分类号 : TP391. 41 文献标志码 : A DOI :10.19358/j.issn.2097-1788.2026.02.005
中文引用格式 : 王丽黎 , 郑益聪 , 郭东旭 , 等. 基于内容引导异构双解码器的息肉图像分割 [J]. 网络安全与数据治理 , 2026 , 45
(2) : 34 -43.
英文引用格式 : Wang Lili, Zheng Yicong, Guo Dongxu, et al. Content-guided heterogeneous dual-decoder network for polyp image segmen- tation [J]. Cyber Security and Data Governance, 2026 , 45(2) : 34 -43.

Content-guided heterogeneous dual-decoder network for polyp image segmentation

Wang Lili1 ,2 , Zheng Yicong 1 , Guo Dongxu 1 , Wang Zhenning1

1. School of Automation and Information Engineering, Xi ′an University of Technology; 2. Key Laboratory of Wireless Optical Communication and Network Research

Abstract： In response to issues such as varying polyp sizes, blurred boundaries in colorectal images, and limited clarity in endoscopic images, this paper proposes a feature fusion network based on content-guided heterogeneous dual decoders (HCGFNet). In HCGFNet, the encoder net- work employs the proposed Heterogeneous Multi-path Adaptive Feature Fusion module (HAF) , which captures concealed small polyps and sur- rounding feature information in complex intestinal environments more accurately through heterogeneous multi-data streams. The decoder network utilizes the designed Content-Guided Feature Fusion Attention mechanism (CGFA) to process interfering information in feature maps during the decoding phase layer by layer, refining the segmentation of target edges and assisting in grayscale image reconstruction. Extensive comparative experiments conducted on the Kvasir-SEG, CVC-ClinicDB, and CVC-ColonDB polyp datasets demonstrate that the proposed HCGFNet outper- forms current mainstream models across various performance metrics. After incorporating the HAF and CGFA modules, performance improve- ments range from 2% to 5% compared to the baseline model and from 1% to 2% compared to state-of-the-art models.

Key words : medical image segmentation; colorectal polyps; heterogeneous multipath; feature fusion; grayscale reconstruction

引言

目前 , 结直肠癌是全球最常见的恶性肿瘤之一 , 其发病率和死亡率也在众多肿瘤中位居前列。肠息肉作为结肠癌前期主要病变因素 , 发现并切除可以有效阻断结直肠癌的发生 , 但结肠镜检查仍存在漏诊的现象 , 其中以锯齿状病变息肉 ( Sessile Serrated Lesions with dysplasia , SSL) 为主。由于 SSL 多数具备形状不规则、边界模糊、尺寸微小等特点 , 需要一个自动化系统辅助医生完成息肉检测。

传统医学图像分割术主要包括阈值法[1] 、区域生长法[2] 、边缘检测法[3] 以及基于聚类[4] 的分割算法等 , 但在实际临床诊断中 , 肠息肉常隐匿于肠道组织中 , 且表面易被粘液或粪便所覆盖 , 提取到的浅层特征不足以准确定位息肉。直到近年随着深度学习技术的飞速发展 , 全卷积网络 ( Fully Convolutional Networks, FCN) [5] 可通过像素级别的预测来分割息肉 , 然而 , 基于 FCN 的方法对细节特征恢复以及多尺度特征处理仍存在不足。自 2015 年 , 基于编解码器的网络模型因其卓越的性能 , 逐渐占据图像分割领域的主导地位 , 如 U-Net[6] 、U-Net + + [7] 和 ResUNet + + [8] 等 , 但在面临形状复杂、纹理模糊的微小型 SSL 息肉时 , 上述模型的分割性能依旧受限。在此前提下 , 对模型的提升应聚焦于捕捉息肉周围更多的上下文和语义信息。鉴于此 , Wang 等人[9]设计了多尺度特征融合单元 , 合并息肉的上下文信息与边界细节 , 从而使模型能够适应各种尺寸的息肉特征 ; Li 等人[10] 提出了 MSCFF-Net 模型 , 通过多尺度注意力机制抑制了图像背景噪声的干扰 ; Qin 等人[11] 提出了 FFA-Net, 通过引入空间注意力机制生成空间重要性图 , 该指标能够自适应地区分不同像素位置的重要级别 , 提升模型对重要特征提取能力的同时抑制并去除干扰信息 , 但并未考虑到解码阶段分配至每一特征层中的冗余信息 ; 为了抑制此干扰信息 , Chen 等人[12] 提出的 DEA-Net 对编码阶段特征进行优化 , 获得更加稳定的特征掩码。

基于以上研究 , 为了更好地捕捉 SSL 肠息肉 , 本文提出了一种新的肠镜息肉分割方法 , 该方法主要通过增强上下采样过程中多尺度特征的捕获能力以及对重要特征信息的还原来提高分割精度。本文贡献如下 :

(1) 提出一种基于内容引导异构双解码器结构的多尺度特征融合网络 ( Hetero-path Content Guidance Feature Fusion Net, HCGFNet) , 利用自编码器网络和注意力机制辅助模型对目标特征信息的捕捉与恢复 , 并通过跳跃连接充分融合低级空间信息与高级语义空间。

(2) 提出一种异构多路径自适应特征融合模块 (Hetero-path Adaptive Feature Fusion, HAF) , 利用多路并联的结构与注意力机制来精确提取息肉附近上下文特征信息 , 从而区分肠息肉与肠内壁。

(3) 提出一种内容引导特征融合注意力机制 (Content-Guided Feature Fusion Attention, CGFA) , 对每一条通道分配独一无二的重要性权重系数 , 实现对重要特征信息的引导。

在实验中添加各个模块后 , 均大幅提升了息肉边界的分割精度。在Kvasir-SEG、CVC-ClinicDB、CVC- ColonDB三个数据集中均取得了良好的效果。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000006987

作者信息：

王丽黎1 ,2 , 郑益聪1 , 郭东旭1 , 王振宁1

(1. 西安理工大学自动化与信息工程学院 , 陕西西安 710048 ;

2. 西安市无线光通信与网络研究重点实验室 , 陕西西安 710048)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容