| 基于上下文感知网络的场景图生成方法 | |
| 所属分类:技术论文 | |
| 上传者:wwei | |
| 文档大小:2561 K | |
| 标签: 场景图生成 消息传递 门控循环单元 | |
| 所需积分:0分积分不够怎么办? | |
| 文档介绍:场景图生成的核心任务是从图像中挖掘多目标间的结构化关系,其本质是对视觉数据要素的语义化组织与关联。现有方法在数据流通过程中未能充分筛选和利用目标上下文信息,导致关系预测的鲁棒性与精度受限。为此,提出消息上下文感知网络(MCAN),通过构建从粗到细的数据要素融合机制,提升场景图生成中上下文信息的质量与利用率。该模型利用门控循环单元(GRU)捕获目标间长程依赖关系,通过多头注意力机制实现上下文数据要素的细粒度筛选,并结合残差融合策略增强视觉表示的稳定性。在Visual Genome数据集上的实验表明,MCAN在三个子任务上平均性能提升2.1%,有效验证了其在多模态数据流通中的噪声抑制与信息增强能力。消融实验进一步揭示了各模块在数据要素融合中的贡献。 | |
| 现在下载 | |
| VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。 | |
Copyright © 2005-2024 华北计算机系统工程研究所版权所有 京ICP备10017138号-2