扩散模型的推理端优化：可控性与加速的方法综述-AET-电子技术应用

扩散模型的推理端优化：可控性与加速的方法综述

电子技术应用

赵家池，张杰

宁波大学信息科学与工程学院

摘要： 扩散模型在图像、语音与科学计算中表现优异，但工程部署常受两类瓶颈约束：一是推理可控性不足，条件对齐易因随机性与时间步离散误差而波动；二是推理开销偏高，多轮的采样会大量增加时延。聚焦推理端优化，围绕可控性与效率两条主线，对近年代表性工作进行系统梳理，强调在不改动模型与数据的前提下，通过对扩散推理过程的约束与择优，在少步与极少步条件下同时提升条件对齐与细节稳定，并显著降低时延。同时概述了具备迁移性的应用场景。最后，提出面向应用级部署的展望，追求速度、覆盖与质量的统一提升。

关键词： 扩散模型推理优化可控性效率

中图分类号：TP391 文献标志码：A DOI: 10.16157/j.issn.0258-7998.257410
中文引用格式： 赵家池，张杰. 扩散模型的推理端优化：可控性与加速的方法综述[J]. 电子技术应用，2026，52(6)：35-40.
英文引用格式： Zhao Jiachi，Zhang Jie. A survey of inference-time optimization in diffusion models: controllability and acceleration[J]. Application of Electronic Technique，2026，52(6)：35-40.

A survey of inference-time optimization in diffusion models： controllability and acceleration

Zhao Jiachi，Zhang Jie

College of Information Science and Engineering，Ningbo University

Abstract： Diffusion models show strong performance in images, speech, and scientific computing. Practical deployment, however, faces two bottlenecks: limited controllability at inference and high inference cost. Conditional alignment can fluctuate due to sampling randomness and time-step discretization. Multi-step sampling also increases latency. This survey focuses on Inference-Time Optimization (ITO). We organize recent work along two axes: controllability and efficiency. Without changing the pretrained backbone or the data, ITO uses constraint, scheduling, and selection strategies to improve conditional alignment and detail stability under few-step or one-step budgets, while reducing latency. We also outline transferable application scenarios. Finally, we present deployment-oriented prospects that aim to improve speed, coverage, and quality in a unified manner.

Key words : diffusion models；inference-time optimization （ITO）；controllability；efficiency

引言

扩散模型[1-3]以“逐步加噪-去噪”的可逆随机过程为核心，近年来在图像、语音以及多类科学计算任务中展现出甚至超越传统生成范式的质量与稳健性。然而，其实际应用仍受两方面制约。其一是推理可控性：虽然模型能够较好逼近数据分布，但在条件分布对齐上不稳定，迭代生成过程的随机性也可能导致样本质量波动，对观测噪声与分布漂移较为敏感。其二是时延与资源开销：多步去噪天然带来大量网络前向与时延，使得其在实时与边缘设备场景中部署面临挑战。

围绕上述挑战，部分研究尝试从训练侧[4]缓解：例如通过更强的条件信号、数据与监督增强等，该方式已经证明确实可带来平均增益；但随规模与重训成本上升，该策略边际收益趋缓。另一些方向通过在潜空间[5]进行扩散和压缩表示来降低单步计算代价，但从本质上并未摆脱多轮采样所带来的整体时延与资源需求。

相较之下，推理优化更具部署友好性与场景可迁移性：一类面向可控性的策略通过无需外部判别器的引导、借助外部表征或任务评分的弱反馈，以及并行择优与重采样，提升条件对齐；另一类面向效率的策略则在既定设计空间内重整时间表与参数化、采用少步求解，并将多步轨迹压缩为少步乃至一步，显著降低时延与开销。基于此，本文以可控性提升与效率提升为两条主线，系统梳理具有代表性的思路与进展，为扩散模型的应用部署提供指导。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000007101

作者信息：

赵家池，张杰

（宁波大学信息科学与工程学院，浙江宁波 315211）

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容