中文引用格式: 于重,许文静,安宁,等. 一种基于混合专家模型的多模态工单数据智能处理方法[J]. 电子技术应用,2025,51(9):1-10.
英文引用格式: Yu Zhong,Xu Wenjing,An Ning,et al. An intelligent processing method for multimodal work order data based on mixture of experts model[J]. Application of Electronic Technique,2025,51(9):1-10.
引言
智能工单系统的多模态数据分析与处理是提升业务系统数字化、智能化水平的关键步骤,承担着客户服务请求响应[1]、资源调度优化与业务流程协同的关键职能。然而,面对复杂业务场景中多模态数据分布不均、非结构化数据占比高、图像文字信息验证困难的特殊场景,现有工单系统存在分类效率低、数据清洗耗时长、跨模态验证准确率低的问题,严重制约了工单处理的自动化水平。
现阶段工单系统主要依赖单模态优化技术提升处理效率,但对多模态工单数据的协同处理能力较低。一方面,多源异构数据存在跨模态冗余与语义冲突,导致数据解析过程中关键信息漏检率偏高;另一方面,基于单模态处理的大语言模型难以有效捕捉跨模态关联特征,导致结构化表单生成数据精度偏低,严重制约了工单处理的智能化水平。
目前学术界在多模态数据处理领域取得阶段性进展:甘卓浩等[2]提出一种基于跨模态交互 Transformer 的多模态方面级情感分析模型,通过文本语义增强模块融合图像标题与原始文本以弥补情感语义缺失;聂佳莉等[3]提出了一种基于卷积神经网络和注意力机制模型的多模态特征融合波束赋形方法,以实现感知辅助的高可靠通信;此外,Kettenring[4]、Groves[5]和Martínez-Montes[6]等人也分别提出了不同的分析模型。然而,现有研究仍存在局限:一是跨模态冗余数据的协同利用率不足,关键信息漏检率高;二是多模态特征融合缺乏语义一致性保障,数据清洗与结构化生成环节割裂。
本文针对上述挑战提出系统性解决方案。首先,基于DeepSeekMoE架构设计多模态语义分析模型,分别构建面向语音、文本、图像数据的领域专家子网络,实现了跨模态数据的特征解耦与关键内容提取,完成非结构化数据的降噪清洗与语义增强。其次,提出基于Thinker-Talker的多模态特征融合架构,对异构数据的深层语义进行表征映射与冲突消解,实现多源特征的互补性验证,有效提升冗余数据利用率与语义一致性。最后,针对工单生成场景设计了非结构化数据清洗与结构化表单生成算法,动态抓取系统日志、设备状态等辅助信息,通过双向约束校验机制实现字段完整性验证与异常修正,最终输出符合相关标准的结构化工单。
本文结构如下:第1章介绍基于大语言模型的多模态数据处理技术的发展与技术现状;其次给出基于DeepSeekMoE架构的多模态语义分析模型;然后提出基于Thinker-Talker的双通道多模态特征融合架构;接着介绍了非结构化数据清洗与结构化表单生成算法在智能工单系统的实证应用;最后对提出的方法进行了消融实验验证其性能。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006679
作者信息:
于重,许文静,安宁,刘珠慧
(国务院国有资产监督管理委员会干部教育培训中心,北京 100053)

