SuperCLUE发布2026年3月中文大模型基准测评结果-AET-电子技术应用

SuperCLUE发布2026年3月中文大模型基准测评结果

日期： 2026-03-30

来源：快科技

关键词： 大模型 Anthropic Gemini OpenAI 字节跳动

3月30日消息，中文大模型基准测评SuperCLUE发布2026年3月最新结果，22款国内外主流模型参与角逐。

字节跳动旗下豆包（Doubao-Seed-2.0-pro-260215(high)）以71.53分拿下国内第一，成功跻身全球第一梯队；小米集团的MiMo-V2系列两款模型均顺利上榜。

本次测评覆盖数学推理、科学推理、代码生成等六大核心任务，全面检验模型综合能力。海外闭源模型依旧占据总分前列，Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。

豆包则紧随其后，总分仅与GPT-5.4相差0.95分，实现全方位追赶，在智能体任务规划维度更是反超部分海外模型，跻身全球前五。

小米此次有两款模型入选测评榜单，其中MiMo-V2-Pro以60.67分位列闭源模型前列，在数学推理任务中取得84.03分的亮眼成绩；开源版本MiMo-V2-Flash虽以49.97分排名靠后，但在代码生成等细分场景中表现出一定潜力。

测评还显示，国产模型整体表现亮眼，开源赛道尤为突出，Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三，大幅领先海外同类模型。

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

SuperCLUE发布2026年3月中文大模型基准测评结果

日期： 2026-03-30

来源：快科技

相关内容