数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

中文大模型SuperCLUE测评:豆包紧追海外顶尖模型 小米两款模型入榜国产开源亮眼

2026-03-30来源:快讯编辑:瑞雪

在最新发布的中文大模型基准测评SuperCLUE中,22款国内外主流模型展开激烈竞争,测评结果引发行业广泛关注。本次测评围绕数学推理、科学推理、代码生成等六大核心任务展开,全面评估模型的综合能力,为技术发展提供了重要参考依据。

海外闭源模型在总分排名中继续占据优势地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包揽前三名,展现出强大的技术实力。值得注意的是,字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分的成绩紧随其后,与第三名GPT-5.4仅相差0.95分,成功跻身全球第一梯队。该模型在智能体任务规划维度表现尤为突出,甚至反超部分海外竞争对手,位列全球前五。

国内科技企业在此次测评中表现亮眼。小米集团推出的MiMo-V2系列两款模型均成功入围榜单,其中MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅,特别是在数学推理任务中取得84.03分的高分。另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后,但在代码生成等特定场景中展现出独特潜力,为开发者提供了新的选择。

开源赛道成为本次测评的一大亮点。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三名,在性能表现上大幅领先海外同类开源模型。这一成果不仅体现了国内企业在开源技术领域的积累,也为全球开发者社区贡献了重要力量,推动了行业技术的共同进步。

中兴老旗舰“逆袭”!骁龙8+配顶级三摄,512G大内存仅1450元
AXON中文名叫天机,是中兴最高端的产品线,所以该机当时发布的价格高达6299元,而且只有一款是行业定制的卫星通信版。 虽然该机是3年前的产品,处理器等核心配置已稍显落后,但毕竟曾经是超级机皇,整机的用料做…

2026-03-30

周鸿祎刘慈欣科幻大会激辩:AI时代人类如何定位,百亿智能体将至?
针对“普通人是否会沦为算法附庸”的担忧,刘慈欣表示,当AI接管大部分人类决策与社会运转时,探讨人类是进化还是退化已失去意义,因为文明的主体将发生改变,世界将不再受人类绝对控制。周鸿祎强调,在AI能够大规模生成…

2026-03-30

vivo X300 Ultra与X300s明日登场,影像性能双升级,规格亮点抢先看
vivo X300s一面影像旗舰,蔡司超清影像+蓝图原生色彩+蓝图调色盘+全场景追光人像;一面性能旗舰,144Hz6.78英寸电竞大直屏,视听触全面升级,超多X系列史上最强。 全新的vivo X300s则…

2026-03-30

磁吸扩容新体验!朗科HD10M2 Pr硬盘盒:让苹果存储焦虑秒变自由
其实早就更聪明的解决方案:把存储从「内置焦虑」变成「外置自由」,像朗科这款M.2 NVMe磁吸硬盘盒HD10M2 Pr,直接把扩容这件事玩成了「外挂级」体验——吸上就用,高速读写不拖后腿,容量想加多少自己说…

2026-03-30

2026年小屏手机怎么选?这六款旗舰各有绝活,闭眼入不踩雷
它在6.3英寸超视网膜XDR屏幕下,隐藏着性能溢出的A19Pro芯片和蒸发冷却技术,GPU性能提升30%,游戏稳定性堪称玄学。一加15T用强悍续航和极致性能打破了物理定律,荣耀Magic8ProAir则在薄如…

2026-03-30