数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

GLM-5开源登场:从代码模拟到生态闭环,国产AI开启智能体工程新纪元

2026-02-12来源:快讯编辑:瑞雪

互联网上关于神秘模型“Pony Alpha”的猜测持续发酵一周后,谜底终于揭晓——这款引发诸多讨论的模型,正是智谱 AI 推出的 GLM-5,它被视作智谱 AI 在春节期间放出的“大招”,并且一登场便直接开源,这一举措在 AI 领域引发了广泛关注。

在测试环节,GLM-5 展现出了惊人的能力。当被要求创建一个交互式的 HTML、CSS 和 Java 卫星系统模拟程序,模拟卫星向地面接收器发送信号的过程时,它没有立刻给出代码,而是稍作“停顿”,模拟思考过程后,生成了一个符合要求的 HTML 网页。在这个网页中,卫星不仅围绕地球运行,信号传输还带有符合多普勒效应视觉隐喻的波纹扩散动画,这表明它理解了模拟背后的物理规律,而不仅仅是完成简单的绘图任务。

进一步加大难度,测试人员提出了一个抽象的 Python 任务:可视化展示单行道中交通信号灯的工作原理,车辆以随机速率进入。不到 3 分钟,GLM-5 就生成了一个动态的交通流模拟图。绿灯时车辆放行,红灯时车辆排队,车辆加速减速的随机性也得到了很好的模拟,不过界面设计稍显简陋。

GLM-5 的出色表现吸引了众多网友参与测试。网友 @anurudhsharmaa 仅用一行提示词,就让它生成了一个具有审美感的网站;网友 @zakarinoo7 则生成了一个全功能的媒体播放器,支持 MP4/MP3 解码、播放列表管理,还具备深色模式 UI,编译后仅有 15MB。

在更复杂的测试中,测试人员让 GLM-5 打造一个火柴人开放世界游戏。它没有急于编写代码,而是像人类一样,从技术栈、核心玩法、世界风格等方面逐步对接需求。在开发过程中,测试人员不断提出新的想法,如增加经济系统、动作元素、背包 UI 以及与 NPC 对话功能等,GLM-5 都能一一满足。最终运行效果令人满意,游戏体验尽善尽美。

GLM-5 在系统打造方面也有出色表现。有人让它打造一个 Mac 系统,虽然整体有些粗糙,但经典的屏幕背景、顶部状态栏的时间同步显示以及底部 Dock 栏的图标排列都得以呈现,而且每个应用都能打开。

基准测试结果显示,GLM-5 在 Coding 与 Agent 能力上取得了开源领域的最优表现。在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认难度极高的编程榜单中,GLM-5 分别获得了 77.8 和 56.2 的高分,在真实编程场景中的体验已无限接近 Claude Opus 4.5。

GLM-5 之所以能取得如此优异的成绩,得益于其独特的技术架构。它采用了 MoE 架构和异步强化学习(Asynchronous RL),总参数量为 744B,激活参数仅 40B,既聪明又轻量。智谱构建的全新“Slime”框架是其关键所在,以往的模型训练如同“考试”,为拿高分而背题;而 GLM-5 的训练则像“实习”,在 Slime 环境中通过完成一个个完整的长程项目,在反馈和交互中不断学习。它还首次集成了 DeepSeek Sparse Attention(稀疏注意力机制),在处理大量代码上下文时不会“迷路”,还能大幅降低部署成本。

值得注意的是,在官方公告底部的致谢名单中,出现了华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等众多国产芯片企业的名字,这几乎涵盖了中国半导体行业的“半壁江山”。这意味着 GLM-5 的开源不仅是软件层面的突破,更标志着国产 AI 生态从底层芯片算力、中间框架到上层模型,逐渐形成了一个完整的闭环。

联想集团第三财季营收达222亿美元 人工智能业务成强劲增长引擎
截至2025年12月31日止第三季度,该集团收入同比增长18%,达创纪录的222亿美元,三大业务集团的收入均录得双位数同比增长。 第三季度调整后权益持有人应占溢利达5.89亿美元,同比增长36%,增速达收入…

2026-02-12

青藏高原蛇绿岩藏天然氢气“密码” 为我国清洁能源指明新方向
记者从中国科学院地质与地球物理研究所获悉,该研究所刘传周和吴福元领衔的研究团队在青藏高原的蛇绿岩中,首次发现了封存于微观包裹体内的天然氢气。这一发现,完整勾勒出天然氢气从深部生成、迁移到近地表聚集的“源—汇”…

2026-02-12

最后一辆初代小米SU7下线 累计交付近37万辆 新一代SU7即将登场
雷军在今晚的直播中透露,最后一辆初代小米SU7量产下线,正在运送途中,将安排车主提车,这也意味着初代小米SU7正式停产。 而购买最后一辆初代SU7的车主是一位50多岁的老米粉,从事石油行业,曾长期在国外生活…

2026-02-12

2026出行好物指南:六款屏显充电宝深度测评,帮你精准匹配使用场景
Anker采用自动轮播模式,每3秒切换一次电量、功率、温度,也支持按键暂停,唤醒延迟0.2秒,兼顾了便捷与可控;倍思则用双按键设计,一个切换信息,一个锁定屏幕,适合需要固定查看功率的办公用户。 本次参评的六…

2026-02-12