数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

智谱GLM-4.7来袭:代码工具推理全升级,国产开源模型迈向新高度

2025-12-23来源:快讯编辑:瑞雪

在人工智能领域,国产大模型正以惊人速度追赶国际顶尖水平。智谱最新发布的GLM-4.7开源模型,凭借在代码生成、工具调用和复杂推理等核心指标上的突破性表现,成功跻身全球开源模型第一梯队。根据Code Arena全球开发者盲测榜单,该模型在Web开发方向排名第六,超越GPT-5.2与Claude Sonnet 4.5,成为当前全球排名最高的开源模型,同时稳居国产模型榜首。

技术突破体现在多维度的性能跃升。在代码能力方面,GLM-4.7在SWE-bench Verified基准测试中取得73.8%的准确率,LiveCodeBench V6测试达84.9%,整体水平对齐Claude Sonnet 4.5。复杂推理任务中,HLE(人类水平考试)成绩在工具辅助条件下提升至42.8%,较前代提升超12个百分点,超越GPT-5.1 High版本。工具调用能力成为最大亮点,在τ²-Bench测试中取得87.4%的优异成绩,BrowseComp在开启上下文管理后提升至67.5%,展现出稳定的多轮交互能力。

这些提升源于内部思考机制的革新。模型在原有"交错思考"基础上,引入保留式思考与轮级控制机制。每次生成或调用工具前,系统会先进行独立推理,并在多轮任务中自动保留历史思考结果,避免重复推导。开发者可根据任务复杂度选择是否启用完整推理流程,在简单请求中降低延迟,在复杂任务中确保稳定性。这种设计显著提升了长任务执行的一致性,为代码智能体、终端任务和工具协同等场景提供技术支撑。

真实任务测试验证了模型的工程价值。在覆盖前端开发、后端逻辑和指令遵循的100个编程任务中,GLM-4.7前端任务胜率达64.6%,指令遵循场景胜率58.3%,后端复杂任务胜率稳定在46.7%。更值得关注的是多模态技能调度能力,通过全新Skills模块,模型可统一调度ASR语音识别、TTS语音合成和GLM-4.6V视觉模型,实现跨模态工具链的完整闭环。

在Z.ai平台的实测中,模型展现出惊人的交互创造力。测试人员要求生成"3D圣诞树炸开成照片墙"的交互场景,模型输出完整HTML代码,构建出由5000多个粒子组成的立体圣诞树,顶部带有辉光星星。通过摄像头识别手势动作,用户张开手掌时圣诞树炸开为悬浮照片墙,握拳时重新收缩为树形,整个过程伴随流畅的粒子动画和UI反馈。更令人惊喜的是,代码中集成了InstancedMesh渲染优化技术,在不依赖构建工具的情况下保持高帧率运行。

另一个测试案例中,模型1:1复刻iOS主界面,不仅实现Safari、健康等图标的点击交互,日历、计算器等功能页也能正常操作。在双人格斗游戏测试中,生成的界面高度还原Switch手柄配色布局,左侧蓝色手柄对应键盘AD移动、JK攻击,右侧红色手柄对应UIO技能释放,中间主屏幕显示动态血条和波次信息,完整构建出游戏框架。

开源社区的热烈反响印证着模型的市场价值。GLM系列代码全球下载量已突破6000万次,付费API使用量长期位居OpenRouter全球前十。随着智谱即将登陆港交所,这款模型的发布不仅标志着技术实力的突破,更成为国产大模型从实验室走向产业应用的关键转折点。当开源模型开始主导开发者工具链,当国产技术开始定义行业标准,人工智能领域的竞争格局正在发生深刻变革。

IPO关键节点,智谱GLM-4.7上线开源,编码推理等多方面能力显著提升
在推进IPO的关键节点,智谱AI正式上线并开源其最新旗舰模型GLM-4.7,新版本针对Coding场景着重强化了编码能力、长程任务规划与工具协同,标志着该公司技术产品线的又一次重要迭代。 12月23日,智谱正…

2025-12-23

“人造太阳”模拟太阳核聚变,可控核聚变技术能否破解能源困局?
“人造太阳”技术以可控核聚变为核心,其核心原理与太阳能量产生机制一致,区别在于太阳核聚变是自然发生的不可控过程,而“人造太阳”需借助特定装置约束高温等离子体,让氢同位素氘和氚在人工创造的极高温高压环境下发生聚…

2025-12-23

华为非凡大师品牌主题曲12月29日上线,刘德华或倾情献唱引期待
IT之家 12 月 23 日消息,华为终端官方今日宣布,非凡大师品牌主题曲将于 12 月 29 日 9:00正式上线。2023 年 9 月,中国交响乐团和中国音乐学院青年爱乐乐团在发布会现场重新演绎了《我的梦…

2025-12-23

一加Turbo系列新机安兔兔跑分超260万,骁龙8s Gen4加持配置亮眼
IT之家 12 月 23 日消息,安兔兔官方今日发文称在后台发现了一款型号为 PLU110 的新机,具体身份还不能确认,但预计为一加 Turbo系列新机。 测试机型在安兔兔 V11 版跑分超 260 万(总…

2025-12-23

英特尔处理器架构大变革:Razor Lake升级,Hammer Lake或终结大小核时代
消息源透露英特尔正在规划一项激进的架构转型,在代号为 Hammer Lake 的处理器中,英特尔计划放弃目前使用的异构混合架构(即独立的 P核与 E 核),转而采用全新的“统一核心”(Unified Co…

2025-12-23

苹果持续探索UFG玻璃技术 iPhone Fold或实现屏幕折痕隐形新突破
据消息人士称,苹果并没有放弃iPhone Fold折叠屏手机的无折痕设想,目前仍然在测试UFG超薄柔性玻璃,力求让屏幕在展开时,完全没有视觉上的折痕,或者能够让折痕隐形,进而解决现有折叠屏手机长期使用的痛点。…

2025-12-23

华为nova 15系列及全场景新品发布,影像性能升级成亮点
据介绍, nova 15 Ultra 搭载 双星镜头模组设计,可选好搭紫、带感绿、零度白、幻夜黑四款配色,以及 2.5D 直屏设计,厚度6.8mm,重量约 209g。 与华为 nova 15 Ultra …

2025-12-23

vivo手机外语语音听不懂别发愁!3种实用翻译方法,轻松打破沟通障碍
其实,你的vivo手机里藏着不少“黑科技”,配合专业的工具,可以轻松搞定语音翻译。 如果你收到的不是简单的几秒钟语音,而是一段较长的录音文件,或者是会议记录、课程录音,甚至是对准确度要求极高的商务语音,系统自…

2025-12-23