数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

6位前DeepMind成员创元系统,低成本策略引领大模型推理新突破

2025-12-15来源:快讯编辑:瑞雪

在人工智能领域,一场由前Google DeepMind成员掀起的技术革新正引发广泛关注。这支6人团队成立的新公司Poetiq,通过构建元系统重新定义了大模型的应用方式,在复杂推理任务中展现出突破性表现。其研发的Gemini 3 Pro优化技术在ARC-AGI-2基准测试中以54%的准确率登顶排行榜,同时将计算成本压缩至行业最优水平的一半。

这个技术团队虽成立不足一年,却汇聚了来自DeepMind的资深专家,累计拥有53年人工智能研发经验。他们选择了一条与众不同的技术路径:不追求构建更大规模的模型,而是专注于开发能够智能调度现有模型的元系统。这种创新架构使系统能够自动生成针对特定任务的解决方案,通过组合不同模型的优势实现性能突破。

在12月8日公布的官方验证结果中,Poetiq系统在ARC-AGI-2半私有评估集上创造了新纪录。其纯Gemini配置方案以每题30.57美元的成本达成54%准确率,相比前纪录保持者Gemini 3 Deep Think(77.16美元/45%)实现双重超越。更引人注目的是,该系统在公共数据集上构建的帕累托前沿,同时推进了准确率与成本效率的边界。

技术核心在于其递归式元系统架构。该系统通过多轮交互实现自我优化:首先生成初步解决方案,再根据反馈持续改进,最终形成可靠答案。这种自我监控机制能够智能判断何时终止计算,有效避免算力浪费。测试数据显示,基于Grok-4-Fast的配置在保持高准确率的同时,成本比原始模型降低两个数量级;而开源模型GPT-OSS-120B的衍生方案,甚至实现了单题成本低于1美分的突破。

该系统的适应性在跨模型测试中得到充分验证。当应用于ChatGPT、Claude Haiku、Gemini等12个主流模型时,Poetiq均实现了准确率与成本的双重优化。这种表现源于其完全基于大语言模型的架构设计——从系统构建到运行监控,整个流程均由模型自主完成。这种递归式强化机制,使得系统能够快速整合新模型的能力,在Gemini 3和GPT-5.1发布后数小时内即完成适配并取得领先成绩。

选择ARC-AGI作为测试场源于其对复杂推理能力的严苛考验。该基准测试要求模型具备抽象推理、归纳总结和策略生成能力,恰好对应Poetiq系统的优势领域。通过让模型自主发现最优推理路径,系统能够在预算、算力等现实约束下,持续优化解决方案。这种设计理念在测试中得到充分验证:系统在处理多样化任务时展现出强大的自适应能力,能够根据任务特性动态调整模型组合策略。

技术团队透露,其开源配置旨在证明智能的本质不在于提示词工程,而在于构建能够自我进化的系统。通过多步骤验证和自我检查机制,系统能够逐步打磨解决方案,这种运行模式突破了传统大模型对提示词的依赖。随着任务多样性的增加,元系统的进化速度将进一步提升,为生成式AI在复杂场景的应用开辟新路径。

海归博士胡宇航创办首形科技 获中网投蚂蚁集团等联合领投新一轮融资
瑞财经 吴文婷12月12日,首形科技(AheadForm)宣布完成新一轮融资。 本轮由中国互联网投资基金(中网投)与蚂蚁集团联合领投,其他投资人包括上海未来产业基金、东方富海,老股东招商局创投持续超额追投,深…

2025-12-15

OPPO Reno 15c官宣12月下旬登场:入门新机配置亮点与影像续航全解析
新机的发展,离不开手游、应用、生态、系统更新等方面,主要是考虑到整体性能需求,确保各方面流畅运行,让新机体验更舒适,这也是各大品牌追求之一。看来新机的重点不在配置上,更多是外观与体验,与其它版本有所差异。新机…

2025-12-15

天力复合2天2板涨幅69% 商业航天等多概念加持后市可期?
该股强势的概念有:商业航天+可控核聚变+专精特新+陕西国资在商业航天相关领域,公司是国内层状金属复合材料龙头,产品用于卫星姿态控制系统关键连接件,是《卫星用钛-不锈钢爆炸复合过渡接头棒规范》国军标起草单位,…

2025-12-14

豆包手机引热议:安全疑云未散,智能革新能否开启人机交互新篇?
12月1日,字节跳动旗下AI大模型“豆包”宣布上线手机助手并与中兴通讯合作推出“豆包手机”——努比亚M153,作为一款拥有系统级权限的手机助手,它能像人类一样操作智能手机,试图重塑人机交互逻辑,这款在AI时…

2025-12-14

W49周手机销量榜:iPhone 17系列强势,国产旗舰与苹果差距待缩小
换言之现在iPhone 17系列不仅自己热销,还带动了苹果过时机型的销量,试问国产旗舰哪一个系列能在两个多月的时间激活量在国内达到近1300万台。另外不知道大家注意到了没有,那波国产旗舰(9-10月)目前只有…

2025-12-14

荣耀席迎军详解PC YOYO:聚焦文档AI与一语智控 持续打磨学习工作新体验
IT之家 12 月 14 日消息,荣耀全场景软件主理人席迎军昨日发文解释了 PC 上 YOYO 和手机 YOYO的区别。他表示,从三年前决定启动 PC YOYO 开发时,一切从零开始、场景很多、方向很多。 …

2025-12-14