数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

谷歌Gemini 3 Pro上线:多模态交互升级,AI“执行者”时代来临

2025-11-22来源:快讯编辑:瑞雪

谷歌近日正式上线了其最新旗舰模型Gemini 3 Pro,这款被公司称为迄今为止“最智能”且“最准确”的模型,不仅在编码和推理能力上实现了显著提升,还大幅减少了“谄媚式”回应,转而提供更加直接和实用的信息。这一举措被视为谷歌对竞争对手ChatGPT的直接回应,标志着人工智能领域的新一轮竞争正式拉开帷幕。

Gemini 3 Pro的最大亮点在于其“原生多模态”特性,能够同时处理文本、图像和音频,打破了传统模型仅限于文本交互的局限。谷歌官方演示中,该模型不仅流畅地处理了RNA数据,还展示了翻译菜谱照片为食谱、根据视频讲座创建交互式学习卡片等实用功能。在Gemini应用中,用户还能利用内置的Canvas构建功能更全面的程序,支持“生成式界面”,创建包含图片的杂志式视觉格式,或根据用户提示定制动态布局的用户界面。

搜索功能方面,Gemini 3 Pro同样表现出色。它能够根据用户搜索呈现图像、表格、网格和模拟等视觉元素,通过分解问题并理解用户意图,找到之前可能遗漏的新内容。谷歌DeepMind高级总监兼产品负责人Tulsee Doshi表示,这一模型将助力谷歌实现“人人皆可获取且人人皆可使用”的信息目标,推动搜索引擎向更丰富、更完整的实际内容展示迈进。

在回应风格上,Gemini 3 Pro也进行了显著调整。谷歌强调,该模型的回复将更加“智能、简洁、直接”,摒弃陈词滥调和奉承,提供真正的洞见。这一变化被视为对ChatGPT等模型空洞奉承式回应的直接挑战,旨在为用户提供更加实用和有价值的信息。

除了上述改进外,Gemini 3 Pro还具备更强大的推理和智能代理能力,能够完成更复杂的任务并可靠地进行长期规划。谷歌表示,该模型为Gemini Agent的实验性功能提供支持,可在应用内帮助用户执行查看和整理电子邮件、搜索和预订旅行等任务。

在性能方面,Gemini 3 Pro在官方21项基准测试中表现优异,除OCR和代理编码外,其他指标均遥遥领先。谷歌还特别强调了人类最终测试、终端工作台2.0和SimpleQA Verified三个指标,矛头直指Claude Sonnet4.5和GPT-5.1等竞争对手,试图证明其在标准化知识生成、AI工具使用乃至“人工智能”整体指标上的全方位优势。

与此同时,谷歌还推出了基于Gemini 3 Pro及其他第三方模型的开发工具Antigravity。这款工具支持多个智能体直接访问编辑器、终端和浏览器,旨在面向“智能体优先的未来”。Antigravity具有生成“工件”文件以验证工作进度、报告操作和外部工具使用情况等功能,并提供了编辑器视图和管理器视图两种主要使用视图,方便用户同时控制多个代理。

谷歌表示,Antigravity中的代理能够从过去的工作中学习,保留特定代码片段或执行任务所需步骤。在官方演示中,该工具成功构建并测试了一个基本的航班跟踪应用程序,并通过浏览器录制报告了测试结果。目前,Antigravity已推出公开预览版,兼容Windows、macOS和Linux系统。

谷歌此次的发布不仅限于一个大模型,更展示了其构建从模型、应用到开发者的完整生态闭环的野心。随着多模态交互的普及,AI正从一位博学的“对话者”转变为能看、能听、能行动、能规划的“执行者”。这一转变预示着未来3D和全景、沉浸式交互竞赛的临近,人工智能领域将迎来更加激烈的竞争和更加广阔的发展前景。

陈清泉:以AI智能体破局交通治理 驱动产业向全局最优深度进化
我常说,汽车革命的上半场是电动化,我们解决了动力的清洁化问题,中国已走在世界前列;而下半场则是智能化、网联化,其核心在于如何构建更好的“路”与“网”,在一个人、车、能源、环境构成的极端复杂系统中,找到那个全局…

2025-11-22

Google推出Nano Banana Pro图像模型:功能升级,分辨率提升,多场景应用拓展
A:Nano Banana Pro在前代Nano Banana基础上实现了多项改进:能够创建更详细的图像和准确的文本,可以生成不同风格、字体和语言的文本,支持2K和4K高分辨率图像生成,具备网络搜索功能,并…

2025-11-22

IBM与思科携手,本世纪三十年代初将建成大规模容错量子计算互联网络
IT之家 11 月 21 日消息,IBM与思科美国当地时间昨日宣布,双方计划联手建设大规模容错量子计算机互联网络,目标是在本世纪三十年代初实现这一目标,为三十年代末的量子计算互联网奠定基础。IBM 和思科…

2025-11-22