数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

谷歌Gemini Embedding 2登场:全模态融合,开启AI嵌入技术新篇章

2026-03-11来源:快讯编辑:瑞雪

谷歌DeepMind近日宣布推出Gemini Embedding 2,这一原生多模态嵌入模型实现了文本、图像、视频、音频及文档五种媒体形式的统一嵌入,标志着人工智能嵌入技术进入全模态融合的新时代。该模型突破了传统嵌入模型仅支持单一模态的局限,通过将不同类型的数据映射至同一向量空间,为多模态应用开发提供了更高效的解决方案。

在技术架构上,Gemini Embedding 2基于Gemini框架构建,支持多种输入格式:文本处理能力提升至8192个token,图像可同时处理6张PNG或JPEG格式文件,视频支持最长120秒的MP4/MOV格式,音频可直接生成嵌入向量无需转录,文档则支持6页以内的PDF文件。该模型最显著的创新在于支持交错输入,允许开发者在单次请求中混合多种模态数据,从而捕捉不同媒体类型间的复杂语义关联。

性能表现方面,谷歌披露的基准测试数据显示,Gemini Embedding 2在文本、图像及视频任务中均超越当前主流模型。特别值得关注的是其原生语音处理能力,这项此前同类模型普遍缺失的功能,使音频数据可直接生成嵌入向量,省去了语音转文字的中间环节,显著提升了处理效率。为平衡性能与成本,模型延续了Matryoshka表示学习技术,允许开发者根据应用场景将输出维度从默认的3072灵活调整至1536或768。

对于企业用户而言,该模型的发布具有重要实践价值。通过统一嵌入空间的设计,开发者构建多模态检索增强生成(RAG)、语义搜索及数据分类系统的技术门槛大幅降低。以往需要分别处理不同模态数据的复杂管道,现在可通过单一模型简化实现。谷歌特别强调,维度压缩技术使大规模部署嵌入向量的企业能够在控制基础设施成本的同时,保持较高的模型精度。

目前,Gemini Embedding 2已通过Gemini API和Vertex AI平台开放预览,开发者可立即接入使用。据谷歌透露,部分早期合作伙伴已基于该模型开发出多模态应用,这些实践案例正在验证其在高价值场景中的实际效能。随着嵌入技术在上下文工程、大规模数据管理及传统搜索分析等领域的广泛应用,这款新模型有望推动相关技术生态的进一步发展。

华为全线布局双层OLED与触控笔技术 书写交互生态再升级?
【CNMO科技消息】3月11日,数码博主“智慧皮卡丘”爆料称,华为手机、平板、PC全线测试双层OLED屏幕以及触控笔。 与双层OLED测试同步曝光的,还有华为在触控笔领域的近期动作。国家知识产权局信息显示,华…

2026-03-11

苹果智能家居显示屏或秋季亮相,Siri AI更新成关键,多设备同步升级
我们一直在传闻的“带屏幕的HomePod”原本计划在2025年推出,随后又推迟到今年春季,而根据最新消息,它现在将被推迟到今年秋季才上市。泄密者Kosutami上周在X(Twitter)上发布了此信息,今天B…

2026-03-11

诺特联接携专业连接技术入盟,助力光热电站升级与清洁能源发展
作为专注于光热发电行业镜场通讯链路连接解决方案及定制化电缆线束连接附件的专业企业,旨在通过稳定高效的产品与服务,筑牢光热电站“神经系统”,助力行业基础设施升级与清洁能源产业高质量发展。 在定制化电缆线束连接附…

2026-03-11

iPhone16Pro升级iOS26.4.4实测:续航提升信号改善,流畅度全面优化
因为之前iOS26.3个别场景下还会出现锁80帧,导致卡顿出现,这次更新后,大部分场景下都能120Hz全开了,修复了流畅度变慢的问题。 以上就是iPhone16Pro升级iOS26.4.4的真实体验测评,这次…

2026-03-11

MacBook Neo评测:低价亲民,或成苹果生态破圈普及新引擎
所以虽然从表面上看来,MacBook Neo使用的是2性能核+4能效核、5核心GPU的A18 Pro,但其实也能将它理解为某种意义上的“M4 lite”。我们按照这个标准将其连上WiFi后,屏幕亮度锁定在5…

2026-03-11

OPPO与一加部分老机型将调价,内存成本攀升或推动手机市场多轮涨价
IT之家 3 月 10 日消息,OPPO 今日在其官方商城发布公告,预告部分产品将于 3 月 16 日调整价格。 亲爱的用户:目前涉及价格调整的已发售产品包括 OPPO A 系列、K 系列以及一加,不包…

2026-03-11