Gemini Omni引领AI视频新变革：动动嘴就能剪视频，开启世界生成新纪元-企业动态-数据世界

在今日凌晨的Google I/O大会上，谷歌DeepMind团队正式推出了革命性的AI模型Gemini Omni，这款被视为视频生成领域"Banana时刻"的新产品，正在重新定义人工智能与数字内容创作的边界。

不同于传统视频生成工具，Gemini Omni实现了从"生成内容"到"生成世界"的跨越。该模型不仅具备对动能、重力等物理规律的深刻理解，更能将复杂概念转化为直观的可视化场景。通过整合Gemini系列强大的推理能力与生成技术，新模型在多模态交互、视频编辑和世界模拟方面展现出突破性进展。

技术团队透露，Gemini Omni的训练方式与传统模型存在本质差异。其采用"多模态输入-多模态输出"架构，将图像、音频、视频和文本数据作为理解世界的原始素材，而非简单的附加条件。这种训练范式使模型能够自主掌握风格迁移、场景续写等未显式训练的能力——当用户要求将视频转换为蜡笔画风格时，模型能自动生成符合要求的版本；面对"走廊怪物出现"的开放式指令，系统可自然延续场景几何结构与人物特征。

产品负责人Nicole Brichtova在发布访谈中强调，这不是对Veo系列的常规升级，而是"从地基开始的重建"。团队耗时数月构建五条并行评估管线，在视频生成、编辑、图像生成、文本对齐和音频同步等维度进行综合优化。研究总监Shlomi Fruchter透露，模型展现出的"涌现能力"多次超出预期，例如通过音乐生成训练提升视频时间连贯性，利用绘画训练增强物理空间感知。

硅谷风投机构a16z合伙人Justine Moore指出，Gemini Omni的对话式编辑功能与数字分身技术具有颠覆性意义。用户现在可通过自然语言指令修改视频元素，甚至将个人形象植入历史场景。该模型在生物学解释、人体特写处理等领域表现尤为突出，例如能清晰展示蒙娜丽莎从颜料分子到原子结构的缩放过程。

DeepMind联合负责人Demis Hassabis坦言，这款模型代表着通往通用人工智能的重要一步。当被问及为何打破延续三年的命名体系时，团队成员表示："这标志着技术路径的根本转变，我们正在构建能够理解并模拟真实世界的系统。"目前，谷歌已开放部分功能的体验申请，全球创作者正等待见证这场数字内容革命的全面到来。

字节AI时代再崛起：战略清醒、生态协同与组织力成制胜关键

紧接着在极短的时间内，字节把内部整个AI品牌体系：包括模型和产品全部统一到"豆包"这一个名字下，并将集团的资源集中到豆包上，阿里到2025年年底才完成了这种统一。这就是字节能在AI时代再出一个豆包的原因—…

2026-05-21

阿里云谷歌同日发力Agent化阿里云“芯云模推”全栈升级引领行业新趋势

智能体作为AI的下一个主战场的判断在全球科技行业已经接近共识，但想要体系化围绕Agent做全栈重构，要求一家公司同时在底层AI芯片、中间层云计算基础设施和前沿大模型三个领域拥有顶级自研能力，芯片决定算力自…

2026-05-21

联想拯救者手机Y70新一代发布：旗舰配置搭配2K电竞屏，现已开启全款预售

新机亮点，比如2K电竞屏、乾坤散热、星环大电池、电竞Wi-Fi天线、AI游戏功能、新一代旗舰芯片等方面，大部分亮点以提升游戏性能为主，不愧是新一代游戏手机，各方面配置定位精准。功耗方面，采用芯片级AI功耗调…

2026-05-21

2026拍照手机新标杆！Find X9s Pro专项摄影全制霸演唱会直播无短板

无论是追求演唱会舞台上清晰捕捉爱豆瞬间，还是在逆光环境下保证人像脸不黑，亦或是需要自然不假面的自拍效果，甚至是对直播画质有高要求，这些需求都指向了一款手机在影像系统、算法、硬件和生态上的综合实力。它并非单纯堆…

2026-05-21

存储芯片高景气延续！三条主线精选潜力股，把握投资机遇与策略

2026-05-21

国家能源局4月用电数据：充换电与数据服务用电飙升，高耗电时代来临

2026-05-21

阿里巴巴股东信披露：AI业务进入回报期，自研芯片加码，财务数据有喜有忧

2026-05-21

云深处IPO获受理拟募资25亿，A股“摘星脱帽”行情升温，67股申请撤销警示

2026-05-20