当全球AI视频生成领域还在为画质提升和时长拓展激烈竞争时,一家中国初创公司已悄然开启交互革命。Xmax AI近日发布的实时交互模型X1,通过毫秒级响应和手势操控技术,将传统视频消费模式升级为虚实融合的共创体验。这项突破性成果标志着AI视频正式进入"可玩时代",用户无需专业设备即可用指尖调动虚拟与现实世界的像素。
在技术演示中,X1展现出惊人的交互能力:当手机摄像头对准桌面时,用户上传的滚球兽照片瞬间"活"过来,在桌面上四处探索。这个虚拟生物不仅能对抚摸、捏抓等手势做出精准反应,还能根据物理规则呈现Q弹形变。更令人惊叹的是,所有交互响应都在毫秒级完成,彻底摆脱了传统AI视频生成需要云端渲染的等待时间。目前该技术已通过X-cam测试版开放体验,苹果用户可通过TestFlight下载尝鲜。
突破性成果背后是多项核心技术创新。研发团队构建的端到端流式重渲染架构,将扩散采样速度提升百倍;统一交互模型架构则融合三维空间关系与二维屏幕操作,使模型能精准解析"捏""拖拽"等复杂手势。针对虚实融合数据稀缺的难题,团队开发的半自动化合成管线已积累大量珍贵数据资产,为行业树立新的技术标杆。
这款革命性产品的四大核心玩法正在重塑内容交互方式。"次元互动"功能让动漫角色突破屏幕限制,用户抚摸屏幕中的兔子时,模型会实时生成转头蹭手的动态响应;"世界滤镜"可将现实场景转化为梵高画作或乐高积木风格,且人物动作保持风格连贯性;"触控动图"能唤醒静态照片,拖拽猫咪嘴角即可让它露出微笑;"表情捕手"则能快速生成魔性表情包,为社交互动增添趣味。
这个颠覆性产品出自一支跨界精英团队。由前华为"天才少年"领衔的研发阵容,汇聚了清华大学、香港科技大学(广州)的学术力量,以及字节跳动、快手等企业的工程专家。团队在算法优化与工程落地间找到完美平衡点,既攻克了实时性与精准度的世界级难题,又确保技术能真正走进日常生活。
X1模型的发布只是开始。Xmax AI正以"Play the World through AI"为理念,构建下一代内容交互引擎。当其他公司还在卷画质参数时,这家中国初创公司已用技术创新重新定义了AI视频的边界——在这里,每个用户都能成为虚拟与现实世界的创造者与玩家。




