数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

港科大贾佳亚团队新突破:DreamOmni2开源,AI多模态创作迈入新阶段

2025-10-24来源:快讯编辑:瑞雪

当语言无法精准传递灵感时,AI能否跨越文字的局限,直接捕捉创作者心中的视觉想象?香港科技大学贾佳亚团队最新推出的DreamOmni2模型,通过突破性的多模态编辑技术,为这一难题提供了创新解决方案。该成果在GitHub上线两周即收获1600颗星,引发YouTube创作者群体热议,被视为AI图像生成领域的里程碑。

传统AI创作工具长期受困于指令依赖困境。当用户试图将照片中的背包替换为波西米亚风格图案时,复杂纹理的语义描述往往导致结果偏差;而模仿老照片的复古光影或画家笔触时,现有模型更因抽象属性处理能力不足而束手无策。DreamOmni2的突破性在于,其构建的FLUX Kontext基座模型通过多参考图像解析机制,首次实现了对具体物体与抽象概念的同步编辑。

实测数据显示,该模型在人物替换任务中展现出惊人精度。将赛博场景中的男性角色替换为女性形象时,生成的画面不仅完整保留了背景光影与文字细节,更通过面部光线迁移技术,使新角色自然融入原始环境。在风格迁移测试中,模型成功将像素艺术、二次元画风等视觉特征完整迁移,相较GPT-4o的色调复制和Nano Banana的简单变色,展现出对艺术风格的深度理解。

技术白皮书揭示,研究团队通过三阶段数据工程构建了新型训练范式。首先利用特征混合技术生成包含相同物体/属性的高质量图像对,解决数据稀缺难题;继而开发提取-编辑双模型架构,自动生成(源图+指令+参考图)→目标图的完整训练链;最终通过多参考图像生成机制,形成覆盖具体物体与抽象属性的综合数据集。这种创新方法使模型在基准测试中,抽象属性处理得分超越GPT-4o与Nano Banana。

模型架构创新同样引人注目。针对多图像输入的混淆问题,研究团队引入索引编码与位置偏移技术,使模型能精准区分不同参考图像。通过视觉语言模型(VLM)与生成模型的联合训练机制,系统可自动将用户模糊指令转化为结构化操作,显著提升真实场景下的指令理解能力。LoRA微调策略的运用,则在保持基座模型性能的同时,实现了多模态能力的无缝激活。

在四图组合生成测试中,DreamOmni2将三位不同角色的特征与第四张图的画风完美融合,生成画面中人物服饰细节、动物品种特征与艺术笔触均得到准确呈现。这种跨图像、跨模态的编辑能力,使设计师能直接通过视觉参考进行创作,而非依赖文字描述。YouTube教程作者评价该模型为"免费工作流中的性能王者",其多图编辑精度已达到专业创作工具水准。

小米再拓欧洲版图:巴黎首家直营门店即将开业 开启法国市场新篇章
近日,小米法国副国家经理“产品逸飞”发文官宣,小米将在巴黎开设首家直营门店。针对网友提问“之前不是在香街有一个吗?”,他进一步回应称,该店为客户运营的授权店,后因疫情因素暂时退出市场。 此前,小米集团总裁卢…

2025-11-15

华为Mate X7或本月登场 首发20GB超大内存 配色丰富性能强劲
11月份的机圈将会是华为的主场,不仅新一代的直板旗舰华为Mate80系列会震撼亮相,还会有迭代的大折叠屏手机华为Mate X7发布。@定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史…

2025-11-15

TCL华星全球显示生态大会:四款新品亮相,AI赋能制造,印刷OLED节能显著
智东西11月14日苏州现场报道,今天上午,国内显示产业头部玩家TCL华星召开了自家一年一度的全球显示生态大会(DTC2025),发布了覆盖LCD、OLED和MLED等技术领域的多款旗舰新品,以及《视觉健康白…

2025-11-15

iPhone 17系列上市两月中国市场激活破千万,配置亮眼预售火爆
2025年11月14日,知名数码博主“数码闲聊站”爆料称,iPhone 17系列于本周完成中国市场激活超1000万台。 据了解,iPhone 17系列于2025年9月10日苹果秋季发布会推出,含标准版、Air…

2025-11-14

iPhone 17系列线上线下热销,苹果2025年有喜有忧未来可期
在此情况下,原本不被看好的苹果 iPhone 17 系列成为一匹黑马,上市后销售极为火爆,尤其是中国市场的表现远超预期:首发 10天销量同比增长 14%,第三季度出货量达 1010 万台,成为头部厂商中唯…

2025-11-13

华为PC业务双线并行:鸿蒙PC加速突破,智选PC延续Windows生态
11月13日消息,虽然有了鸿蒙PC,但华为似乎短期并不想放弃Windows系统。 有博主给出的消息显示,华为在PC业务上仍将维持“鸿蒙PC”与“智选PC”双线并行的策略,短期内不会放弃基于Windows系统的…

2025-11-13

一加Ace 6T新机曝光:骁龙8 Gen5加持,8000mAh大电池+超炫联名配色来袭
对此,在笔者看来,在高通骁龙8 Gen5芯片的加持下,一加Ace6T这款智能手机的综合性能是不用担心的,也即能够对标华为、小米、vivo、荣耀等厂商的中高端机型。 在续航上,爆料信息显示一加Ace 6T这款…

2025-11-13

Viwoods AiPaper Reader电纸书来袭:AI互动阅读 6.13英寸墨水屏新体验
IT之家 11 月 11 日消息,据科技媒体 NoteBook Check 今天报道,Viwoods 现已推出 AiPaper Reader电纸书,运行 Android 16 操作系统,机身配备专用 AI …

2025-11-12