数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

小红书联合复旦推出InstanceAssemble:AI绘画实现复杂布局精准生成新突破

2025-12-27来源:快讯编辑:瑞雪

AI绘画领域迎来重要突破,复旦大学与小红书联合研发的InstanceAssemble技术,在布局控制生成(Layout-to-Image)方向实现关键性进展。这项基于扩散变换器架构的创新方案,通过引入"实例拼装注意力"机制,成功解决了复杂场景下物体布局对齐与语义匹配的难题,相关研究成果已被国际顶级学术会议NeurIPS 2025收录。

传统AI绘画技术主要依赖文字描述生成图像(Text-to-Image),而新一代布局控制生成技术则要求系统根据用户指定的空间约束条件进行创作。这些约束条件包括物体边界框、分割掩码或骨架图等空间定位信息,技术难点在于如何确保生成图像中的每个物体都严格符合预设位置,同时保持语义逻辑的连贯性。现有方案普遍存在布局偏移、语义脱节或计算资源消耗过大等问题。

研究团队提出的InstanceAssemble技术通过创新机制实现了精准控制。该系统采用轻量化设计,仅需在现有模型基础上增加约7100万个参数(相当于Stable Diffusion3-Medium模型容量的3.46%),即可完成模型适配。特别值得注意的是,当适配Flux.1模型时,额外参数需求更低至0.84%,显著降低了技术落地门槛。

实验数据显示,在包含90万个实例的密集布局数据集测试中,新技术展现出卓越性能。研究团队专门构建的"Denselayout"基准测试集包含5000张图像和9万个实例,配合全新设计的"Layout Grounding Score"评估指标,能够精确量化生成图像与布局指令的匹配程度。测试结果表明,即使训练数据仅包含稀疏布局(≤10个实例),系统在处理密集场景(≥10个实例)时仍能保持稳定输出。

这项突破性成果标志着AI绘画技术进入精准构图时代。用户只需提供物体位置框和内容描述,系统即可在指定区域生成符合语义的图像元素,无论是简单场景还是复杂构图都能保持高度一致性。研究团队表示,该技术已具备实际应用条件,未来可广泛应用于数字内容创作、虚拟场景构建等领域,为创意产业提供新的技术支撑。

小米17Ultra国际版信息流出,REDMI多款新品或春节前亮相
据悉,此前有消息曝光过一段内部代码,显示小米 17 Ultra 国际版搭载了 6000mAh 电池,相比国行版的 6800mAh 少了800mAh。 除此之外,博主@数码闲聊站 的一份爆料还中提到过,RE…

2025-12-27

华为新机规划揭晓:Mate 80 GTS性能跃升,Pura X2阔屏设计再升级
据CNMO了解,此前已有其他数码博主透露,华为Mate 80 GTS在性能配置上将迎来重大突破。 值得一提的是,华为Mate 80 GTS还将在散热方面进行创新,内置微型散热风扇。CNMO基于目前爆料的信息…

2025-12-27

荣耀WIN深度评测:超大电池配主动散热 打造电竞旗舰新标杆
游戏流畅体验,不仅取决于性能,屏幕也是非常重要的,荣耀WIN配备了一块6.83英寸185Hz的超高刷电竞屏,更高的屏幕刷新率也可以为用户带来更顺滑的游戏体验。 目前原生支持185Hz刷新率的游戏已经超过20…

2025-12-27

英特尔Xeon 654处理器现身PassMark:性能提升但难敌AMD竞品
根据跑分库显示的信息,对比同为 18 核心的前代产品 Xeon W5-2565X,英特尔 Xeon 654 单线程性能方面提升了18%,多线程性能也提升了 17%。IT之家附上原文跑分对比截图如下: 需要…

2025-12-27

解锁小米相册隐藏技能!6个实用功能让手机修图办公轻松升级
你还可以根据需求选择一寸、二寸或考公、签证等特定尺寸,在家就能搞定正规证件照。日常修图、去路人、换天空,直接用原生相册;遇到需要修改图片尺寸、压缩大小、转格式等“硬指标”任务,记得召唤“一键改图”;办公提取文…

2025-12-26

2025人像手机大揭秘:五款旗舰影像对决,谁才是人像拍摄王者?
其5000万像素主摄和5000万像素长焦均支持OIS光学防抖,3X光学变焦特别适合拍摄半身人像,能带来自然的透视关系。荣耀500凭借2亿像素主摄和创新的实况人像功能,成为追求极致人像效果用户的首选;vivo …

2025-12-26