数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里HappyHorse 1.1视频生成模型升级,动态表现等多维度提升助力创作

2026-06-22来源:天脉网编辑:瑞雪

阿里巴巴近日宣布其视频生成模型HappyHorse迎来重要升级,正式推出1.1版本。该版本在动态表现、主体一致性、指令响应、画面质感及音频效果等核心领域实现突破性进展,为内容创作者提供更强大的工具支持。

针对视频生成中普遍存在的动作僵硬问题,1.1版本通过优化运动建模算法,显著提升了画面流畅度与力量感。此前版本中出现的动作迟缓、节奏断层等现象得到根本性改善,现在能够更精准地呈现快速移动、激烈打斗等复杂动态场景。在指令理解方面,模型展现出更强的语义解析能力,无论是简短关键词还是长篇叙事描述,都能准确转化为视觉内容,特别在多角色、多场景的复杂叙事中保持镜头编排的稳定性。

主体一致性优化是本次升级的另一亮点。新版本支持同时输入9张角色参考图,通过深度学习技术确保商品细节、品牌标识、人物特征在不同镜头间保持高度统一。这项改进有效解决了多分镜拍摄中常见的"角色变脸"问题,特别适用于直播带货、系列短剧、品牌广告等需要强身份识别的创作场景。测试数据显示,在包含5个以上分镜的项目中,主体识别准确率提升至92%。

视觉呈现方面,研发团队重点解决了"过度美化"的行业痛点。新模型在保留皮肤纹理、毛孔等真实细节的同时,智能调节光影效果,使画面既保持专业质感又避免塑料感。音频模块的升级同样引人注目,现在能够根据场景情绪自动调整语速、停顿和语气,支持通过提示词添加环境音效,使生成的视频具备更完整的沉浸式体验。

技术参数保持原有优势,单次生成时长覆盖3-15秒区间,支持720p/1080p分辨率及自定义宽高比。目前该模型已深度应用于影视制作、电商营销、游戏动画等多个领域,服务客户包括虎鲸文娱集团等头部企业。为促进技术普惠,阿里巴巴同步启动"Horsepower"AI影像大赛,设立百万级商业合作奖励,邀请全球创作者通过HappyHorse官网提交作品,由张纪中等影视界权威人士组成评审团进行评选。

闪迪探索创新路径:芯片下堆叠NAND闪存,应对存储容量新挑战
6月22日消息,闪迪正在研发更多创新方案以解决存储容量受限问题,例如在芯片内部堆叠 NAND闪存。过去,芯片厂商只需推出全新存储技术就能满足需求,彼时 DRAM 是核心存储器件。但如今研发成本攀升、工艺良率…

2026-06-22

京东全球首开源全栈实时视频视觉语言交互模型JoyAI-VL-Interaction 赋能多场景AI助手
官方表示,它让大模型从“一问一答”走向“边看边说”,开发者基于这套框架,可以快速搭建能持续观察、自主判断、即时响应的实景 AI 助手。 实时响应,而非事后总结:传统视频理解更多是上传完整视频后再分析,但在安…

2026-06-22

120元捡漏骁龙845+10G内存双屏机!vivo NEX二手实测:划痕多但续航稳
像vivo NEX双屏版很容易出现主屏或副屏损坏的情况,我买的这台是副屏坏了,主屏正常。 我买的这台是主屏完好,开价155元,被我一刀砍到120元包邮(实付119.9是蹦出个0.1的支付优惠),承诺收货1小时…

2026-06-22

2026年太阳能逆变器怎么选?从工艺到售后,四家工厂横向测评来了
A:建议重点看三个硬指标:一看工厂有没有自己的SMT贴片线和完整组装线,有全流程制造能力的工厂比纯组装厂在品控和交付上更可靠;二看认证覆盖度,ISO9001加上CE、TUV等产品认证是基本门槛,出口型采购还…

2026-06-22

京东全球首推全栈开源实时视频交互模型JoyAI-VL-Interaction 赋能开发者打造实景AI助手
官方表示,它让大模型从“一问一答”走向“边看边说”,开发者基于这套框架,可以快速搭建能持续观察、自主判断、即时响应的实景 AI 助手。 实时响应,而非事后总结:传统视频理解更多是上传完整视频后再分析,但在安…

2026-06-22