数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

阿里巴巴HappyHorse 1.1升级发布,能力多维提升,邀创作者参与AI影像大赛

2026-06-22来源:快讯编辑:瑞雪

阿里巴巴近日宣布,旗下视频生成模型HappyHorse正式推出1.1版本,在动态表现、主体一致性、指令理解、视觉效果和音频处理等多个维度实现全面升级。目前,用户可通过HappyHorse官网、阿里云百炼平台及千问云体验最新功能,同时该模型已开放技术接口供开发者调用。

技术规格方面,1.1版本延续了前代3-15秒单次生成时长,支持720p与1080p分辨率输出,并保持自由宽高比设置。此次升级重点聚焦于创作质量提升:通过优化运动建模算法,新版本解决了复杂动作场景中的迟缓问题,使人物运动轨迹更流畅自然;在多图参考生成视频(R2V)功能中,模型对商品细节、角色特征及场景元素的还原精度显著提高,支持多分镜组合与N宫格参考的智能融合。

指令理解能力是本次升级的核心突破。研发团队强化了长上下文语义解析与场景规划模块,使模型能够精准捕捉用户输入中的角色关系与叙事逻辑。无论是简短描述还是复杂故事线,系统均可自动编排镜头语言,生成符合预期的多角色连贯画面。针对专业创作需求,新版本特别优化了镜头衔接稳定性,在短剧制作、广告拍摄等场景中实现更自然的多视角切换。

视觉呈现层面,1.1版本通过改进细节生成引擎,在人物肤质还原上取得突破性进展。模型现在能够智能平衡真实特征与美学表现,在保留痘印、法令纹等生理细节的同时,避免过度锐化或油光感。专业镜头语言理解模块的加入,使系统可准确识别正反打、跟拍等拍摄手法,在人物特写镜头中展现更强的叙事表现力。据实测数据,新版本在多镜头叙事连贯性指标上提升达37%。

音频处理能力的革新为内容创作带来全新可能。升级后的系统可动态调整台词语速、停顿与语气,使声音表达更贴合场景情绪。通过增强对声音描述指令的解析能力,背景音乐与环境音效的匹配度显著提升,有效减少无关音效干扰。更精准的音画同步技术确保声音与画面动作、剧情节奏严格对齐,为用户带来更具沉浸感的视听体验。

为推动AI影像技术创新,阿里巴巴联合虎鲸文娱集团即日起启动"Horsepower"全球AI影像大赛。赛事设置百万级商业合作奖励,邀请张纪中等影视行业权威人士组成评审团。创作者可通过HappyHorse官网提交作品,参赛内容需体现模型在动态叙事、多镜头衔接或音画融合等方面的创新应用。此次大赛特别设立海外赛道,为全球AIGC创作者提供展示平台。

首次占比超五成!耳夹式耳机缘何崛起?听听用户真实心声
而在今年最新发布的降噪耳机Liberty 5Pro上,安克也展示了端侧大模型在通话降噪方面的强大,后续随着相关技术的普及,耳夹式耳机或许也会迎来一次“AI降噪”的变革。 在雷科技看来,耳夹式耳机的爆发,本…

2026-06-22

家电ETF博时159730开盘微涨0.30% 格力海尔等重仓股表现分化
来源:新浪基金∞工作室 6月22日,家电ETF博时(159730)开盘涨0.30%,报1.015元。家电ETF博时(159730)重仓股方面,格力电器开盘涨0.03%,美的集团跌0.86%,三花智控跌0.13…

2026-06-22