腾讯混元大模型上线文生视频，一句话生成视频教程来啦！-产业资讯-数据世界

腾讯近日在AI技术领域迈出了重要一步，其混元大模型宣布正式上线了一项创新功能——文生视频。这一功能允许用户仅凭一句话的描述，就能自动生成相应的视频内容。

据悉，腾讯此次开源的视频生成大模型拥有惊人的130亿参数量，是目前市场上最大的视频开源模型。这一技术的推出，无疑为视频创作领域带来了全新的变革。

用户在使用该功能时，只需输入一段简短的描述文字，系统即可根据输入内容生成视频。更令人惊喜的是，该功能支持中英文双语输入，且提供了多种视频尺寸和清晰度选项，满足用户的不同需求。

目前，腾讯已将这一创新功能集成到了其元宝APP中。用户只需通过AI应用中的“AI视频”板块，即可申请试用该功能。同时，企业客户也可以通过腾讯云提供的服务接入该功能，目前API内测申请也已同步开放。

在实际应用中，腾讯混元视频生成模型展现出了卓越的性能。在与国内外多个顶尖模型的评测对比中，该模型在文本视频一致性、运动质量和画面质量等多个维度上均取得了领先地位。特别是在人物、人造场所等复杂场景下，其表现尤为出色。

该模型生成的视频不仅画质超写实，而且能够高度符合用户的提示词。画面流畅自然，不易出现变形现象。腾讯混元在处理大幅度运动画面时，也展现出了卓越的能力。

例如，在冲浪、跳舞等场景中，该模型能够生成非常流畅且合理的运动镜头。物体在画面中的运动轨迹自然，不易出现变形现象。同时，光影反射效果也基本符合物理规律，在镜面或照镜子等场景中，能够实现镜面内外动作的一致性。

更为先进的是，腾讯混元视频生成模型还具备自动切换镜头的能力。在保持画面主角不变的情况下，该模型能够自动切换镜头，为观众带来更加丰富的视觉体验。这一功能在业界中尚属罕见。