数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

腾讯混元大模型上线文生视频,一句话生成视频教程来啦!

2024-12-05来源:ITBEAR编辑:瑞雪

腾讯近日在AI技术领域迈出了重要一步,其混元大模型宣布正式上线了一项创新功能——文生视频。这一功能允许用户仅凭一句话的描述,就能自动生成相应的视频内容。

据悉,腾讯此次开源的视频生成大模型拥有惊人的130亿参数量,是目前市场上最大的视频开源模型。这一技术的推出,无疑为视频创作领域带来了全新的变革。

用户在使用该功能时,只需输入一段简短的描述文字,系统即可根据输入内容生成视频。更令人惊喜的是,该功能支持中英文双语输入,且提供了多种视频尺寸和清晰度选项,满足用户的不同需求。

目前,腾讯已将这一创新功能集成到了其元宝APP中。用户只需通过AI应用中的“AI视频”板块,即可申请试用该功能。同时,企业客户也可以通过腾讯云提供的服务接入该功能,目前API内测申请也已同步开放。

在实际应用中,腾讯混元视频生成模型展现出了卓越的性能。在与国内外多个顶尖模型的评测对比中,该模型在文本视频一致性、运动质量和画面质量等多个维度上均取得了领先地位。特别是在人物、人造场所等复杂场景下,其表现尤为出色。

该模型生成的视频不仅画质超写实,而且能够高度符合用户的提示词。画面流畅自然,不易出现变形现象。腾讯混元在处理大幅度运动画面时,也展现出了卓越的能力。

例如,在冲浪、跳舞等场景中,该模型能够生成非常流畅且合理的运动镜头。物体在画面中的运动轨迹自然,不易出现变形现象。同时,光影反射效果也基本符合物理规律,在镜面或照镜子等场景中,能够实现镜面内外动作的一致性。

更为先进的是,腾讯混元视频生成模型还具备自动切换镜头的能力。在保持画面主角不变的情况下,该模型能够自动切换镜头,为观众带来更加丰富的视觉体验。这一功能在业界中尚属罕见。