数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

快手开源Keye-VL-2.0多模态大模型:突破长视频技术瓶颈,拓展AI应用新场景

2026-05-29来源:天脉网编辑:瑞雪

近日,快手宣布其自主研发的Keye-VL-2.0多模态大模型正式开源,为国内多媒体人工智能领域注入全新活力。这款模型针对长视频时序分析与内容逻辑推理等核心挑战进行了深度优化,有效解决了传统AI模型在解析复杂视频内容时的诸多短板,为产业应用提供了更高效的技术解决方案。

当前市场上多数多模态模型在处理长视频时存在明显局限,面对动态画面丰富、信息密度高的素材时,常出现内容识别碎片化、逻辑链条断裂等问题。Keye-VL-2.0通过引入DSA稀疏注意力机制重构模型架构,突破性实现了256K超长上下文处理能力,可支持小时级视频的完整分析流程。该模型不仅能精准捕捉动作变化轨迹,更能构建内容间的因果关系网络,将视频理解从单帧识别升级为动态叙事解析。

在权威评测中,Keye-VL-2.0展现出显著优势。TimeLens专项测试显示,其视频动作定位精度与高光时刻提取效率均超越谷歌Gemini系列同类模型,细粒度感知能力保持稳定输出。针对行业普遍存在的"视频越长精度越低"痛点,该模型在VideoMME V2测试中呈现反常曲线——输入帧数增加时识别准确率持续攀升,长视频处理稳定性获得质的提升。LongVideoBench综合评测中,其性能指标稳居开源模型第一梯队。

功能拓展方面,Keye-VL-2.0突破传统模型被动识别模式,新增工具调用、信息检索、代码执行等主动交互能力。通过自主任务拆解与多模态信息融合,模型可完成从内容解析到决策输出的完整闭环。工程优化层面,快手采用混合并行架构与动态算力分配技术,使模型推理能耗降低40%,同时通过精细化监督学习机制将输出偏差控制在2%以内。

目前该模型已实现全平台开源,支持PyTorch、TensorFlow等主流框架部署。在快手内部应用中,Keye-VL-2.0已承担起内容分发推荐、创作者辅助创作、违规内容识别等核心业务,日均处理视频量超亿级。行业分析师指出,这款模型凭借性能与成本的双重优势,有望在影视分析、在线教育、智能安防等领域引发技术变革,加速多模态AI从实验室走向产业化应用的进程。

派克SCPSDI-250-04-27压力传感器:多领域适配,助力工业流体系统智能升级
派克SCPSDI-250-04-27压力传感器是集成监测、反馈与控制于一体的智能化工业传感元件,凭借优异的环境适配性与信号稳定性,可适配各类复杂工业工况,为流体控制系统提供精准、实时的压力数据支撑,助力设备实…

2026-05-29

小米汽车V8s EVO超级电机揭秘:28000rpm高转速,引领电动新速度
小米 V8s EVO 超级电机还搭载自研碳化硅功率模块,全电压范围都可以输出 800A 有效电流,电控峰值功率密度达到120kW/L,功率提升了 5.9%。 IT之家注意到,小米 YU7 GT 还采用双电…

2026-05-29

科创人工智能ETF广发半日微跌0.43% 成交额超2亿 重仓股表现分化
来源:新浪基金∞工作室 5月28日,截止午间收盘,科创人工智能ETF广发(588760)跌0.43%,报0.916元,成交额2.26亿元。科创人工智能ETF广发(588760)重仓股方面,芯原股份截止午盘涨4…

2026-05-29

2026世界智能产业博览会启幕 京津冀机器人天团共绘智能新图景
2026世界智能产业博览会设有1个综合展区,以及人工智能核心技术与具身智能、智能网联汽车、低空经济与航空航天等6大主题展区,聚焦全场景AI落地应用,400多款各类机器人集中亮相、同台展演,呈现人工智能赋能千…

2026-05-29