数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

原阿里千问后训练核心郁博文离职后火速加盟 字节Seed多模态布局再添强援

2026-03-12来源:天脉网编辑:瑞雪

近日,科技行业传来一则重磅人事变动消息:原阿里巴巴通义实验室Qwen(千问)大模型后训练负责人郁博文,已正式加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。这一变动引发了业界对大模型技术发展路径的广泛关注。

郁博文在学术领域有着深厚的积累。他本科就读于中南大学,之后在中国科学院信息工程研究所攻读研究生,并于2022年获得中国科学院大学博士学位。读研期间,他专注于自然语言处理与信息抽取领域的研究,在ACL、EMNLP等国际顶级学术会议上发表过多篇论文。他创新性地提出将信息抽取任务转化为图结构问题,有效解决了实体重叠、嵌套等复杂场景下的识别难题,凭借这些突出成果,他荣获了中国科学院院长奖。

2022年博士毕业后,郁博文以阿里集团最高级别校招项目“阿里星”的身份加入阿里巴巴达摩院,担任算法专家(P7)。入职初期,他就深度参与了通义千问大模型的早期训练与研发工作,凭借出色的能力迅速成长为千问团队的核心骨干,并最终担任后训练负责人。

在后训练岗位上,郁博文成绩斐然。他主导了Qwen系列Chat模型的研发,运用监督微调(SFT)、强化学习(RLHF)、直接偏好优化(DPO)等技术,成功将通用大模型转化为符合人类价值观和使用习惯的对话模型。针对不同规模的模型,他设计了“四阶段进化论”和“知识蒸馏”策略,使得Qwen模型在长文本生成、复杂推理及多模态理解等任务上表现出色。在LMSYS Chatbot Arena等全球权威评测中,Qwen系列多次进入前十名。

然而,2026年3月,阿里通义实验室启动了组织架构调整,计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整使得郁博文的管理范围大幅缩小,而且与他坚持的“预训练与后训练必须深度耦合”的技术理念产生了冲突。阿里高层对千问团队施加的商业化考核压力,也进一步加剧了团队内部的分歧。

2026年3月3日,郁博文提交了辞职申请,并于次日正式离职。他的工作由前Google DeepMind高级资深研究员周浩接任。

字节Seed团队近年来在大模型和多模态领域持续投入资源、积极布局。郁博文的加入,无疑将为该团队在视觉与多模态交互方面的后训练能力带来显著提升,进一步推动字节在AI领域的发展。业界普遍认为,这一人事变动可能会引发大模型技术领域的新一轮竞争与合作格局的变化。

伊顿与欧特克合作:以AI能源数字孪生与软件工具赋能建筑数据中心升级
欧特克Tandem副总裁兼总经理Robert Bray表示:“通过整合伊顿在能源领域的专长与欧特克Tandem强大的数据可视化和集成能力,我们正在为建筑运营商提供从被动响应转向主动预测的工具,从而实现更高水…

2026-03-12

三星Galaxy S26系列美国预售成绩亮眼:多渠道增长,高端机型占比突出
最新统计显示截至 2026 年 3 月 9 日,在包括 Samsung.com、主要运营商和全国零售商在内的多个渠道上,Galaxy S26系列预购量相比上一代 S25 系列增长近 25%,而且在预订订单…

2026-03-11

2026年实用指南:免费PDF转Word工具大测评,手机操作轻松搞定
在2026年,我们推荐以下几款免费且实用的PDF转Word工具,它们不仅操作简便,而且功能强大,非常适合日常办公和学习使用。 PDF转换兔是一款专注于PDF转换的小程序,它以其简洁的操作界面和免费无套路…

2026-03-11