数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

从清华少年到OpenAI骨干:翁家翌如何用“铲子”撬动AI未来?

2026-01-21来源:快讯编辑:瑞雪

在人工智能领域,OpenAI一直是备受瞩目的创新引擎,而其核心团队中有一位来自中国的工程师——翁家翌,近日在AI播客WhynotTV Podcast中分享了他从清华学子成长为OpenAI基础设施骨干的非凡经历,引发了广泛关注。

翁家翌在强化学习与后训练(Post-Training)系统开发中扮演着关键角色,深度参与了GPT-3.5、GPT-4、GPT-5等里程碑式模型的训练工作。他构建的基础设施系统不仅成为OpenAI内部大模型训练与迭代的核心支撑,更是ChatGPT持续进化的重要基石。在长达两个多小时的深度对话中,他首次公开了OpenAI内部Post-Training系统的构建逻辑,并剖析了公司持续产出爆款模型的成功要素。

从清华大学到OpenAI,翁家翌的职业轨迹充满传奇色彩。在清华求学期间,他就展现出与众不同的思维模式——将所有作业开源共享,打破信息壁垒,这一举动在校园内引发轰动。他坦言:"在清华,信息差常被视为生存资源,但我认为每个人都应平等获取知识。"这种理念贯穿了他的整个职业生涯。

大学时期,翁家翌的科研方向几经转折。从图形学到网络安全,再到最终专注的强化学习,他始终保持着对技术本质的探索热情。大二时,他与学长发现并修复了清华校园网的漏洞,使原本需要付费的成绩单下载服务变为免费,这一经历不仅锻炼了他的实战能力,更坚定了他用技术解决实际问题的信念。

在强化学习领域,翁家翌的探索之路并非一帆风顺。他回忆道,早期在一个上世纪90年代的游戏中训练神经网络时,常常需要"疯狂地用技巧防止训练崩掉",这种"炼丹"般的体验让他意识到工具层面的重要性。大四时,他决定转向基础设施开发,这一战略选择为他日后在OpenAI的工作奠定了基础。

2020年,面对多家科技巨头的橄榄枝,翁家翌最终选择了当时尚未广为人知的OpenAI。"我想体验世界最前沿的research是怎么做的",这个决定源于他对强化学习和系统能力的深刻认知。加入初期,他就参与了WebGPT后续项目,构建的RL训练系统在ChatGPT上线前已成为公司主力基础设施之一。

在OpenAI,翁家翌主导搭建了强化学习后训练阶段的核心基础设施,他的工作哲学是"把infra地基打好,让别人去玩"。他将自己定位为"卖铲子里最面向客户的那位",因为强化学习模块处于基础设施栈的最顶端。这种定位使他能够直接影响模型训练的效率和效果。

对于OpenAI持续推出爆款模型的现象,翁家翌归因于两个关键因素:高效率的迭代机制和技术领导层的深度参与。他透露,公司引入前Google工程负责人后,团队开始系统性提升工程效率,"RL本质上就是试错,试得越快越多,成功就越近"。而领导层对技术细节的强关注,确保了组织上下信息通畅,避免了"身子动了,脚没动"的执行困境。

在ChatGPT 3.5发布前,翁家翌就已在GPT-4上验证了RLHF流程的可行性。他回忆道,当时需要从头构建许多关键流程,最大的挑战在于模型效果的衡量标准不清晰。"你训练出很多个checkpoint,但不知道哪个更好",最终团队只能依赖"人机协同"的评估流程,通过内部员工交互测试来选出最佳版本。

面对外界对OpenAI"不开放"的批评,翁家翌有着深刻理解。他认为开源与商业可持续之间存在必然取舍:"你没法直接把最好的模型开源,因为公司要生存。"在他看来,OpenAI的"Open"战略体现在降低使用门槛上,比如提供免费版本和语音模式体验,这比直接开源模型权重更有实际意义。

对于AGI(通用人工智能)的定义,翁家翌认为不存在统一标准:"OpenAI内部15个人可能有20种定义方法。"他个人倾向于任务完成度的量化标准:"如果它能完成80%、90%我认为有意义的任务,那可能就是AGI了。"不过,他坦言当前模型尚无法完全接管他负责的代码修改工作,因为AI infra的数据集覆盖度仍然不足。

在组织管理层面,翁家翌观察到大型科技公司的共同挑战——规模带来的效率衰减。他提到DeepSeek的快速迭代曾引发OpenAI内部警觉,这也是公司决定重构Infra的原因:"Infra的迭代是OpenAI的生死线,我们早就不做为了刷榜而做的事了。"

展望未来,翁家翌提出了一个大胆设想:具有无限上下文记忆能力的AI Agent可能成为最合适的CEO。他认为,当前组织臃肿、信息共享不一致的问题源于人类认知的局限性,而AI可以突破这些限制,未来或许能承担起决策者的核心角色。

当被问及如果拥有预测未来的能力会如何时,这位技术理想主义者表现出罕见的谨慎:"这会导致所有价值体系的崩塌。"他选择专注于当下,"假装不知道世界是否确定",这种哲学思考折射出他对技术伦理的深刻反思。

轻薄与性能兼得 红魔11 Air:游戏手机中寻得完美平衡新路径
因此红魔11 Air甚至比一些常规手机还要轻薄,手感更好,已经快没什么理由拒绝游戏手机了,很好地在游戏手机和常规手机找到了一个平衡点。 还有屏幕在近距离观看时,可观察到轻微的纵向纹理底噪,尽管多数时候因为人…

2026-01-20

春节前手机圈热闹非凡:荣耀新机引热议 小米挑战续航 vivo推新色 OPPO传佳绩
当友商还在一味的借鉴iPhone时,荣耀已经做到了超越iPhone,把iPhone Air的短板全部都补齐了,且价格比iPhoneAir有诚意多了。 都是为春节市场做准备vivo来了点不一样的,就在今天官方…

2026-01-20

全球数亿iPhone用户注意!多数需升级iOS 26,仅三款旧机型可留旧版
这意味着自去年12月12日起,iPhone 11及以上机型需升级至iOS 26,否则将停留在无安全维护的旧系统。《福布斯》报道称,苹果大概率会在推送iOS 26.3时,同步发布XS系列专属的iOS 18.…

2026-01-20

雷蛇Project AVA选Grok AI引争议,CEO陈民亮详解背后考量
IT之家 1 月 20 日消息,雷蛇(Razer)此前发布了一款名为“ProjectAVA”的人工智能桌面设备,其核心功能是投射出一个被描述为“虚拟女友(waifu)”的全息形象。 雷蛇为这款设备推出了多款…

2026-01-20

2026年vivo快充充电宝选购指南:精准适配机型,差旅办公高效补能
选购vivo/iQOO专属快充充电宝,需牢记五大核心要点:20000mAh(74Wh)合规登机容量是差旅/办公族基础,匹配机型的FlashCharge功率版本是vivo用户核心,VFCP+PD3.0+PPS…

2026-01-20

2026年货节1000-2000元手机大搜罗!父母学生游戏党闭眼入好机来啦
每年这个时候都是给爸妈换手机、学生党换装备的黄金期~今天整理了9款1000-2000元价位的宝藏机型,从续航战神到游戏神器应有尽有,款款都是年货节闭眼入的真香机!骁龙6 Gen1处理器虽然性能一般,但荣耀的系…

2026-01-20