数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek团队揭秘:清北应届生领衔,年轻力量如何撑起AI大模型新篇章?

2025-01-04来源:ITBEAR编辑:瑞雪

在人工智能领域,一支年轻的团队正以惊人的速度崛起,他们的名字叫做DeepSeek。近期,DeepSeek发布的DeepSeek-v3大模型,以仅为Llama 3 405B模型1/11的算力,实现了超越前者的性能,这一成就迅速在AI圈内引起了轰动。

随着DeepSeek-v3的发布,关于该团队的各种传闻也随之而来,其中最为引人注目的是“雷军开出千万年薪挖角DeepSeek研究员罗福莉”的消息。这一传闻不仅让科技圈沸腾,更让全网都对这支神秘的团队充满了好奇。

DeepSeek究竟有何魅力?为何能吸引如此多的关注?从各种资料中,我们可以发现,这支团队的最大特点就是年轻和充满活力。团队成员中,应届生、在读生占据了相当大的比例,特别是来自清华大学和北京大学的应届生,更是团队中的佼佼者。

在这些年轻的面孔中,不乏已经在学术界崭露头角的佼佼者。例如,有的成员在DeepSeek搞研究的同时,其博士学位论文还获得了奖项的认可。他们中的一些人,从DeepSeek LLM v1开始,就参与了团队的工作,一直到现在,已经成为了团队中的中坚力量。

DeepSeek的核心成员中,高华佐和曾旺丁是MLA架构的关键创新者。MLA(Multi-head Latent Attention)是DeepSeek-V2中的一项重要创新,它大幅减少了计算量和推理显存,为DeepSeek-V2的成功奠定了坚实的基础。而曾旺丁,则来自北京邮电大学,其导师是北邮人工智能与网络搜索教研中心主任张洪刚。

除了MLA,DeepSeek-V2还涉及到了另一项关键成果——GRPO。GRPO是PPO的一种变体RL算法,它显著减少了训练资源的需求,受到了业内的广泛关注。这一成果的背后,也有着年轻研究员的辛勤付出。邵智宏、朱琪豪和Peiyi Wang等核心作者,在DeepSeek实习期间就完成了这一工作。

邵智宏是清华大学交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。他的研究领域包括自然语言处理和深度学习,对构建一个稳健且可扩展的AI系统有着浓厚的兴趣。朱琪豪则是北京大学计算机学院软件研究所的博士毕业生,他的研究方向是深度代码学习,曾发表多篇CCF-A类论文。

DeepSeek的创始人梁文锋,在团队的建设上有着独到的见解。他强调,团队的核心技术岗位主要以应届和毕业一两年的人为主,看能力而不是看经验。这一理念贯穿了整个团队的招聘和人才培养过程,使得团队能够吸引并留住大量的年轻才俊。

除了团队成员的年轻化,DeepSeek在国内AI公司中还有着另一个突出的特点:非常重视模型算法和硬件工程的配合。在DeepSeek-v3的论文中,有200位作者参与了这一工作,他们不仅负责AI算法和数据,还参与了硬件的优化和算力的提升。

这种软硬件协同的设计,使得DeepSeek能够以极低的算力实现高性能的大模型训练。而这一切的背后,离不开团队中那些既懂算法又懂硬件的年轻工程师们的辛勤付出。

DeepSeek的运作模式也让人想起了另一家AI界的巨头——OpenAI。同样不看经验、重用新人,同样面对潜力方向时从顶层开始设计布局和资源推动。或许,在未来的某一天,DeepSeek会成为组织形态上最像OpenAI的中国AI公司。

百度发布多项AI重磅成果,李彦宏:内化AI能力让智能不再是成本而是生产力
“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”11月13日举办的2025百度世界大会上,百度创始人李彦宏演讲时表示,更应关心如何让AI跟每一项任务有机结合,“让AI成为企业发展和个人成长的原生推动力。”作为最早进军AI赛道的科技公司,百度正

2025-11-13

昆仑芯未来五年“按年上新”,百度智能云宣布打造最硬AI云
11月13日,在百度世界2025大会上,百度智能云正式发布全新一代昆仑芯及基于昆仑芯的超节点产品天池,并公布未来五年按年推出新产品的规划。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,AI基础设施一定是长期投资,面向未来百度智能云将坚定长期布局,持续打造最

2025-11-13

双十一声学品类迎来“迷你风暴”,BOYAmini系列以技术革新领跑无线麦克风市场
随着“双十一”购物狂欢的开启,消费电子品类再度成为用户关注的焦点。在音频设备领域,轻量化、智能化与专业化的融合正成为新的趋势。据京东平台10月20日的“首小时战报”显示,BOYA品牌在数码影音娱乐类目中,专业音频解决方案厂商排名第一,搜索量与销售额双双跻身榜

2025-11-11

合合信息与上海交通大学开展课题合作研究,共探智能文档图像处理前沿技术
计算机视觉技术作为AI的“眼睛”,是当前人工智能领域的重要研究方向。近期,计算机视觉领域三大顶级学术会议之一的国际计算机视觉大会(ICCV 2025)顺利举行。会议期间,合合信息联合上海交通大学等机构主办了首届VQualA视觉质量评估研讨会,同时,为了推动建立智能文档

2025-11-07

伊利与京东启动“试销实验室” 打造新品孵化生态标杆
11月3日,伊利集团与京东联合举办战略合作发布会,正式启动“伊利x京东试销实验室”。此举标志着双方的合作由传统的渠道销售,全面迈向了基于用户洞察、共创产品、整合供应链的“价值共生”新阶段。现场直击:从“渠道铺货”到“用户造品”的战略升维依托京东新品创新中

2025-11-05

启信宝获得法博会“行业洞见奖”,相关服务即将登陆“深律通”
为构建多元联动、创新开放的法律服务体系,近日,以“以法律创新护航科技与产业创新”为主题的2025深圳法律服务博览会(下称“法博会”)顺利举办,吸引国内外权威机构和行业专家参与。合合信息旗下启信宝凭借其在法律科技领域的创新应用,于法律科技产品大赛中斩获“行业

2025-11-04

陈天桥在AIAS上提出:发现式AI而不是生成式AI是AGI的标准
10月27日、28日,AI驱动科学研讨会(Symposium for AI Accelerated Science,AIAS 2025)在美国旧金山举行。会议汇聚了近30位全球顶尖学者与产业领袖,与现场数百位学者、学生共同探讨AI如何驱动科学发现。会上,盛大集团、天桥脑科学研究院创始人陈天桥发表主题演讲,首

2025-11-03

从国家授时中心攻击事件,看数据中心安全的底层逻辑与实践路径
近期,国家安全教育日披露的美国国家安全局对我国国家授时中心的长期攻击案件,让关键信息基础设施的安全防护问题再次成为焦点。作为支撑金融交易毫秒级同步、电力调度精准控制、航空航天轨道计算的“时间中枢”,国家授时中心的安全直接关联国计民生运转,而此次攻击的

2025-10-30

Excel服务器2025实现了不用安装Excel也能实现Excel共享
想象一下这样的场景:企业信息化部门的王经理正在部署一套传统的Excel服务器,却被告知必须为每台电脑安装特定版本的Office软件;业务部门的小张发现,虽然名为“服务器”,但想要在手机上审批流程却无法实现;财务总监李总需要整合ERP和CRM系统的数据生成经营分析报告,

2025-10-28

全国盛会·智育未来——大沩赋能AI体育教育高质量发展
10月24日至26日,第86届中国教育装备展示会在青岛世界博览城成功举办。本届展会以“人工智能引领教育装备高质量发展”为主题,由中国教育装备行业协会主办,山东省教育厅和青岛市人民政府共同承办,集中展示了全国教育装备领域的最新技术成果与应用实践。浙江大沩携其智

2025-10-25