数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

英伟达Feynman GPU或集成LPU技术 3D堆叠设计能否引领AI推理新潮流?

2025-12-30来源:快讯编辑:瑞雪

科技领域近期传出重磅消息,英伟达正酝酿一项大胆计划,意图在2028年推出的新一代GPU产品中集成创新技术,以巩固其在AI推理市场的领先地位。这款代号为“费曼”(Feynman)的GPU,将首次尝试融合Groq公司的LPU(语言处理单元)架构,引发行业高度关注。

命名灵感源自诺贝尔物理学奖得主理查德·费曼的这款GPU,其设计理念借鉴了AMD在X3D处理器上的成功经验。行业专家AGF通过技术分析指出,英伟达极有可能采用台积电最先进的SoIC混合键合技术,通过3D堆叠实现芯片架构的重大突破。这种设计将计算核心与存储单元分离制造,再通过垂直堆叠实现高效互联。

具体实现方案显示,主计算模块将采用台积电1.6nm制程的A16工艺制造,集成Tensor计算单元与控制逻辑。而包含大规模SRAM存储阵列的LPU模块则会单独制造成独立芯片,直接堆叠在计算核心上方。这种设计充分利用了A16工艺的背面供电特性,通过释放正面空间实现超低延迟的数据传输通道,理论上可带来显著的性能提升。

推动这种复杂架构设计的核心动因,源于半导体物理层面的现实约束。随着制程工艺向原子级迈进,SRAM存储单元的缩放速度已明显落后于逻辑电路。若在先进制程节点上集成大容量SRAM,不仅会造成高端硅片的浪费,更会导致晶圆成本呈指数级增长。将存储单元剥离为独立芯片进行堆叠,成为平衡性能与成本的最优技术路径,这也与当前芯片行业盛行的“芯粒”(Chiplet)化趋势不谋而合。

尽管3D堆叠方案在理论层面具有显著优势,但其工程实现仍面临多重挑战。首当其冲的是散热问题,在原本高密度的计算核心上叠加存储芯片,极易突破热功耗极限。更棘手的是软件生态适配难题:Groq的LPU架构强调确定性执行流程,而英伟达现有的CUDA生态则建立在硬件抽象与灵活调度基础之上。如何在保持CUDA兼容性的同时,实现两种异构架构的无缝协同,将成为考验英伟达工程团队的关键课题。

这项技术革新若能成功落地,不仅将重新定义AI推理芯片的性能标准,更可能引发整个半导体行业的架构革命。但从业界反馈来看,从实验室原型到商业化产品仍需跨越散热设计、信号完整性、制造良率等多重技术门槛。这场由行业巨头主导的技术博弈,正在为全球AI硬件发展开辟新的可能性空间。

华为Pura 80系列升级鸿蒙6,功能体验升级,年底换机选它正当时!
全新鸿蒙6带来了“小艺一句话修图”,让普通用户也能轻松完成过去需要专业软件才能实现复杂修图。旅途中遇见绝美风景或精致物件,只需手持华为Pura 80系列环绕主体拍摄一段视频,系统便能自动生成一个可360度…

2025-12-30

智能办公本怎么选?科大讯飞X5Pro、Remarkable 2、BOOX Nova Air C横向对比助你决策
今天,我们将对比几款市场上备受关注的智能办公本,包括科大讯飞智能办公本X5Pro、Remarkable 2、BOOX Nova AirC等,帮助你找到最适合你的办公工具。 科大讯飞智能办公本X5Pro是近年…

2025-12-30

石头科技:全员勤勉坚守,2025年将加码创新拓宽渠道促长远发展
证券日报网讯 12月29日,石头科技在互动平台回答投资者提问时表示,公司从治理层、管理层到团队成员一直勤勉尽责、坚守岗位,为石头科技的经营和发展投入了大量的时间和精力、献策献力。2025年,公司将继续实施技术…

2025-12-30