数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

黄仁勋谈AI芯片内存之争:SRAM容量受限 难撼HBM核心地位

2026-01-10来源:快讯编辑:瑞雪

在近期举办的CES 2026展会上,英伟达首席执行官黄仁勋就行业热议的“是否能用低成本SRAM替代昂贵HBM”问题给出了明确回应。这一讨论源于AI领域对降本增效的迫切需求——随着SRAM加速器、GDDR推理方案及开放权重模型的兴起,部分从业者认为这些技术可减少对英伟达高成本硬件的依赖。

SRAM(静态随机存取存储器)凭借其基于触发器的高速特性,在基准测试中展现出无延迟的访问优势,甚至被视为HBM(高带宽内存)的潜在替代者。黄仁勋承认,对于特定工作负载,SRAM的速度表现“令人惊叹”,但其致命缺陷在于容量限制——当前SRAM可容纳的模型规模仅为HBM系统的百分之一。当AI模型因上下文扩展或功能增加而超出SRAM容量时,系统必须调用外部内存,导致效率优势瞬间丧失。

他进一步指出,现代AI模型的多样性加剧了硬件适配的难度。混合专家模型(MOE)、多模态任务、扩散模型及自回归模型等架构对硬件的需求差异显著:有的依赖显存容量,有的依赖互连带宽(如NVLink),且需求随任务变化动态调整。若硬件过度优化某一特性(如纯SRAM方案),一旦工作负载类型改变,昂贵的芯片将因无法兼容而闲置,造成资源浪费。

基于这一判断,英伟达坚持选择HBM作为核心内存方案。黄仁勋解释,在共享数据中心场景中,硬件的灵活性直接决定经济效益。尽管HBM的物料成本更高,但其能适配算法和模型架构的快速迭代,确保硬件在数周甚至数月的运营周期内保持高利用率。相比之下,专用硬件虽能在5%-10%的任务中表现极致,却无法覆盖其余90%的通用需求,长期来看反而增加成本。

针对“开放模型是否会削弱英伟达技术壁垒”的质疑,黄仁勋回应称,开放并不等同于降低硬件要求。随着开放模型整合更长上下文和更多模态,其内存占用同样会呈指数级增长。英伟达选择承担HBM的高成本与复杂系统设计,正是为了保留“可选性”——既避免客户被锁定在狭窄的性能范围,也保护自身硬件免受模型架构快速迭代的冲击。这一策略的核心在于平衡短期成本与长期适应性,以应对AI技术演进的不确定性。

周鸿祎预言2026:百亿智能体时代来临,AI重塑经济与社会新格局
1月9日,360集团创始人周鸿祎在其个人社交平台发布题为《2026年AI全景预测:迈向百亿智能体时代的20个发展趋势》的重磅观点,系统提出对人工智能未来一年发展的二十大核心预测。百亿级智能体将全面融入经济社…

2026-01-10

雷军透露2026年小米新品:自研芯片、OS与AI大模型将“三剑合璧”
颁奖现场,雷军重磅爆料,2026年小米将推出一款终端产品,实现自研芯片、自研OS与自研AI大模型的“大会师”。 编辑点评:从玄戒O1获奖到玄戒O2蓄势,再到MiMo-V2-Flash跻身开源大模型第一梯队,…

2026-01-10

固态电池2027量产倒计时:材料路线分歧待解 设备配套挑战重重
据王硕介绍,目前硫化物固态电池尚未跑通量产的主要难点有两个:一是“固—固界面问题”导致电池循环次数较低,直接影响电池寿命;二是电池循环过程中外压降低难题——在循环过程中,电极材料,硅碳负极等电极材料会发生体…

2026-01-09

2025年2000元档手机怎么选?荣耀500凭硬核配置成全能性能王
本文将围绕性能、影像、续航等核心维度,对比Redmi K80、vivo Y500 Pro、realme GTNeo6等同价位机型,为预算2000元左右的用户提供真实客观的购机参考。 在2000元左右性能最强…

2026-01-09