数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

算苗科技3D TokenPU芯片流片,开辟AI推理新赛道助力云端算力升级

2026-06-18来源:天脉网编辑:瑞雪

近日,专注于3D架构AI云端大算力芯片研发的算苗科技对外宣布,其自主研发的3D TokenPU芯片A4E已于6月15日成功完成流片。这款芯片专为满足大模型推理需求而设计,基于自研的RISC-V架构,并采用成熟的国产工艺制造,旨在实现推理场景下的极致性能与更低的总拥有成本(TCO)。

算苗科技创始人兼CEO汪福全,同时也是中科院声学所国家重点实验室的博士,在接受采访时表示:“我们并非在既有的赛道上追赶,而是致力于开辟全新的方向。3D TokenPU专为大模型的Token处理而设计,无需过度依赖制程的缩小,就能实现算力密度和能效比的显著提升。”

A4E芯片的一大创新在于其存储与计算架构。它将8层存储晶圆垂直堆叠在计算逻辑晶圆之上,通过硅通孔(TSV)与凸点(bump)技术实现微米级的互联。这一设计将传统芯片间毫米级的传输距离大幅压缩,带来了超大的访存带宽,有效缓解了大模型推理过程中因数据搬运效率低下而导致的“数据饥饿”问题。

当前,AI算力的需求正逐渐从训练侧向推理侧转移。据德勤预测,长期来看,全球推理负载在AI算力中的占比有望超过80%。与此同时,开源的RISC-V架构正从“备选”逐渐走向“主流”,在数据中心及AI推理等场景中加速渗透。

车百智库的报告也指出,无论是电子电气架构还是智能驾驶解决方案,都高度依赖算力的合理分布与高效利用。算力已成为智能汽车的核心要素。与车端计算芯片相比,云端芯片需要承担更为复杂的训练任务和海量数据处理,因此其算力更为强劲。

据算苗科技的技术人士介绍,3D TokenPU目前主要面向云端大算力AI推理场景,可应用于头部大模型公司的超节点服务器、大型智算中心服务器,以及部分金融等专业领域需要私有化部署到本地的场景。随着汽车智联、智驾功能的日益普及,许多智能化处理同样需要通过云端服务器完成,其中就会涉及云端AI服务器,因此3D TokenPU这类推理芯片也将有机会在这些领域得到应用。

国产GLM-5.2来袭:编码实力比肩国际大模型,但挑战仍在路上
第二个问题是模型的上下文长度只支持到了 256k,这就导致但如果你用它干点稍微复杂的活,上下文一被塞满,模型的能力就会有所下降。 当然,跑分再高也只能做个参考,为了看看它是不是一个只会刷题的小镇做题家,世超…

2026-06-18

阿斯麦CEO谈马斯克Terafab项目:确保供应能力避免成发展瓶颈
法国巴黎举行的VivaTech科技大会期间,阿斯麦(ASML Holding NV)首席执行官克里斯托夫·富凯(Christophe Fouquet)表示,在为马斯克的Terafab等新项目提供服务时,公司必…

2026-06-18