算苗科技3D TokenPU芯片流片，开辟AI推理新赛道助力云端算力升级-宏观经济-数据世界

近日，专注于3D架构AI云端大算力芯片研发的算苗科技对外宣布，其自主研发的3D TokenPU芯片A4E已于6月15日成功完成流片。这款芯片专为满足大模型推理需求而设计，基于自研的RISC-V架构，并采用成熟的国产工艺制造，旨在实现推理场景下的极致性能与更低的总拥有成本（TCO）。

算苗科技创始人兼CEO汪福全，同时也是中科院声学所国家重点实验室的博士，在接受采访时表示：“我们并非在既有的赛道上追赶，而是致力于开辟全新的方向。3D TokenPU专为大模型的Token处理而设计，无需过度依赖制程的缩小，就能实现算力密度和能效比的显著提升。”

A4E芯片的一大创新在于其存储与计算架构。它将8层存储晶圆垂直堆叠在计算逻辑晶圆之上，通过硅通孔（TSV）与凸点（bump）技术实现微米级的互联。这一设计将传统芯片间毫米级的传输距离大幅压缩，带来了超大的访存带宽，有效缓解了大模型推理过程中因数据搬运效率低下而导致的“数据饥饿”问题。

当前，AI算力的需求正逐渐从训练侧向推理侧转移。据德勤预测，长期来看，全球推理负载在AI算力中的占比有望超过80%。与此同时，开源的RISC-V架构正从“备选”逐渐走向“主流”，在数据中心及AI推理等场景中加速渗透。

车百智库的报告也指出，无论是电子电气架构还是智能驾驶解决方案，都高度依赖算力的合理分布与高效利用。算力已成为智能汽车的核心要素。与车端计算芯片相比，云端芯片需要承担更为复杂的训练任务和海量数据处理，因此其算力更为强劲。

据算苗科技的技术人士介绍，3D TokenPU目前主要面向云端大算力AI推理场景，可应用于头部大模型公司的超节点服务器、大型智算中心服务器，以及部分金融等专业领域需要私有化部署到本地的场景。随着汽车智联、智驾功能的日益普及，许多智能化处理同样需要通过云端服务器完成，其中就会涉及云端AI服务器，因此3D TokenPU这类推理芯片也将有机会在这些领域得到应用。