数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

谷歌发布第八代TPU:8t强训8i快推,为AI智能体发展筑牢算力根基

2026-04-23来源:快讯编辑:瑞雪

在近期举办的 Cloud Next '26 峰会上,谷歌正式推出第八代 TPU 架构,包含专为训练设计的 TPU 8t 和聚焦推理的 TPU 8i。这两款芯片将于 2026 年下半年面向市场开放,采用申请制分配,Google Cloud 用户需通过官网提交使用需求。目前原生 PyTorch 对 TPU 的支持处于预览阶段,谷歌正与特定合作伙伴及早期客户开展小规模测试,以优化算力资源分配策略。

TPU 8t 通过多项技术创新重塑模型训练格局。其搭载的 SparseCore 核心专为混合专家模型优化,可解决此类模型因参数不规则激活导致的内存访问瓶颈。结合谷歌自研的 Virgo 网络拓扑,芯片间通信带宽翻倍,外部数据中心连接带宽提升四倍。通过 Direct Storage 技术绕过 CPU 直接读取高速存储数据,训练速度提升达十倍。在算力集群方面,单个超级计算单元集成 9600 颗 TPU 8t 芯片,共享 2PB 内存,总算力达 121 ExaFlops,单位成本算力较前代提升 2.7 倍,能效比实现两倍增长。

针对实时推理场景,TPU 8i 通过硬件架构革新突破延迟限制。其配备的 288GB 高带宽内存和 384MB 片上 SRAM(容量为前代三倍),可将完整对话上下文缓存于芯片内部,减少外部数据交互。集体通信加速引擎(CAE)将芯片同步延迟降低五倍,互联带宽提升至 19.2 Tb/s。新型 Boardfly 网络拓扑借鉴 Dragonfly 架构思想,使千颗芯片系统中任意两点通信路径缩短 56%,从 16 跳减少至 7 跳。这些改进使推理任务性价比提升 80%,搭配谷歌自研 Arm Axion 架构 CPU 后,系统整体能效再获显著优化。

谷歌此次技术迭代精准回应了 AI 发展对芯片的差异化需求。训练场景需要极致算力与高效协同,推理场景则要求低延迟与高能效。第八代 TPU 通过架构分型实现专业分工,TPU 8t 构建的超级计算集群可支撑千亿参数模型训练,TPU 8i 的长上下文处理能力则推动 AI 从简单预测向复杂决策演进。随着这两款芯片向全球云客户开放,开发者无需掌握新编程语言即可调用算力资源,谷歌提供的开源参考模型代码将进一步降低技术门槛。这一布局或将重新定义智能体时代的算力基础设施标准。

科技与艺术的完美融合:HIFIMAN Edition XS耳机开启声学新体验
这款耳机采用纳米级超薄振膜,配合隐形磁体技术,能够精准还原音乐中的每一个细节,从低频的深沉到高频的清澈,都能完美呈现。 HIFIMANEdition XS隐形磁体版平板振膜耳机以其卓越的音质表现和舒适的佩戴…

2026-04-23

vivo Y600 Pro 4月27日登场:万级续航加持,入门中端新选择来袭
新机多方面已预热,比如万级长续航、机身强化、寰宇增强通信3.0、新机外观等方面,新机优势明确,不以高性能为主,重点均在机身、通信能力、续航能力上。 新机外观,屏幕延续上一代设计,经典的单孔直屏设计,屏边有所…

2026-04-23

华为Pura X Max首销来袭!折叠技术革新,性能影像双飞跃引期待
新机亮点明确,比如阔型屏、折叠技术、XMAGE智拍、小艺伴随式、性能大升级等方面,对比上一代,重点升级屏幕、影像、性能等方面,其它配置均为常规升级。 影像方面,外屏前置为8MP,内屏前置为8MP,后置为四摄,…

2026-04-23

OpenAI意外“剧透”:GPT-5.5等多款前沿AI模型提前现身Codex CLI界面
IT之家 4 月 22 日消息,OpenAI 今天(4 月 22 日)发布 ChatGPT Images 2.0 生图工具外,其偷跑的GPT-5.5 模型迅速成为网友热议焦点。根据部分网友反馈,在 Code…

2026-04-23

库克深情寄语特努斯:坚守苹果本心,以独特风格引领AI时代新辉煌
库克表示,特努斯是苹果未来的最佳领导者,希望他坚守苹果核心价值观,保持独立思考,做真实的自己,不要模仿乔布斯或自己,带领苹果在 AI 时代再创辉煌,延续改变世界的使命。苹果的成功,源于每一代领导者的独特风格与…

2026-04-23

Rufus 4.14 Beta版来袭:Windows 11静默安装+预装应用批量移除超实用
快科技4月22日消息,Windows启动盘制作工具Rufus发布4.14Beta版本,带来多项重大更新,其中最受关注的两项新功能是Windows 11静默安装和预装应用批量移除。 预装应用方面,Rufus …

2026-04-23