DeepSeek 今日宣布推出实验性大模型 DeepSeek-V3.2-Exp,该模型在长文本处理领域实现了技术突破。通过引入自主研发的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,新模型在保持性能稳定的同时,显著提升了训练与推理效率。
作为 DeepSeek-V3.1-Terminus 的升级版本,V3.2-Exp 的核心创新在于首次实现了细粒度稀疏注意力机制。这种技术通过动态调整注意力权重,在处理超长上下文时能够精准聚焦关键信息,减少无效计算。据官方披露,DSA 机制在几乎不损失模型输出质量的前提下,将长文本场景下的资源消耗降低了约40%。
为验证新机制的实际效果,研发团队采用与前代模型完全相同的训练配置进行对比测试。公开评测数据显示,V3.2-Exp 在多项基准任务中的表现与 V3.1-Terminus 持平,部分复杂推理任务甚至略有提升。这一结果证明,稀疏化改造并未影响模型的核心能力,反而通过优化计算路径提升了整体效率。
技术升级带来的成本优势迅速转化为市场策略。DeepSeek 同步宣布将 API 服务价格下调超50%,开发者调用单次推理的成本降至行业最低水平之一。官方负责人表示,此举旨在降低 AI 技术应用门槛,推动自然语言处理技术在更多垂直领域的落地。
目前,DeepSeek 官方 App、网页端及小程序已完成版本更新,用户可无缝体验新模型带来的性能提升。技术社区普遍认为,这种通过架构创新实现效率跃升的路径,为大规模模型优化提供了新的研究方向。据内部人士透露,团队正基于 DSA 机制研发下一代通用大模型,预计将在年内推出更高效的版本。
上市72小时即交付,全新问界M7交付现场竟然她们也来了!
文 / 小林美编 / 顾青青出品 / 电动新物种9月26日的问界M7交付现场,来了一群特殊的客人。中国国家艺术体操队的姑娘们穿着训练服,好奇地打量着眼前这台刚刚上市就火爆全网的新车。她们伸手触摸车身线条,就像在赛场上感受器械的质感一样专注。一边是刚刚创下“一小时大
2025-09-30
伊利和京东,将搭子进行到底
大厂们悄悄拿捏搭子经济学。消费市场的气温,总是比季节变化更快。今年中秋,月饼的销量依旧撑起了节日的半边天,但另一边,消费者的行为却显得更有意思:买月饼的时候,顺手加一箱牛奶。对品牌而言,这不是小动作,而是节点营销的新答案:当越来越多消费者拒绝复杂、拒
2025-09-29
贾跃亭公布FX品牌第二款车型FX 4产品计划 目标AIEV时代下RAV4颠覆者
9月29日,Faraday Future(FF)创始人、联席CEO贾跃亭公布了FX品牌第二款车型FX 4产品计划,目标是打造AIEV时代下RAV4的颠覆者;同时宣布在10月28日举行FX Super One中东Final Launch发布会,并计划11月率先在中东市场开启交付,并发布FX 4重大项目进展及产品设计图。此外
2025-09-29
双11节奏出炉:10月9日晚8点开启 主打官方直降
今年11.11购物节,正式定档10月9日开启!9月29日,京东宣布,今年京东11.11将于10月9日晚8点现货开卖。在汇集海量热销爆款好物的同时,将提供“官方直降 低至1折”的优惠福利,为消费者带来又好又便宜的消费体验!京东11.11选择在“十一黄金周”结束后的第一天启动,将为
2025-09-29