数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升

2025-08-24来源:ITBEAR编辑:瑞雪

中国人工智能领域的明星企业DeepSeek近期宣布了其旗舰大语言模型的重大更新,新版本针对即将面世的新一代国产芯片进行了专门优化。

据DeepSeek介绍,此次升级采用了名为UE8M0的新型数据类型来训练V3.1模型,这是对现有FP8格式的一种扩展,已被英伟达等业界巨头所支持。DeepSeek在微信平台上澄清,这一变化是为了更好地适配即将推出的国产芯片,指出“UE8M0 FP8专为新一代国产芯片设计”。

使用较低精度的数据类型带来了诸多优势,包括减少内存占用和提升推理及训练速度。值得注意的是,DeepSeek之前已经在使用FP8格式中的E4M3类型。因此,转向UE8M0更多是为了确保与新一代芯片的兼容性,而非单纯追求效率提升。

虽然DeepSeek未透露新模型所适配芯片的具体制造商,但有报道称这家AI初创公司与华为有着紧密合作,利用华为的昇腾系列神经处理单元(NPU)进行模型训练和推理。华为的昇腾910C为其CloudMatrix机架系统提供动力,但目前不支持FP8格式,这或许意味着华为正在研发性能更强大的加速器。

有消息指出,DeepSeek曾尝试在华为昇腾加速器上训练其下一代R2模型,但因遇到困难而改用英伟达的H20加速器。不过,DeepSeek目前仍在评估华为加速器的推理性能。

关于R2模型,目前尚不清楚它是否就是此次发布的V3.1版本,或是另一个即将推出的模型。

值得注意的是,DeepSeek V3.1并非从零开始的全新模型,而是基于早期V3版本的检查点进一步训练而成。尽管如此,这一新版本在功能上有显著改进。V3.1版本不再区分“思考型”和“非思考型”模型,而是将两种范式整合到单一模型中,并通过聊天模板实现模式切换。因此,DeepSeek的聊天机器人界面也不再提及R1版本。

统一模型以支持推理和非推理输出的概念并非DeepSeek首创。阿里巴巴今年早些时候也曾尝试过类似做法,但因发现该功能降低了模型质量而放弃。然而,在基准测试中,DeepSeek的V3.1版本似乎成功避免了这一问题。与V3版本相比,V3.1的非思考模式在各项指标上都有显著提升。

在启用思考功能后,V3.1版本的性能提升虽然相对温和,但DeepSeek指出,该模型现在需要更少的思考Token就能给出答案,这将有助于降低模型服务的成本。

在上下文处理能力方面,DeepSeek将V3.1版本的上下文窗口(即短期记忆)从65,536个Token扩展到131,072个,尽管这一数字仍然落后于阿里巴巴的Qwen3等其他中国模型,后者能处理高达百万级的Token上下文。

DeepSeek还声称在工具和函数调用能力方面取得了重大进展,这对于需要实时检索外部数据和调用工具的AI工作负载至关重要。例如,在针对自主浏览器使用任务的Browsecomp基准测试中,DeepSeek V3.1版本获得了30分的高分,而R1版本的5月版本仅得8.9分。

除了通过聊天机器人服务和API端点提供服务外,DeepSeek还在Hugging Face和ModeScope平台上提供了基础模型和指令调优模型的权重下载,方便开发者进一步定制和优化。

关于DeepSeek V3.1版本的更多信息,以下是几个常见问题及解答:

Q:DeepSeek V3.1有哪些新特点?

A:V3.1版本最大的特点是使用UE8M0数据类型进行优化,专为即将发布的国产芯片设计。同时,它整合了“思考型”和“非思考型”模型功能,在单一模型中通过聊天模板实现模式切换,并将上下文窗口的Token数量大幅提升。

Q:为什么DeepSeek要切换到UE8M0数据类型?

A:DeepSeek切换到UE8M0主要是为了与即将推出的新一代国产芯片保持兼容。尽管公司之前已在使用FP8的E4M3类型,但UE8M0是专为新一代国产芯片设计的,预示着可能有更强大的国产加速器即将面世。

Q:DeepSeek V3.1版本的性能如何?

A:在基准测试中,V3.1版本的非思考模式相比V3版本在各项指标上都有显著提升。在工具调用方面,V3.1版本在Browsecomp浏览器任务测试中得分高达30分,远超R1版本的8.9分。同时,该模型现在需要更少的思考Token就能给出答案,有助于降低服务成本。

SK海力士新DDR5芯片“X021”亮相:或适配Intel未来处理器,原生频率达7200MT/s
快科技10月22日消息,SK海力士的全新DDR5内存芯片近日在网络上出现,据称代号为“X021”,并带有新的零件编码“AKBD”。 根据unikoshardware的说法,芯片上的“X021”标记表明它是第二…

2025-10-22

魔方网表,以技术为本,坚定的长期主义者
全球数字化的汹涌浪潮推着各行各业不断向前,商业世界正在以前所未有的速度与频率经历巨变。对此,企业如何快速有效地在日益复杂的市场环境下,抓住自身的发展机遇,是各行各业的急需解答的难题,而数字化转型又成为其中的必修之课。然而,对很多企业来说,快速变化的业

2025-10-22

售价13000元!三星Galaxy XR头显发布 直面苹果Vision Pro高端之争
【CNMO科技消息】10月21日,三星正式发布了其首款混合现实头戴设备——GalaxyXR,官方售价定为1799.99美元(约合人民币13000元),直接瞄准了苹果Vision Pro的高端市场。借助头显的…

2025-10-22

性能与美学的双重盛宴:iQOO 15的自我修养与突破
前面我们详细聊过,它把一块自研电竞芯片Q3塞进机身,像给手机装上一块真正的“独显”,再辅以双轴马达、对称大师双扬和一位随时陪练的AI军师——这一次,性能旗舰的终点不再是冷冰冰的跑分,而是指尖、耳朵,甚至心脏都…

2025-10-21

国家广电总局首颁“便捷看电视”认证,认准标志选电视享便捷观影体验
IT之家 10 月 20日消息,国家广播电视总局今日宣布,国家广播电视总局广播电视规划院为首款符合认证标准的智能电视机颁发“便捷看电视”认证证书。这款率先通过认证的产品由康佳研发打造,即将正式上市销售。 作…

2025-10-21

2025上半年全球智能眼镜出货增64.2%,2029年或破4000万台中国增速居首
【环球网科技综合报道】10月21日消息,市场研究机构(IDC)发布报告显示,2025上半年,全球智能眼镜(AI眼镜)市场出货量达406.5万台,同比增长64.2%。 IDC预计,到2029年全球智能眼镜市场出…

2025-10-21

牌面拉满!比亚迪成为多国元首的选择
近年来,我国新能源汽车产业在科技创新驱动下实现跨越式发展,比亚迪作为行业领军企业,技术领先全球瞩目,凭借过硬的技术实力与产品品质,赢得多国元首青睐,成为“中国制造”向“中国智造”转型升级的典型代表,更成为传递中国科技实力的“移动新名片”与“无声外交官

2025-10-21

IDC报告:百度智能云智算服务市场份额第一,GenAI IaaS增速最快
10月21日,国际权威咨询机构IDC发布了《中国智算专业服务市场(2025上半年)跟踪》报告。其中,在智算解决方案实施服务市场中,百度智能云以19.9%的份额位居第一;在GenAI IaaS领域,百度智能云实现近5倍增长,增速位居市场首位。随着大模型及AI应用的爆发,云计算正在以C

2025-10-21

抖音电商持续治理虚假宣传保健功效,清退违规达人4.3万名,违规商家793家
10月20日,抖音电商安全与信任中心发布治理虚假宣传保健功效的进展,公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象,已成为食品行业的顽疾。据了解,部分不良商家、达人将普通食品包装为“保健品”或“特医食品”,甚至将保健食品夸大为具有医疗功效,损

2025-10-21