数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

字节跳动Seed团队开源推理大模型,Seed-OSS系列斩获7项SOTA成绩

2025-08-22来源:ITBEAR编辑:瑞雪

近日,字节跳动旗下的Seed团队在开源领域迈出了重要一步,正式推出了Seed-OSS系列模型。这一系列模型专为长上下文处理、推理任务、智能体交互及通用场景设计,其上下文窗口长度达到了前所未有的512k,这一数字是业界常规标准的四倍,甚至超越了GPT-5的两倍,相当于能够一次性处理约1600页文本的信息量。

Seed-OSS系列模型不仅针对推理任务进行了深度优化,还创新性地引入了思维预算功能,允许用户根据实际需求灵活调整模型的推理成本。这一特性使得开发者能够在保证模型性能的同时,有效控制资源消耗,提升用户体验。

此次开源的Seed-OSS系列包括三个版本:基础模型Seed-OSS-36B-Base、无合成数据基础模型Seed-OSS-36B-Base-woSyn,以及经过指令微调的Seed-OSS-36B-Instruct。其中,指令微调后的Seed-OSS-36B-Instruct在多个领域的基准测试中表现出色,取得了同量级开源模型中的七项最佳性能(SOTA),整体实力超越了Qwen3-32B、Gemma3-27B、gpt-oss-20B等模型,与Qwen3-30B-A3B-Thinking-2507在多数领域不相上下。

值得注意的是,Seed团队在发布这一系列模型时,采取了极为“研究友好”的策略。考虑到合成指令数据在预训练中的潜在影响,团队特别发布了无合成数据基础模型,为科研工作者提供了更多样化的研究选项。Seed-OSS系列模型还支持4位和8位格式的量化处理,进一步降低了内存需求,提升了模型的应用灵活性。

在技术上,Seed-OSS系列模型采用了12万亿个token的预训练数据,并沿用了当前主流的因果语言模型架构。这一系列模型均为稠密模型,未采用MoE等复杂架构,而是结合了RoPE旋转位置编码、GQA注意力机制、RMSNorm归一化及SwiGLU激活函数等高效组件,以提升训练稳定性和推理性能。其512k的上下文窗口并非后续扩展而来,而是通过原生训练实现,能够一次性处理数十万字的内容。

思维预算功能的引入,使得开发者可以根据任务复杂度灵活调整模型推理成本。对于简单任务,模型思维链较短,分数波动不明显;而对于复杂任务,随着思维预算的增加,模型分数也会相应提升。若未设置思维预算,Seed-OSS将默认无思考长度限制;若指定预算,则建议优先考虑512的整数倍值,因为这些区间上的模型训练更为充分。

Seed-OSS系列模型的发布,在开源社区内引起了广泛关注。Hugging Face的华人工程师Tiezhen Wang评价称,这一系列模型非常适合进行消融研究,能够以较低成本探索不同组件对大模型性能的影响。网友们也纷纷表示,如此规模的基础模型在开源界实属罕见,长上下文能力对于实际应用具有重大意义。

近年来,开源已成为技术创新的重要推动力,连OpenAI等原本坚持闭源策略的厂商也开始逐步开源模型。字节跳动此次将核心语言模型贡献给社区,无疑为开源社区的后续研究提供了更多基础模型的选择,进一步推动了人工智能技术的开放与发展。

Apple Store应用6.6版焕新登场:液态玻璃设计带来视觉与交互新体验
2025-11-14 08:20:29 作者:狼叫兽 今日,iPhone与iPad平台的AppleStore应用迎来6.6版本更新,此次更新引入了全新设计的应用图标,并对界面进行了视觉升级,以适配iOS 2…

2025-11-14

华为Mate70 Air深度体验:打破常规,超大屏“Air”的另类演绎
可以确定,华为Mate70 Air的影像没有因为“Air”的定义做妥协,在同价位机型中是能打的,硬件配置方面也是这个思路。这也符合华为Mate70 Air的技术路径,虽然重量不可避免地来到208g,但是保…

2025-11-14

中国“天衍-287”超导量子计算机搭建完成 搭载同款芯片将全球开放应用
感谢IT之家网友 的线索投递! 11 月 14 日消息,据《科创板日报》11 月 13日报道,从中国电信量子研究院获悉,搭载“祖冲之三号”同款芯片的超导量子计算机“天衍-287”已完成搭建。 该量子计算系…

2025-11-14

荣耀500 Pro配置亮点全揭秘:骁龙8至尊版+2亿主摄+8000mAh长续航
【CNMO科技消息】11月14日,有数码博主曝光了荣耀500Pro的核心参数。CNMO注意到,新机将搭载骁龙8至尊版移动平台,电池容量达到8000mAh,主打2亿像素大底主摄。 除了上述核心亮点外,荣耀50…

2025-11-14

京东11.11平板教育品类齐发力 办公游戏平板热销 智能学习设备受青睐
直播渠道同样表现抢眼,联想小新Pro GT、荣誉平板GT2 Pro、小米平板7 Pro获得观众最多青睐。在新兴的闺蜜机品类中,海信、小度添添、小米占据品牌领先地位,海信大白闺蜜机X8 Pro、小度添添闺蜜机…

2025-11-13

荣耀500系列或11月24日登场 骁龙8系加持2亿主摄 影像续航双升级
据悉,荣耀500系列将延续“中屏旗舰”定位,提供两款机型:标准版荣耀500将搭载高通骁龙8s Gen4移动平台,而高配版荣耀500Pro则配备更强劲的骁龙8至尊版移动平台。 除核心性能外,荣耀500系列在…

2025-11-12

华硕提前布局库存应对存储涨价,后续将灵活调整产品与售价策略
IT之家 11 月 12 日消息,华硕联席 CEO 胡书宾昨日在公司的 2025 年第三季法人说明会上表示,该企业已建立一定库存应对目前的DRAM 内存和 NAND 闪存涨价情况;华硕将调整产品组合,适度灵…

2025-11-12

vivo Y500 Pro正式登场!1799元起售,影像续航双优能否搅动中端市场?
2025年11月10日,根据多家科技媒体的消息,vivo这家智能手机厂商举行新品发布会,推出Y系列新一代产品——vivo Y500 Pro,这款产品集影像、设计、系统、耐用、续航等多方面优势于一体,配备2亿H…

2025-11-12