字节跳动Seed开源语言模型Seed-OSS系列

字节跳动Seed开源语言模型Seed-OSS系列

日期

2025-08-21

分类

技术发布

Seed-OSS 是字节跳动 Seed 团队开发的开源语言模型系列,其支持原生长上下文、灵活调整推理长度,并在推理、智能体及通用性能方面进行了强化,为开发者提供更丰富的选择。


Seed-OSS 使用 12T tokens 进行训练,在多个主流基准测试中取得了不错的成绩,可在低成本下实现较好的实际应用性能。


我们已在 Apache-2.0 许可下,将 Seed-OSS 系列发布到开源社区,包括3个版本:Seed-OSS-36B-Base(含合成数据版本)、Seed-OSS-36B-Base-woSyn(不含合成数据版本) 与 Seed-OSS-36B-Instruct(指令微调版本)。

关键特性

原生长上下文: 原生支持高达 512K 长上下文。


灵活控制思考预算: 允许用户根据需要,灵活调整推理长度,以提高模型在实际应用场景中的推理效率。


增强推理能力: 在保持平衡且优秀的通用能力基础上,针对推理任务进行了专门优化。


Agent 能力: 在使用工具、解决问题等智能体任务中表现较为出色。


利于研究: 鉴于预训练中包含合成指令数据可能影响后训练的研究,我们发布了包含合成数据和不包含合成数据的两种基础模型,为研究人员提供更多样化的选择。


评测结果

完成预训练的 Seed-OSS-36B-Base 模型在多数评测基准上有较好表现。其中,包含合成数据的 Seed-OSS-36B-Base 效果优于不包含合成数据的 woSyn 版本。


image


Seed-OSS-36B-Instruct 是基于 Seed-OSS-36B-Base 进行后训练的模型版本,在数学、代码、推理、Agent能力、长文本能力等评测中,接近或达到同级别尺寸开源模型的最好水平。


image


我们期待,Seed-OSS 系列能够为开源社区带来新的可能,欢迎广大开发者和研究人员使用这些模型进行实验和应用。未来,该系列将会持续迭代,希望与从业者一起碰撞出更多创新火花。