首页模型研究加入我们
EN
中文
首页模型研究加入我们
Multimodal Interaction & World Model
Seed-多模态交互与世界模型团队致力于研发具备人类水平的多模态理解与交互能力的模型,并推动多模态助手类产品的探索和研发
研究进展

Seed1.5-VL

Seed1.5-VL
视觉-语言多模态大模型,在视觉推理、图像问答、图表理解与问答、视觉定位/计数、视频理解、GUI 智能体等任务中均表现突出。

BAGEL

BAGEL
开源的理解与生成统一模型,具备图像生成、图像编辑、风格迁移、扩图等多项能力,能够实现精确、准确且逼真的输出。

UI-TARS

UI-TARS
基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。

精选论文

2025.05.20
Emerging Properties in Unified Multimodal Pretraining
Computer Vision
2025.05.13
Seed1.5-VL Technical Report
LLM
2025.01.21
UI-TARS: Pioneering Automated GUI Interaction with Native Agents
Computer Vision
查看更多

热招岗位

多模态世界模型算法研究员/专家-Seed
北京/上海/杭州/深圳
社招
立即投递
多模态世界模型算法工程师/专家-Seed
北京/上海/杭州/深圳
社招
立即投递
视觉大模型算法专家-Top Seed
北京/上海/杭州/深圳
校招
立即投递
多模态世界模型算法实习生-Seed
北京/上海/杭州/深圳
实习
立即投递
查看更多
模型成果
Seed1.8Seed1.5-VLSeedance 1.5 proSeedream 4.5Seed LiveInterpret 2.0Seed Realtime VoiceSeed Music
研究团队
LLMInfrastructuresVisionSpeechMultimodal Interaction & World ModelAI for ScienceRoboticsResponsible AI
了解更多
模型研究加入我们Top SeedSeed Edge
模型成果
Seed1.8
Seed1.5-VL
Seedance 1.5 pro
Seedream 4.5
Seed LiveInterpret 2.0
Seed Realtime Voice
Seed Music
研究团队
LLM
Infrastructures
Vision
Speech
Multimodal Interaction & World Model
AI for Science
Robotics
Responsible AI
了解更多
模型
研究
加入我们
Top Seed
Seed Edge
追求智能上限,创造社会价值
欢迎加入字节跳动 Seed
Copyright © 2026 Bytedance Seed
用户协议隐私政策
联系我们 : seed.feedback@bytedance.com
欢迎加入字节跳动 Seed
Copyright © 2026 Bytedance Seed
用户协议隐私政策