2026.02.07 内测开启 / 字节跳动出品

Kill The Game SEEDANCE 2.0

新一代AI视频生成模型，支持文生视频 / 图生视频 / 音视频同步。从自运镜、自分镜到多模态参考，Seedance 2.0 将AI生成与后期编辑深度融合，重新定义视频创作标准。

探索未来

官方平台：jimeng.jianying.com · 会员 69 元/月起

秒 · 单次生成时长

电影级画质输出

多模态参考输入

A/V

原生音画同步

10x

生成速度提升

产品概览 / Overview

Seedance 2.0 是字节跳动推出的新一代AI视频生成模型，主打多模态参考与高效创作。支持首尾帧、视频片段及音频综合参考，精准复刻运镜逻辑、动作细节与音乐氛围。核心突破在于将AI生成与后期编辑深度融合，可直接修改不满意部分，显著降低废片率。在复杂叙事、短剧创作等场景表现优异，已广泛应用于动漫、影视广告等领域。

模型定位

新一代文生视频/图生视频AI模型，由字节跳动自研，已在即梦AI平台与豆包App上线（内测灰度中），支持桌面端与移动端。

生成能力

支持5-60秒可变时长视频生成，最高4K分辨率输出，可选横屏16:9、竖屏9:16、方形1:1等多种画幅比例。

多模态输入

同时支持最多12个参考文件上传（图片、视频、音频），AI自动学习并复刻画面构图、角色特征、动作风格与镜头语言。

音频生成

自动生成对话语音、背景音乐和环境音效，支持多种语言及指定歌曲歌词输入，实现音画一体化创作。

后期编辑融合

将AI生成与后期编辑融合为一体，可直接修改不满意的局部内容，显著降低废片率，大幅提升创作效率。

生成效率

生成速度较上代提升10倍以上，15秒视频约30积分消耗。会员69元/月起即可体验，配合分布式GPU集群支持高并发与快速迭代。

核心突破 / Core Innovation

自分镜 & 自运镜

告别复杂的镜头提示词。只需描述情节，Seedance 2.0 自动规划分镜逻辑，像专业导演一样调度摄影机，实现推拉摇移的完美叙事。

原生音画同步

双分支架构并行处理视觉与听觉信号流，生成与画面完美匹配的原生音效、配乐及口型同步，告别AI视频的"哑剧"时代。

全方位多模态参考

支持同时上传最多12个参考文件（图片、视频、音频），AI自动学习并复刻画面构图、角色特征、动作风格与镜头语言，实现像素级精准控制。

多镜头叙事一致性

解决AI视频最大痛点——一致性。在长达60秒的多镜头序列中，保持角色、场景、物体的高度统一，让AI生成完整短剧成为现实。

真实世界物理模拟

内置物理反馈模拟引擎，液体流动、布料飘动、刚体碰撞等物理效果均符合真实世界规律，生成视频经得起逐帧审视。

端到端推理优化

基于自研推理加速框架，在保持生成质量的前提下大幅缩短等待时间。配合分布式GPU集群，支持高并发生成请求。

首尾帧精准控制

上传第一帧和最后一帧图片，AI自动生成中间过渡内容，实现精准的镜头控制与场景衔接，让每一帧都在掌控之中。

生成 + 后期编辑一体化

突破传统“生成即定稿”模式，用户可对AI生成视频直接进行局部修改，不满意的片段无需重新生成，显著降低废片率。

以上核心能力并非孤立存在——自运镜、多模态参考、音画同步与多镜头一致性相互协同，使 Seedance 2.0 真正实现「导演级」的创作体验。不再需要反复抽卡碰运气，而是像导演一样专注于讲好故事。

技术架构 / Architecture

双分支扩散变换器 (Dual-Branch DiT)

Seedance 2.0 摒弃了传统的单模态生成思路，采用革命性的双分支架构。视觉与听觉信号在潜空间（Latent Space）中进行从训练到推断的深度融合，实现真正意义上的音画同生。

▶ 并行视觉/听觉信息流处理
▶ 跨注意力机制实现模态对齐
▶ 物理反馈模拟引擎 (Physics Feedback)
▶ 时空一致性约束模块
▶ 多尺度特征金字塔解码器

基于 DiT 架构深度定制

性能对比 / Benchmark

当前版本
Seedance 2.0最大时长60s
最大分辨率4K
原生音频支持
多模态参考最多12个参考文件
自运镜/自分镜支持
多镜头一致性高

Sora

最大时长20s

最大分辨率1080p

原生音频不支持

多模态参考有限

自运镜/自分镜部分

多镜头一致性中

Runway Gen-3

最大时长10s

最大分辨率1080p

原生音频不支持

多模态参考图片参考

自运镜/自分镜不支持

多镜头一致性低

Kling 1.6

最大时长10s

最大分辨率1080p

原生音频不支持

多模态参考图片参考

自运镜/自分镜部分

多镜头一致性中

使用指南 / How to Use

访问平台入口

Seedance 2.0 已在即梦AI平台上线（内测灰度中），支持桌面端和移动端，也可通过豆包App直接使用。

选择生成模式

在创作界面选择工作流——文生视频（输入文字描述）或图生视频（上传参考图片），根据需求灵活切换。

上传参考素材

批量上传最多12个参考文件，包括图片（角色/场景/风格）、视频（动作参考）、音频（语音/音乐），AI自动学习素材特征。

设置首尾帧（可选）

如需精确控制镜头，分别上传第一帧和最后一帧图片，AI自动生成中间过渡动画，实现场景自然衔接。

输入提示词

在文本框中描述视频内容，建议包含场景、动作、氛围、镜头运动等细节，配合参考素材可获得更精准效果。

选择参数设置

设置视频比例（16:9 / 9:16 / 1:1）、视觉风格（写实/电影/动漫/赛博朋克等）和视频时长（5-60秒）。

开启音频同步（可选）

如需对口型或配音，上传音频文件，系统自动生成与音频节奏匹配的人物口型、面部表情与动作。

生成与预览

点击生成按钮，等待AI处理（速度较上代提升10倍以上）。预览结果，不满意可调整参数或直接局部编辑。

下载与分享

确认满意后下载高清视频（支持1080p-4K），可直接发布至抖音、小红书等社交平台，或用于商业项目。

应用场景 / Use Cases

影视短片

从剧本到成片，AI辅助完成分镜脚本、镜头调度与后期合成，大幅降低影视制作门槛。

品牌广告

快速迭代创意概念视频，支持多风格参考输入，品牌营销从创意到成品仅需数分钟。

社交内容

为内容创作者提供高质量视频生产工具，一句话生成吸睛短视频，抢占流量高地。

教育培训

将抽象知识转化为直观动画演示，科学原理、历史场景均可生动重现，提升学习效率。

游戏预告

根据游戏概念美术和角色设定，快速生成高品质预告片与过场动画，加速游戏宣发流程。

电商产品展示

制作商品展示视频、360度产品动画与使用场景演示，提升电商平台产品吸引力与转化率。

影视预可视化

为电影、电视剧制作分镜预览与概念验证视频，帮助导演和制片方在前期快速决策，节省制作成本。

社交媒体营销

为品牌生成产品宣传视频、活动预告、节日营销内容，通过多模态参考保持品牌视觉一致性。

AI漫剧制作

凭借多镜头一致性与自运镜能力，高效批量产出风格统一的漫剧分镜与短剧片段，推动AI漫剧规模化生产。

行业评价 / Industry Reviews

"Kill the game!（杀死比赛）。这个评价，相当客观。AIGC的童年时代，结束了。至少今天的Seedance 2.0，来自中国。"

— 冯骥（《黑神话：悟空》制作人）

"改变视频行业的AI。不仅是视频精细度，它的摄影机运动流畅度、分镜连续性及音画匹配度都实现了行业突破性进展。"

— Tim（影视飓风创始人）

"Seedance 2.0 在自运镜和自分镜方面，体现了全方位多模态思考能力。它为用户提供了导演级的控制精度与创作自由度。"

— 开源证券研报

关于内容安全与合规

为保障创作环境健康，Seedance 2.0 暂不支持输入真人图片或视频作为主体参考。即梦App与豆包App中，如需使用真人形象，需通过严格的真人校验流程。平台始终坚持"创意的边界是尊重"。