2026.02.07 内测开启 / 字节跳动出品

Kill The Game SEEDANCE 2.0

新一代AI视频生成模型,支持文生视频 / 图生视频 / 音视频同步。从自运镜、自分镜到多模态参考,Seedance 2.0 将AI生成与后期编辑深度融合,重新定义视频创作标准。

探索未来

官方平台:jimeng.jianying.com · 会员 69 元/月起

0
秒 · 单次生成时长
4K
电影级画质输出
0
多模态参考输入
A/V
原生音画同步
10x
生成速度提升

产品概览 / Overview

Seedance 2.0 是字节跳动推出的新一代AI视频生成模型,主打多模态参考与高效创作。支持首尾帧、视频片段及音频综合参考,精准复刻运镜逻辑、动作细节与音乐氛围。核心突破在于将AI生成与后期编辑深度融合,可直接修改不满意部分,显著降低废片率。在复杂叙事、短剧创作等场景表现优异,已广泛应用于动漫、影视广告等领域。

模型定位

新一代文生视频/图生视频AI模型,由字节跳动自研,已在即梦AI平台与豆包App上线(内测灰度中),支持桌面端与移动端。

生成能力

支持5-60秒可变时长视频生成,最高4K分辨率输出,可选横屏16:9、竖屏9:16、方形1:1等多种画幅比例。

多模态输入

同时支持最多12个参考文件上传(图片、视频、音频),AI自动学习并复刻画面构图、角色特征、动作风格与镜头语言。

音频生成

自动生成对话语音、背景音乐和环境音效,支持多种语言及指定歌曲歌词输入,实现音画一体化创作。

后期编辑融合

将AI生成与后期编辑融合为一体,可直接修改不满意的局部内容,显著降低废片率,大幅提升创作效率。

生成效率

生成速度较上代提升10倍以上,15秒视频约30积分消耗。会员69元/月起即可体验,配合分布式GPU集群支持高并发与快速迭代。

核心突破 / Core Innovation

自分镜 & 自运镜

告别复杂的镜头提示词。只需描述情节,Seedance 2.0 自动规划分镜逻辑,像专业导演一样调度摄影机,实现推拉摇移的完美叙事。

原生音画同步

双分支架构并行处理视觉与听觉信号流,生成与画面完美匹配的原生音效、配乐及口型同步,告别AI视频的"哑剧"时代。

全方位多模态参考

支持同时上传最多12个参考文件(图片、视频、音频),AI自动学习并复刻画面构图、角色特征、动作风格与镜头语言,实现像素级精准控制。

多镜头叙事一致性

解决AI视频最大痛点——一致性。在长达60秒的多镜头序列中,保持角色、场景、物体的高度统一,让AI生成完整短剧成为现实。

真实世界物理模拟

内置物理反馈模拟引擎,液体流动、布料飘动、刚体碰撞等物理效果均符合真实世界规律,生成视频经得起逐帧审视。

端到端推理优化

基于自研推理加速框架,在保持生成质量的前提下大幅缩短等待时间。配合分布式GPU集群,支持高并发生成请求。

首尾帧精准控制

上传第一帧和最后一帧图片,AI自动生成中间过渡内容,实现精准的镜头控制与场景衔接,让每一帧都在掌控之中。

生成 + 后期编辑一体化

突破传统“生成即定稿”模式,用户可对AI生成视频直接进行局部修改,不满意的片段无需重新生成,显著降低废片率。

以上核心能力并非孤立存在——自运镜、多模态参考、音画同步与多镜头一致性相互协同,使 Seedance 2.0 真正实现「导演级」的创作体验。不再需要反复抽卡碰运气,而是像导演一样专注于讲好故事。

技术架构 / Architecture

双分支扩散变换器 (Dual-Branch DiT)

Seedance 2.0 摒弃了传统的单模态生成思路,采用革命性的双分支架构。视觉与听觉信号在潜空间(Latent Space)中进行从训练到推断的深度融合,实现真正意义上的音画同生。

  • 并行视觉/听觉信息流处理
  • 跨注意力机制实现模态对齐
  • 物理反馈模拟引擎 (Physics Feedback)
  • 时空一致性约束模块
  • 多尺度特征金字塔解码器
基于 DiT 架构深度定制
Text / Img Input DiT Core Visual Audio Cross-Attn Physics Engine Video + Audio

性能对比 / Benchmark

当前版本

Seedance 2.0

最大时长60s
最大分辨率4K
原生音频支持
多模态参考最多12个参考文件
自运镜/自分镜支持
多镜头一致性

Sora

最大时长20s
最大分辨率1080p
原生音频不支持
多模态参考有限
自运镜/自分镜部分
多镜头一致性

Runway Gen-3

最大时长10s
最大分辨率1080p
原生音频不支持
多模态参考图片参考
自运镜/自分镜不支持
多镜头一致性

Kling 1.6

最大时长10s
最大分辨率1080p
原生音频不支持
多模态参考图片参考
自运镜/自分镜部分
多镜头一致性

使用指南 / How to Use

访问平台入口

Seedance 2.0 已在即梦AI平台上线(内测灰度中),支持桌面端和移动端,也可通过豆包App直接使用。

选择生成模式

在创作界面选择工作流——文生视频(输入文字描述)或图生视频(上传参考图片),根据需求灵活切换。

上传参考素材

批量上传最多12个参考文件,包括图片(角色/场景/风格)、视频(动作参考)、音频(语音/音乐),AI自动学习素材特征。

设置首尾帧(可选)

如需精确控制镜头,分别上传第一帧和最后一帧图片,AI自动生成中间过渡动画,实现场景自然衔接。

输入提示词

在文本框中描述视频内容,建议包含场景、动作、氛围、镜头运动等细节,配合参考素材可获得更精准效果。

选择参数设置

设置视频比例(16:9 / 9:16 / 1:1)、视觉风格(写实/电影/动漫/赛博朋克等)和视频时长(5-60秒)。

开启音频同步(可选)

如需对口型或配音,上传音频文件,系统自动生成与音频节奏匹配的人物口型、面部表情与动作。

生成与预览

点击生成按钮,等待AI处理(速度较上代提升10倍以上)。预览结果,不满意可调整参数或直接局部编辑。

下载与分享

确认满意后下载高清视频(支持1080p-4K),可直接发布至抖音、小红书等社交平台,或用于商业项目。

应用场景 / Use Cases

影视短片

从剧本到成片,AI辅助完成分镜脚本、镜头调度与后期合成,大幅降低影视制作门槛。

品牌广告

快速迭代创意概念视频,支持多风格参考输入,品牌营销从创意到成品仅需数分钟。

社交内容

为内容创作者提供高质量视频生产工具,一句话生成吸睛短视频,抢占流量高地。

教育培训

将抽象知识转化为直观动画演示,科学原理、历史场景均可生动重现,提升学习效率。

游戏预告

根据游戏概念美术和角色设定,快速生成高品质预告片与过场动画,加速游戏宣发流程。

电商产品展示

制作商品展示视频、360度产品动画与使用场景演示,提升电商平台产品吸引力与转化率。

影视预可视化

为电影、电视剧制作分镜预览与概念验证视频,帮助导演和制片方在前期快速决策,节省制作成本。

社交媒体营销

为品牌生成产品宣传视频、活动预告、节日营销内容,通过多模态参考保持品牌视觉一致性。

AI漫剧制作

凭借多镜头一致性与自运镜能力,高效批量产出风格统一的漫剧分镜与短剧片段,推动AI漫剧规模化生产。

行业评价 / Industry Reviews

"Kill the game!(杀死比赛)。这个评价,相当客观。AIGC的童年时代,结束了。至少今天的Seedance 2.0,来自中国。"

— 冯骥(《黑神话:悟空》制作人)

"改变视频行业的AI。不仅是视频精细度,它的摄影机运动流畅度、分镜连续性及音画匹配度都实现了行业突破性进展。"

— Tim(影视飓风创始人)

"Seedance 2.0 在自运镜和自分镜方面,体现了全方位多模态思考能力。它为用户提供了导演级的控制精度与创作自由度。"

— 开源证券研报

关于内容安全与合规

为保障创作环境健康,Seedance 2.0 暂不支持输入真人图片或视频作为主体参考。即梦App与豆包App中,如需使用真人形象,需通过严格的真人校验流程。平台始终坚持"创意的边界是尊重"。