指南
Seedance 2.0 技術架構
本頁根據公開來源(如官方部落格、第三方 API 文檔)整理 Seedance 2.0 的技術要點,非官方規格,可能未反映最新實作。以下依據第三方報導與公開資訊整理,具體以平台為準。
來源基礎與閱讀邊界
這些指南按第三方參考站方式整理,用來解釋公開資訊與常見用法,不等同於官方產品文件或官方支援內容。
來源依據
- ByteDance official launch blog: Seedance 2.0(2026-03-27)
- ByteDance Seedance 2.0 project page(2026-03-27)
- ByteDance Seed Models page(2026-03-27)
模型與輸入
根據公開資訊,公開技術描述提到統一的「多模態音影片聯合生成」架構。輸入:文本 + 最多 9 張圖、3 段影片、3 段音頻(以平台為準)。文本驅動場景、動作與風格;圖/影片/音頻提供構圖、動作、運鏡與聲音參考。提示詞中的 @ 標籤可指定各素材用途。
輸出
影片:通常 4–15 秒可選;解析度最高 2K(2048×1080);比例常見 16:9、9:16、1:1、4:3、3:4、21:9 及自適應。音頻:原生立體聲,與畫面聯合生成(非後期配音);根據公開報導支援多語種口型同步。多數流程支援影片延長與片段編輯。
音影片聯合生成
根據第三方報導,技術文章描述為「雙分支擴散 Transformer」,在單次推理中同時處理畫面與音頻流,使口型、音效與音樂從生成起就與畫面對齊。多鏡頭一致性透過複用同一參考圖並在提示詞中引用實作。API 可透過火山引擎 BytePlus 及第三方提供方接入,流程多為非同步(提交任務、輪詢狀態、下載結果)。具體規格請以 Seedance 專案頁與提供方開發者文檔為準。
常見問題
有 API 嗎?
有。火山引擎 BytePlus 及第三方(如 fal.ai、Seedance2API 類文檔)提供 API,流程多為非同步:提交任務、輪詢狀態、下載結果。請以 Seedance 專案頁與提供方開發者文檔為準。
Seedance 2.0 支援什麼解析度?
根據公開報導,原生輸出最高 2K(2048×1080),常見比例包括 16:9、9:16、1:1 等。詳見本站對比頁了解與其他工具的規格差異。
模型如何處理多模態輸入?
根據公開技術描述,模型採用統一的文圖音視頻聯合架構,單次可組合最多 9 張圖、3 段視頻、3 段音頻加文本,透過 @ 標籤在提示詞中指定各素材用途。詳見本站多模態指南。
相關指南
指南
Seedance 2.0 對比 Kling AI 等工具
中立對比 Seedance 2.0 與 Kling 3.0:解析度、時長、多模態、價格。何時選誰,基於 2026 年公開對比與用戶反饋。
查看指南指南
Seedance 2.0 全能參考(Omni-Reference)與多模態輸入 — 圖片、影片與音訊參考詳解
Seedance 2.0 全能參考(Omni-Reference)多模態輸入:最多 9 張圖、3 段視頻、3 段音頻 + 文本。@ 標籤引用系統與原生音視頻聯合生成。
查看指南指南
Seedance 2.0 完整使用手冊 — 如何使用文字生成影片與圖片生成影片(逐步指南)
Seedance 2.0 完整使用手冊:文生視頻與圖生視頻、提示詞結構、時長與解析度設定、生成與延長。基於公開教程與常見流程。
查看指南指南
Seedance 2.0 與 MCP(第三方連接器):範圍、邊界與安全採用
給創作者與團隊的第三方說明:MCP 在智慧體與 IDE 工作流程中的角色、與官方模型/宿主介面的差異,以及採用連接器前的實用檢查清單。
查看指南