Seedance2

Seedance 2.0 技術アーキテクチャ

このページでは、技術的な側面をまとめました Seedance 2.0 パブリックソース(公式ブログ、サードパーティなど)から API ドキュメント 正式な仕様ではなく、最新の実装を反映していない場合があります。

最終更新:

最終確認日:

更新頻度: 数日おき

ソースベースと読書境界

これらのガイドは、公式の製品ドキュメントやサポートコンテンツではなく、サードパーティの参照の要約として書かれています。

使用されるソース

ByteDance の 2026年2月12日公開 Seedance 起動資料、公開プロジェクトページ、および選定したサードパーティのチュートリアル・比較・ワークフロー解説から構成。

バウンダリー

これらのページを使用して、公共のクレーム、一般的なワークフロー、および用語の理解を行います。 正式なサポート、承認、または製品所有者の声明としてそれらを読みません。

タイムライン

ポータル、価格設定、UI、言語サポート、世代別スピード、 API 提供状況は変更される場合があります。 それらに依存する前に、公式またはプライマリソースで現在の詳細を確認します。

参照元

このページは公開情報を要約しています。仕様・価格・提供状況は変わる可能性があるため、意思決定前に一次情報で再確認してください。

モデルと入力

公共技術の説明は、統一されたマルチモーダルオーディオビデオ共同生成アーキテクチャを指します。 入力:テキストと最大9つの画像、3つのビデオクリップ、および3つのオーディオトラック(プラットフォームの制限に差し込む)。 テキストは、シーン、アクション、スタイルを駆動します。画像/ビデオ/オーディオは、構成、モーション、カメラ、および音の参照を提供します。 プロンプトの@タグシステムでは、各アセットにロールを割り当てることができます。

出力

ビデオ: 普通選択可能な4–15秒; までの決断 2K ( )2048×1080; アスペクト比は、多くの場合、16:9、9:16、1:1、4:3、3:4、21:9および適応性を含みます。 音声:ネイティブステレオ、ビデオと共同で生成される(ポスト-dubbedではなく)、パブリックレポートで複数の言語でサポートされているリップ同期。 ビデオエクステンションとインプレース編集は、多くのワークフローでサポートされています。

オーディオビデオジョイント生成

サードパーティの技術的な書き込みアップは、ビジュアルとオーディオストリームを単一の推論で処理するデュアルブランチの拡散トランスを記述し、リップ同期、サウンドエフェクト、音楽を有効にして、開始から画像と整列することができます。 ショット全体での一貫性は、同じ参照イメージを再利用し、プロンプトでそれらを参照することによって達成されます。

よくある質問

API はありますか?

はい。BytePlus・Volcano Engine およびサードパーティプロバイダ(fal.ai、Seedance2API スタイルのドキュメントなど)が API アクセスを提供しています。ワークフローは非同期が一般的:ジョブ送信、ステータスポーリング、結果ダウンロード。現行の API 提供と価格は公式 Seedance プロジェクトページおよびプロバイダの開発者ドキュメントをご確認ください。

Seedance 2.0 はどの解像度をサポートしていますか?

公開レポートによると、ネイティブ出力は最大 2K(2048×1080)で、一般的なアスペクト比は 16:9、9:16、1:1 などです。他ツールとの比較は当サイトの比較ガイドをご覧ください。

Seedance 2.0 対比 Kling AI その他ツール

モデルはマルチモーダル入力をどのように処理しますか?

公開技術説明によると、モデルは統一されたテキスト・画像・動画・音声の共同アーキテクチャを使用します。1 リクエストで最大 9 画像、3 動画、3 音声トラックにテキストを組み合わせ可能。プロンプトの @ タグシステムで各アセットに役割を割り当てます。マルチモーダルガイドをご覧ください。

Seedance 2.0 オムニリファレンス(Omni-Reference)& マルチモーダル入力 — 画像・動画・音声リファレンスの解説

関連ガイド

ガイドを見る

Reviewer
Seedance2 編集チームによるレビュー
最終レビュー
Content basis
公開情報に基づく第三者によるまとめ

この内容は一般公開されている資料を基に作成されたものであり、公式の製品ドキュメントではありません。