Seedance2

ガイド

Seedance 2.0 技術アーキテクチャ

このページでは、技術的な側面をまとめました Seedance 2.0 パブリックソース(公式ブログ、サードパーティなど)から API ドキュメント 正式な仕様ではなく、最新の実装を反映していない場合があります。

最終更新: 最終確認日:

ソースベースと読書境界

これらのガイドは、公式の製品ドキュメントやサポートコンテンツではなく、サードパーティの参照の要約として書かれています。

参照元

モデルと入力

公共技術の説明は、統一されたマルチモーダルオーディオビデオ共同生成アーキテクチャを指します。 入力:テキストと最大9つの画像、3つのビデオクリップ、および3つのオーディオトラック(プラットフォームの制限に差し込む)。 テキストは、シーン、アクション、スタイルを駆動します。画像/ビデオ/オーディオは、構成、モーション、カメラ、および音の参照を提供します。 プロンプトの@タグシステムでは、各アセットにロールを割り当てることができます。

出力

ビデオ: 普通選択可能な4–15秒; までの決断 2K ( )2048×1080; アスペクト比は、多くの場合、16:9、9:16、1:1、4:3、3:4、21:9および適応性を含みます。 音声:ネイティブステレオ、ビデオと共同で生成される(ポスト-dubbedではなく)、パブリックレポートで複数の言語でサポートされているリップ同期。 ビデオエクステンションとインプレース編集は、多くのワークフローでサポートされています。

オーディオビデオジョイント生成

サードパーティの技術的な書き込みアップは、ビジュアルとオーディオストリームを単一の推論で処理するデュアルブランチの拡散トランスを記述し、リップ同期、サウンドエフェクト、音楽を有効にして、開始から画像と整列することができます。 ショット全体での一貫性は、同じ参照イメージを再利用し、プロンプトでそれらを参照することによって達成されます。

よくある質問

API はありますか?

はい。BytePlus・Volcano Engine およびサードパーティプロバイダ(fal.ai、Seedance2API スタイルのドキュメントなど)が API アクセスを提供しています。ワークフローは非同期が一般的:ジョブ送信、ステータスポーリング、結果ダウンロード。現行の API 提供と価格は公式 Seedance プロジェクトページおよびプロバイダの開発者ドキュメントをご確認ください。

Seedance 2.0 はどの解像度をサポートしていますか?

公開レポートによると、ネイティブ出力は最大 2K(2048×1080)で、一般的なアスペクト比は 16:9、9:16、1:1 などです。他ツールとの比較は当サイトの比較ガイドをご覧ください。

モデルはマルチモーダル入力をどのように処理しますか?

公開技術説明によると、モデルは統一されたテキスト・画像・動画・音声の共同アーキテクチャを使用します。1 リクエストで最大 9 画像、3 動画、3 音声トラックにテキストを組み合わせ可能。プロンプトの @ タグシステムで各アセットに役割を割り当てます。マルチモーダルガイドをご覧ください。

関連ガイド