Panduan
Seedance 2.0 Omni-Reference — Masukan Multimoda
Menurut blog resmi ByteDance Seed (Februari 2026), Seedance 2.0 menggunakan saluran multimodal terpadu: Anda dapat menggabungkan teks hingga 9 gambar, 3 klip video, dan 3 trek audio dalam satu permintaan (tergantung pada batasan platform). Model dapat mereferensikan komposisi, gerakan, kamera, efek, dan suara dari input ini. Bagian ini merangkum gambaran publik tentang sistem tersebut.
Dasar sumber dan batas bacaan
Panduan ini ditulis sebagai ringkasan referensi pihak ketiga, bukan dokumentasi produk resmi atau konten dukungan.
Dasar sumber
- ByteDance official launch blog: Seedance 2.0(2026-03-27)
- ByteDance Seedance 2.0 project page(2026-03-27)
Masukan yang didukung
Teks: perintah bahasa alami. Gambar: seringkali hingga 9 (misalnya masing-masing 30 MB di beberapa dokumen). Video: hingga 3 klip, sering kali totalnya 2–15 detik, ~50 MB per klip. Audio: hingga 3 file, sering kali totalnya ≤15 detik, masing-masing ~15 MB. Total hingga 12 file referensi sekaligus. Model menggunakannya untuk tata letak, gerakan, kamera, gaya, dan suara sesuai arahan perintah dan tag @ Anda.
@ sistem referensi tag
Anda dapat merujuk ke aset yang diunggah di perintah dengan tag @ (misalnya @Image1, @Video1, @Audio1). Contoh dari dokumen publik: “@Image1 sebagai frame pertama,” “Referensi @Video1 untuk pergerakan kamera,” “Gunakan @Audio1 untuk musik latar.” Hal ini memberikan kontrol yang tepat atas gambar mana yang menggerakkan karakter, video mana yang menggerakkan gerakan, dan audio mana yang menggerakkan musik atau dialog.
@ contoh praktis referensi
Pola @ tag umum untuk Omni-Reference: (1) Kunci frame pertama: '@Image1 sebagai frame pembuka, karakter berjalan menuju kamera' — mengunci komposisi awal. (2) Konsistensi karakter: 'Karakter sama seperti @Image1, pakaian sama seperti @Image2' — mengunci identitas antar-shot. (3) Replikasi kamera: 'Replikasi gerakan kamera dari @Video1, terapkan ke adegan baru dengan @Image1' — mentransfer jalur gerak. (4) Audio: 'Gunakan @Audio1 sebagai musik latar, lip-sync dialog dengan @Audio2' — memisahkan musik dan suara. (5) Combo multi-referensi: '@Image1 sebagai karakter, @Image2 sebagai latar, @Video1 untuk kamera, @Audio1 untuk suara lingkungan' — rakitan penuh dengan 4 referensi. Selalu nyatakan peran setiap aset dalam prompt.
@ contoh praktis referensi
Pola @ tag umum untuk Omni-Reference: (1) Kunci frame pertama: '@Image1 sebagai frame pembuka, karakter berjalan menuju kamera' — mengunci komposisi awal. (2) Konsistensi karakter: 'Karakter sama seperti @Image1, pakaian sama seperti @Image2' — mengunci identitas antar-shot. (3) Replikasi kamera: 'Replikasi gerakan kamera dari @Video1, terapkan ke adegan baru dengan @Image1' — mentransfer jalur gerak. (4) Audio: 'Gunakan @Audio1 sebagai musik latar, lip-sync dialog dengan @Audio2' — memisahkan musik dan suara. (5) Combo multi-referensi: '@Image1 sebagai karakter, @Image2 sebagai latar, @Video1 untuk kamera, @Audio1 untuk suara lingkungan' — rakitan penuh dengan 4 referensi. Selalu nyatakan peran setiap aset dalam prompt.
Generasi audio-video asli
Seedance 2.0 menghasilkan video dan audio dalam satu proses gabungan (bukan pasca-dubbing). Mendukung keluaran stereo, sinkronisasi bibir (termasuk berbagai bahasa dalam laporan publik), dan penyelarasan musik dan efek suara dengan gambar. Berguna untuk iklan, MV, dan klip yang banyak dialog.
Pertanyaan yang sering diajukan
Berapa banyak gambar referensi yang dapat saya gunakan?
Menurut dokumentasi publik, hingga 9 gambar dalam satu permintaan, ditambah 3 video dan 3 file audio. Periksa batasan platform Anda saat ini dan aturan ukuran file.
Input apa yang didukung Seedance 2.0 multimodal?
Menurut laporan publik, Seedance 2.0 mendukung teks, hingga 9 gambar, 3 klip video, dan 3 trek audio plus bahasa alami. Hingga 12 file referensi per permintaan. Lihat tutorial kami untuk alur lengkap.
Bagaimana input audio mempengaruhi output video?
Menurut dokumentasi publik, input audio dapat menggerakkan musik latar, dialog, atau efek suara. Model menghasilkan gambar dan audio secara bersama, dengan suara selaras dengan gambar. Mendukung sinkronisasi bibir multibahasa. Lihat tutorial kami untuk lebih lanjut.
Bisakah saya menggabungkan referensi gambar dan video?
Ya. Menurut dokumentasi publik, Anda dapat menggabungkan hingga 9 gambar dan 3 klip video dalam satu permintaan. Gunakan tag @ dalam prompt untuk menetapkan peran setiap aset. Lihat panduan gambar-ke-video kami untuk detail.
Panduan terkait
Panduan
Seedance 2.0 Tutorial — Cara Menggunakan Teks-ke-Video & Gambar-ke-Video (Langkah demi Langkah)
Tutorial langkah demi langkah Seedance 2.0: teks-ke-video vs gambar-ke-video, struktur prompt, pengaturan, dan pembuatan. Berdasarkan panduan umum dan alur kerja yang umum.
Buka panduanPanduan
Seedance 2.0 Arsitektur Teknis
Ikhtisar teknis Seedance 2.0: transformator difusi cabang ganda, masukan multimodal (9 gambar, 3 video, 3 audio), keluaran 2K, 4–15 detik, pembuatan sambungan audio-video asli.
Buka panduanPanduan
Seedance 2.0 Tips Menulis Prompt — Cara Menulis Prompt Video yang Lebih Baik
Cara menulis perintah Seedance 2.0 yang efektif: subjek + tindakan + lingkungan + kamera + rumus gaya, @ tag referensi, dan apa yang harus dihindari. Berdasarkan panduan umum.
Buka panduan