Leitfaden

Seedance 2.0 Glossar

Dieses Glossar übersetzt die häufigsten Seedance-2.0-Begriffe in praktische Sprache, damit Sie öffentliche Guides schneller lesen, Prompts klarer schreiben und Workflow-Probleme ohne Rätselraten beheben können.

Zuletzt aktualisiert: 2026-03-27Zuletzt verifiziert: 2026-03-27

Quellenbasis und Einordnung

Diese Leitfäden sind unabhängige Zusammenfassungen aus öffentlichen Quellen, keine offizielle Produktdokumentation und kein Support.

Quellenbasis

ByteDance Seedance 2.0 project page(2026-03-27)
Dreamina official guide: How to use Seedance 2.0(2026-03-27)

Konsistenz, Referenzen und Identity Lock

Wenn öffentliche Guides von Charakterkonsistenz sprechen, meinen sie meist: dieselbe Person, Kleidung, Silhouette und Identität über mehrere Shots hinweg beibehalten. In der Praxis hängt das von sauberen Referenzen ab: wenige klare Bilder, visuell nah am gewünschten Ergebnis, und dieselben Identitätsvorgaben in jedem Prompt wiederholen. Bricht die Konsistenz, trägt das Modell oft zu viele visuelle Variablen gleichzeitig.

Shot-Planung, Verlängerung und Kontinuität

Videoverlängerung bedeutet, einen bestehenden Clip ab den letzten Frames fortzusetzen statt eine komplett neue Szene zu generieren. Multi-Shot-Storytelling bedeutet, mehrere Shots zu planen, die sich wie eine Sequenz anfühlen. Beides hängt zusammen, ist aber nicht identisch: Verlängerung betrifft vor allem zeitliche Kontinuität, Multi-Shot-Planung betrifft Story-Struktur, Pacing, Kamerawechsel und visuelle Anker, die von Shot zu Shot bestehen bleiben.

Multimodale Steuerung, natives Audio und Lip-Sync

Multimodale Eingabe bedeutet, Text mit Bildern, Video und manchmal Audio in einer Anfrage zu kombinieren. Natives Audio bedeutet, dass die Ausgabe erzeugten Sound enthalten kann statt nur stummes Video. Lip-Sync bezieht sich auf Mundbewegung, die zum gesprochenen Dialog passt. Diese Begriffe sind wichtig, weil sie beeinflussen, wie Sie das Modell briefen: Ein reiner Text-Prompt braucht mehr beschreibende Details, ein multimodaler Prompt kann Teile der Steuerung an Referenzen, Quellmaterial und Audio-Timing delegieren.

Beispiele & Quellen

Mini-Pattern: eine Hauptfigur stabil halten

Nutzen Sie ein bis drei starke Referenzbilder, wiederholen Sie dieselbe Identitätsphrase in jedem Shot und vermeiden Sie unabhängige Stiländerungen, bis die Basis stabil ist.

Same woman as reference, same cream trench coat, same short black hair, stable face and proportions, walking through a rainy neon street, slow tracking shot, cinematic night lighting.

Weiterlesen: Bild-zu-Video-Guide

Mini-Pattern: guten Shot verlängern statt neu schreiben

Wenn der erste Clip bereits das gewünschte Framing und die Bewegung hat, verlängern Sie ihn mit einem kurzen Fortsetzungs-Prompt statt die ganze Szene neu aufzubauen.

Continue from the final frame, same woman and same street, camera keeps moving forward slowly, umbrella lifts in the wind, preserve lighting and color palette.

Weiterlesen: Best-Practices-Guide

Mini-Pattern: multimodale Eingabe, wenn Text allein zu vage ist

Wenn der Prompt sowohl ein spezifisches Produktaussehen als auch eine bestimmte Kamerastimmung braucht, kombinieren Sie ein sauberes Produktbild mit einer kurzen Textanweisung statt eines sehr langen generischen Absatzes.

Reference image for product shape and branding. Text prompt: premium studio ad, slow arc camera move, soft rim light, shallow depth of field, subtle electronic sound bed.

Weiterlesen: Multimodal-Guide

Häufige Fragen

Was bedeutet Charakterkonsistenz in der Praxis?

Dass dieselbe Person, Kleidung und visuelle Identität über Shots hinweg stabil bleiben. Öffentliche Workflows erreichen das meist mit saubereren Referenzen, weniger visuellen Variablen und wiederholten Identitätsanweisungen statt einem überladenen Prompt.

Wann Videoverlängerung statt neuer Generierung nutzen?

Verlängerung, wenn der erste Clip bereits das richtige Framing, die Bewegung oder Stimmung hat und Sie nur mehr Sekunden brauchen. Neue Generierung, wenn Sie eine andere Komposition, ein anderes Setup oder eine andere Kamerasprache brauchen.

Was ändert multimodale Eingabe im Vergleich zu reinem Text-Prompting?

Referenzen übernehmen einen Teil der Steuerung. Statt jedes visuelle Merkmal in Text zu beschreiben, können Sie Bilder, Video oder Audio nutzen, um Stil, Bewegung und Timing zuverlässiger zu fixieren.

Warum sprechen öffentliche Tutorials ständig von Referenzhygiene?

Weil gemischte oder minderwertige Referenzen oft Drift verursachen. Wenn Ihre Quellbilder bei Gesichtsform, Kleidung, Licht oder Kamerawinkel nicht übereinstimmen, wird das Ergebnis unberechenbarer, auch mit starkem Prompt.

Welche Seite als Nächstes nach dem Glossar?

Wenn Sie bessere Prompts schreiben wollen, wechseln Sie zur Prompt-Bibliothek oder zum Prompt-Schreib-Guide. Wenn Sie instabile Ausgaben debuggen, zur Troubleshooting-Seite.