Seedance2

Guía

Seedance 2.0 Omni-Reference — Entrada multimodal

Según el blog oficial de ByteDance Seed (febrero de 2026), Seedance 2.0 utiliza un canal multimodal unificado: puede combinar texto con hasta 9 imágenes, 3 videoclips y 3 pistas de audio en una sola solicitud (sujeto a los límites de la plataforma). El modelo puede hacer referencia a la composición, el movimiento, la cámara, los efectos y el sonido de estas entradas. Esta sección resume la descripción pública de ese sistema.

Última actualización: Última verificación:

Fuentes y alcance de lectura

Estas guías están escritas como resúmenes de referencia de terceros, no como documentación oficial del producto ni como contenido de soporte.

Base de fuentes

Entradas admitidas

Texto: mensaje en lenguaje natural. Imágenes: a menudo hasta 9 (por ejemplo, 30 MB cada una en algunos documentos). Vídeo: hasta 3 clips, a menudo de 2 a 15 s en total, ~50 MB por clip. Audio: hasta 3 archivos, a menudo ≤15 s en total, ~15 MB cada uno. Total de hasta 12 archivos de referencia de una sola vez. El modelo los utiliza para el diseño, el movimiento, la cámara, el estilo y el sonido según lo indiquen las etiquetas de aviso y @.

@ sistema de referencia de etiquetas

Puede hacer referencia a los recursos cargados en el mensaje con etiquetas @ (por ejemplo, @Image1, @Video1, @Audio1). Ejemplos de documentos públicos: "@Image1 como primer fotograma", "Referencia @Video1 para el movimiento de la cámara", "Usar @Audio1 para música de fondo". Esto brinda un control preciso sobre qué imagen impulsa el personaje, qué video impulsa el movimiento y qué audio impulsa la música o el diálogo.

@ ejemplos prácticos de referencia

Patrones comunes de @ tags para Omni-Reference: (1) Bloqueo de primer plano: '@Image1 como el fotograma de apertura, personaje camina hacia la cámara' — fija la composición inicial. (2) Consistencia de personaje: 'Mismo personaje que @Image1, con la misma ropa que @Image2' — bloquea identidad entre tomas. (3) Replicación de cámara: 'Replicar el movimiento de cámara de @Video1, aplicar a nueva escena con @Image1 como sujeto' — transfiere trayectoria. (4) Audio: 'Usar @Audio1 como música de fondo, lip-sync con @Audio2' — separa música y voz. (5) Combo multi-referencia: '@Image1 como personaje, @Image2 como fondo, @Video1 para cámara, @Audio1 para sonido ambiente' — ensamblaje completo con 4 referencias. Siempre especifique el rol de cada activo en el prompt.

@ ejemplos prácticos de referencia

Patrones comunes de @ tags para Omni-Reference: (1) Bloqueo de primer plano: '@Image1 como el fotograma de apertura, personaje camina hacia la cámara' — fija la composición inicial. (2) Consistencia de personaje: 'Mismo personaje que @Image1, con la misma ropa que @Image2' — bloquea identidad entre tomas. (3) Replicación de cámara: 'Replicar el movimiento de cámara de @Video1, aplicar a nueva escena con @Image1 como sujeto' — transfiere trayectoria. (4) Audio: 'Usar @Audio1 como música de fondo, lip-sync con @Audio2' — separa música y voz. (5) Combo multi-referencia: '@Image1 como personaje, @Image2 como fondo, @Video1 para cámara, @Audio1 para sonido ambiente' — ensamblaje completo con 4 referencias. Siempre especifique el rol de cada activo en el prompt.

Generación nativa de audio y vídeo.

Seedance 2.0 genera vídeo y audio en un único proceso conjunto (no post-doblaje). Admite salida estéreo, sincronización de labios (incluidos varios idiomas en informes públicos) y alineación de música y efectos de sonido con la imagen. Útil para anuncios, MV y clips con muchos diálogos.

Preguntas frecuentes

¿Cuántas imágenes de referencia puedo usar?

Según documentación pública, hasta 9 imágenes en una sola solicitud, más 3 vídeos y 3 archivos de audio. Verifique los límites actuales de su plataforma y las reglas de tamaño de archivos.

¿Qué entradas admite Seedance 2.0 multimodal?

Según información pública, Seedance 2.0 admite texto, hasta 9 imágenes, 3 videoclips y 3 pistas de audio más lenguaje natural. Hasta 12 archivos de referencia por solicitud. Consulte nuestro tutorial para el flujo completo.

¿Cómo afecta la entrada de audio a la salida de vídeo?

Según documentación pública, la entrada de audio puede impulsar música de fondo, diálogo o efectos de sonido. El modelo genera imagen y audio conjuntamente, con el sonido alineado a la imagen. Soporta sincronización labial multilingüe. Consulte nuestro tutorial para más.

¿Puedo combinar referencias de imagen y vídeo?

Sí. Según documentación pública, puede combinar hasta 9 imágenes y 3 videoclips en una solicitud. Use etiquetas @ en el mensaje para asignar el rol de cada recurso. Consulte nuestra guía de imagen a vídeo para detalles.

Guías relacionadas