Guía

Seedance 2.0 Omni-Reference — Entrada multimodal

Según el blog oficial de ByteDance Seed (febrero de 2026), Seedance 2.0 utiliza un canal multimodal unificado: puede combinar texto con hasta 9 imágenes, 3 videoclips y 3 pistas de audio en una sola solicitud (sujeto a los límites de la plataforma). El modelo puede hacer referencia a la composición, el movimiento, la cámara, los efectos y el sonido de estas entradas. Esta sección resume la descripción pública de ese sistema.

Última actualización: 2026-03-27Última verificación: 2026-03-27

Fuentes y alcance de lectura

Estas guías están escritas como resúmenes de referencia de terceros, no como documentación oficial del producto ni como contenido de soporte.

Base de fuentes

ByteDance official launch blog: Seedance 2.0(2026-03-27)
ByteDance Seedance 2.0 project page(2026-03-27)

Entradas admitidas

Texto: mensaje en lenguaje natural. Imágenes: a menudo hasta 9 (por ejemplo, 30 MB cada una en algunos documentos). Vídeo: hasta 3 clips, a menudo de 2 a 15 s en total, ~50 MB por clip. Audio: hasta 3 archivos, a menudo ≤15 s en total, ~15 MB cada uno. Total de hasta 12 archivos de referencia de una sola vez. El modelo los utiliza para el diseño, el movimiento, la cámara, el estilo y el sonido según lo indiquen las etiquetas de aviso y @.

@ sistema de referencia de etiquetas

Puede hacer referencia a los recursos cargados en el mensaje con etiquetas @ (por ejemplo, @Image1, @Video1, @Audio1). Ejemplos de documentos públicos: "@Image1 como primer fotograma", "Referencia @Video1 para el movimiento de la cámara", "Usar @Audio1 para música de fondo". Esto brinda un control preciso sobre qué imagen impulsa el personaje, qué video impulsa el movimiento y qué audio impulsa la música o el diálogo.

@ ejemplos prácticos de referencia

Patrones comunes de @ tags para Omni-Reference: (1) Bloqueo de primer plano: '@Image1 como el fotograma de apertura, personaje camina hacia la cámara' — fija la composición inicial. (2) Consistencia de personaje: 'Mismo personaje que @Image1, con la misma ropa que @Image2' — bloquea identidad entre tomas. (3) Replicación de cámara: 'Replicar el movimiento de cámara de @Video1, aplicar a nueva escena con @Image1 como sujeto' — transfiere trayectoria. (4) Audio: 'Usar @Audio1 como música de fondo, lip-sync con @Audio2' — separa música y voz. (5) Combo multi-referencia: '@Image1 como personaje, @Image2 como fondo, @Video1 para cámara, @Audio1 para sonido ambiente' — ensamblaje completo con 4 referencias. Siempre especifique el rol de cada activo en el prompt.

@ ejemplos prácticos de referencia

Generación nativa de audio y vídeo.

Seedance 2.0 genera vídeo y audio en un único proceso conjunto (no post-doblaje). Admite salida estéreo, sincronización de labios (incluidos varios idiomas en informes públicos) y alineación de música y efectos de sonido con la imagen. Útil para anuncios, MV y clips con muchos diálogos.

Preguntas frecuentes

¿Cuántas imágenes de referencia puedo usar?

Según documentación pública, hasta 9 imágenes en una sola solicitud, más 3 vídeos y 3 archivos de audio. Verifique los límites actuales de su plataforma y las reglas de tamaño de archivos.

¿Qué entradas admite Seedance 2.0 multimodal?

Según información pública, Seedance 2.0 admite texto, hasta 9 imágenes, 3 videoclips y 3 pistas de audio más lenguaje natural. Hasta 12 archivos de referencia por solicitud. Consulte nuestro tutorial para el flujo completo.

¿Cómo afecta la entrada de audio a la salida de vídeo?

Según documentación pública, la entrada de audio puede impulsar música de fondo, diálogo o efectos de sonido. El modelo genera imagen y audio conjuntamente, con el sonido alineado a la imagen. Soporta sincronización labial multilingüe. Consulte nuestro tutorial para más.

¿Puedo combinar referencias de imagen y vídeo?

Sí. Según documentación pública, puede combinar hasta 9 imágenes y 3 videoclips en una solicitud. Use etiquetas @ en el mensaje para asignar el rol de cada recurso. Consulte nuestra guía de imagen a vídeo para detalles.

Guías relacionadas

Guía

Seedance 2.0 Tutorial — Cómo usar texto a video e imagen a video (paso a paso)

Tutorial de Seedance 2.0 para empezar: texto a video, imagen a video, estructura de prompt, ajustes y generación. Basado en guías públicas y flujos de trabajo habituales.

Abrir guía

Guía

Arquitectura técnica de Seedance 2.0

Resumen técnico de Seedance 2.0: transformador de difusión de doble rama, entradas multimodales (9 imágenes, 3 videos, 3 audios), salida 2K, clips de 4 a 15 s y generación conjunta nativa de audio y video.

Abrir guía

Guía

Seedance 2.0 Consejos para prompts — Cómo escribir mejores prompts de video

Cómo redactar prompts eficaces para Seedance 2.0: sujeto + acción + entorno + cámara + estilo, etiquetas @ de referencia y errores que conviene evitar.

Abrir guía

Explora más guías