Seedance2

Seedance 2.0 Architecture Technique

Cette page résume les aspects techniques du Seedance 2.0 provenant de sources publiques (par exemple, blog officiel, documents API tiers). Il ne s'agit pas d'une spécification officielle et peut ne pas refléter la dernière implémentation.

Dernière mise à jour:

Dernière vérification:

Fréquence de mise à jour: Tous les quelques jours

Base source et limite de lecture

Ces guides sont rédigés sous forme de résumés de référence tiers, et non de documentation produit officielle ou de contenu d'assistance.

Sources utilisées

Compilé à partir du matériel de lancement ByteDance Seed publié le 12 février 2026, de la page publique du projet et d'une sélection de didacticiels tiers, de comparaisons et de descriptions de flux de travail.

Limite

Utilisez ces pages pour comprendre les réclamations publiques, les flux de travail courants et la terminologie. Ne les lisez pas comme un support officiel, une autorisation ou des déclarations du propriétaire du produit.

Actualité

Les portails, les tarifs, l'interface utilisateur, la prise en charge linguistique, la vitesse de génération et la disponibilité API peuvent changer. Vérifiez les détails actuels auprès de sources officielles ou primaires avant de vous y fier.

Base des sources

Cette page résume les documents disponibles publiquement. Les spécifications, tarifs et accès peuvent changer ; vérifiez les sources primaires avant de prendre des décisions.

Modèle et entrées

Les descriptions techniques publiques font référence à une architecture de génération conjointe audio-vidéo multimodale unifiée. Entrées : texte plus jusqu'à 9 images, 3 clips vidéo et 3 pistes audio (sous réserve des limites de la plateforme). Le texte détermine la scène, l'action et le style ; les images/vidéos/audio fournissent une référence pour la composition, le mouvement, la caméra et le son. Le système de balises @ dans les invites vous permet d'attribuer des rôles à chaque actif.

Sorties

Vidéo : généralement 4 à 15 secondes sélectionnables ; résolution jusqu'au 2K (2048×1080) ; les formats d'image incluent souvent 16:9, 9:16, 1:1, 4:3, 3:4, 21:9 et adaptatif. Audio : stéréo natif, généré conjointement avec la vidéo (non post-doublé) ; synchronisation labiale prise en charge pour plusieurs langues dans les rapports publics. L'extension vidéo et le montage sur place sont pris en charge dans de nombreux flux de travail.

Génération conjointe audio-vidéo

Des documents techniques tiers décrivent un transformateur de diffusion à double branche qui traite les flux visuels et audio en une seule inférence, permettant ainsi d'aligner la synchronisation labiale, les effets sonores et la musique sur l'image dès le départ. La cohérence entre les prises de vue est obtenue en réutilisant la ou les mêmes images de référence et en y faisant référence dans l'invite.

Questions fréquemment posées

Existe-t-il un API ?

Oui. BytePlus/Volcano Engine et des fournisseurs tiers (par exemple fal.ai, documents de style Seedance2API) proposent un accès API. Le flux de travail est souvent asynchrone : soumission du travail, statut du sondage, résultat du téléchargement. Consultez la page officielle du projet Seedance et les documents de développement de votre fournisseur pour connaître les offres et les tarifs API actuels.

Quelle résolution Seedance 2.0 prend-il en charge ?

Selon les rapports publics, la sortie native va jusqu'à 2K (2048×1080), avec des formats d'image courants comme 16:9, 9:16, 1:1 et d'autres. Consultez notre guide de comparaison pour voir comment cela se compare aux autres outils.

Seedance 2.0 vs Kling AI et autres outils

Comment le modèle gère-t-il les entrées multimodales ?

Selon les descriptions techniques publiques, le modèle utilise une architecture conjointe texte-image-vidéo-audio unifiée. Une seule requête peut combiner jusqu'à 9 images, 3 vidéos et 3 pistes audio plus du texte ; le système de balises @ dans les invites attribue des rôles à chaque ressource. Consultez notre guide multimodal pour en savoir plus.

Seedance 2.0 Omni-Reference & Entrée Multimodale — Images, Vidéo et Audio de référence expliqués

Guides associés

Explorez plus de guides

Reviewer
Vérifié par l'équipe éditoriale Seedance2
Dernière vérification
Content basis
Compilation tierce à partir de sources publiques

Ce contenu est compilé à partir de documents accessibles au public et ne représente pas la documentation officielle du produit.