Seedance2

Kılavuz

Seedance 2.0 Teknik Mimarlık

Bu sayfa teknik yönleri özetliyor Seedance 2.0 Halk kaynaklardan (e.g. resmi blog, üçüncü taraf API Docs). Resmi bir belirti değildir ve en son uygulamayı yansıtamaz.

Son güncelleme: Son doğrulama:

Kaynak temeli ve okuma sınırı

Bu kılavuzlar üçüncü taraf referans summaries olarak yazılır, resmi ürün belgeleri veya destek içeriği değildir.

Kaynak temeli

Model ve girişler

Kamu teknik açıklamalar birleşik multimodal ses-video ortak nesil mimarisine işaret eder. Girişler: metin 9 görüntüye artı, 3 video kliplere ve 3 ses parçaları ( platform sınırlarına ek). Text sahne, aksiyon ve stil; görüntüler / videolar / görüntüler kompozisyon, hareket, kamera ve ses için referans sağlar. Hızlıca @ etiketi sistemi, her varlık için rol atamanıza olanak sağlar.

Çıktılar

Video: tipik olarak 4-15 saniye seçilebilir; karar için 2K (2048×1080); yönleri genellikle 16:9, 9:16, 1:1, 4:3, 3:4, 21:9 ve uyarlanabilir. Ses: yerel stereo, video ile birlikte üretilen (post-dubbed değil); halka açık raporlarda birden çok dil için desteklenen dudak-sen. Video uzantı ve yerinde düzenleme birçok iş akışlarında destekleniyor.

Audio-video ortak nesil

Üçüncü taraf teknik yazı-uplar, tek bir inferencede görsel ve ses akışları kullanan bir çift-branch diffüzyon dönüştürücüyü, dudak-sen, ses efektleri ve müzik başlangıçtan gelen resimle uyumlu olmak. Görüntüler arasındaki tutarlılık aynı referans imajını yeniden kullanarak elde edilir ve onlara hızlı bir şekilde atıfta bulunur.

Sık sık sorulan sorular

API var mı?

Evet. BytePlus/Volcano Engine ve üçüncü taraf sağlayıcıları (örn. fal.ai, Seedance2API tarzı dokümanlar) API erişimi sunar. İş akışı genellikle asenkron: iş gönder, durum sorgula, sonucu indir. Güncel API teklifleri ve fiyatları için resmi Seedance proje sayfası ve sağlayıcınızın geliştirici dokümanlarını kontrol edin.

Seedance 2.0 hangi çözünürlüğü destekliyor?

Kamu raporlarına göre yerel çıktı 2K'ya (2048×1080) kadar, yaygın en-boy oranları 16:9, 9:16, 1:1 ve diğerleri. Diğer araçlarla karşılaştırma için karşılaştırma rehberimize bakın.

Model çok modlu girdileri nasıl işliyor?

Kamu teknik açıklamalarına göre model birleşik metin-görüntü-video-ses ortak mimarisi kullanır. Tek bir istek 9 görüntü, 3 video ve 3 ses parçası artı metin birleştirebilir; promptlardaki @ etiket sistemi her varlığa rol atar. Çok modlu rehberimize bakın.

İlgili rehberler