字節跳動發佈了全新的音視頻生成模型Seedance 1.5 pro,原生支持音視頻聯合生成,在視聽協同、視覺張力和敍事協調性等方面實現突破:
- 音畫高精同步:採用創新的原生音視頻聯合生成架構,支持環境音、動作音、合成音效、樂器、背景音樂、人聲等多種元素,實現毫秒級音畫同步輸出。
- 多人多語言對白:支持獨白與多人對話,口型毫秒級精準對齊,並覆蓋中文、方言(四川話、粵語、陝西話、上海話等)、英文及小語種,全方位還原真實自然的對話質感,實現全球化創作。
- 影視級敍事張力:運動幅度自然、節奏感強,能夠精準捕捉運動細節;畫面感知力強,人物情緒與表情呈現細膩,大幅提升生動性,實現影視級創作質感。
目前,Seedance 1.5 pro已在豆包APP(灰度測試)、即夢、火山引擎體驗中心上線,用户可以試用體驗。關於模型的更多技術細節,詳見項目主頁:https://seed.bytedance.com/zh/seedance1_5_pro