快手可靈 AI 團隊宣佈,可靈視頻正式升級至 2.6 版本,帶來了里程碑式的「音畫同出」能力,標誌着可靈 AI 正式邁入“有聲”時代。
據介紹,該模型徹底改變了傳統 AI 視頻“先生成無聲畫面,後人工配音剪輯”的割裂流程。通過對物理世界聲音與動態畫面的深度語義對齊,視頻 2.6 能夠在單次生成中,端到端地輸出包含自然語音、動作音效及環境氛圍音的完整視頻,實現“所見即所聞”的沉浸式體驗。
可靈 2.6 提供兩條創作路徑:
-
文生音畫:從一句話到一條完整音視頻;
-
圖生音畫:讓靜態畫面開口説話、動起來。
該模型號稱“音畫由您全盤掌控”,適用於單人獨白(商品展示 / 生活 Vlog / 新聞播報 / 演講表達)、旁白解説(商品講解 / 賽事解説 / 紀錄片 / 故事敍述)、多人對白(訪談節目 / 短劇等)、音樂表演(唱歌 / 説唱表演 / 多人合唱 / 樂器演奏)等場景。
詳情查看使用手冊:https://docs.qingque.cn/d/home/eZQBMUXCmLjb57bpfsVk2jNvx?identityId=2MimOrbHfKF