中國科學技術大學及國內多家高校的科研團隊近期發佈了一項名為“UniCorn”的新型技術框架。該框架的核心目標是賦予自動化圖像處理系統一種特殊能力:識別並修復其在生成內容過程中的自身缺陷。
研究人員發現,目前的圖像識別與生成系統雖然能夠理解複雜的視覺信息,但在將其轉化為具體圖像時,往往表現出認知與表達的不一致。例如,一個系統可以準確判斷出樣圖中“左側為沙灘、右側為海浪”,但在其自主生成新圖時,卻經常出現空間順序顛倒的低級錯誤。
中國科研人員將這種“能理解卻説不對”的現象比作醫學領域的“傳導性失語症”——這是一種患者雖能聽懂語言但無法正確複述的神經系統疾病。為了彌合這一認知鴻溝,UniCorn框架引入了一套創新的協同機制。
UniCorn的核心理念在於:既然系統評估圖像質量的能力通常優於其從零開始構建圖像的能力,那麼這種“審美評估”標準就應該反過來指導生成過程。為此,研究人員在同一套運行空間內,將系統劃分為三個互補的角色,使其同時承擔觀察者、執行者和質檢員的任務。
通過這種“角色分工”,系統在輸出圖像的過程中會實時對比自身的認知標準。一旦發現生成的畫面與原始邏輯存在偏差,內部糾錯機制將立即介入並進行調整。初步測試顯示,該框架顯著提升了自動化系統在處理複雜空間邏輯和細節紋理時的準確性。