僅憑感官,如何識別AI生成的內容?_技巧


目錄

  1. 前言
  2. 辨別AI生成的圖像、視頻
  3. 甄別AI生成的音頻
  4. 鑑別AI生成的文本
  5. 小結

今年雙十一,竟然有不少人,為了騙商家“僅退款”,用AI來p圖。

比如賣襪子的商家在網上怒斥某職校生買家用AI生成有質量問題的襪子。再比如有買了洗鼻器的男子,直接P了個圖,給商家説,這個頭有問題,結果商家放大圖片一看,有AI水印(這哥們忘記p掉了)。

僅憑感官,如何識別AI生成的內容?_技巧_02

(左為襪子p圖退款,右為洗鼻器p圖退款)

AI不知何時,從單純的好助理,變成了身兼數職的複雜角色——除任工作好秘書一職外,還任詐騙者的幫兇,混淆視聽者的狗腿子。

對,屏幕前的你想的沒錯,壞的是人,不是AI。

不過幕後操控AI之人散落各方,要想解除他們帶給我們的負面影響,還是對付AI生成內容的可操作性最強。而應對AI生成結果,第一步就是要辨別它。

為了幫助大家甄別信息真假、防止被誘導和被消費,本篇針對不同模態,教給大家一些快速辨別真偽的方法。


一、辨別AI生成的圖像、視頻

AI圖像可以結合如下五個維度去判斷:

一、看結構邏輯

其實就是人體五官和比例邏輯,物體、空間結構邏輯。這是AI最容易出錯的地方。AI常見的異常有:

  • 身體問題。身體比例不協調,手臂過長、關節奇怪、姿勢物理不合理。手部問題突出,表現為手指數量多或少,指尖融合,手部的三視圖邏輯有誤,手部變形。
  • 空間問題。就是距離和尺寸問題,具體表現為AI圖像中的“長寬高(深)”基本是不可能三角,多人之間的距離、兩(多)個物品的尺寸對比、兩(多)個人物的身高對比不符合常理。
  • 背景問題。背景透視畸變、地平線彎曲、背景漂浮等。

二、看光影反射

這也是辨別大多數AI生圖平台生成結果的重要方法,即便是數一數二的AI生圖模型,也容易出現其中一方面的問題。

  • 光照方向。陰影方向矛盾、光照不對應。
  • 陰影邊緣。陰影邊緣形狀與實物不一致,或者有物理錯誤。
  • 反光反射。鏡面反射圖像扭曲、不對應或缺失。金屬/玻璃反光區域亂或模糊一片
  • 眼睛高光。高光位置不同、反射物怪異。 

三、看材質細節

  • 紋理問題。人臉顏值高,人的皮膚平滑均勻、沒什麼瑕疵。金屬、木頭、植物紋理重複或對稱分佈。動物毛髮整齊、過密或很模糊。
  • 對稱問題。成對的物品,比如手套、耳環等,出現不對稱或樣式不同。
  • 背景問題。背景模糊不清、邊界拉扯。

四、看文字符號

  • 文字書寫。文字模糊、亂碼、扭曲,英文拼寫錯誤。
  • 字排版。行距亂、偽拉丁文。

五、看整體氛圍

  • 環境方面。光線夢幻、景深誇張、色調統一。
  • 風格方面。畫面“像渲染”,沒有拍攝噪點。

重要的還是前三點。比如看陰影邊緣和動物毛髮:

僅憑感官,如何識別AI生成的內容?_技巧_03

(左為實拍,右為即夢4.0生成)

僅憑感官,如何識別AI生成的內容?_多模態_04

(左為實拍,右為即夢4.0生成)

即夢4.0生成的太陽沒有外層輪廓,邊緣分界不明,小狗臉上的毛髮和鬍鬚模糊。

僅憑感官,如何識別AI生成的內容?_AI內容識別_05

(左為實拍,右為即夢4.0生成)

不過也有無法分辨的,比如上面湖景圖。

當碰上圖生圖復刻能力和細節處理優秀的工具時,或者碰上夢幻唯美類的藝術圖片時,就還是需要工具檢測。比如國內的朱雀 AI 檢測助手、Deepfake Defenders,國外的AI Image Detector、Undetectable AI Image Detector等。

視頻的辨別方法在圖像和音頻方法的基礎上多瞭如下兩部分:

一、看一致性(百試百靈)

  • AI圖片的主體(形象、面貌、裝扮)、環境的構成元素和位置(靜物)連續幀容易不一致。

二、看動態邏輯(百試百靈)

  • 面部動態。AI易嘴型不同步、眨眼頻率很低、聲畫不同步等
  • 行為動態。AI大多難以生成短時變化多、大的動作視頻,所以這種動作下的AI視頻就顯得動作不自然,比如快速切菜、武打、體育、抖腿等。

就比如這個真實和AI生成的對比視頻,你能分辨出來哪個為真嗎?

僅憑感官,如何識別AI生成的內容?_技巧_06

當然,我們網上看到的優質AI視頻也能從中發現AI味兒,儘管它最大程度上繞開了上面説的AI問題。但它產生的新特點就是場景切換快、同框角色少、運鏡有瑕疵,引導的視覺重心在劇情。

若實在分辨不出,或者提升辨別效可使用朱雀 AI 檢測助手、DeepReal、Sensity AI等工具進行檢測。


二、甄別AI生成的音頻

相比音樂,普通人更能聽出AI人聲。AI人聲沒有呼吸聲,語速四平八穩,停頓很有規律,情緒假或者根本就沒有情緒波動,説的方言奇奇怪怪。

所以,這裏重點講區別AI音樂和人類製作音樂的方法。需要注意的是,這裏所講的方法還是更適合有樂理基礎和音樂敏感人士哦~

方法如下:

一、聽和聲

  • AI音樂的和聲過於結構化,失去了人類音樂中細微的不和諧感,聽起來不自然。

二、聽音樂片段

  • AI音樂容易出現出現“編曲突兀”的問題。
  • AI音樂容易出現插入不協調的編曲段落。
  • AI音樂容易出現“幽靈音效層”的問題。

這三個問題都是因為AI模型有難以規避的連貫性弱點,在構建長時序音樂時容易暴露。 

三、聽動態與情緒

  • 相比人類製作音樂,通常AI音樂的動態變化不大。有研究發現AI音樂的振幅標準差可能比人類音樂更小。
  • AI音樂可能缺乏人類作曲中那種層層遞進的情感張力。

四、聽人聲

  • AI音樂中人聲通常有電音,聲音在音區轉換平滑、情緒線條機械。
  • 人聲“貼耳”、共鳴單一或無共鳴。
  • 人聲無生理噪聲,完全乾淨。
  • 之前提到的情感不足,演繹與詞義脱節。

五、聽空間與樂器

  • AI音樂大多無法體現聲場定位,無法生成錄音室、音樂廳等不同演繹場景的歌曲
  • AI音樂所用的樂器聲可能沒有層次感、共鳴和本身質感。

對於小白羣體,若連聽人聲也無法鑑別,那麼使用專業工具就是最佳方法。這類專業工具常見的有Resemble AI、Hiya Deepfake Voice Detector、SafeEar等。


三、鑑別AI生成的文本

因為甄別是為了規避被誘導、被消費、被騙的不利影響,所以下面不對“AI激發文本創意”作討論,僅對講求原創、需要保持客觀真實的文本(大多來源於教育科研、文學藝術和傳媒領域)作探討。

這類文本大多篇幅較長(除詩詞之外),我們可以從如下五個方面結合去判斷:

一、看語言節奏

若提示詞未經精雕細琢,AI生成的文本大多具有語氣平穩、結構模板化、頻繁使用邏輯連詞、詞彙和句式重複的特點。不過若文本本身就是説明性、研究性較強的文章,就需要結合其他維度判斷。

二、看內容邏輯

  • 框架上,AI提煉的框架往往全面但重點不明;人工寫作可能框架不全,但重點突出。
  • 內容上,AI寫作無明顯錯誤,但也深度不夠;人工寫作或可有歧義、語病的情況,但篇內也有明顯所長之處。
  • 銜接上,AI容易在層次交接處出現生硬、銜接不通的問題,人工寫作此情況較少。

三、看情緒、修辭(百試百靈)

  • AI寫作一般語氣單調,很少出現反問或感嘆(除了小説之外);人工寫作視體裁而定,語氣可能有多樣性(如敍事、抒情散文、小説等)。
  • AI寫作難以正確運用修辭手法,可能出現濫用、應用不當的情況,更是不會運用反語、雙關、隱喻等修辭手法,也不會正確表達幽默、諷刺等情緒。

四、看細節痕跡(百試百靈)

  • AI寫作易出現細節邏輯問題,比如不符合現實行為規律、前後描述不一致等。
  • AI寫作易出現語言誇張、誇大情況,衍生出違背現實的邏輯問題。
  • AI寫作往往沒有詳實案例或案例不真實,往往數據有誤、匱乏或缺失。

五、看個人風格

  • AI寫作通常風格混雜,沒有自己獨特“標籤”,即便是仿寫文章,它也會削弱對方風格,添入自己的屬性。

比如我讓Gemini寫的散文《背影》(提示詞見評論區)

僅憑感官,如何識別AI生成的內容?_多模態_07

(文由Gemini生成)

一句句細看後,我們能發現它有幾個突出的問題:

送別場景重點不突出;有幾處邏輯問題(父親嘴上只説了不送,但母親卻勸他不送;一般深夜歸來時視覺上看到的是正面而不是背影;2次提到“最後一次”);修辭太多;用詞風格跨度大(近代、現代、二次元都有)。

不過細看耗時較多,且當碰上用AI生成、人工修改的文本時,區分就非常費力了。此時還是需要用上專業鑑別工具,比如朱雀 AI 檢測助手、PaperYY、Papertime等。


四、小結

經過AI提示詞的反覆訓練,AI生成文本、音頻、圖像和視頻的結果會更逼真,不過無論如何逼真,只要抓住如下關鍵,就能快速發現它們的“狐狸尾巴”:

1.圖像抓身體、空間結構邏輯,光影反射和材質細節。

2.視頻抓一致性和動態邏輯。

3.音樂抓人聲音質、編曲協調性和動態變化。

4.文本抓細節邏輯、帶有數據的具體案例(科研、商業文)和表現情緒的手法。

好了,今天的分享就到這裏了。若你也有一些辨別AI生成式內容的心得和方法,歡迎在評論區分享和討論哦~

關注ChooseAI,和我們一起探索AI時代!