baihai 博客

Nov 28 2025

baihai - 剖析大模型產生幻覺的三大根源

編者按：為什麼大語言模型總是“一本正經地胡説八道”？它們是在故意欺騙，還是被訓練機制“逼”成了這樣？我們今天為大家帶來的這篇文章指出：幻覺並非模型的故障，而是當前訓練與評估機制下的一種理性選擇 —— 當模型因進行猜測獲得獎勵、因坦白“我不知道”而被懲罰時，編造答案就成了最優策略。文章系統剖析了幻覺的三大根源：預訓練階段以統計預測替代事實判斷、後訓練

llm , AI , 人工智能 , 深度學習 , 大模型幻覺

Nov 21 2025

baihai - “推理能力”的提升本質上是模型智能的提升嗎？

編者按：推理模型的“推理能力”飛躍，究竟是模型本身的進步，還是工程編排的巧妙包裝？我們今天為大家帶來的這篇文章提出了一個尖鋭的觀點：所謂“推理模型”的突破，本質上並非模型智能的根本性提升，而是通過工具調用與流程編排對模型能力停滯所做的工程性補償。文章深入剖析了 GPT-5 等最新模型在執行任務時嚴重依賴 Python 沙箱、API 調用等外部工具的

llm , AI , 人工智能 , 深度學習

Nov 19 2025

baihai - 分享一名海外獨立開發者的 AI 編程工作流

編者按：當AI編程智能體宣稱能自動化一切時，我們是否在工具與概念的叢林中迷失了方向，反而忘記了如何最簡單、直接地解決問題？本文的核心主張尖鋭而明確：與其追逐繁雜的“智能體套件”、子智能體（Subagents）、RAG 等概念，不如迴歸本質 —— 選擇一個強大且高效的模型，像與一位靠譜的工程師同事那樣，通過簡潔的對話和直覺性的協作來直接解決問題。作者直言不諱地

AI , AI編程 , 人工智能 , 深度學習

baihai 博客

博客 / 列表

baihai - 剖析大模型產生幻覺的三大根源

baihai - “推理能力”的提升本質上是模型智能的提升嗎？

baihai - 分享一名海外獨立開發者的 AI 編程工作流

Product

Company

Support

Company