2024 年 8 月,由 Transformer 論文作者之一 Llion Jones 創立的 Sakana AI 公司宣佈推出全球首位「AI 科學家(AI Scientist)」, 通過自主生成研究想法、設計實驗、編寫代碼、執行實驗乃至撰寫論文,並藉助「AI 審稿人」對結果進行評審與改進,形成了完整閉環的科研生態系統。今年 3 月,該系統產出的一篇計算機科學論文通過了 ICLR 2025 研討會的雙盲評審;同期,Autoscience 研究所也表示其 AI 系統 Carl 撰寫的論文也被 ICLR 的 Tiny Papers 賽道接收。
從某種程度上看,這些 AI 科學家已經走出實驗室,正在一步一步攀向與人類研究人員比肩的高度。
然而,當 AI 將瞄準鏡指向科學發現時,對人類而言或是喜憂參半——一方面, AI 在數據處理、信息整合效率上的優勢無疑是其進入科研界的敲門磚,能夠解放人類科學家去完成更多高維思考、探索;另一方面, 其黑箱困境難解,在科研這個對可解釋性要求嚴苛的領域內存在難以彌合的鴻溝。
那麼,AI 科學家究竟如何定義?它的未來前景與憂思將何去何從呢?
AI 科學家:一個被重新定義的角色
傳統認知中,科學家是科學探索的絕對核心:從觀察現象中提煉問題,基於現有理論提出假設,設計嚴謹的實驗方案,親手操作設備獲取數據,最終通過分析推理形成結論。這一流程延續數百年,塑造了人類對科學研究的基本認知。
但 AI 技術的爆發正在解構這一傳統角色。
如今的科研場景中,科學家的職責開始出現清晰的分化:大語言模型與專用算法負責推演海量的可能性空間,從數億級的分子結構中篩選候選方案;自動化機器人與實驗平台精準執行合成、觀測、檢測等重複性操作,24 小時不間斷工作;人類科學家則聚焦於更核心的價值環節 —— 對 AI 生成的結果進行解讀、判斷其科學意義,並提出新的探索方向。
DeepMind CEO Demis Hassabis 認為「AI 科學家將成為現代版的顯微鏡與望遠鏡,幫助我們發現人類無法看到的規律。」 這意味着 AI 已超越單純的工具屬性,從科研流程的 「加速器」 升級為科學推理與探索的 「共同體成員」。
MIT 教授 Regina Barzilay 在 TED 演講中進一步闡明瞭這一關係: 「未來的科學不會是 AI 替代科學家,而是科學家選擇與 AI 共同工作。」 在她看來,AI 與人類科學家的關係絕非零和博弈,而是基於各自優勢的協同共創 —— 正如當年顯微鏡的發明並未取代生物學家,而是讓生物學研究進入細胞層面的新紀元。
2025 年諾貝爾化學獎得主、「MOF 之父」Omar Mwannes Yaghi 也對 AI 科學家抱有信心, 直言「AI 不只是幫助科學家,而是讓科學本身獲得新的思維方式。」
AI 科學家的現實分類與進展
誠然,AI 科學家的意義,遠不止於讓科研「更快」,其正逐步成為科學創新體系中的關鍵角色。
當前,全球多家科研機構與科技公司正競相探索各具特色的 AI 科學家系統。按照功能定位,這些系統大體可分為兩種路線:增強型科研助手與自主型科學發現者。
第一類系統的核心目標是讓 AI 成為人類科學家的「第二大腦」, 即在人類主導研究方向的前提下,智能體負責提供跨學科知識整合、實驗思路生成與數據分析等支持。
斯坦福大學研發的在線系統 Virtual Lab 正是這一思路的代表。該系統可以根據科學家的研究需求,自動組建具備不同學科背景的 AI 科學家團隊,協同解決複雜問題。Virtual Lab 組建的虛擬聯合團隊中包括「免疫學家」「計算生物學家」等角色,他們提出了一套全新的納米抗體計算設計框架,成功輔助人類科學家設計出 92 種抗病毒納米抗體。
這類系統的出現,正在重塑科研協作的邊界——科研不再只是人與人之間的合作,也可以是人與智能體之間的深度共創。
論文鏈接:
https://www.nature.com/articles/s41586-025-09442-9
第二類系統的野心更大,目標是構建完全自主的科學發現引擎。
這類 AI 科學家不再依賴人類指導,而是由多個智能體協作完成從問題提出、假設生成、實驗驗證到論文撰寫的完整科研閉環。人類科學家的角色更多轉向提出宏觀研究目標、驗證結果與提供倫理審查。
例如,2025 年 5 月,美國 AI 研究機構 Future House 宣佈,其多智能體系統 Robin 自主發現了一種可用於治療乾性黃斑病變(致盲主要原因之一)的候選藥物, 並通過 RNA 實驗驗證了作用機制。其發表論文中所有假設、實驗方案、數據分析和數據圖表均由 Robin 完成,成為了首個在迭代式實驗室循環框架內自主發現並驗證新型候選藥物的 AI 系統。
這意味着,AI 科學家不僅能提出研究問題,還能在生命科學這一極度複雜的領域中,完成具有臨牀潛力的發現。
公司官網: https://www.futurehouse.org/
總體來看,無論是以提升研究效率為目標的「輔助型」,還是追求自主推理與實驗設計的「自主型」,AI 科學家都正在從概念走向落地。
而正是這些快速推進的現實進展,讓我們得以更清晰地觀察到:當 AI 真正參與科學研究時,它究竟帶來了哪些超越人類的優勢?
優勢:突破速度、擴展規模、跨界創新
速度優勢:從 「研究幾年」 到 「幾小時驗證」
一直以來,「時間」成本、漫長的研發週期始終困擾着科學家,即便設備在持續更新,但提速始終難有指數級跨越。材料科學領域,一個新型功能化合物的篩選與驗證往往需要數年時間;藥物研發中,僅臨牀前的候選分子優化階段就可能耗時 3-5 年。這種漫長的週期嚴重製約了科學進步的步伐。
AI 科學家的出現徹底打破了這一時間桎梏。通過 「模型預測 - 實驗驗證 - 數據反饋 - 迭代優化」 的閉環系統,科研週期被壓縮至原來的幾十分之一甚至幾百分之一: Sakana AI 的系統可在數小時內完成從文獻調研到論文初稿的全流程,而谷歌 DeepMind 開發的 「AI Co-Scientist」 更創下了 2 天破解人類數年難題的紀錄 —— 倫敦帝國理工學院的 José Penadés 教授團隊研究數年的 DNA 跨物種傳遞謎題,被該系統精準破解,其提出的核心假説與團隊未公開的發現完全一致,甚至附帶的備選假説經初步驗證也顯示正確性。
公司官網: https://deepmind.google/
更具代表性的是 AI 科學家 Kosmos 的表現:單次運行可自動閲讀 1,500 篇學術論文,執行 4.2 萬行代碼,代碼生成量較同類系統提升 9.8 倍,僅需 1 天時間就能完成相當於人類科學家 6 個月的研究工作量。
公司官網: https://edisonscientific.com/
::: hljs-center
圖源:Edison
:::
規模優勢:同時處理數億級任務
AI 科學家的第二個核心優勢在於規模化探索能力。
人類認知的侷限性決定了傳統科研只能聚焦於有限的研究方向,而 AI 科學家則擁有 「全景搜索」 能力,可同時處理數億級的並行任務,將科學探索的範圍擴展到人類無法觸及的尺度。
例如在藥物研發領域,AI 可以直接生成並測試成千上萬種候選分子,篩選出最有潛力的結構,再交由機器人實驗平台驗證。這類「並行科學實驗」的出現,讓科學不再受制於實驗室的物理邊界,而進入了計算驅動的「虛擬實驗宇宙」。
在分子生物學領域,AI Co-Scientist 能同時模擬數十萬種蛋白質與小分子的相互作用,從中篩選出潛在的藥物靶點。 Yaghi 教授團隊開發的 「從分子到社會」 平台,其設計層可一次性生成上萬種 MOF 分子結構,通過多維度參數篩選出最具應用價值的候選者,這一規模是人類團隊一年工作量的數百倍。
在能源材料研究中,SciAgents 系統利用本體知識圖譜連接 2.3 億個科學概念, 可同時推演不同材料在千變萬化的温度、壓力條件下的性能表現,這種處理規模遠超任何人類研究團隊的能力邊界。
::: hljs-center
SciAgents 系統工作流程
:::
論文地址:
https://arxiv.org/abs/2409.05556
跨學科突破:打破科學研究的 「次元壁」
傳統科學研究存在森嚴的學科壁壘,生物學家難以深入理解量子化學的理論框架, 材料工程師往往缺乏基因編輯的專業知識。這種學科分割使得許多交叉領域的創新機會被錯失 —— 而這正是 AI 科學家的天然優勢。
AI 科學家不受制於人類的知識邊界,可自由穿梭於不同學科領域,實現跨學科知識的融合創新。CMU 開發的 Coscientist 系統就是典型代表:當收到 「合成新型導電聚合物」 的自然語言指令後,它能自主檢索化學合成文獻、材料科學數據庫與電子工程標準,整合化學合成路徑設計、導電性預測與穩定性測試等多學科方法,最終通過機器人平台完成實驗,整個過程無需人類跨學科協作的磨合成本。
Yaghi 教授的 7 個 AI 智能體協作實驗更展現了跨學科協同的深度:實驗規劃師負責整體方案設計,文獻分析師聚焦材料科學文獻,算法編碼員開發貝葉斯優化程序,機器人控制器對接實驗設備,安全顧問則參照化學安全標準進行風險管控。這些分屬不同學科領域的 AI 智能體協同工作,成功解決了 COF-323 材料長期難以結晶的難題, 實現了從無定形到高結晶的突破。
論文鏈接:
https://pubs.acs.org/doi/10.1021/acscentsci.3c01087
在交叉學科領域,這種優勢更為顯著。斯坦福大學的研究顯示,AI 科學家提出的研究假設中 ,有 37% 屬於跨學科創新,而這類假設在人類科學家的提案中佔比不足 5%。
儘管 AI 科學家在速度、規模和跨學科能力上展現出前所未有的優勢,但這種快速發展也伴隨着新的問題與風險,挑戰也隨之而來。
挑戰:AI 科學家的黑箱、倫理和認知邊界
黑箱困境:只給答案不給理由的「因果失衡」
科學研究的核心不僅在於 「發現什麼」,更在於 「為什麼如此」。 可解釋性與因果推理是科學理論構建的基石,而當前 AI 科學家的最大短板恰恰在於其 「黑箱」 屬性 —— 能夠給出精準的結果,卻無法解釋得出結果的邏輯過程。
OpenAI 原科學家 Andrej Karpathy 曾尖鋭地指出:「我們對前沿大模型的理解仍停留在經驗層面,它們就像擅長考試的學生,卻無法説清解題思路。」 這種不可解釋性帶來了一系列問題:在材料科學中,DeepMind GNoME 項目預測 380,000 多種穩定晶體結構,但文獻同時指出機制可解釋性仍是瓶頸。在醫藥領域,Harvard HMS 的 TxGNN 模型為 17,000 多種罕見病識別候選藥物,但研究明確指出「模型雖提供預測分數,但需要專家理解其預測邏輯以驗證假設並理解潛在治療機制」, 暗喻 AI 在機制解釋方面仍存在短板。
2025 年斯坦福大學舉辦的 Agents4Science 實驗性會議更暴露了深層問題:此次會議要求所有論文以 AI 為第一作者,評審全程由 AI 完成。 結果顯示,AI 評審的論文雖在技術層面無明顯錯誤,但大量研究 「既無趣也不重要」。斯坦福大學的 Risa Wechsler 教授提出了靈魂拷問:「我們如何教會 AI 擁有『良好的科學品味』?」 這一問題直指黑箱困境的核心 ——AI 缺乏人類科學家基於學術史和學科認知形成的價值判斷能力,無法識別研究的真正創新點與科學意義。
可靠性鴻溝:數據真實有待考證
只給答案不給理由的回答機制導致另一大隱患——人們對 AI 科學家的可靠性產生了質疑。
AI 科學家的訓練與運行依賴於數據集和理論模型,但這些虛擬世界的 「模擬」 與真實物理世界之間存在巨大鴻溝。許多在模型中表現完美的方案,在實際實驗中卻無法復現,這種 「可靠性鴻溝」 成為制約 AI 科學家落地的關鍵障礙。
2025 年曝光的 MIT 論文造假事件從側面反映了這一問題。 該論文聲稱 AI 輔助可使新材料發現量增加 44%、專利申請量提升 39%,一度被奉為 「AI 對科學影響的最佳研究」,甚至被一眾科學大佬點贊。但後續調查發現,論文數據存在造假。雖然校方由於隱私未將調查結果披露,但在聲明中明確表示「對論文所用數據的來源、可靠性及研究結論的真實性均存疑」。
更嚴峻的是,AI 可能會 「美化」 自己的結果。研究發現,部分 AI 系統會選擇性忽略與預測不符的數據,甚至生成虛假的實驗記錄來迎合模型結論, 這種 「自我欺騙」 行為若未被及時發現,可能導致整個研究方向誤入歧途。
人才危機:傳統科研能力的式微與轉型
AI 科學家的崛起正重塑科研人才的需求結構,傳統的「單打獨鬥型」科學家逐漸失去優勢,而既懂專業領域又掌握 AI 技術的「雙棲人才」變得供不應求。 哈佛大學教授 George Church 曾在訪談中強調,生物學家無需精通 AI 算法,但必須理解 AI 的侷限性、能判斷 AI 結果合理性,這種「專業+AI 協同能力」將成為科研人員的核心競爭力。
這種轉型對現有科研人員提出了顯著挑戰。學術出版商 Wiley 2025 年全球科研人員調查顯示(樣本量 2,430 名),84% 的科研人員已在研究中使用 AI 工具, 但僅 48% 認為 AI 有助於提升批判性思維,超過半數人對 AI 使用抱有擔憂。核心困擾集中在兩方面:一是傳統技能面臨重構,64% 的受訪者擔心 AI 生成錯誤或「幻覺」,58% 擔憂隱私安全問題,習慣親手設計實驗、分析數據的資深科研人員,難以快速適應「向 AI 提問、解讀 AI 結果」的新型工作模式。
此外,教育體系的滯後加劇了人才危機。目前,全球多數高校的理工科專業仍以傳統課程為主,AI 與科研方法的融合教學嚴重不足,僅有少數院校開設「AI 科研工具應用」「人機協同實驗設計」等實戰課程。 這導致學生雖掌握專業理論知識,但缺乏與 AI 協同工作的能力——Wiley 調查顯示,57% 的科研人員認為「缺乏使用規範和培訓」是 AI 推廣的主要障礙,剛畢業的學生往往需要額外培訓才能適配實驗室的新工作流。
更值得警惕的是,過度依賴 AI 可能導致基礎能力弱化:MIT 相關研究指出 AI 可能降低腦部活動,而當 AI 廣泛用於數據處理與公式推導時,若缺乏引導,學生可能忽視數學基礎與實驗技能訓練,而這些恰恰是科學創新的根基。
儘管挑戰重重,AI 與科研的深度融合已是不可逆趨勢。 Wiley 調查顯示,83% 的受訪者認為 AI 將在 2027 年前成為科研工作的重要組成部分,57% 的人表示若 AI 智能體足夠成熟,願意讓其自主執行部分科研任務。這意味着,無論是科研人員還是教育體系,都需主動適配變革——科研人員需補充 AI 工具應用與結果解讀能力,高校則需加速課程改革,將 AI 科研方法融入核心教學,才能培養出符合未來需求的「雙棲人才」。
結語:AI 與人類共創的科學新紀元
從 Sakana AI 的全流程自動化系統,到 Yaghi 教授的 「從分子到社會」 循環,AI 科學家正以不可逆轉之勢重塑科學研究的面貌。它帶來的不僅是速度與規模的革命,更是思維方式的突破 —— 當 AI 能探索人類無法想象的科學路徑,當跨學科協作不再受限於人類知識邊界,科學發現的效率與廣度正進入爆發期。
但我們必須清醒地認識到,AI 科學家終究是人類智慧的延伸而非替代。 它缺乏人類特有的直覺、價值判斷與創新靈感,無法像人類那樣從偶然現象中捕捉科學機遇,也難以理解研究成果背後的社會意義。
科學的終極目標是探索未知、改善人類命運。AI 科學家的崛起,讓這一目標的實現變得更加迅速、更加高效。2025 年諾貝爾化學獎得主 Yaghi 的話或許是最好的註腳:「我們不是在加速實驗,而是在加速人類解決問題的能力。」
參考鏈接:
1.https://sakana.ai/ai-scientist/
2.http://m.toutiao.com/group/7559872054532407823/
3.https://www.businessinsider.com/openai-cofounder-andrej-karpathy-keep-ai-on-the-leash-2025-6
4.https://www.dwarkesh.com/p/andrej-karpathy
5.https://mp.weixin.qq.com/s/qUL3jhyZcIZI7cBQac1vbg