關鍵詞:Gemini 3 ;Grok 4.1 ;螞蟻靈光;
Giants
巴菲特重金入股谷歌;Meta 員工 AI 使用情況直接掛鈎 KPI
蘋果 CEO 庫克被曝最早明年讓位,內部稱蘋果 AI 已落後同行 2 年
金融時報最新爆料,蘋果現任 CEO 庫克最早將於明年退休,接棒人選為現任硬件工程高級副總裁 John Ternus。此舉反映了蘋果在 AI 時代的緊迫感。據彭博社知名記者古爾曼爆料,蘋果內部也認為其人工智能"落後行業領導者兩年多"。從 2023 年底谷歌推出 Gemini 時蘋果匆忙推出開源機器學習框架 MLX,到包含摘要、總結等功能的 Apple Intelligence 在競品光環下失去亮點,蘋果在 AI 領域的表現確實不盡如人意。iPhone Air 首銷周激活量僅 5w+,不足 iPhone 17 Pro Max 的十分之一,進一步加劇了蘋果的焦慮情緒。
巴菲特系 49 億美金入股 Google
投資公司 Berkshire Hathaway 最新披露,其截至 9 月 30 日持有 Alphabet 約 17.85 萬股,估計市值約達 49 億美元。這一舉動標誌着長期以來被視為"避科技股"的伯克希爾投資風格出現轉變,亦被市場解讀為對 Alphabet 未來在 AI 與雲基礎設施領域佈局的信心投票。谷歌母公司 Alphabet Inc。股價在盤前交易中大幅上漲約 5.5%。分析人士指出,Alphabet 的估值仍低於多家 AI 重倉科技巨頭,此次巴菲特系入場或有助於重塑市場對這家科技巨頭未來增長路徑的預期。
Meta 革新員工績效評估,AI 使用情況直接掛鈎 KPI
Meta 在內部信函中宣佈,從 2026 年起,AI 將與員工績效掛鈎。公司將評估員工使用 AI 的情況,考察他們如何通過 AI 提高自己的工作效率,以及是否構建有能夠顯著提升生產力的工具。Meta 還將在內部推出 AI 績效工具 Metamate,幫助員工撰寫績效評估內容和反饋。這一舉措標誌着 Meta 全面擁抱 AI 的戰略決心,也反映了硅谷科技公司對 AI 工具使用的重視程度不斷提升。
全球首家 AI 編程創企估值破 2000 億,英偉達和谷歌搶投
爆款 AI 編程神器 Cursor(母公司為 Anysphere)宣佈完成 23 億美元的鉅額 D 輪融資,投後估值達 293 億美元(約合人民幣 2079.1 億元),成為全球首家估值突破 2000 億元人民幣的 AI 編程創企。此輪融資的投資方陣容豪華,新增投資者包括英偉達、谷歌和頂級基金 Coatue。Cursor 的年化收入已突破 10 億美元,數百萬開發人員和許多世界上最成功的工程組織都是其客户。英偉達創始人兼 CEO 黃仁勳稱,在英偉達,每一位軟件工程師都在用 Cursor,Cursor 就像是大家的編程夥伴,大幅提升了生產力。
Models & Applications
Gemini 3 深夜炸場馬斯克奧特曼點贊;Grok 4.1 情感交互能力展現優勢;螞蟻靈光、阿里千問 APP 上線
谷歌 Gemini 3 Pro 全面超越 GPT-5.1,馬斯克奧特曼紛紛點贊
谷歌發佈 Gemini 3 Pro 模型,在幾乎所有基準測試中超過 GPT-5.1 和 Claude4.5,包括人類最後的考試、ARC-AGI-2 等專為 AGI 準備的測試。數學的 AIME 2025 帶工具拿滿分,還刷新了之前讓大模型全員得 0 分的 LiveCodeBench Pro 紀錄。用户投票的大模型競技場中,馬斯克的 Grok4.1 昨天才刷完榜,今天就被反超了。奧特曼和馬斯克也不得不佩服,前後腳出來點贊祝賀。谷歌還推出 Google Antigravity 實驗性智能體開發平台,構建"智能體優先"的開發環境,將開發者從繁瑣的編碼工作中解放出來。
阿里千問 app 開啓公測,性能躋身全球前列
阿里巴巴正式宣佈"千問"項目,全力進軍 AI to C 市場。千問 APP 公測版基於全球性能第一的開源模型 Qwen3,憑藉免費以及與各類生活場景生態的結合。阿里核心管理層將"千問"項目視為"AI 時代的未來之戰"。Qwen 系列模型的全球下載量已突破 6 億次,近期發佈的旗艦模型 Qwen3-Max,性能超過 GPT5、Claude Opus 4 等國際競爭者,躋身全球前列。Airbnb CEO 布萊恩·切斯基公開表示,公司正"大量依賴 Qwen",因其比 OpenAI 模型更快更好。
螞蟻靈光 App 空降,主推 30 秒生成小應用
螞蟻集團推出全模態通用 AI 助手"靈光",支持自然語言 30 秒生成小應用,或輸出 3D 數字模型、音頻、圖標、動畫、地圖等全模態信息。"靈光"App 首批上線三大功能:"靈光對話"、"靈光閃應用"、"靈光開眼",分別對應文字對話、應用生成和多模態三種玩法。該應用支持快速生成雲養貓互動小應用、記賬應用等實用工具,還具備視覺功能可識別氣温信息並提供穿衣指南。值得注意的是,"靈光"的發佈與阿里"千問"App 的發佈僅僅相隔 1 天,兩大巨頭在 AI 超級入口的爭奪戰日趨激烈。
馬斯克 Grok 4.1 低調發布,情感交互能力展現優勢
xAI 公司毫無預兆地發佈了 Grok 4.1 模型,一經發布,在 LMArena 的 Text Arena 排行榜上,Grok 4.1 的推理模式以 1483 的 Elo 分數位居總榜首位,領先最高的非 xAI 模型整整 31 分。即便是非推理模式也以 1465 Elo 分數位居第二,超越了其他所有模型在啓用完整推理配置下的表現。該模型在情感智能、創意寫作等方面表現突出,在 EQ-Bench3 和 Creative Writing v3 基準測試中均位居前兩名。馬斯克在 x 上宣傳稱,Grok 4.1 在真實世界可用性方面帶來顯著提升,尤其是在創造力、情感互動和協作交互方面表現出色。
谷歌Nano Banana Pro上線,深度結合Gemini 3打造專業級圖像生成
谷歌發佈最新圖像生成模型Nano Banana Pro(Gemini 3 Pro Image),結合Gemini 3 Pro的強大推理能力和世界知識,實現專業級圖像生成能力。該模型支持生成2K和4K高分辨率圖像,支持廣泛的長寬比,最多可融合14張參考圖像並保持多達5個人物的一致性。具備強大的文字渲染效果,能夠生成準確、清晰可讀的多語言文本。通過與Google搜索結合,可生成基於最新數據的事實性視覺內容。所有生成的圖像都將嵌入SynthID數字水印,用户可在Gemini應用中驗證圖像是否由Google AI生成。
字節跳動 InfinityStar 視頻生成技術突破,單 GPU 一分鐘生成 5 秒 720p 視頻
字節跳動商業化技術團隊發佈入圍 NeurIPS'25 Oral 的論文,提出 InfinityStar 方法,一舉兼得視頻生成的質量和效率。該技術採用時空金字塔建模,是首個在 VBench 上超越擴散模型的離散自迴歸視頻生成器。核心架構將視頻分解為"首幀+後續片段",通過時空自迴歸 Transformer 建模,實現從百步去噪到自迴歸的轉變。InfinityStar 在單張 GPU 上生成一個 5s 720p 的視頻僅需不到 1 分鐘,比同尺寸的基於 DiT 的方法快一個數量級。該技術現已通過 Discord 社區向公眾開放體驗。
ChatGPT 破折號問題被修復,奧特曼親自官宣
OpenAI CEO 奧特曼親自宣佈,ChatGPT 可以聽從指示,在輸出內容中不再濫用破折號。在此之前,ChatGPT 對破折號的"痴迷"早已讓用户不勝其煩,成為人們判斷 AI 生成內容的標誌。GitHub 軟件工程師 Sean Goedecke 的研究發現,AI 對破折號的偏愛極有可能來自於 RLHF 信息提供者的語言習慣,以及 19 世紀出版物的引入。GPT 從 GPT-4 開始,破折號使用頻率比之前增長了十倍,而這段時間剛好是破折號的使用高峯。
谷歌 DeepMind WeatherNext 2 革命性天氣預測,32 個隨機數字推演地球未來 15 天
谷歌 DeepMind 發佈 WeatherNext 2,讓查天氣升級成小時級、實時化。運行速度比上一代快 8 倍,分辨率提高到小時級,可以細到"明天 2–3 點有小雨,3–4 點雨勢增強"的節奏。關鍵創新是 FGN(Functional Generations Networks)功能生成網絡,通過給模型本體加上輕微但全局一致的隨機擾動,讓模型變成一個會變化的小地球。輸入 32 個隨機數字就能生成高達 8700 萬維的全球天氣變化,99.9%的預測變量和時效都超過了上一代。在 1 個 TPU 上,生成一次 15 天的全球預報只需要不到 1 分鐘。
中國醫療 AI 未來醫生工作室全球第一,眾多醫生已用於診斷
在由 32 位國內頂尖臨牀專家組織的"多模型臨牀實戰測評"中,未來醫生 AI 工作室的核心模型 MedGPT,以明顯優勢擊敗 OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B 等國際最前沿的知名大模型,奪得臨牀"安全"與"有效性"評測的全球第一。該工作室提供診中臨牀決策 AI 助手和診後患者隨訪 AI 助手,被數十位全國學科主委納入日常使用。安全性得分比全部模型平均水平高出近 70%,在兒童、孕產婦、老年人等複雜人羣場景中也很穩健。
微博 VibeThinker 小模型大突破,7800 美元訓練成本超越 DeepSeek-R1
微博發佈首個自研開源大模型 VibeThinker,僅擁有 15 億參數,但在國際頂級數學競賽基準測試上擊敗了參數量高達 6710 億的 DeepSeek R1 模型。更令人矚目的是,其單次"後訓練"的成本僅 7800 美元,對比 DeepSeek-R1 和 MiniMax-M1 等成本直接降低了幾十倍。該模型在 AIME24、AIME25 以及 HMMT25 三個高難度數學測試集上的表現超越了 DeepSeek-R1-0120 版本,與規模為 456B 的 MiniMax-M1 效果接近或相當。微博計劃將 VibeThinker 應用於微博智搜等核心 AI 產品中。
全球AI政策與市場簡訊
神秘 AI 創企 Project Prometheus 獲 62 億美元融資,貝索斯首次正式擔任 CEO
美國神秘 AI 創企 Project Prometheus 獲得 62 億美元(摺合人民幣約 441 億元)融資,亞馬遜創始人傑夫·貝索斯不僅是新融資部分金額的出資者,還將作為聯合 CEO 協助管理該公司。這是貝索斯自 2021 年 7 月卸任亞馬遜 CEO 以來,首次正式擔任公司運營職務。Project Prometheus 非常神秘,成立時間、成立地點現在一概沒有公開,且沒有公司官網。其業務將專注於 AI 在計算機、航空航天和汽車等多個領域的應用。知情人士透露,Project Prometheus 已經僱用了近 100 名員工,包括從 OpenAI、谷歌 DeepMind 和 Meta 等頂級 AI 公司挖來的研究人員。
以上所有信息源自網絡
THE END