編者按: 為什麼大語言模型總是"一本正經地胡説八道"?它們是在故意欺騙,還是被訓練機制"逼"成了這樣? 我們今天為大家帶來的這篇文章指出:幻覺並非模型的故障,而是當前訓練與評估機制下的一種理性選擇 ------ 當模型因進行猜測獲得獎勵、因坦白"我不知道"而被懲罰時,編造答案就成了最優策略。 文章系統剖析了幻覺的三大根源:預訓練階段以統計預測替代事實判斷、後訓練階段(如 RLHF)採用非黑
新聞 RSS 訂閱
Electron 39.2.4 發佈,跨平台桌面應用開發工具
Electron 是一個使用 JavaScript、HTML 和 CSS 構建跨平台的桌面應用程序。它基於 Node.js 和 Chromium,被 Atom 編輯器和許多其他應用程序使用。Electron 兼容 Mac、Windows 和 Linux,可以構建出三個平台的應用程序。 Electron v39.2.4 現已發佈,一些更新內容如下: 修復 修復了menu.popup的 close
AI 到 2035 年或將取代英國 300 萬個低技能崗位
根據英國國家教育研究基金會最新發佈的一份報告,預計到2035年,人工智能(AI)和自動化技術可能使英國300萬個 “低技能” 崗位消失。 這項研究指出,受影響最嚴重的職業包括技術工人、機械操作員及各類行政職位。與此同時,AI 的發展也將導致對高技能專業人才的需求增加 報告顯示,儘管 AI 帶來的衝擊將使低技能職位減少,整體而言,預計到2035年,英國經濟仍會淨增230萬個崗位。然而,新增崗位的分
DeepSeekMath-V2 開源發佈,世界首個奧數金牌 AI
據 Hugging Face 頁面顯示,深度求索 DeepSeek 團隊發佈了大語言模型 DeepSeekMath-V2,聚焦可自驗證的數學定理證明能力,實現可自驗證的數學推理突破。 該模型通過訓練一個高精度、高保真的驗證器,並以其作為獎勵信號引導證明生成器自我修正,形成“生成—驗證—優化”閉環。為應對生成與驗證能力同步提升的挑戰,團隊提出擴展驗證計算資源以自動標註難驗證樣本,持續優化驗證器性
DAU 超 1100 萬,Soul App 成為中國 AI 社交第一股
國內 AI+沉浸式社交平台Soul App已正式向港交所主板遞交上市申請,由中信證券擔任獨家保薦人,戰略投資者騰訊持股達 49.9%(不參與日常管理及業務運營)。 公司財務報告指出,其收入從2022年的16.67億元增長至2024年的22.11億元,複合增長率超15%,2025年前八個月收入達16.83億元;自2023年起已實現穩定盈利,2024年全年及2025年前八個月經調整盈利分別為3.37
“聽文章”功能來了:DevFM —— 專為程序員量身定製的技術音頻助手
社區呼聲已久的“聽文章”功能終於來了,「DevFM」——專為程序員打造的技術音頻助手,把您想看的技術內容自動變成隨時可聽的高質量播客。 「DevFM」通過智能生成結構清晰、語音自然的技術解讀,讓你在通勤、健身、走路、做飯時也能持續輸入。 它不只是“把文章讀出來”,而是像一位資深架構師陪在你身邊,用播客的節奏和深度,把晦澀的技術乾貨拆成一條條可隨取隨用的知識切片。 使用場景 通勤地鐵太
OpenAI 公告:已將 Mixpanel 從生產環境中移除
OpenAI 就網站分析服務 Mixpanel 安全事件發佈公告稱,2025 年11 月 9 日,Mixpanel 發現有攻擊者未經授權訪問了其部分系統,並導出了一個包含有限客户身份信息和分析信息的數據集。Mixpanel 通知 OpenAI 正在進行調查,並於 2025 年 11 月 25 日與其分享了受影響的數據集。 其中,與 platform.openai.com 使用相關的用户個人資料信息
嵌入式 AI 產品做得再強,沒續航也留不住用户
在嵌入式AI持續升温的這幾年,“效果很好”的演示並不少見,但真正進入量產、長時間運行後,多數產品依舊會在續航、穩定性、開發週期等環節出現落差。走訪行業案例時,一個普遍感受愈發清晰:AI 能否落地,不只靠模型本身,還取決於低功耗能力以及能否在一個健康的開源生態中開發。 很多終端設備的AI能力難以堅持到用户的真實使用週期。一旦電量不足,語音喚醒、實時識別等功能就會被迫關閉,用户自然也就失去了體驗AI的
嵌入式語音 AI 的完整實踐路徑:從設備到雲的真實工程經驗
隨着語音交互走進更多應用場景,越來越多團隊開始探索「能跑得快、夠可定製、還真能落地」的語音 AI 代理。而下面這份分享帶來了一條完整的工程路徑:從硬件到流式處理,再到端雲協同,讓語音 AI 真正具備可用性。 在現實工程中,語音 AI 的實現大致有三種形態: 本地運行,將模型直接部署在設備端,隱私好、響應快,但設備需要更強的算力。 遠程服務,設備只負責錄音和播放,將識別與生成完全交給雲端。模型
谷歌新 AI 編程工具 Antigravity 被曝重大安全漏洞
谷歌推出的基於 Gemini 的 AI 編程工具 “Antigravity” 在上線24小時內便被發現存在嚴重安全漏洞。安全研究員亞倫・波特諾(Aaron Portnoy)發現,通過修改 Antigravity 的配置設置,他可以讓 AI 執行惡意代碼,從而在用户的計算機上創建一個 “後門”。這使得他能夠潛在地安裝惡意軟件,進行數據竊取或甚至發動勒索攻擊。這個漏洞對 Windows 和 Mac 系
中國“開源 AI 模型”超越美國
根據《金融時報》的報道,中國目前已經在全球“開放(open-weight)AI 模型”市場上超過美國,成為主導力量。 一項由 MIT 與 Hugging Face 聯合進行的研究顯示:過去一年,中國團隊新發布的開放權重(open-weight)AI 模型下載量佔比已達到 17%。這一數字首次超過了美國科技公司(包括 Google、Meta、OpenAI 等)的 15.8%。這意味着中國企業/研究
淺談 AI 搜索前端打字機效果的實現方案演進
作者:vivo 互聯網前端團隊 - He Yanjun 在當代前端開發領域,打字機效果作為一種極具創造力與吸引力的交互元素,被廣泛運用於各類網站和應用程序中,為用户帶來獨特的視覺體驗和信息呈現方式,深受廣大用户的喜愛。 本文將深入介紹在AI搜索輸出響應的過程中,打字機效果是怎樣逐步演進的。力求以通俗的語言和嚴謹的思路深入剖析打字機效果在不同階段的關鍵技術難點和優劣勢。 1分鐘看圖掌握核
匯豐銀行斷言 OpenAI 到 2030 年難以盈利
匯豐銀行 11 月 24 日發佈的最新測算稱,OpenAI 若想撐到2030年,得再掏2070億美元(約1.47萬億元人民幣)去買算力,相當於在美國中西部再建一個“中型州”的電站。且即使屆時營收衝破2130億美元,公司依舊可能賺不到一分錢的淨利潤——自由現金流持續為負,缺口就是上面那2070億。 匯豐模型顯示,到2030年 OpenAI 將坐擁30億用户、覆蓋全球44% 的成年人,付費比例翻倍至1
韓國政府成立 AI 工作組,部署 26 萬塊英偉達 GPU
本週四,韓國政府與三星電子、現代汽車集團以及其他企業成立了一個人工智能聯合工作小組,旨在規劃這26萬GPU的部署計劃,推動全韓範圍內建立人工智能基礎設施的行動。 英偉達上個月曾宣佈,將向韓國政府和多家韓國大企業供應超26萬顆最先進的AI芯片。這代表着英偉達在韓國的最新擴張。這筆交易將使韓國使用的英偉達AI芯片的數量從目前的6.5萬顆增至30萬顆以上,從而使韓國成為除美國之外全球最大的人工智能計算中
巨人網絡發佈三大 Muli-Modal 模型
巨人網絡 AI Lab聯合清華大學與西北工業大學推出三項研究成果:YingVideo-MV、YingMusic-SVC 與 YingMusic-Singer,並陸續開源。分別面向音樂驅動的視頻生成、歌聲轉換與歌聲合成任務,完善了真實業務場景中多項關鍵能力鏈路,為 “視頻 × 音樂” 的多模態生成方向帶來了系統性的技術進展。 其中,YingVideo-MV模型實現僅憑“一段音樂加一張人物圖像”即可
國家發改委:要注意防範重複度高的人形機器人產品“扎堆”上市
國家發展改革委政策研究室副主任李超在新聞發佈會上表示,“速度”與“泡沫”一直是前沿產業發展過程中需要把握和平衡的問題,對於具身智能產業發展也一樣。 在“速度”方面,近年來,在創新引領和需求釋放的雙重作用下,以人形機器人為代表的具身智能產業規模,正在以超50%的增速跨越式發展。根據市場調研機構預測,2030年將達到千億元市場規模。 與此同時,我們也看到,當前人形機器人在技術路線、商業化模式、應用場景
KDE Plasma 6.8 起將完全轉向 Wayland
KDE 官方確認,從即將到來的 Plasma 6.8 開始,桌面環境將停止提供 X11 會話,全面採用 Wayland 作為默認且唯一支持的會話模式。不過,基於 X11 的傳統應用依然可以通過 XWayland 正常運行,因此對大多數用户來説,使用體驗不會受到明顯影響。 目前仍保留 X11 會話支持的版本是 Plasma 6.7 系列,預計將持續維護到 2027 年初。KDE 團隊表示,藉由淘汰
開源中國董事長馬越出席香港開源論壇:開源基礎設施服務香港智能轉型
2025 年 11 月 25 日,由中國科學院香港創新研究院主辦的「香港開源技術應用及生態發展論壇」在香港數碼港舉行。開源中國董事長馬越受邀發表演講,圍繞平台佈局、國家級項目進展、AI 技術能力與國際化戰略,系統闡述了開源中國如何以基礎設施為核心支撐,服務從本地研發協同到全球生態鏈接的轉型目標。 多平台協同,打造開源全棧體系 開源中國自 2008 年起步,迄今已構建涵蓋社區、研發協同、AI 平
Spec 驅動開發者新範式:Qoder 演進與最佳實踐
在本次的分享中,演講者從行業趨勢切入,討論了開發者與人工智能協作方式正在經歷的變化。PPT 中指出,AI Coding 已從輔助性工具逐步成為研發流程的必選項,使用方式也在從問答式交互向任務自動化遷移。隨着人們對模型的依賴不斷增強,更完整的任務委派模式開始普及。 分享重點介紹了“Quest Mode”這一基於規格説明書(Spec)的 AI 自主編程方式,將開發流程劃分為需求澄清、任務執行與結果驗
阿里巴巴開源 Z-Image 圖像模型:支持中英雙語文字渲染
阿里巴巴通義實驗室開源全新圖像生成模型Z-Image,該模型憑藉僅6B的參數規模,實現了高效的圖像生成與編輯,其視覺質量已接近國際領先商業模型的三倍參數級別(約20B)。 Z-Image 採用單流 DiT (Diffusion Transformer) 架構,包含Z-Image-Turbo(專注於快速推理)、Z-Image-Base(基礎開發)和Z-Image-Edit(圖像編輯)三大核心變體,以
全國首個 AI 輔助勞動仲裁系統上線,111 個爭議類型全覆蓋
深圳人社發文稱,國內首個“全案由覆蓋、全流程賦能、全方位支撐”的勞動爭議仲裁智能輔助辦案系統已在深圳市勞動人事爭議仲裁院正式上線。系統啓用後,仲裁員閲卷效率提高50%,裁決書製作時間減少約50%,整體辦案週期明顯縮短。 除辦案效率提升外,仲裁立案審查準確度、調解方案合規度、法律適用精準度也有望得到進一步提升,並有力促進同案同裁、案結事了和裁審銜接。 系統創新採用“知識圖譜打底、思維鏈驅動”的算法
消息稱字節跳動重啓出售沐瞳科技,沙特公司或接盤
彭博社援引知情人士消息稱,字節跳動正在與沙特 Savvy 遊戲集團洽談,向後者出售旗下游戲公司上海沐瞳科技。 此次洽談標誌着字節跳動重啓了出售沐瞳科技的計劃,該計劃在去年被擱置。字節跳動2021年以大約40億美元的估值收購了沐瞳科技。沐瞳科技開發了在線戰術競技類遊戲《無盡對決》。 知情人士表示,相關談判仍在進行中,而且可能不會達成交易。 Savvy同樣涉足電競領域,由沙特公共投資基金在2021年
螞蟻 ASystem 團隊開源 NCCL 功能擴展庫:AMem NCCL-Plugin
螞蟻 ASystem 團隊宣佈開源其強化學習系統的關鍵組件:AMem NCCL-Plugin,用於解決 RL 訓練中的顯存瓶頸和通信連接的耗時難題,以實現高性能計算。 NCCL 是 NVIDIA Collective Communications Library(英偉達集合通信庫)的縮寫,它是多 GPU 和多節點分佈式深度學習的核心通信庫,提供了包括 AllReduce、AlltoAll等多種
Kode - 從模型演進看下一代Agent應用開發
這場主題為 “從模型演進看下一代 Agent 應用開發” 的分享,用一個清晰的技術脈絡回顧了近幾年大模型從“會説話”走向“能做事”的演化,並嘗試梳理這種能力變化將如何影響未來軟件形態與開發者角色。 演講首先聚焦於模型能力的階段式演進。PPT 中將 LLM 的發展分為四個時期:預訓練階段主要依靠海量文本進行語言模仿;SFT + RLHF 階段讓模型具備了回答問題的能力,卻仍停留在建議層面;Work