字節跳動發佈了其最新的多模態大語言模型 Vidi2,一個擁有120億參數、專用於視頻理解的AI模型。該模型能夠處理數小時長的原始素材,理解其中的故事脈絡,並根據簡單提示生成完整的TikTok短視頻或電影片段,被視為對現有視頻編輯行業的重大顛覆。 Vidi2的關鍵在於其視頻理解能力。新模型新增了精細的時空定位(STG)功能,能夠同時識別視頻中的時間戳和目標對象的邊界框。給定文本查詢,Vidi2不僅能
新聞 RSS 訂閱
上海交大增設全球首個“具身智能”本科專業
上海交通大學近期發佈公告,宣佈即日起擬增設具身智能本科專業,成為全球高校中首個計劃獨立設置該專業的院校。 根據公告內容,上海交通大學將在 2025 年度增設具身智能本科專業。該專業將隸屬於人工智能學院計算機類,授予工學學位,修讀年限為四年。預計年度招生人數 30 人,其中升學人數 25 人,佔比約 83%。 預計就業人數 5 人,華為聯合培養 2 人,國家地方共建人形機器人創新中心 3 人。
《北京人工智能產業白皮書(2025)》發佈:全年核心產值預計突破 4500 億元
北京市科學技術委員會、中關村科技園區管理委員會正式發佈《北京人工智能產業白皮書(2025)》。數據顯示,2025年上半年,本市人工智能核心產業規模達2152.2億元,同比增長25.3%。據初步估算,全年產業規模有望超過4500億元,產業發展實現量質齊升。 《白皮書》顯示,北京人工智能產業生態日趨完善。截至目前,全市人工智能企業數量超過2500家,已備案大模型達183款,持續保持全國領先。 在創新
前 10 個月我國軟件業務收入 125104 億元
工業和信息化部運行監測協調局發佈 “2025年1—10月份軟件業運行情況”指出,2025年前10個月,我國軟件和信息技術服務業(以下簡稱“軟件業”)運行態勢良好,軟件業務收入穩健增長,利潤總額增勢放緩,軟件業務出口保持正增長。 一、總體運行情況 前10個月,我國軟件業務收入125104億元,同比增長13.2%。軟件業利潤總額15721億元,同比增長7.7%。軟件業務出口510.9億美元,同比增長
Apache Hudi 1.1.0 正式發佈,開源數據湖平台
Apache Hudi 1.1.0 是一個重大版本更新,為平台帶來了顯著的性能提升、新功能和重要變更。此版本重點增強了表格式支持、改進了索引功能、擴展了引擎支持,並改進了記錄合併 API。 發佈重點 可插拔表格格式框架- 多種表格格式的原生集成與統一的元數據管理 支持 Spark 4.0 和 Flink 2.0- 全面支持最新主要計算引擎版本 增強型索引- 分區記錄索引、分區級桶索引、原生
如何塑造 AI 虛擬人的“活人感”
在過去幾年裏,虛擬人技術的進步速度非常快,但行業裏真正難的部分,從來不在“會説什麼”,而在“怎麼像一個活生生的人”。這份分享來自一位長期深耕智能體與虛擬人的開發者,他在實踐中逐步總結了內容、行為、情緒與人格四個層面的“活人感”塑造方法論。這些經驗對於正在評估虛擬人項目的團隊、或思考未來智能體產品形態的技術管理者,都有參考價值。 首先,內容層面的擬真已經不再是行業的瓶頸。大模型越獄示例、類圖靈測試的
Gitee 產品更新:Web 端提交、工作項與知識庫體驗提升
Gitee 在最近對Web Git 提交、工作項流轉、知識庫管理等核心協作體驗進行了集中升級。本次更新聚焦提交更靈活、流程更可控、信息更易追溯三大方向,為團隊在研發溝通、跨項目協同及內容管理中帶來更清晰、更高效的體驗。 Web 端提交支持自定義信息 在 Web 端進行提交時,無論是修改文件、合併/回退 Pull Request 還是使用 WebIDE,現在都會在提交前彈出編輯框,可直接修改 Co
阿里通義最新生圖模型 Z-Image 發佈首日下載量達 50 萬
阿里通義大模型團隊最新發布的生圖模型 Z-Image 在上線後迅速登頂 Hugging Face 趨勢榜雙榜第一,其首日下載量達 50 萬。 據介紹,Z-Image 是一款開源、免費的高效圖像生成基礎模型,參數量為 6B,1秒出圖。無需依賴頂級算力和參數堆砌,即可在 16GB 顯存的消費級顯卡上,生成品質可與頂級商業模型相媲美的超真實圖像,尤其在中英雙語文本渲染方面效果突出。 Z-Image 僅
近半數亞洲企業將 AI 作為 2026 年戰略優先事項
根據 Diligent Institute 與新加坡董事協會(SID)及澳大利亞治理協會(GIA)聯合發佈的《亞太治理展望 2026》報告,越來越多的亞洲企業正將人工智能(AI)作為未來戰略的重中之重。在面對日益加劇的經濟和地緣政治不確定性時,近 48% 的治理領導者表示,AI 採用已成為 2026 年的首要戰略優先事項。這一比例高於追求增長機會(45%)、管理網絡安全風險(39%)和應對地緣政治
三星解散 HBM 特別團隊併入 DRAM 部門
韓國媒體報道稱,三星電子宣佈對半導體部門進行重大組織架構調整,正式解散成立僅一年的高帶寬內存(HBM)特別開發團隊,並將該團隊的人員與相關業務整體併入DRAM開發部門下屬的設計團隊。 此次調整在日前舉行的高管內部通報會上正式公佈,核心變動為撤銷去年7月專為加速HBM研發而設立的獨立團隊。原團隊成員將統一劃歸至DRAM開發體系,繼續從事高性能存儲技術的研發工作。這一變動意味着HBM業務不再以獨立單元
ReSharper 和 Rider 2025.3.0.3 發佈
ReSharper和Rider2025.3 版本又發佈了一系列更新。具體更細內容如下: ReSharper 2025.3.0.3 此版本最顯著的修復是,編輯器和 InspectCode 現在可以正確識別僅包含源代碼的 NuGet 包中的擴展方法。[RSRP-502165] 下載 ReSharper 2025.3.0.3 Rider 2025.3.0.3 本次更新修復了以下問題: 自動軟件包恢復
當搜索遇上大模型:開發者怎樣把傳統搜索系統升級成 AI 搜索?
在生成式 AI 已經深入業務的今天,搜索系統的角色正在發生很明顯的變化。用户對搜索的期望不再侷限於關鍵詞匹配,而是希望系統具備語義理解、多模態處理以及實時推理能力。傳統的全文檢索依舊是基礎,但很難覆蓋這些新需求,搜索逐漸成為 AI 應用的核心底座。 Elastic 中國首席佈道師劉曉國在 GOTC 2025 全球開源技術峯會的演講提到了一個更實際的問題:在現有技術棧中,如何用向量搜索、混合搜索、R
谷歌因需求激增收緊 Gemini 3 Pro 免費用户使用限制
谷歌宣佈由於用户需求急劇上升,對其 AI 產品 Gemini3Pro 和 Nano Banana Pro 的免費用户使用權限進行了限制。這一變化是為了應對激增的用户訪問量和相應的容量壓力。自 Gemini3Pro 與 Nano Banana Pro 發佈以來,很多用户紛紛涌入體驗這些新功能,造成了服務的不穩定。 最初,Gemini3Pro 為免費用户提供的每日提示詞發送上限為5次,與之前的 Ge
快手開源新一代旗艦多模態模型 Keye-VL
快手宣佈正式發佈新一代旗艦多模態模型 Keye-VL-671B-A37B,並同步開放代碼。公告稱,該模型具備“善看會想”,並在在通用視覺理解、視頻分析、數學推理等多項核心benchmark中全面領跑。 在保持基礎模型強大通用能力的前提下,Keye-VL-671B-A37B 對視覺感知、跨模態對齊與複雜推理鏈路進行了系統升級,實現了多模態理解和複雜推理的全方位性能躍升:更會“看”、更會“想”、也更會
Ubuntu 26.04 "Resolute Raccoon" Snapshot 1 發佈
Canonical 已正式啓動 Ubuntu26.04 LTS(代號 Resolute Raccoon)的開發週期,本週發佈了 Ubuntu 26.04 首個 Snapshot 1 ISO,這也是新一輪每月快照節奏的開端。 下載地址 https://cdimage.ubuntu.com/ubuntu/releases/26.04/snapshot1/ https://cdimage.ubun
我國人形機器人企業已超 150 家
國家發展改革委11月27日舉行新聞發佈會,國家發展改革委政策研究室副主任、新聞發言人李超在會上指出,近年來,在創新引領和需求釋放的雙重作用下,以人形機器人為代表的具身智能產業規模,正在以超50%的增速跨越式發展。根據市場調研機構預測,2030年將達到千億元市場規模。 “我們也看到,當前人形機器人在技術路線、商業化模式、應用場景等方面尚未完全成熟,隨着新興資本加速入場,我國目前已有超過150家人形機
Kagi 發佈 Orion 瀏覽器 1.0 正式版:基於 WebKit 引擎、不集成 AI 功能
採用WebKit引擎的Kagi Orion瀏覽器推出 1.0 正式版,登陸 macOS 平台,主打隱私與高性能,面向希望兼得系統內置 Safari 瀏覽器的速度、又不願被瀏覽數據收集跟蹤的用户。 下載地址:https://cdn.kagi.com/downloads/OrionInstaller.dmg 對於想擺脱目前市場上占主導地位的 Chromium 瀏覽器(如 Chrome、Edge、Br
從 RAG 到 KAG :結構化思考範式下的複雜推理
導語 |隨着人工智能技術的迅速發展,基於大語言模型(LLMs)的應用逐漸成為主流。然而,這些大模型在實際應用中仍像在“閉卷考試”,一旦題目超綱便只能憑空編造,即便後來引入 RAG 讓其“開卷”,也常因翻不到正確的頁碼而答非所問。尤其在垂直領域的應用中,單純依靠大模型往往無法滿足複雜業務對精準問答、實時知識更新和推理深度的需求。因此,技術正從 RAG (Retrieval Augmented Gen
Recharts 3.5.1 發佈,React 和 D3 構建的圖表庫
Recharts 3.5.1 現已發佈,具體更新內容包括: Fix Pie:為Pieshapeprop 添加缺失的Sector索引#6683 此功能可自定義Pie的特定扇區,類似於 2.x 版本中的activeIndex。 PiePieChart:防止 multi-PiePieCharts在共享數據鍵時出現 cross-Pie 高亮#6678 僅當鼠標懸停在特定
OpenReview 平台因 API 接口存在未授權訪問漏洞,導致審稿人數據可公開訪問
昨夜,學術論文審稿最常用的 OpenReview 平台出了一個前端 bug (存在能夠未授權訪問的 API 接口,調用該接口可以查找歷史所有會議論文的審稿人和 Area Chair 等實名信息),導致原本的「雙盲評審」變成了實名打分且分數可查。 只要把投稿的 paper ID 填入特定的 API 鏈接(如下),就能瞬間拉出這篇論文的所有作者、審稿人、AC 的完整信息:姓名、郵箱、機構、個人履歷。更
摩爾線程發佈 Torch-MUSA v2.7.0
摩爾線程近日正式發佈PyTorch 深度學習框架的 MUSA 擴展庫——Torch-MUSA v2.7.0,新版本在功能集成、性能優化與硬件支持方面實現進一步突破。 自v2.5.0起,Torch-MUSA版本號已與PyTorch主版本號保持同步,便於開發者進行版本識別與管理。新版本進一步集成muSolver與muFFT等計算加速庫,顯著提升複雜計算任務的執行效率;同時新增對統一內存設備(Unifi
AGFS:致敬 Plan 9 “萬物皆文件”理念的 Agent 文件系統
PingCAP 聯合創始人兼 CTO 黃東旭最近發佈了名為「AGFS」的開源項目。 根據介紹,AGFS(Aggregated File System / Agent File System)嘗試以“文件系統統一抽象”方式聚合現代多種後端服務。項目靈感來自 Plan 9 的“萬物皆文件(Everything is a file)”理念,希望在當下 AI Agent 與分佈式應用快速增長的背景下,提供
雷軍:所有產業都值得用 AI 重做一遍
據財聯社報道,小米集團創始人、董事長雷軍近日接受專訪時表示,未來五年,人工智能將對傳統產業產生深刻影響,提出“所有產業都值得用AI再做一遍”的重磅論斷。 雷軍以小米汽車工廠為例,闡述了AI與傳統制造融合帶來的效率飛躍。他指出,通過結合X光機和AI視覺大模型對大壓鑄件進行檢測,檢測時間可壓縮至2秒內,效率是人工的10倍,精度提升至人工的5倍以上,體現了AI對質量控制和生產效率的顛覆性提升。 他預測
智譜清影 2.0 發佈,一句話生成 1080P 視頻
智譜AI 宣佈清影2.0上線,文本直出1080P高清視頻,最長10秒,運動幅度、鏡頭語言、風格控制全由模型説了算。 官方實測顯示,畫質與穩定性已接近OpenAI Sora,且中文提示詞理解更準、生成更快。 新版本基於自研CogVideoX大模型,支持一次跑多條視頻、自由指定鏡頭推拉搖移,還能“導演”畫面風格——賽博霓虹、國風水墨、膠片復古,一句話搞定。智譜同時放出CogSound音效模型,視頻生