開發者朋友們大家好:
這裏是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@瓚an、@鮑勃
01 有話題的技術
1、SiMa.ai 聯合 Cerence 發佈車載對話式 AI 方案:基於 Modalix SoC 實現全本地化推理,功耗低於 10W
SiMa.ai 與 Cerence 在 CES 2026 期間展示了新一代車載生成式 AI 對話系統。該方案通過 Modalix SoC 實現了完全的端側運行,在確保高性能邊緣推理的同時,將整機功耗控制在 10W 以下。
- Modalix SoC 專有加速: 採用針對 GenAI 優化的專用 SoC 架構,支持在不依賴雲端連接的情況下,於邊緣側完成複雜自然語言處理任務。
- 10W 低功耗運行: 相比通用 GPU 或高性能計算平台,該方案在提供高密度 AI 算力的同時,將運行功耗壓低至 10W 以內,優化了車載環境的散熱要求。
- 高自然度人機交互: 相比 IAA 2025 發佈的早期版本,本次迭代提升了端側模型的響應速度與邏輯理解能力,支持更接近真人的對話體驗。
- 全本地化部署: 所有語音處理與大模型推理均在本地完成,確保了數據隱私並消除了雲端請求帶來的延遲風險。
( @SiMa\_lnc\@X)
2、Tucuvi 獲 2000 萬美元 A 輪融資:推出語音智能體「LOLA」,支持 50+ 自動化臨牀工作流
西班牙醫療 AI 初創公司 Tucuvi 完成 2000 萬美元 A 輪融資,由 Cathay Innovation 和 Kfund 領投。其核心產品 AI 護理管理平台利用語音智能體「LOLA」自動化處理患者電話溝通與臨牀決策支持,旨在解決醫療系統行政效率低下及人手短缺問題。
- 語音智能體「LOLA」實現複雜臨牀交互: 智能體通過語音交互執行患者隨訪,支持包括術後跟蹤、慢病管理、術前評估、分診篩選及藥物管理在內的 50 多種臨牀工作流。
- 端到端工作流編排與人工升級機制: 平台支持全流程自動化,並在識別到異常臨牀指標或複雜情況時,自動將任務升級至人工醫療團隊處理。
- 深度集成與自動文檔化: 該平台不侷限於語音通話,還涵蓋了臨牀文檔的自動生成,並實現了與現有醫療機構運營系統的後端集成。
- 大規模醫療合規性驗證: 系統已在歐洲 60 多個醫療系統中部署,累計處理超過 30 萬次真實患者通話,強調在臨牀環境下的可審計性與安全性。
目前已在歐洲 60 多個醫療系統中上線應用;本輪融資將用於向全歐洲及美國市場擴張。
( @Tech.eu)
02有亮點的產品
1、可以科技完成超億元股權融資,將關注人機情感交互
消費級機器人公司可以科技完成超億元股權融資,本輪由吳中金控集團、元禾控股領投,基石資本、藍馳創投、黎萬強跟投。
天眼查信息顯示,可以科技此前已完成 7 輪融資,2022 年完成 C 輪融資,投資方涵蓋藍馳創投、源碼資本、小米、順為資本、安克創新、鬆禾遠望等知名機構。
可以科技成立於 2014 年,旗下擁有細胞機器人(Cell Robot)和可立寶(ClicBot)兩款旗艦產品。據官方信息,本輪融資將用於加速家庭服務機器人與教育機器人產品的研發及市場拓展。
本週的 CES2026 活動上,可以科技推出全新產品,桌面助理機器人 Loona Deskmate。
區別於同類型桌面產品,Loona Deskmate 不自帶屏幕、攝像頭或麥克風,用户需要將手機吸附到無線充電位,同步啓動 AI 陪伴應用。
DeskMate 通過多模態 AI 感知與實時情感計算,實現了「無需下令,主動理解」的自然交互方式。
另據外部信息,可以科技 B+輪融資路演或將於 2026 年 2 月底正式啓動。
( @多知)
2、開源插件 CallMe 發佈:通過 「Telnyx」/「Twilio」 實現 Claude Code 語音外呼與多輪交互
開發者 zefram.eth 發佈了名為 CallMe 的 MIT 開源插件,使 Claude Code 能夠通過電話外呼方式與開發者進行異步交互。當 AI 任務完成、運行卡頓或需要人工決策時,系統將自動撥打用户電話並支持多輪語音對話。
- 混合 API 技術棧:語音通信鏈路基於 「Telnyx」 和 「Twilio」 接口,TTS 與 STT 由 OpenAI API 提供支持。
- 併發工具調用能力:支持在通話過程中執行 Tool Use ,例如 Claude 可在保持通話的同時進行網頁搜索並將結果同步至語音流。
- 全終端覆蓋:由於基於傳統電信網絡,該功能兼容智能手機、智能手錶及固定電話,無需安裝特定移動端 App。
- 權限校驗約束:由於 Claude Code 的權限授予(如 ls 讀取目錄)必須通過終端輸入完成,插件當前無法通過語音遠程授權,建議在全自動模式下配置跳過權限確認。
- 極低運行成本:插件本體免費且開源,底層 API 通話成本僅為每分鐘數美分。
現已在 GitHub 開放源碼,採用 MIT 開源協議。用户需自行配置相關 API 密鑰。
( @boredGenius\@X)
3、福特發佈基於 LLM 的車載 AI 助手,下一代「BlueCruise」成本降低 30% 並瞄準 2028 年「Eyes-off」能力
Ford 在 CES 2026 宣佈推出由 Google Cloud 託管的 LLM 智能體,並披露下一代「BlueCruise」智駕系統路線圖。該更新旨在通過降低硬件成本和深化車端數據集成,實現從點對點輔助駕駛向高階自動駕駛的演進。
- 深度數據集成智能體: 助手基於 Google Cloud 託管的現成 LLM 構建,擁有車輛底層數據訪問權限。除了常規交互,可處理針對性技術諮詢(如皮卡貨箱載重限制、實時機油壽命分析),計劃於 2027 年實現原生車載集成。
- 「BlueCruise」硬件成本削減: 下一代智駕系統製造支出較現行版本降低 30%。該系統將首發於「Universal Electric Vehicle」平台,首款搭載車型預計為 2027 年發佈的中型皮卡。
- 點對點自主駕駛: 新版系統將提供類似於「Tesla」FSD 的端到端輔助能力,支持從起點到終點的連續導航輔助,初期仍需駕駛員全程監督。
- 「Eyes-off」技術節點: 明確 2028 年為實現「Eyes-off」駕駛的目標年份。屆時系統將允許駕駛員在特定條件下視線離開路面,標誌着從 L2+ 向 L3 級及以上自動駕駛的轉變。
AI 助手計劃 2026 年初上線手機 App,2027 年開啓車載原生支持;下一代「BlueCruise」預計 2027 年隨 UEV 平台新車發佈。
( @TechCrunch)
4、Google 發佈 Gemini 3 驅動的 Gmail 升級:原生集成 AI Overviews 與上下文感知 AI Inbox
Google 宣佈 Gmail 正式接入 Gemini 3 大模型,推出具備語義搜索能力的 AI Overviews、自動化優先級排序的 AI Inbox 以及跨應用上下文的創作工具。此舉旨在利用 LLM 的推理能力,將郵件客户端從單一通訊工具轉型為主動式「智能體」助手。
- 基於 Gemini 3 的自然語言檢索:AI Overviews 支持通過自然語言查詢跨年份、跨郵件的具體細節(如去年的裝修報價),直接生成精準回答而非返回郵件列表;對話摘要功能已面向全體用户免費開放,Q\&A 檢索功能限 Pro/Ultra 訂閲者使用。
- 語義識別驅動的 AI Inbox:該功能通過分析用户往來頻率、聯繫人關係強度及郵件正文語義,自動識別 VIP 並提取關鍵待辦事項進行內置置頂,實現非固定規則的動態優先級排序。
- 跨應用上下文輔助寫作:Help Me Write 模塊新增個性化功能,下月起將支持調用其他 Google 應用(如日曆、文檔)中的上下文信息進行郵件草擬;同時集成 Proofread 接口,提供進階語法與語調校對。
- 多模態與性能優化:底層由 Gemini 3 系列模型驅動,在保持低延遲的前提下提升了長文本的合成摘要能力,目前首發支持英文,後續將擴展多語言支持。
即日起在美國市場上線(僅限英文),AI Overviews 摘要功能全員免費,Q\&A 與 Proofread 需訂閲 Google AI Pro/Ultra;AI Inbox 目前處於 Trusted Testers 測試階段,預計未來數月內規模化部署。
( @Google Blog)
03有態度的觀點
1、Epoch AI 新報告:中國平均落後 7 個月,最小差距 4 個月
近日,Epoch AI 發佈了一份關於全球大模型進展的最新圖表,通過量化數據揭示了中美 AI 實力之間的真實差距。報告指出,自 2023 年以來,中國前沿 AI 模型的進展平均落後於美國 7 個月,其中最小差距為 4 個月,最大差距則達到 14 個月。
報告採用了綜合能力指數(ECI)作為衡量標準,全面評估了模型在語言理解、推理分解、多任務泛化及專家校準等維度的表現。圖表顯示,中美 AI 能力的演進曲線雖然方向一致,但節奏各異。美國 AI 表現出極為密集的更新頻率,從 GPT-4、o1 到 Gemini 3 Pro,其能力的提升已不僅依賴參數規模,更在於推理路徑設計和訓練目標的重構。
相比之下,中國 AI 模型展現出明顯的「跳躍式」追趕特徵。從早期的 Baichuan2、Yi-34B 到近期的 DeepSeek-V2、Qwen2.5 及 Qwen3 Max,中國模型主要通過擴大參數規模和採用 MoE 架構來快速拉平差距。數據顯示,雙方代差已從 2023 年的 10–12 個月,逐步收斂並穩定在目前的 7 個月左右。
報告揭示了一個核心事實:這 7 個月的代差本質上也是「開源與閉源」的差距。目前,美國最頂尖的前沿模型(如 GPT-5、Gemini 3)均為閉源,持續拉高全球能力上限;而中國最領先的模型如 Qwen 和 DeepSeek 系列,大多選擇開放權重。中美 LLM 能力的差距,幾乎完全貼合了閉源與開源模型之間的整體能力落差。
儘管存在代差,但數據顯示中國 LLM 已完全進入全球大模型第一競爭梯隊。行業分析認為,未來的決勝關鍵將不再僅僅是參數規模的競爭,而是轉向範式的躍遷。隨着 2026 年「持續學習」信號的釋放,如何在不重新訓練的情況下實現參數內的自我迭代,以及讓 AI 推理與行動深度耦合、具備智能體級的系統能力,將成為定義下一代前沿 AI 的核心。誰能率先跨越這條線,誰就將重新定義全球 AI 的競爭格局。
(@新智元)
閲讀更多 Voice Agent 學習筆記:瞭解最懂 AI 語音的頭腦都在思考什麼
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請通過開發者社區或公眾號留言聯繫,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、項目、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
作者提示: 個人觀點,僅供參考