博客 / 列表

RTE開發者社區 - OpenAI 揭秘 Tolan 背後 AI 技術:如何讓語音智能體擁有連貫記憶和穩定人格?丨 Voice Agent 學習筆記

忘掉是為了記住——為了保持記憶質量,Tolan 每晚都會運行壓縮任務,刪除低價值或冗餘條目(例如「用户今天喝了咖啡」)並解決記憶中的矛盾之處。 哈嘍大家好~這是 Voice Agent 學習筆記系列的又一篇深度分享。我是課代表瓚 an👩🏻‍💻 在進入硬核技術拆解前,我們先快速瞭解一下今天的主角: Tolan 是由初創公司 Portola 打造的一款「語音先行」的 AI 伴侶應用。它沒有選擇

人工智能

RTE開發者社區 - AI 語音隨訪患者,AI 醫療初創 Tucuvi 融資 2000 萬美元;Gmail 升級 AI 版,轉型主動式智能體助手丨日報

開發者朋友們大家好: 這裏是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、SiMa.ai 聯合 Cere

人工智能

RTE開發者社區 - 西工大開源 VoiceSculptor:自然語言靈活設計音色;BreakReal R1:全球首款對話式 AI 調酒機丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、西工大開源 VoiceScu

人工智能

RTE開發者社區 - 如何用 Fun-ASR-Nano 微調一個「聽懂行話」的語音模型?丨Voice Agent 學習筆記

雖然通用語音識別模型在大多數場景下表現不錯,但有些時候,面對專業術語、特定口音或私有詞彙時,難免“聽錯”甚至“幻聽”,比如把內部產品代號識別為常見詞,或在方言會議中漏掉關鍵信息。 如果你希望模型更貼合自己的業務場景,微調是一個高效且實用的選擇。通過使用領域內標註數據微調模型(幾百到幾千小時不等),可以提升模型在特定場景、特定領域、特定用户羣體下的識別準確率,讓通用的模型更好地適應具體應用需求。微調

人工智能

RTE開發者社區 - 1956-2026:人類與機器智能的七十年對話

1956年夏天,當約翰·麥卡錫(John McCarthy)、馬文·明斯基(Marvin Lee Minsky)等先驅在達特茅斯學院首次提出“人工智能”這個概念時,他們樂觀地預言:十年內機器將具備人類級別的推理能力。 七十年過去了,這個預言雖未完全實現,但AI的演進軌跡卻遠比當初設想的更加波瀾壯闊——從符號推理的黃金時代到“AI寒冬”的沉寂,從機器學習的復興到深度學習的爆發,再到2026年AI全

人工智能

RTE開發者社區 - Wispr 曝光內部項目:不僅轉錄文本還執行任務;蘋果將推送 LLM 架構 Siri:支持屏幕感知與應用調用丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、NVIDIA 發佈 Nemo

人工智能

RTE開發者社區 - OpenAI 首款 AI 硬件是一支筆,並將研發全新音頻模型架構;Pickle 預售四攝 AR 眼鏡,可行性遭質疑丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01有話題的技術 1、DeepSeek 開年炸場,梁

人工智能

RTE開發者社區 - 如何讓你的語音助手有眼力見——Turn Detection 的 5 種解法丨Voice Agent 學習筆記

從2022年優化智能客服開始,我就開始嘗試優化人機語音對話中的 “語義完整度” 模塊。當時大部分人的精力都集中在優化識別率,在語音對話系統中,這不是一個核心模塊,似乎是可有可無的,但語義上的完整度對於用户體驗、信息收集的效率都有很大的影響。 特別是在今天人們對於智能和體驗的極致追求下,語音對話類各種應用,比如陪伴、玩具、客服等場景的大模型升級,越來越多的工作開始瞄準這個方向,業界需求也在增加,這也

人工智能

RTE開發者社區 - 字節版 NotebookLM 悄悄上線;樂鑫、塗鴉爭相推出 AI 硬件交互方案;2025 AI 語音輸入工具盤點丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、樂鑫攜手 Bosch Sen

人工智能

RTE開發者社區 - 路透社:2026 年將迎來智能體語音交互爆發;Traini 融資 5000 萬元:解析寵物叫聲與行為,實現人犬實時對話丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、Meta 斥資數十億美元收

人工智能

RTE開發者社區 - 關於 AI 陪伴新規,應該知道的幾件事丨社區來稿

2025年12月27日,國家網信辦發佈《人工智能擬人化互動服務管理暫行辦法(徵求意見稿)》,意見徵集期至2026年1月25日。 AI陪伴一直是監管關注的重點,之前我們在《AI陪伴別再"擦邊",情緒價值生意也得合規》和《第一家被通報下架的AI APP出現了!不合規就紅牌罰下》中分析過,已經有產品被約談整改,也有被下架整改的。 但這次不一樣。這份新規把很多之前模糊的地帶都説清楚了。如果説之前的監管動

人工智能

RTE開發者社區 - AI 不想取代播客主播,因為播客根本不賺錢|編碼人聲

「編碼人聲」是由「RTE開發者社區」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。 別再問「AI 會不會取代播客主播」了——AI 根本懶得動你,因為你這個賽道壓根不賺錢,而音頻 AI 變現場景是在別處。 在 RTE2025 大會開放麥現場,四位內容和 AI 從業者撕開了 AI 替代論的遮羞布: 播客是數字時代的「膠片相機」,

人工智能

RTE開發者社區 - 音軌分割模型SAM-Audio優化版:消費級GPU運行;2025兒童AI硬件圖譜:290億市場規模與高退貨率博弈丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、Dexmal 原力靈機提出

人工智能

RTE開發者社區 - 實時數字人 Lemon Slice 融資 1050 萬美元,單 GPU 實現 20FPS 生成;釘釘發佈 AI 防錄音魔盒丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、Qwen3-TTS上新,支持

人工智能

RTE開發者社區 - CES 2026 拉斯維加斯交流晚宴 | 半個 AI 硬件圈子都來了丨社區來稿

一年一度科技盛會 CES 來了,CES 2026 AI的競爭已從模型能力,轉向設備架構、系統整合與規模化落地。AI Companion 正成為對實時性與系統協同要求最高的 AI 設備形態。 共識的是AI Companion 不是功能疊加,而是系統工程。芯片、HAL、實時交互、對話式 AI、Agent 與設備形態,必須在同一架構下協同設計。而在其中真正的門檻不在模型,而在整合。 針對這個關鍵問題,A

人工智能

RTE開發者社區 - Runway 發佈世界模型,模擬實時環境和可交互數字人;Qwen3-Omni 升級,視頻語義理解與音視頻同步能力持續優化丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、GPT-5.2 正式發佈,狙

人工智能

RTE開發者社區 - AV1 獲艾美獎,Mozilla 披露 AV2 方向:面向實時交互;智譜開源語音合成模型 GLM‑TTS 丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 *本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、Google AI Stu

人工智能

RTE開發者社區 - 球星 C 羅投資 AI 初創 Perplexity;微軟開源 VibeVoice-Realtime,低延遲流式輸出丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01有話題的技術 1、TheWhisper:開源

人工智能

RTE開發者社區 - 構建擁有記憶的端到端實時語音助手:TEN Framework + memU 教程丨社區來稿

實時語音模型讓我們可以輕鬆構建能即時響應的語音助手Agent。但如果想讓一個語音助手真的有“用”,僅僅能聽和説還不夠——它必須擁有記憶。 在本教程中,你將使用 TEN Framework + memU 構建一個具備實時語音能力與長期記憶的智能Agent,它可以記住和你發生的一切對話內容。 你將構建 基於本教程的實時語音 + 記憶 Pipeline,你可以將 Agent 擴展為: AI 夥伴

人工智能

RTE開發者社區 - Meta 挖角蘋果設計師,重塑 AI 硬件交互;健康追蹤應用 Healthify 升級 AI 助手:實時語音與攝像頭交互丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、亞馬遜公佈新款自研 AI 芯

人工智能

RTE開發者社區 - Kyutai團隊創立新語音AI公司Gradium,融資7000萬美元;AWS端到端語音模型升級:多語言切換跨模態交互丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃** 01 有話題的技術 1、字節跳動 Seed 推出

人工智能

RTE開發者社區 - 米哈遊聯創推出可對話「貓貓」AI,具備情緒與獨立思考;微軟研究發現空間音頻可將 AI 同傳理解度翻倍丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@瓚an、@鮑勃 01 有話題的技術 1、DeepSeek V3.2

人工智能

RTE開發者社區 - Nari Labs 更新 TTS 模型 Dia2,將推出語音到語音引擎;谷歌或重啓 AI 眼鏡,最快明年四季度發佈丨日報

開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@鮑勃 @Gemini(即將帶👓版) 01有話題的技術 1、Nar

人工智能

RTE開發者社區 - Pion 創始人聊 WebRTC、AI、SIP 和 QUIC I Voice Agent 學習筆記

深入理解 WebRTC 後,你會欣賞那些最初讓你沮喪的設計。——Sean DuBois Pion 作為 WebRTC 開源領域的新興力量,憑藉其 Go 語言實現、高性能和可擴展性,迅速獲得廣泛關注,併成為眾多第三方項目的基礎架構。開發者可以利用 Pion 輕鬆構建高效且可定製的 WebRTC 解決方案,滿足從數據通道通信、音視頻流媒體到複雜應用場景的需求。 Pion 的創建者 Sean DuBo

人工智能