AIO Sandbox:為 AI Agent 打造的一體化、可定製的沙箱環境
文章來源|字節跳動 Web Infra x veFaas團隊 項目地址|github.com/agent-infra/sandbox 引言: AI Agent 在執行復雜任務時,常需在瀏覽器、代碼執行、文件系統之間切換。傳統多沙箱方案面臨環境割裂、數據搬運、鑑權複雜等問題。AIO Sandbox 通過一個 Docker 鏡像整合所有能力,提供統一文件系統與鑑權,並支持鏡像定製,提升了
Nickname 字節跳動開源
Contributes185
Followers0
文章來源|字節跳動 Web Infra x veFaas團隊 項目地址|github.com/agent-infra/sandbox 引言: AI Agent 在執行復雜任務時,常需在瀏覽器、代碼執行、文件系統之間切換。傳統多沙箱方案面臨環境割裂、數據搬運、鑑權複雜等問題。AIO Sandbox 通過一個 Docker 鏡像整合所有能力,提供統一文件系統與鑑權,並支持鏡像定製,提升了
Nickname 字節跳動開源
你是不是也經常遇到這樣的情況:團隊文檔散落在無數個聊天記錄、郵件附件和本地文件夾裏,找個去年的方案得翻半天;新員工入職培訓時,面對一堆零散資料無從下手;或者寫技術文檔時,明明公司內部有現成案例,卻壓根不知道去哪裏找? 別擔心,你不是一個人。在信息爆炸的2025年,高效的知識管理已經成為企業和個人發展的核心挑戰。好在,AI技術的成熟讓知識管理工具迎來了全新突破。今天要聊的,正是一款讓我眼前一亮的知識
Nickname 百川雲開發者
摘要 6 月底,GMI Cloud 技術 VP YujingQian 受邀參與了由 InfoQ 舉辦的 AICon 北京大會,在大會上Yujing發表了主題為《GMI Cloud Inference Engine 全球化高性能分佈式推理服務構建實踐》的演講,本文是他的演講總結。 越來越多的企業將自己的 AI 應用拓展到海外市場時,在推理服務方面遭遇諸多挑戰。例如用户跨地域分佈,單個集羣難以平衡低時
Nickname GMICloud
自 DGX Spark 發佈以來,這段探索之路挑戰與收穫並存。在成功完成軟件移植的攻堅後,我們決定將這段時期的實戰經驗系統梳理,轉化為一份關於模型選擇與性能優化的實用指引,希望能助力更多團隊高效利用 DGX Spark。 模型選擇策略:效率與性能並重 經過充分測試,我們發現不同模型在 DGX Spark 平台上的表現存在明顯差異。 以下是我們的具體推薦: 文本生成模型首選: gpt-oss-20b
Nickname 老IT人
在人工智能迅猛發展的浪潮中,算力已成為驅動技術創新的核心要素。然而,全球範圍內面臨着異構算力協同困難、硬件資源利用不足、集羣軟件生態不完善等共同挑戰。 為解決技術生態碎片化困局,構建產學研協同的集羣軟件生態體系,openFuyao社區於2023年由華為主導啓動孵化,於2025年5月23日,由華為、中國工商銀行、中國移動雲能力中心、聯通數字科技有限公司、四川華鯤振宇智能科技有限責任公司、江蘇博雲科技
Nickname openFuyao
前段時間我們使用單台 DGX Spark 測試了gpt-oss-120b模型性能。今天,我們通過一根 200 Gbps 帶寬的 QSFP 線纜連接兩台 DGX Spark,並測試了一個參數更大的模型:Qwen3-235B,看看性能如何。 整體測試下來,單用户生成速度為10 tokens/s,但預填充速度還不錯,單用户可達1000 tps,詳細測試數據如下: 生成速度 知識庫應用(輸入4K) 知
Nickname 老IT人
世界變化飛快——快到過去需要數月才能發佈的產品,如今只需幾天就能上線。客户希望立刻得到解答,員工期待工作體驗能像他們最喜愛的APP一樣流暢自如。而隨着AI的發展,人們對速度和服務質量的期望值也在持續攀升。 但大多數企業仍停留在“石器時代”:團隊各自為政、工具笨重難用,“創新”往往意味着長達六個月的部署週期和數百萬美元的諮詢費用。想想都令人頭疼。 為此,Atlassian推出了全新的服務管理解決方案
Nickname 龍智DevSecOps
原文地址:https://mp.weixin.qq.com/s/JnRcU-6wg6g9RjdVXe3fQA 很多 RAG 系統失敗,並不是因為 LLM 不夠聰明,而是因為它們的架構太簡單。它們試圖用線性的一次性方式,處理一個本質上循環、多步驟的問題。 許多複雜查詢需要推理、反思,以及何時行動的聰明決策,這與我們面對問題時如何檢索信息非常相似。這正是 RAG 流水線中引入“agent 驅動行為”的
Nickname Candy
最近,許多開發者和視頻創作者都在尋找Sora2pro的國內接入方案。OpenAI官方渠道對國內用户存在諸多限制:網絡不穩定、付費繁瑣、且無法保證高頻調用的可靠性。更重要的是,Sora2pro按次計費的模式下,一旦調用失敗,費用依然會被扣除,試錯成本極高。那麼,有沒有一個既便宜又可靠的國內替代方案? 經過多方測試和對比,我們發現速創API平台提供的Sora2 API國內中轉服務,完美解決了上述痛點。
Nickname 發財的小狗_lUapn
摘要 日前,網易科技對 GMI Cloud 創始人兼CEO Alex Yeh 進行了專訪,內容主要圍繞 AI 算力賽道機遇、GMI Cloud 差異化優勢及全球佈局等,下文為對話精華實錄。 近期,網易科技對話了全球頭部 AI Cloud 算力提供商 GMI Cloud 的創始人兼CEO Alex Yeh。他從全球行業視角指出,大模型的持續迭代與推理應用的爆發,正推動高端算力需求進入一個前所未有的黃
Nickname GMICloud
企業部署智能體,若缺乏科學的質量評估體系,極易陷入“效果模糊、價值難控”的困境。智能體的質量評估絕非單一維度的技術測試,而是需圍繞業務目標、人機協同、持續迭代構建系統方法論,並從系統性能、任務成效、輸出質量、工具協作四大維度全方位刻畫其價值,最終實現“技術健康度”與“業務貢獻度”的雙重驗證。 科學的評估體系需緊扣業務場景與長期運營,遵循三大原則: 指標與業務目標深度
Nickname 容智信息
實踐是最好的學習方式。為了深入理解 LangGraph 和模型上下文協議(MCP)服務器的生態,我們來從零開始構建一個 CLI 編碼代理。我們的目標是,拋開 Claude Code 那些花裏胡哨的功能,看看最基礎的編碼代理能做到什麼程度。 那些商業編碼代理往往會添加各種專有的"秘密配方"——特殊的上下文管理、精心設計的提示策略、優化過的工具選擇算法。這些技術細節被包裝得嚴嚴實實,很難
Nickname deephub
2024年以來上海率先建成超千萬級感知終端的城市數字孿生平台,每日處理視頻數據量超過PB級別,標誌着AI視頻分析技術正式成為智慧城市建設的核心基礎設施。 一、政策引領與技術基礎 在國家"十四五"規劃推動下,新型智慧城市建設快速推進。2023年,住建部與工信部聯合發佈指導意見,明確要求到2025年建成一批特色鮮明的城市數字孿生平台。東部沿海地區憑藉其技術優勢,率先實現AI視頻分析技術的規模化應用。
Nickname 張老師講數字孿生
特徵越多模型效果就越好?這個想法在實踐中往往站不住腳,因為過多的特徵反而會帶來過擬合、訓練時間過長、模型難以解釋等一堆麻煩。遞歸特徵消除(RFE)就是用來解決這類問題的,算是特徵選擇裏面比較靠譜的方法之一。 本文會詳細介紹RFE 的工作原理,然後用 scikit-learn 跑一個完整的例子。 RFE 是什麼 遞歸特徵消除本質上是個反向篩選過程。它會先用全部特徵訓練模型,然後根據模型給出的重要性評
Nickname deephub
提到稚暉君,毫無疑問,在科技圈一直是頂流的存在。自從稚暉君從華為出來投身機器人創業以後,大佬的技術動向無時無刻不被業界所關注着。 這不,就在剛剛過去的 1024 程序員節,稚暉君動態迎來一波大更新,並且一出手又是一個王炸,相信不少同學也刷到了,那就是官宣: 全球首個 0 代碼機器人內容創作平台:「靈創」正式發佈了! 智元這次發佈的靈創平台,是一個面向大眾的機器人創作平台。 即便用户沒有專業的編程
Nickname CodeSheep
近年來,中國"人造太陽"EAST(全超導託卡馬克裝置) 實現了1億攝氏度等離子體穩定運行1000秒的全球紀錄,標誌着核聚變能源技術的重大突破。在這一成就背後,數字孿生技術作為關鍵使能工具,通過構建動態虛擬模型與物理實體的實時交互,為複雜系統優化提供了核心支持。本文結合EAST案例,探討數字孿生在核聚變裝置中的兩大技術原理,並引用真實解決方案示例,闡述其如何助力能源技術迭代。 一、引言:從EAST突
Nickname 張老師講數字孿生
作者 | 矩陣起源 轉載自 | InfoQ 當 NL2SQL 從 Demo 走向生產,關鍵不在"更大的模型",而是"更乾淨的數據底座 + 更小的專用模型 + 更可控的工程化流程"。 摘要 先數據、後模型:把元數據、業務語義、權限、樣例 SQL 做成"AI-ready data",是 NL2SQL 能否可靠落地的第一性問題。 小模型足夠用:以 3B-7B 級別的代碼/SQL 友好模型,配合 LoR
Nickname MatrixOrigin
現在的 Agent 系統有個很明顯的問題 —— 會話一結束,什麼都忘了。 這不是個技術缺陷,但是卻限制了整個系統的能力邊界。Agent 可以做推理、規劃、執行復雜任務,但就是記不住之前發生過什麼。每次對話都像是第一次見面,這種狀態下很難説它真正"理解"了什麼。 記憶能力是把 LLM 從簡單的問答工具變成真正協作夥伴的關鍵。一個只能"回答當前問題",另一個能"基於歷史經驗做決策",這就是增加了記憶能
Nickname deephub
摘要 36 氪研究院發佈《2025 年中國 AI 應用出海企業發展需求洞察報告》,系統剖析了中國 AI 應用企業出海的現狀、核心需求與未來趨勢。該報告基於對 700 家出海一線 AI 應用企業的深入調研,呈現的並非僅是理論桌面推演,而是對市場真實需求的系統梳理。除了詳實的數據與全面分析之外,更針對企業決策者、技術研發人員、投資機構及行業研究者等不同角色讀者提供了差異化價值。 近日,36
Nickname GMICloud
開發者朋友們大家好: 這裏是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的技術」、「有亮點的產品」、「有思考的文章」、「有態度的觀點」、「有看點的活動」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。 本期編輯:@Jerry fong,@鮑勃 01有話題的技術 1、MiniMax
Nickname RTE開發者社區
你是不是經常遇到這樣的情況:明明記得某個技術細節曾經研究過,卻翻遍電腦也找不到當時的筆記?或者在團隊協作時,大家各自為戰,知識難以共享和沉澱?又或者,面對海量的專業資料,想要快速找到某個問題的答案卻如同大海撈針? 別擔心,今天我要給你介紹一個真正能解決這些痛點的神器——PandaWiki。它不僅是一個知識庫系統,更是一個智能的知識管理夥伴,而且完全開源免費! 什麼是PandaWiki? Panda
Nickname 百川雲開發者
一、 萬界星空科技MES的核心定位與定價模式 市場定位: 專注於中小型製造企業,特別是離散製造行業(如機械加工、裝備組裝、電子電氣等)。其核心賣點是“輕量化、易實施、高性價比”。 主要定價模式: 一次性買斷(永久授權) + 年服務費: 這是其主流模式。客户支付一次性軟件授權費用,獲得軟件的永久使用權,然後每年支付一定比例(通常為授權費的15%-20%)的維保服務費(含技術支持和版本
Nickname 萬界星空科技
摘要:GMI Cloud Inference Engine 通過國際權威基準測試,展現出了卓越性價比與強大的實時響應能力。 隨着生成式 AI 的加速發展,企業對 AI 推理平台的性能、響應速度與成本控制提出更高要求。尤其在大型語言模型(LLM)和多模態 AI 應用迅速普及的背景下,選擇一個高性能、靈活可擴展的推理平台,已成為企業開發者的核心課題。 在最新一輪由獨立研究機構 Artificial A
Nickname GMICloud
2024年,《數字中國建設整體佈局規劃》明確提出要"構建數字孿生空間",國家發改委等多部門聯合印發《關於推進數字孿生流域建設的指導意見》,數字孿生技術正式納入"十五五"國家信息化規劃重點發展方向。 隨着數字化轉型深入推進,數字孿生作為連接物理世界與數字世界的核心技術,正成為各行業智能化升級的關鍵支撐。數字孿生AI 3D引擎通過構建高精度、實時交互的虛擬映射,為"十五五"期間數字孿生技術的規模化應用
Nickname 張老師講數字孿生