tag AI

標籤
貢獻136
297
03:55 AM · Nov 07 ,2025

@AI / 博客 RSS 訂閱

風雨中的小七 - 解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

AI

收藏 評論

躺柒 - 讀浪潮將至10國家的未來

1.馬鐙 1.1.在馬鐙出現之前,騎兵在戰場上的實際作用極其受限 1.2.戰馬的主要作用僅僅是將士兵運送到戰場上 1.3.馬鐙將騎兵與衝鋒的戰馬緊密地結合在一起,從而形成了一個強大的戰鬥單元 1.4.在中世紀早期,馬鐙剛剛傳入歐洲不久,法蘭克人的領袖查理·馬特察覺到了它的潛力 1.5.隨之形成的新的社會基礎結構為這些權力中心提供了支撐與保障 1.6.技術的指數級發展擴大了每個人和每件事的影響力

AI

收藏 評論

躺柒 - 讀浪潮將至11困境

1.災難 1.1.在某種程度上,人類的歷史就是一部災難史 1.2.大流行病廣泛存在 1.3.兩場大流行病曾導致世界上多達30%的人口死亡 1.3.1.6世紀的查士丁尼瘟疫和14世紀的黑死病 1.3.2.1300年,英格蘭的人口約為700萬,但到了1450年,由於瘟疫的肆虐,人口鋭減到僅剩200萬 1.4.災難也可能是人為造成的 1.4.1.一戰和二戰分別導致

AI

收藏 評論

PetterLiu - 關於AI上下文工程重塑人機協作的 5 個顛覆性認知

關於AI上下文工程重塑人機協作的 5 個顛覆性認知 寶子們,AI界的大瓜來了!GAIR團隊剛發佈了Context Engineering 2.0,這可完全顛覆了我們對人機交互的認知。以前我們總想着怎麼設計prompt,現在才發現,context才是關鍵! “一個人就是各種context的集合。”機器不是不夠聰明,而是缺乏處理context的能力。從1.0的context作為翻譯,到2.0的con

AI

收藏 評論

哥布林學者 - 吳恩達深度學習課程二: 改善深層神經網絡 第一週:深度學習的實踐(六)梯度現象和梯度檢驗

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本篇為第二課第一週的內容,1.10到1.14的內容,也是本週理論部分的最後一篇。 本週為第二課的第一週內容,就像課題名稱

AI

收藏 評論

雲棧開源日記 - DeepCode:把論文和想法變成代碼的 AI 工具

看論文時,你是不是也遇到過這種情況? 明明算法思路看懂了,但要自己從零實現,光是搭環境、調參數就要折騰大半天。或者腦子裏突然冒出個網站創意,想快速驗證一下可行性,卻被前後端開發的工作量勸退了。 最近發現香港大學開源的 DeepCode 項目,專門解決這類問題——用 AI 自動把想法轉成能跑的代碼。 這個工具能做什麼 DeepCode 是一個基於大語言模型的編碼工具,主要功能是把"人的想法"自動轉

AI

收藏 評論

躺柒 - 讀浪潮將至12穿越浪潮

1.眾説紛紜的代價 1.1.在國家和超國家層面,在一個全面的、可執行的框架下,巧妙的監管可以平衡技術進步的需求與合理的安全限制,從科技巨頭和軍隊,到高校的小型研究團隊和初創企業,都應當受到監管 1.2.制定並實施有效的法規是一項艱鉅的任務 1.2.1.技術日新月異,但走完立法流程需要數年時間 1.3.目前,在車庫裏工作的業餘愛好者能接觸到更強大的工具,科技公司也在研發上投入了數十億美元,而

AI

收藏 評論

躺柒 - 讀浪潮將至13遏制的關鍵步驟

1.審計 1.1.知識就是力量,力量就是控制 1.2.對技術控制來説至關重要 1.3.為技術創建安全的物理或虛擬隔離容器是基礎 1.4.實施有意義的監督,制定可執行的規則,並對技術執行情況進行審查,這些都是極其重要的 1.5.信任源自透明度 1.5.1.絕對需要在各個層面驗證系統的安全性、完整性和未受損狀態 1.6.外部審查的重要性不言而喻 1.6.1.全球範圍內並沒有形成系統性的、常

AI

收藏 評論

張鐵牛 - 2. AI 輸出內容導出Word!docx4j+poi-tl 實現Markdown轉Word全流程

1.簡介 我們在上一章介紹瞭如果想實現將markdown內容轉換為word的話, 如果想要轉換後的word內容排版好看的話, 就需要將其轉換過程分為兩步 markdown→html html→ooxml(Office Open XML) word內容,word元信息本身就是個xml) 上一章節我們使用flexmark將markdown內容轉換為html內容, 完成了第一步, 本章節我們將介

AI

收藏 評論

PetterLiu - 谷歌Agent Development Kit架構概覽

寶子們,今天這個消息真的讓我驚呆了!Google搞了個大動作,直接把AI的交互方式給改寫了!以前AI都是等你把話説完才回應,現在不一樣了,它能一邊聽你説話一邊反應,還能被中途打斷,甚至能和其他AI實時協作!這就是谷歌新出的Agent Development Kit(ADK),異步I/O、狀態化會話、流式原生工具、實時回調……這哪是簡單的請求-響應啊,這分明就是真正的對話,AI終於有了“生命”的感

AI

收藏 評論

daibitx - Microsoft Agent Framework 接入DeepSeek的優雅姿勢

一、前言 ​ Microsoft Agent Framework 框架發佈也有一陣子了,在觀望(摸魚)過後,也是果斷(在老闆的威脅下)將幾個AI應用微服務完成了從Semantic Kernel 框架到Microsoft Agent Framework 框架中的遷移工作。 所以這篇文章,我想記錄一下在開發過程中的我總結的一下工程化用法。 二、Agent Framework是什麼 簡單來講,Micro

AI

收藏 評論

PetterLiu - 網絡圖片下載+VideCoding+DeepSeekOCR解析實踐

背景 某高校師資網站全面採用網絡圖片展示,網站是禁止右鍵使用下載,也不允許複製信息。我們試圖採集這些信息,使用目前智能體任務+VibeCoding+Deepsee-OCR解析 來突破這個問題。 流程拆解 第一步 html解析 智能體我們方便選擇space.coze.cn, 可以自行部署其他開源智能體框架 解析為一定格式的文本 XPath查詢 圖片URL結果集 Vide codin

AI

收藏 評論

codechen8848 - 全能 AI 對話管理平台!一款支持多模型切換的全能 AI 對話工具!

大家好,我是 Java陳序員。 在如今 AI 火熱的時代,各種大模型層出不窮,給日常工作生活帶來極大的便利。你是否想擁有一個能自由切換多種 AI 大模型、支持本地與在線模型結合,還能實現豐富對話功能的工具? 今天,給大家介紹一款強大的全能 AI 對話服務助手,支持多模型切換! 關注微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典計算機電子書籍等。 項目介紹 ch

AI

收藏 評論

PetterLiu - Applied Machine learning and AI for egnineers與NPL with transform等書推薦

Learn Artificial Intelligence (AI), Machine Learning (ML), and Natural Language Processing (NLP) the trio shaping the future. 兩本書 第二本 資源 landing.deepset.ai/hubfs/Ebooks/oreilly_chapter_e

AI

收藏 評論

哥布林學者 - 吳恩達深度學習課程二: 改善深層神經網絡 第一週:深度學習的實踐 課後作業和代碼實踐

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本篇為第二課第一週的課程習題和代碼實踐部分筆記。 1. 理論習題 【中英】【吳恩達課後測驗】Course 2 - 改善深

AI

收藏 評論

OBCE666 - AI 時代的數據庫進化論 —— 從向量到混合檢索

説明: 本文只是關於數據庫發展趨勢的個人見解,沒有特別深入的向量和混合檢索的實現原理,屬於很淺顯易懂的科普類文章,幾乎不需要任何背景知識,大家可以放心閲讀。 關於混合檢索的原理和最佳實踐類文章,有緣再更,歡迎感興趣的朋友們關注【老紀的技術嘮嗑局】微信公眾號。 背景 數據的分類 我一般會把數據庫中的數據類型,簡單分為三類: 結構化數據:我們可以把傳統數據庫的基礎數據類型,都看成結構化數據

AI

收藏 評論

AI算力小知識 - 使用vLLM實測3090和4090的大模型推理性能

之前使用Ollama基於順序調用的場景比較了3090和4090的顯卡性能: Ollama大模型推理場景下3090和4090性能實測 同時,又基於3090顯卡比較了Ollama和vLLM在順序調用和多併發推理場景下的性能差異: Ollama和vLLM大模型推理性能對比實測 這裏再使用vLLM測試下大模型併發推理場景下3090和4090兩張顯卡的性能表現,看下4090是否在高併發場景下具備

AI

收藏 評論

dashery - 大模型核心參數詳解:從基礎配置到高級調優指南

引言:參數調優的重要性 在大語言模型的應用中,僅僅提供一個好的提示詞往往不足以獲得理想的輸出結果。模型參數的合理配置同樣至關重要,它如同給模型調配合適的“工作性格”,直接影響生成文本的質量、風格和適用場景。本文將系統介紹大模型的各類關鍵參數,幫助你從被動使用者轉變為精準調控專家。 一、模型基礎結構參數 在深入瞭解生成參數前,我們需要先理解模型的基礎結構參數,這些參數決定了模型的“先天能力”。 1.

AI

收藏 評論

哥布林學者 - 吳恩達深度學習課程二: 改善深層神經網絡 第二週:優化算法(一)Mini-batch 梯度下降

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本週為第二課的第二週內容,2.1和2.2的內容。 本週為第二課的第二週內容,和題目一樣,本週的重

AI

收藏 評論

雲棧開源日記 - AI太火爆:教你7個月掌握機器學習到深度學習

覆蓋Python、機器學習、深度學習三大模塊,配套Kaggle級實戰項目,從基礎語法到模型部署的完整學習路徑。解決AI學習碎片化問題,提供從理論到實戰的完整體系,包含特徵工程、模型調優等工業級技能訓練。 這套課程的價值在於它的"完整性"。 市面上很多AI課程要麼只講理論,要麼只做項目,很少有人把整個知識體系串起來。這套課程從AI工程師崗位需求出發,覆蓋了7個學習階段:Python數據分析、機

AI

收藏 評論

哥布林學者 - 吳恩達深度學習課程二: 改善深層神經網絡 第二週:優化算法(二)指數加權平均和學習率衰減

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本週為第二課的第二週內容,2.3到2.5和2.9到2.10的內容。 本週為第二課的第二週內容,和題目一樣,本週的重點是優

AI

收藏 評論

哥布林學者 - 吳恩達深度學習課程二: 改善深層神經網絡 第二週:優化算法(三)Momentum梯度下降法

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本篇為第二課的第二週內容,2.6的內容。 本週為第二課的第二週內容,和題目一樣,本週的重點是優化算法,即如何更好,更高效

AI

收藏 評論

IT開發者筆記 - Java前端框架Vaadin推出官方MCP服務端,讓AI編碼助手實時讀取最新Web開發文檔

在現代 Web 應用開發中,越來越多的開發者開始藉助 AI 助手提升編碼效率。而近日,歐洲知名企業級Java前端框架Vaadin正式發佈了官方MCP(Model Context Protocol)服務端,這意味着開發者的 AI 編碼助手(如 GitHub Copilot、Claude、Cursor 等)可以實時訪問最新的Vaadin官方文檔,實現精準代碼生成與智能指導。 這一創新讓 AI 從“憑

AI

收藏 評論

PetterLiu - 最強LLM生成代碼也會出錯?

背景 大語言模型(LLM)在代碼生成方面無疑取得了驚人的進步,早已成為許多開發者不可或缺的日常工具。從自動補全到生成完整函數,AI正在重塑軟件開發的生態。但當這些先進的AI模型生成錯誤代碼時,背後的真正原因是什麼?真的是因為任務太複雜、代碼太難寫了嗎?一篇針對GPT-4o、Claude Sonnet-4、Llama-3.3-70B等六大主流模型和四大基準測試的深入研究揭示了幾個出人意料的發現。結

AI

收藏 評論