博客 / 列表

PetterLiu - AI手機之深入淺出ADAGRPO三大核心策略

AI手機之深入淺出ADAGRPO三大核心略 為何訓練“手機AI助手”如此困難? 隨着視覺語言模型的飛速發展,能夠自主操作手機圖形用户界面(GUI)的通用智能體——也就是我們常説的“手機AI助手”——的前景變得日益廣闊。想象一下,未來你只需用一句話,AI就能幫你完成打開App、預訂酒店、設置日曆提醒等一系列複雜操作。然而,要將這個願景變為現實,研究人員在使用強化學習(RL)訓練這類智能體時,必須

AI

PetterLiu - AI編程工具策略

AI編程工具的實用選型指南 展示了不同工具在開發流程中的分工和定位: 1. Claude Code(新項目首選) 覆蓋完整開發流程:規劃→設計→任務拆解→實現 寫UI:用 Gemini 3 Pro 寫邏輯:用 Claude Sonnet 4.5 解決Bug:用 GPT 5.1 解讀:即使是"首選工具",仍會根據任務類型選擇不同模型,追求最優效

AI

PetterLiu - 開啓你的領導力發展之旅成長路線圖

開啓你的領導力發展之旅成長路線圖 重新認識領導力 在我多年的教練生涯中,我發現一個最普遍、也最具限制性的誤解,就是將“領導力”與“職位”劃上等號。真正的領導力並非靜態的權力符號,而是一個涉及領導者、下屬和特定情境三者之間複雜互動的動態過程。它的本質,是發生在人與人之間、能夠持續產生積極影響的一種能力。 深入探討了領導力這一複雜主題,將其定義為一種動態的互動過程,而非單純的職位或頭銜,涉及

軟件工程

PetterLiu - HiAgent與BiSheng對比Dify選型

HiAgent 架構與戰略價值 1. 核心定義與證據 實質:HiAgent 不是一個單純的學術概念,而是火山引擎(Volcengine)推出的企業級 AI 應用開發框架(SDK)。 架構邏輯:它採用了“大一統(Unified)”的設計思路,試圖在底層將 LangChain 的靈活性、MCP(Model Context Protocol)的連接性、以及外部工具的異構性,統一抽象

AI

PetterLiu - AI原生自動化測試介紹

AI原生自動化測試(AI-Native Automated Testing) 是一種將人工智能作為核心引擎而非輔助工具的全新測試範式。 與傳統“打補丁”式地在現有工具中加入一點AI功能不同,AI原生意味着測試工具或平台從底層架構開始就是基於AI模型(如計算機視覺、大語言模型LLM、機器學習算法)構建的。它的目標是讓測試像人類一樣“看懂”界面、“理解”業務邏輯,從而實現測試全流程的自主化。

AI

PetterLiu - 如何編寫優秀的 CLAUDE.md

注意:這篇文章同樣適用於 AGENTS.md,這是 CLAUDE.md 的開源等價物,適用於 OpenCode、Zed、Cursor 和 Codex 等代理和工具。 原則:大語言模型(絕大部分)是無狀態的 大語言模型(LLM)是無狀態的函數。它們的權重在進行推理時是固定的,因此它們不會隨時間學習。模型對你代碼庫的唯一瞭解,來源於你輸入給它的 token。 同樣,像 Claude Cod

AI

PetterLiu - LLM驅動的多智能體心靈感應協作

一.概述:從“對話”到“心靈感應”的進化 在人工智能領域,多智能體系統(Multi-Agent Systems, MAS)正迅速成為一項具備戰略性意義的技術。它推動着AI從獨立的“個體思考者”向能夠協同解決複雜問題的“智能團隊”演進。然而,當前主流的多智能體協作方式嚴重依賴於文本——如同人類通過對話交流。這種模式不僅效率低下,還常常因信息的壓縮和轉譯而導致關鍵細節的丟失。為了突破這一瓶頸,一項

AI

PetterLiu - Trae Agent三步解決軟件難題

Trae Agent三步解決軟件難題 認識自動化軟件工程師 Trae Agent 想象一下,一個由多位專家機器人組成的“自動化軟件工程團隊”接到了一項緊急任務:修復一個複雜的軟件漏洞。團隊成員分工明確、協作高效,在短時間內便能提出多種解決方案,並通過嚴格的測試與審查,最終選出最優方案完成修復。這正是 Trae Agent 的工作方式。 Trae Agent 是一個基於大語言模型(LLM)的先

AI

PetterLiu - Nano Banana生成論文標註圖片

Nano Banana生成論文標註圖片 測試論文https://arxiv.org/pdf/2511.04355v1 步驟一 提取重點 請輔助我閲讀論文,把重要內容原始文字與段落抽取出來,進行標註與註釋(標註採用中文) 步驟二 生成圖片 提示詞 用圈內容、畫箭頭引用註解、馬克筆高亮的形式,把重要內容和圖片做精準、深入的閲讀中文語言標註(手繪風格): {{上一輪對話結果重點文字}} 完整圖片

AI

PetterLiu - PT-Mark主流擴散模型水印技術深度對比

PT-Mark主流擴散模型水印技術深度對比 一. 生成式AI時代的版權保護挑戰 隨着文本到圖像(Text-to-image)擴散模型的飛速發展,其在數字藝術創作、影視內容製作等領域的應用日益廣泛,深刻地改變了創意產業的格局。這些模型能夠根據用户精心設計的文本提示生成極具價值的視覺內容。然而,技術的普及也帶來了前所未有的挑戰,其中最突出的便是生成內容的版權歸屬與保護問題。如何有效證明生成作品的所有

AI

PetterLiu - OpenEvals下一代AI模型評估標準

OpenEvals下一代AI模型評估標準 一. 介紹 隨着人工智能技術的飛速發展,大型語言模型(LLM)等先進模型的能力正以前所未有的速度增強。然而,這一進步也帶來了一個日益嚴峻的挑戰:如何科學、公正、可復現地評估這些複雜的 AI 系統,已成為制約行業健康發展的關鍵瓶頸。作為全球領先的開源 AI 社區,Hugging Face 在推動模型、數據集和應用的共享方面取得了卓越成就,其龐大而活躍的生

AI

PetterLiu - 氛圍編程工具個人推薦

大模型推理能力(腦子) 編輯器功能(手)。它更推崇擁有強大邏輯架構能力的模型(如Claude),而不是單純的IDE集成工具。 第一梯隊 (First Echelon):主力軍 這一層級是作者認為完成“Vibe Coding”最核心的工具組合。 Claude Code (核心大腦) 定位: 架構師、總指揮。 專家解讀: 這裏指的應該是搭載

AI

PetterLiu - 六頂思考帽深度解析AI賦能代碼生成技術

六頂思考帽深度解析AI賦能代碼生成技術 簡介 人工智能(AI)賦能的代碼生成技術已不再是簡單的代碼補全工具。它已經迅速演變為一個複雜而龐大的生態系統,涵蓋了從底層的代碼基礎模型、推動軟件工程自動化的智能體(Agents),到保障系統可靠性的安全對齊技術,乃至探索通用人工智能(AGI)邊界的通用智能代理。這個技術版圖正在以驚人的速度擴張,並深刻地重塑着我們對軟件開發的認知。 借鑑權威技術綜述

AI

PetterLiu - K12教育數字化市場洞察與產品競爭策略

K12教育數字化市場洞察與產品競爭策略 1. 宏觀市場環境與核心驅動力分析 本章節旨在為產品戰略的制定提供宏觀視角。在當前K12教育科技市場,任何有效的產品戰略都必須建立在對兩大核心驅動力的深刻理解之上:一是國家頂層設計所帶來的政策東風,二是後疫情時代用户行為的深刻變遷。這兩股力量共同塑造了市場的基本盤,定義了機遇與挑戰的邊界,是所有後續戰術決策的基石。 1.1 政策東風:教育數字化提升至國家

數據庫

PetterLiu - 免費Google 官方的中文提示詞教程

什麼是提示工程? 提示工程是一門設計和優化提示的藝術和科學,可指導 AI 模型(尤其是 LLM)生成所需回答。通過精心設計提示,您可以為模型提供上下文、説明和示例,幫助模型理解您的意圖並做出有意義的回答。您可以將其視為 AI 提供一個路線圖,引導它朝着您預想的特定輸出的方向前進。 如需深入瞭解提示設計領域並探索其應用,請查看 Google Cloud 上的提示設計簡介。 準備好親身嘗試 LLM

AI

PetterLiu - 中國電動汽車充換電市場技術趨勢、核心挑戰與未來競爭格局

中國電動汽車充換電市場技術趨勢、核心挑戰與未來競爭格局 1. 市場概述:從基礎設施建設到服務生態演進 在中國電動汽車市場以前所未有的速度迅猛發展的宏大背景下,充換電基礎設施不僅是關鍵的配套支撐,更已上升為決定產業成敗的核心戰略環節。根據國家規劃,到“十四五”末期,中國的充電基礎設施體系需滿足超過2000萬輛電動汽車的充電需求,這清晰地勾勒出一個規模龐大且充滿潛力的市場。當前,行業正經歷一場深刻

AI

PetterLiu - 戰略工程師的思維

1. 重新定義高級工程師的核心職責 對於身處大型科技公司的高級工程師而言,職業生涯的突破點往往並非源於更深層次的技術鑽研,而是來自一項長期被誤解甚至迴避的能力:理解並有效參與組織動態。當技術實力達到一定水平後,真正決定個人價值和影響範圍的,是如何將這份專長轉化為驅動組織前進的實際動力。這要求我們必須重新審視“辦公室政治”這一概念。 著名軟件工程師及博主Sean Geti提出了一個顛覆性的觀點

軟件工程

PetterLiu - 基於LLM持續改進文章的方法

核心轉變:從"被動聽摘要"變為"主動提問,讓AI當編輯" 原創文章 起點:待打磨的初稿。 NotebookLM自定義音頻(評論模式) 關鍵動作:上傳文檔後,選擇自定義提示詞,向AI主持人主動提問。 示例:"點評第一段是否成功勾起讀者興趣?" 示例:"審閲文檔結構,對一般受眾來説主要觀點明確嗎?" 示例:"針對這份草稿的邏輯漏洞提供建設性反饋" 產出:一段針

AI

PetterLiu - AI瀏覽器Comet用户體驗測試

AI瀏覽器Comet用户體驗測試 移動Web應用 UI/UE 測試的 5 大核心痛點 移動Web應用(H5/PWA)的 UI/UE 測試與傳統的 PC 網頁測試截然不同,也比原生 App 測試更具挑戰性。 以下是 移動Web應用 UI/UE 測試的 5 大核心痛點,這些通常是測試人員和設計師最頭疼的地方: 1. 極致的“碎片化”兼容性 (The Fragmentation Hell) 這是最直觀、

AI

PetterLiu - 2025年11月份博文彙總與視頻

2025年11月份博文彙總與視頻 一.LLM相關 1.如何構建和訓練世界級LLM 一份關於如何構建和訓練世界級大型語言模型(LLMs)的詳細指南,由Hugging Face團隊撰寫。它涵蓋了從模型架構設計、數據準備、訓練過程到後處理的全過程,提供了豐富的技術細節和實踐經驗 2.美團多智能體WOWService智能系統概要 美團最近發佈的一份技術報告2510.13291,詳細介紹了其名為“WOWS

AI

PetterLiu - Z-Image圖像生成模型發佈與競品

1. 引言 當前,高性能文本到圖像(Text-to-Image, T2I)生成模型市場呈現出一種根本性的二元格局。一方面,是以Nano Banana Pro、Seedream 4.0為代表的專有(閉源)商業模型,它們性能強大,但其技術實現被封裝於“黑盒”之內,限制了社區的研究與創新。另一方面,則是以Qwen-Image、Hunyuan-Image-3.0為代表的開源模型,它們雖然推動了技術的普及

AI

PetterLiu - Google生成式UI下一代人機交互技術

Google生成式UI下一代人機交互技術 1.0 摘要 在當前的技術浪潮中,大語言模型(LLM)已展現出在內容生成方面的卓越能力,深刻地改變了我們獲取與處理信息的方式。然而,這些強大的模型在輸出形態上普遍受限於靜態、預定義的界面,最常見的便是由標題、列表和代碼塊組成的Markdown“文本牆”。這種呈現方式雖然有效,卻遠未能完全釋放AI生成內容的潛力。 本文旨在引入並深入探討一個全新的交互範式—

AI

PetterLiu - 蘇格拉底式深度剖析問題五步法-技術管理

結合IT管理場景,對這五個階段進行深度解讀與應用思考: 階段一:收集並審視證據 (Collect and Review Evidence) 核心定義: 找出核心事實與數據,質疑一切。建立堅實的事實基礎。 圖片關鍵點: “這條信息從哪裏來的?”、“樣本量真實嗎?”、“數據相關性?” IT管理者應用與思考: 拒絕“我覺得”: 在處理系統故障

軟件工程