簡介 數智化轉型是一個非常有深度且緊跟當前企業管理與技術趨勢的話題。 區分“數字化”與“智能化”是理解當前企業轉型升級的關鍵起點。數智化轉型(Digital-Intelligent Transformation)則是二者的深度融合與演進,其中**「數字企業模型」與「指標體系」**構成了轉型的核心支柱。以下將系統闡述這些概念及其在企業中的應用。
前言 Context Engineering 2.0: The Context of Context Engineering 今天我們要探討一篇非常有前瞻性和系統性的論文:《上下文工程2.0:上下文工程的“上下文”》(Context Engineering 2.0: The Context of Context En
簡介 RoPE(Rotary Positional Embedding)是當前大語言模型中最主流的位置編碼方式,通過旋轉矩陣操作將位置信息引入Q、K向量角度,實現相對位置建模。它支持長序列泛化、計算高效且保留週期信息,被LLaMA、GPT-NeoX等主流大模型採用。相比傳統位置編碼,RoPE能更好地處理序列順序信息,提升模型對相對距離的感知能力。
前言 微調大語言模型是利用特定任務或領域的定製數據集,對預訓練模型進行調整;而檢索增強生成(RAG)則將檢索系統與生成模型相結合,動態地將外部的、最新的知識融入生成結果中。 隨着生成式人工智能(Gen AI)和自然語言處理(NLP)技術的持續演進,業界對更強大、更高效模型的需求呈指數級增長。從聊天機器人、虛擬助手,到複雜的內容生成與搜索系統,
前言 大家好!LangChain 迎來了 v1.0 這個里程碑版本(2025 年10月正式發佈),這是 LangChain 團隊經過幾年社區反饋和生產實踐後,對框架的一次大刀闊斧的重構。 最大的變化就是模塊化拆分:過去一個 langchain 包,現在被拆成了多個獨立、可按需安裝的包。這樣做的好處是: 主包更輕量、更專注(安裝
前言 今年大家都在談AI,但你是否常常感到困惑: 大模型很強,但怎麼把它嵌入到我現有的業務裏? 只會聊天寫詩,能不能幫我處理複雜的Exce表格或審批公文? 市面上模型那麼多(DeepSeek、通義千問、文心一言…),哪個適合我? 別急,答案就在今天的主角身上 —— 我們全新一代的「智能體平台」。
前語 最近在一直研究各種RAG技術用來工程化應用,但是嘗試了耳熟能詳的GraphRAG和LightRAG後,也發現了一些棘手的問題。 構建知識圖譜 即 index 過程過於複雜,對於大文檔來説非常耗時。 知識圖譜的構建效果比較差,經常抽取出垃圾甚至錯誤的實體和三元組。 在錯誤的知識圖譜引導下,其效果在感官上(直覺)甚
前言 在企業級 RAG系統的演進過程中,我們通常會經歷兩個階段。 第一階段是“建設期”。在這個階段,開發者的核心任務是將非結構化文檔切分、向量化,並存入向量數據庫。 當用户提出問題時,系統通過語義相似度檢索出 Top-K 個片段,餵給大模型生成答案。這套流程在處理“事實性問答”時,表現優異且成本低廉。 然而,隨着系統上線並接入真實
前言 分塊(Chunking)是構建高效RAG(檢索增強生成)系統的核心。從固定分塊、遞歸分塊到語義分塊、結構化分塊和延遲分塊,每種方法都在優化上下文理解和準確性上扮演了關鍵角色。這些技術能大幅提升檢索質量,減少“幻覺”(hallucination),並充分發揮你的RAG pipeline的潛力。 在我近一年構建可擴展AI系統
前言 什麼是“智能體”?其實理解它一點都不復雜,就把智能體理解成一個能幫你跑腿、動腦、幹活的“AI小助手”,只不過比普通助手更“自覺”。 目前用AI,你得一句句指揮:“幫我搜下天氣”“再查下景點”“整理成表格”;但智能體不一樣,你只需要説“幫我做一份週末出遊攻略”,它就會自己規劃步驟——打開瀏覽器查天氣、搜景點評價、對比交通方式,最後把整理好
前言 在本文中,我們將深入探討AI Agent的理論支撐以及其背後的第一性原理,回顧和分析第一性原理的發展軌跡,現階段AI Agent所具備的能力,並探討其在各個領域中的應用。接着,我們會展望AI Agent未來的發展方向,特別是在多Agent協作中的潛力和挑戰。最後,我們將探討Agent的未來技術發展及其廣泛應用前景,為讀者提供一個全面且深入的視
前言 “ RAG的架構雖然有所不同,但其原理都是相同的,都是通過檢索來增強模型的生成能力,只不過在不同的環節做了不同的優化。” 從事RAG技術的工作也有一兩年時間了,但在此之間都是這學一點那學一點,感覺自己好像什麼都會,但從來沒有對整個RAG系統進行過梳理。 所以,今天就從RAG的迭代過程開始梳理一下RAG的架構升級過程,瞭解不同種類R