tag 大模型

標籤
貢獻58
154
01:37 PM · Oct 26 ,2025

@大模型 / 博客 RSS 訂閱

wx6464351503832 - 強化學習(RL)簡介及其在大語言模型中的應用

看到huggingface上有個大模型課程,其中有個章節是講如何構建推理大模型,下面是對應的學習內容。 接下來會用最通俗易懂的方式介紹RL,就算之前完全沒接觸過也能看懂。會拆解核心概念,看看為什麼RL在大語言模型(LLMs)領域變得這麼重要。 什麼是強化學習(RL)? 想象一下訓練一隻狗。想教它坐下。可能會説"坐下!",如果狗坐下了,就

強化學習 , 語言模型 , 自然語言處理 , 人工智能 , Css , 大模型 , 前端開發 , HTML

收藏 評論

wx6464351503832 - Agent實戰教程:深度解析async異步編程在Langgraph中的性能優化

在現代Python開發中,異步編程已經成為提高程序性能的重要手段,特別是在處理網絡請求、數據庫操作或AI模型調用等耗時操作時。本文將通過實際的LangGraph 示例,深入解析async的真正作用,並揭示一個常見誤區:為什麼異步順序執行與同步執行時間相近? async的核心作用 async的主要價值在於創建異步編程環境,讓程序在等待耗

性能優化 , redis , 執行時間 , 智能體 , 數據庫 , 人工智能 , 大模型

收藏 評論

美團技術團隊 - 美團 LongCat 團隊發佈全模態一站式評測基準UNO-Bench

多模態人工智能正從單一感知能力邁向視覺、音頻與文本的統一融合,即全模態大模型(Omni-models)時代。然而,相應的評測體系卻相對滯後。現有的評測工具不僅稀缺、各自為戰,且幾乎完全以英文為中心,缺乏對中文場景的有效支持。此外,一些現存的數據集在設計上存在侷限性,例如部分問題的解答路徑並非嚴格依賴於多模態信息的融合,這為科學評估模型真實的跨模態能力帶來了一定的複雜性。 針對這些痛點,美團Lon

大模型 , 美團

收藏 評論

GMICloud - GMI Cloud@AI週報|OpenAI發佈GPT5.2;智譜AI GLM-4.6V開源

關鍵詞:GPT5.2;智譜AI GLM-4.6V; Giants |蘋果高管動盪;Meta公開抄阿里Qwen作業還閉源 蘋果芯片主管離職,庫克健康問題引關注 近日,蘋果芯片部門主管宣佈離職,這一高管變動發生在公司 AI 戰略關鍵時期。據外媒報道,蘋果 CEO 庫克也被曝出現健康問題,引發市場對公司未來發展方向的擔憂。此次人事變動正值蘋果在 AI 芯片領域加大投入

AI資訊 , AI , 雲服務 , 人工智能 , 深度學習 , cloud , 大模型

收藏 評論

算力之光 - Meta放大招!首屆生成式AI大會LlamaCon即將來襲

Meta宣佈將於4月29日舉辦其首屆生成式AI的開發者大會——LlamaCon。這一大會以Meta的生成式AI模型家族Llama命名,旨在分享Meta在開源AI領域的最新進展,幫助開發者構建出色的應用和產品。 Meta表示,更多細節將在不久後公佈。而Meta的年度開發者大會Meta Connect則仍將按慣例在9月舉行。 Meta的開源AI戰略:從Llama到生態系統的構建 幾年前,Meta開始擁

ai開發 , 人工智能 , meta , 大模型

收藏 評論

微笑的小刀 - 2024最新貪心科技-大模型開發應用實戰營

在大模型技術席捲各行各業的今天,👇🏻ke🍊:xingkeit點top/9645/許多學習者陷入了"紙上談兵"的困境——瞭解概念卻無法實戰,知道技術卻不會應用。30天系統化實戰訓練,正是打通從理論到實踐的關鍵路徑,讓學習者完整掌握大模型應用開發的核心能力。 第一週:掌握與大模型對話的藝術——Prompt工程的精髓 基礎奠基:從零理解Prompt機制 大模型並非神秘的黑箱,而是需要精

實戰 , 應用 , 開發 , 大模型

收藏 評論

信息流星 - 一款Java 開源的 Spring Boot 即時通訊 IM 聊天系統

引入依賴 父pom.xml properties coze.version0.3.0/coze.version /properties dependencyManagement dependencies dependency groupIdcom.coze/groupId

coze , Spring Boot , 後端開發 , springboot , AI Agent , 大模型 , Python

收藏 評論

曼孚科技 - 多模態AI自主研究:現在走到哪了?

當前生成式人工智能的發展正處於關鍵的範式轉型節點。 以大型語言模型(Large Language Models, LLM)為代表的智能系統,在封閉領域的單輪問答任務中已展現出優異性能,但其“單模態表徵”與“任務被動響應”特性構成了深層次桎梏。 這一桎梏使得現有模型難以應對現實世界中普遍存在的、需主動規劃並融合文本、圖像、視頻等多源異構信息開展深度推理與驗證的複雜問題。 為突破此瓶頸,多模態深度研究

機器學習 , 算法 , 人工智能 , 深度學習 , 大模型

收藏 評論

阿里雲大數據AI技術 - 在 DataWorks 中一鍵部署大模型,即刻用於數據集成和數據開發

在AI應用快速落地的今天,越來越多企業希望將大模型能力融入數據處理流程——無論是文本分析、智能摘要,還是RAG知識庫構建。但傳統模式下,模型部署依賴專業MLOps團隊,需自行搭建推理環境、配置GPU資源、維護服務穩定性,門檻高、週期長、成本重。 現在,阿里雲DataWorks發佈大模型服務能力,基於Serverless資源組,支持用户一鍵部署主流大模型,並可在數據集成和數據

AI , 阿里雲 , DataWorks , 人工智能 , 數據分析 , 大模型

收藏 評論

美團技術團隊 - 可驗證過程獎勵在提升大模型推理效率中的探索與實踐

美團業務研發搜推平台部算法團隊創新提出可驗證過程獎勵機制(VSRM),針對大模型推理中的冗餘回覆與過度思考問題,精準獎勵有效推理步驟,顯著縮減輸出長度並提升推理效率。VSRM通過步驟級正確率增益評估,有效抑制無效步驟,兼容主流強化學習算法,助力高效、可靠的複雜推理任務。 1 背景 以 DeepSeek-R1 為代表的大規模推理模型,通過簡單有效的強化學習後訓練方法,培養了強大的推理能力,但卻導致模

大模型 , 美團

收藏 評論

微笑的小刀 - 西瓜老師-2025年大模型 MCP 技術實戰課

當大語言模型(LLM)的能力已經強大到令人驚歎時,👇🏻ke🍊:xingkeit點top/15267/一個新的瓶頸悄然浮現:我們如何才能安全、可控、高效地將這股“洪荒之力”引入到複雜的企業應用和日常工具中?直接將 API 密鑰嵌入代碼?讓模型直接訪問我們的數據庫?這些想法在 2025 年的今天,聽起來既危險又原始。 正是在這樣的背景下,我參加了西瓜老師的 MCP(Model Context P

llm , mcp , 人工智能 , 大模型

收藏 評論

美團技術團隊 - ICCV 2025 | 美團論文精選及多模態推理競賽冠軍方法分享

本文介紹了美團技術團隊在國際頂會ICCV 2025中發表的5篇論文。同時,在ICCV 2025 舉辦的多模態推理競賽中,美團基礎研發平台/計算和智能平台組建的ActiveAlphaAgent團隊,斬獲賽題1真實場景視覺定位(VG-RS)冠軍,賽題2空間感知視覺問答(VQA-SA)季軍和賽題3創意廣告視頻視覺推理(VR-Ads)季軍。本文也分享了這三道賽題的解題思路,希望相關研究能給同學們帶來一些幫

大模型 , 美團

收藏 評論

ceshiren2022 - 如何在技術面試中自信應對“大模型微調”話題?

從事測試開發同學這兩年跳槽,會越來越頻繁遇到“大模型微調”類問題。很多人第一反應是:我平時寫 UI 自動化、搞接口壓測,怎麼突然和模型訓練扯上關係了? 現實就是,AI 已經透進測試領域:質量評估、數據生成、智能測試、甚至大模型測試本身,都需要對微調機制、預訓練邏輯、指令數據構造有基本理解。 下面整理了一份涵蓋 35 個經典微調面試問題的技術解讀幫助你在面試裏不被問懵。 1. 全參數微

面試 , 壓測 , 測試開發 , 人工智能 , 深度學習 , 大模型

收藏 評論

vistart - 百度大模型產品與技術生態(2025年5月)

文心一言(ERNIE Bot) 產品概述 文心一言(ERNIE Bot)是百度推出的基於文心大模型技術的對話式人工智能助手,代表了百度在大語言模型領域的核心產品。自2023年3月16日公測以來,文心一言經歷了多次重大升級,從最初的ERNIE Bot 3.5發展到2025年的ERNIE 4.5 Turbo,成為中國大模型市場的主要參與者。 核心能力與演進 ERNIE Bot 3.5(202

llm , 百度 , 大模型

收藏 評論

美團技術團隊 - LongCat-Flash-Thinking 正式發佈,更強、更專業,保持極速!

今天,美團 LongCat 團隊正式發佈全新高效推理模型 LongCat-Flash-Thinking。在保持了 LongCat-Flash-Chat 極致速度的同時,全新發布的 LongCat-Flash-Thinking 更強大、更專業。綜合評估顯示,LongCat-Flash-Thinking 在邏輯、數學、代碼、智能體等多個領域的推理任務中,達到了全球開源模型的最先進水平(SOTA)。 同

開源 , 大模型 , 美團

收藏 評論

向量檢索 - 如何通過HTTP API插入或更新Doc

本文介紹如何通過HTTP API向Collection中插入或更新Doc。 説明 若調用本接口時Doc Id已存在,則等同於更新Doc;Doc Id不存在,則等同於插入Doc。 若調用本接口時不指定DocId,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 數據庫 , 人工智能 , 大模型

收藏 評論

DashVector - 如何通過Python SDK刪除Collection中已存在的Doc

本文介紹如何通過Python SDK,根據ID或ID列表刪除Collection中已存在的Doc。 説明 如果指定id不存在,則刪除對應Doc的操作無效。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最新版SDK 接口定義 Python示例: Collection.delete( ids: Union[str, List[str]], partiti

向量 , 數據庫 , 大模型

收藏 評論

MemTensor - 零代碼|基於釦子(Coze)使用 MemOS 插件

MemOS 已正式上線 釦子(coze)插件商店,現在大家可以基於釦子創建的智能體,一鍵啓用 MemOS 的記憶能力,讓你的智能體記得更好、更快、更準! 快速開始 Find Us 開發者僅需在釦子(coze)搜索 “MemOS”或“記憶”即可快速找到我們!🎉 釦子插件商店:https://www.coze.cn/store/plugin/7569918012912893995?from=pl

agent , 人工智能 , 開源 , 大模型

收藏 評論

思否編輯部 - 百度 Create AI 開發者大會:李彥宏發佈兩大新模型、多款熱門 AI 應用,幫助開發者全面擁抱 MCP

4 月 25 日,Create 2025 百度 AI 開發者大會在武漢隆重舉辦。百度創始人李彥宏發表了題為《模型的世界 應用的天下》的演講。60 分鐘的演講中,李彥宏發佈了兩大模型,多款熱門 AI 應用,並宣佈將幫助開發者全面擁抱 MCP。 當天發佈的文心大模型 4.5 Turbo 和深度思考模型 X1 Turbo,能力更強、成本更低。相比文心 4.5,文心大模型 4.5 Turbo 速度更快,價

開發者 , 百度 , 大模型

收藏 評論

AI數字人研究社 - 全面盤點AI交互數字人企業,AI數字人如何定義下一代智能入口?

2025年,AI數字人產業迎來歷史性拐點。據統計,全球市場規模突破3000億元,中國AI Agent市場五年內劍指萬億級規模。麥肯錫調研顯示,60%以上企業已部署AI數字人,其應用場景從簡單的信息播報,升級為具備情感交互能力的“數字員工”。 權威榜單認證:世優科技穩居AI數字人行業第一梯隊 根據《2025年全球AI數字人企業競爭力報告》顯示,世優科技憑藉在AI數字人技

智慧展廳 , 數字人 , 數字展廳 , 人工智能 , 計算機視覺 , 大模型

收藏 評論

mob64ca1417eedd - [大模型] LLaMA系列大模型調研與整理-llama/alpaca/lora(部分)

目錄 1. Mixture-of-experts (MoE) 1.1 優勢 1.2 結構 1.3 訓練 2. Low-rank adaptation (LoRA) 3. 數的精度 -- 混合精度 + 量化操作 Task1:DenseMLPWithLoRA 一、任務背景 二、任務要求 Task2:Sparse ML

混合精度 , DenseMLP , Css , LoRA , 混合專家模型 MoE , 大模型 , 前端開發 , HTML

收藏 評論

全棧技術開發者 - 如何理解「128倍更少數據,卻能獲得更強智能體行為」?如何直觀地理解「少即是多(Less is More)」在智能體訓練中意義?

在人工智能尤其是智能體訓練領域,數據量的需求長期被認為是提升模型行為表現的核心驅動力。傳統強化學習方法和深度學習策略普遍依賴大量訓練數據,以期覆蓋智能體在複雜環境中可能遇到的各種狀態和動作組合。這種大規模數據驅動的訓練模式在某種程度上保證了智能體策略的穩健性和泛化能力,但同時也帶來了顯著的資源消耗、計算壓力以及訓練效率低下的問題。尤其在高維環境和複雜任務下,數據量呈指數級增長,訓

yyds乾貨盤點 , 數據 , 模塊化 , 人工智能 , 深度學習 , 子任務 , 大模型

收藏 評論

咕泡科技 - 代碼的未來:當AI學會創造,我們技術人的價值何在?

AI與大模型,已如電力和互聯網般融入我們工作和生活的方方面面。當技術從分析過去邁入生成未來,企業與技術人又該如何重塑自身價值?我們又該如何藉助這一波技術浪潮,實現能力的跨越與職業的突破? 11月16日,咕泡科技聯合創始人、AI大模型事業部負責人譚鋒(Mic)老師受邀參與“數有引力·Sure沙龍丨AI時代,個體機遇新選擇”深度沙龍進行分享,與眾多行業同行展開探討:大模型不僅改

應用層 , 人工智能 , 深度學習 , 生成式 , 迭代 , 大模型

收藏 評論

向量檢索 - 如何通過HTTP API檢索Doc

本文介紹如何通過HTTP API在Collection中進行相似性檢索。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP POST https://{Endpoint}/v1/collections/

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 人工智能 , 大模型

收藏 評論