大模型

標籤

貢獻58

536

01:37 PM · Oct 26 ,2025

@meituanjishutuandui

暱稱美團技術團隊

Last seen
@u_16773655

暱稱向量檢索

Last seen
@u_17589471

暱稱AI數字人研究社

Last seen
@u_16116809

暱稱wx6464351503832

Last seen
@bizidadejianbing

暱稱DashVector

Last seen
@baidujiagoushi

暱稱百度Geek説

Last seen
@u_17586993

暱稱u_17586993

Last seen
@elhix0bg

暱稱阿里雲大數據AI

Last seen
@weixiaodexiaodao

暱稱微笑的小刀

Last seen
@kuaishoutech

暱稱快手技術

Last seen
@u_15591470

暱稱ceshiren2022

Last seen
@u_16651779

暱稱是Yu欸

Last seen

@大模型 / 博客 RSS 訂閱

Nov 18 2025

wx6464351503832 - 強化學習(RL)簡介及其在大語言模型中的應用

看到huggingface上有個大模型課程，其中有個章節是講如何構建推理大模型，下面是對應的學習內容。接下來會用最通俗易懂的方式介紹RL，就算之前完全沒接觸過也能看懂。會拆解核心概念，看看為什麼RL在大語言模型（LLMs）領域變得這麼重要。什麼是強化學習（RL）？想象一下訓練一隻狗。想教它坐下。可能會説"坐下！"，如果狗坐下了，就

強化學習 , 語言模型 , 自然語言處理 , 人工智能 , Css , 大模型 , 前端開發 , HTML

大模型

@大模型 / 博客 RSS 訂閱

wx6464351503832 - 強化學習(RL)簡介及其在大語言模型中的應用

wx6464351503832 - Agent實戰教程：深度解析async異步編程在Langgraph中的性能優化

美團技術團隊 - 美團 LongCat 團隊發佈全模態一站式評測基準UNO-Bench

GMICloud - GMI Cloud@AI週報｜OpenAI發佈GPT5.2；智譜AI GLM-4.6V開源

算力之光 - Meta放大招！首屆生成式AI大會LlamaCon即將來襲

微笑的小刀 - 2024最新貪心科技-大模型開發應用實戰營

信息流星 - 一款Java 開源的 Spring Boot 即時通訊 IM 聊天系統

曼孚科技 - 多模態AI自主研究：現在走到哪了？

阿里雲大數據AI技術 - 在 DataWorks 中一鍵部署大模型，即刻用於數據集成和數據開發

美團技術團隊 - 可驗證過程獎勵在提升大模型推理效率中的探索與實踐

微笑的小刀 - 西瓜老師-2025年大模型 MCP 技術實戰課

美團技術團隊 - ICCV 2025 | 美團論文精選及多模態推理競賽冠軍方法分享

ceshiren2022 - 如何在技術面試中自信應對“大模型微調”話題？

vistart - 百度大模型產品與技術生態（2025年5月）

美團技術團隊 - LongCat-Flash-Thinking 正式發佈，更強、更專業，保持極速！

向量檢索 - 如何通過HTTP API插入或更新Doc

DashVector - 如何通過Python SDK刪除Collection中已存在的Doc

MemTensor - 零代碼｜基於釦子（Coze）使用 MemOS 插件

思否編輯部 - 百度 Create AI 開發者大會：李彥宏發佈兩大新模型、多款熱門 AI 應用，幫助開發者全面擁抱 MCP

AI數字人研究社 - 全面盤點AI交互數字人企業，AI數字人如何定義下一代智能入口？

mob64ca1417eedd - [大模型] LLaMA系列大模型調研與整理-llama/alpaca/lora（部分）

全棧技術開發者 - 如何理解「128倍更少數據，卻能獲得更強智能體行為」？如何直觀地理解「少即是多（Less is More）」在智能體訓練中意義？

咕泡科技 - 代碼的未來：當AI學會創造，我們技術人的價值何在？

向量檢索 - 如何通過HTTP API檢索Doc