tag 量化

標籤
貢獻2
27
04:26 PM · Nov 15 ,2025

@量化 / 博客 RSS 訂閱

mob64ca13fdd43c - [源碼分析] Facebook如何訓練超大模型 --- (2) -

文章目錄 實戰量化Facebook OPT模型 Facebook OPT模型介紹 auto-gptq方式量化 1、定義量化配置 2、加載模型量化 3、檢查量化正確性 4、保存量化後的模型權重 5、使用量化模型進行文本生成 6、使用自定義的數據集

數據集 , 語言模型 , 加載 , 人工智能 , Css , 前端開發 , 量化 , HTML

收藏 評論

超神經HyperAI - 【vLLM 學習】Lora With Quantization Inference

vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼examples/offline_inference/lora_with_quantization_inference.py # SPDX-Licen

llm , 內存管理 , kv存儲 , 量化 , Python

收藏 評論