量化

標籤

貢獻2

109

04:26 PM · Nov 15 ,2025

@u_16213606

暱稱mob64ca13fdd43c

Last seen
@chaoshenjinghyperai

暱稱超神經HyperAI

Last seen

@量化 / 博客 RSS 訂閱

Nov 15 2025

mob64ca13fdd43c - [源碼分析] Facebook如何訓練超大模型 --- (2) -

文章目錄實戰量化Facebook OPT模型 Facebook OPT模型介紹 auto-gptq方式量化 1、定義量化配置 2、加載模型量化 3、檢查量化正確性 4、保存量化後的模型權重 5、使用量化模型進行文本生成 6、使用自定義的數據集

數據集 , 語言模型 , 加載 , 人工智能 , Css , 前端開發 , 量化 , HTML

收藏評論

Aug 13 2025

超神經HyperAI - 【vLLM 學習】Lora With Quantization Inference

vLLM 是一款專為大語言模型推理加速而設計的框架，實現了 KV 緩存內存幾乎零浪費，解決了內存管理瓶頸問題。更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程：零基礎分步指南源碼examples/offline_inference/lora_with_quantization_inference.py # SPDX-Licen

llm , 內存管理 , kv存儲 , 量化 , Python

收藏評論

量化

@量化 / 博客 RSS 訂閱

mob64ca13fdd43c - [源碼分析] Facebook如何訓練超大模型 --- (2) -

超神經HyperAI - 【vLLM 學習】Lora With Quantization Inference

Product

Company

Support

Company