博客 / 列表

圍爐聊科技 - 開源黑科技:AutoMV讓AI自動生成專業級全曲MV,成本直降99%

對於獨立音樂人或中小創作團隊來説,製作一支專業MV始終是道難題:需要導演、攝影、剪輯等多個崗位協同,耗時數月不説,成本動輒上萬美元。而現有的AI視頻生成工具,要麼只能生成幾秒的短片段,要麼畫面與音樂節拍、歌詞完全脱節,甚至出現人物"變臉"的尷尬情況。 就在2025年底,這一困境被一款開源系統徹底打破——由M-A-P研究組織聯合北京郵電大學、南京大學、倫敦瑪麗女王大學等機構研

機器學習 , 人工智能

圍爐聊科技 - 4090實戰:ComfyUI運行Qwen-Image-Edit-2511模型指南(含避坑要點)

Qwen-Image-Edit-2511作為一款性能出色的圖像編輯模型,在ComfyUI中部署時卻受限於顯存資源。本文針對4090顯卡(24G顯存)場景,分享量化模型的部署流程、關鍵避坑點,以及不同採樣步數下的效果對比,幫助大家快速落地實踐。 一、前置準備:ComfyUI安裝 ComfyUI基礎安裝流程此處不贅述,推薦參考官方中文指南,步驟清晰且適配Linux環境:C

人工智能 , 計算機視覺

圍爐聊科技 - Qwen-Image-Edit-2511:AI圖像編輯的新標杆

2025年12月24日,阿里Qwen團隊正式推出圖像編輯模型重大更新版本——Qwen-Image-Edit-2511,作為9月發佈的2509版本的迭代升級之作,新版本聚焦“更強穩定性”與“更可控編輯體驗”兩大核心目標,通過人物一致性強化、LoRA子模型內置、幾何構造能力提升等關鍵優化,進一步鞏固了Qwen系列在圖像編輯領域的技術優勢。 一、版本定位:承接2509優勢,攻克核

人工智能 , 計算機視覺 , Image

圍爐聊科技 - 租用共績算力4090實測龍貓圖片編輯

本人實測發現,本地配備的 16GB 顯存顯卡無法運行 LongCat-Image(龍貓圖片編輯)項目,即便開啓 CPU offloading(CPU 卸載)功能緩解顯存壓力,依然因顯存不足導致運行失敗。 為此,我在網上尋找共享算力資源,最終選擇租用 4090 顯卡進行測試,所使用的算力平台為【共績算力】(官網:https://www.gongjiyun.com/)。

機器學習 , 雲主機 , 人工智能 , Image , Python

圍爐聊科技 - Orchestrator-8B:近期HuggingFace上火熱的小型模型

在AI技術日新月異的2025年,英偉達與香港大學聯合發佈了一項令人矚目的技術突破——Orchestrator-8B,近期在HuggingFace上保持着相當高的熱度。 這個只有80億參數的小型模型,通過巧妙的強化學習訓練和工具調度策略,在人類最後的考試(HLE)基準測試中以37.1%的準確率超越了GPT-5的35.1%。Orchestrator-8B的誕生

機器學習 , 基準測試 , 多目標 , 英偉達 , 人工智能

圍爐聊科技 - 2025年開源圖生圖模型盤點:Kandinsky 5.0、Qwen-Image與Z-Image

2025年,開源圖生圖模型領域迎來爆發式增長,三大代表模型——Kandinsky 5.0、Qwen-Image和Z-Image——以截然不同的技術路線和參數規模,共同重塑了AI圖像生成的生態格局。這些開源模型不僅降低了創作門檻,更通過多語言支持、中文排版優化和輕量化設計等創新,填補了國內AI圖像生成領域的空白。與2024年相比,2025年的開源圖生圖模型在推理速度、分辨率支持和中

機器學習 , 人工智能 , Image

圍爐聊科技 - 從像素到語義:圖像分割技術的演進與實踐

打開手機的人像模式拍攝照片,背景被自然虛化;醫院裏,CT影像中的腫瘤區域被精準標記;自動駕駛汽車實時識別道路、行人與障礙物——這些場景背後,都離不開計算機視覺領域的核心技術:圖像分割。作為連接"圖像感知"與"語義理解"的關鍵橋樑,圖像分割實現了從"看到像素"到"看懂內容"的跨越,其技術演進更是人工智能發展的生動縮影。本文將帶你全面梳理圖像分割技術的發展脈絡,解析核心算法原理,並探

圖像分割 , 人工智能 , 計算機視覺

圍爐聊科技 - DeepSeek V3.2 特別版體驗

12 月 1 日,國產大模型廠商 DeepSeek 正式發佈雙模型版本 ——DeepSeek-V3.2(標準版) 與 DeepSeek-V3.2-Speciale(專業版),分別瞄準通用場景落地與頂尖技術研究需求,引發行業廣泛關注。 作為面向大眾用户的主力版本,DeepSeek-V3.2 核心優勢在於推理能力與輸出效率的極致平衡:官方數據顯示,其在公開基準測試(如 MMLU

機器學習 , 人工智能

圍爐聊科技 - TRAE SOLO:使用初體驗

國內版TRAE SOLO之前就有預約,近期終於等到了,SOLO模式確實讓我大開眼界。它不再只是一個代碼補全工具,而是真正能從需求到上線全程陪跑的"編程夥伴"。 一、激活與界面切換:看似簡單,實則有門道 首先,獲取TRAE SOLO的途徑並不難。國內用户現在可以直接在TRAE國內版中免費使用SOLO模式。 切換SOLO模式的按鈕位於TRAE左上角,點擊後界面會從傳

機器學習 , 技術棧 , 代碼生成 , 人工智能

圍爐聊科技 - Ilya Sutskever在最近訪談中的關鍵觀點及對IT技術人員的啓示

Dwarkesh Patel 與 Ilya Sutskever 近期進行了深度對話,視頻以及英文原文可以參見https://www.dwarkesh.com/p/ilya-sutskever-2 ,個人及AI輔助整理核心觀點及啓示如下。 一、訪談核心觀點 Ilya Sutskever 作為 AI 領域的頂尖學者、SSI 公司創始人,在訪談中圍繞 AI

機器學習 , it , 數據 , 泛化 , 人工智能

圍爐聊科技 - 當AI成為“大腦”:人類如何在機器時代找到不可替代的價值?

一、從“下意識”到“大模型”:我們正在重新定義智能 最近,我常常思考一個問題:如果將當前的大語言模型比作人類的“大腦”,那麼人類那些看似“不經思考”的下意識行為,又該對應什麼呢? 下意識行為是否就是AI系統中的一套快速響應機制:規則引擎、緩存系統、輕量級模型協同工作,共同構建出“自動化”的表象? 我猜測人類與AI的智能機制,其實存在驚人的相似性,並且這個相似性可

機器學習 , 人工智能

圍爐聊科技 - Windows系統設置Ollama使用GPU

[ ] ✅ 前提條件 系統已安裝 CUDA,且版本需與 Ollama 兼容。 以 NVIDIA 顯卡為例,驅動版本需 ≥ 452.39(官方要求)。 Ollama 支持 計算能力 ≥ 5.0 的 Nvidia GPU,具體兼容性請參考:CUDA GPU 列表。 其他顯卡支持情況見官方文檔:GPU 支持説明。 如果系統中有多個 NVIDIA GPU,並且希望

環境變量 , 命令行 , AI寫作 , aigc , CUDA