tag 模態

標籤
貢獻75
121
12:28 PM · Nov 08 ,2025

@模態 / 博客 RSS 訂閱

是嶼小夏呀 - 昇騰平台多模態微調與推理實戰:從理論到落地的完整探索

多模態大模型正在改變AI的應用邊界,從文生圖到文生視頻,從圖像理解到全模態交互,這些能力的背後離不開強大的算力支持和高效的推理框架。 最近我在昇騰平台上完成了一次完整的多模態項目實踐——使用MindSpeed MM進行Qwen2.5-VL模型微調,並通過MindIE SD實現Wan2.1視頻生成模型的高性能推理。 這次經歷讓我深刻體會到,多模態模型的訓練和部署遠比想象中複雜,但昇

Exchange , 服務器 , 權重 , 模態 , Git

收藏 評論

冰淇淋紅茶Q - 具身智能驅動:基於魔琺星雲SDK構建高擬真AI面試官

在當前人工智能的浪潮中,大語言模型(LLM)已展現出強大的認知與邏輯推理能力。然而,其交互界面卻長期受限於一個簡單的文本或語音輸入框。這種抽象且割裂的單維表達,本質上缺乏一個能與人類進行自然、生動交互的視覺或物理載體,尤其在需要傳遞情感、適應情境、展現意圖的場合中,顯得疏離而單薄。 面對這一日益顯著的人機交互鴻溝,具身智能(Embodied AI)正成為彌合認知與體驗的關鍵

雲平台 , 3d , 人工智能 , 深度學習 , 模態

收藏 評論

Ambition的後花園 - Java調用DeepSeek傳圖文示例

瞭解您想用Java同時傳遞圖片和文字信息給DeepSeek API。雖然目前的搜索結果中缺乏直接使用DeepSeek多模態接口處理圖片的Java示例,但我可以基於通用的大模型多模態API調用原理,為您提供一個可行的實現方案。 以下是一個基於OkHttp庫的示例,展示瞭如何構建同時包含文本和圖像數據的請求。 核心概念:圖像傳遞方式 通常,向大模型傳遞圖像有兩種方式

API , 後端開發 , JAVA , 模態 , Json

收藏 評論

軟件求生 - 震撼!SpringAI 扛起多模態大旗:Google Vertex AI 嵌入模型太強了!

大家好,我是小米。 今天我一定要和你們分享一個我最近“玩到停不下來”的東西: Google Vertex AI 的多模態向量模型(Multimodal Embedding)整合進 SpringAI。 你有沒有這種感覺: 明明我們已經用文本向量模型玩得飛起,做語義搜索、做相似度匹配、做推薦算法……結果這時候突然有人告訴你:

機器學習 , yyds乾貨盤點 , google , 相似度 , 人工智能 , 模態

收藏 評論

flyingsmiling - LangChain 完整指南:使用大語言模型構建強大的應用程序

官方對2種ChatMessage的解釋 SystemMessage這是系統發送的消息。通常,作為開發人員,您應該定義此消息的內容。一般來説,您會在此處編寫指令,説明 LLM 在此對話中的角色、行為方式、回覆風格等等。LLM 經過訓練,會更加關注SystemMessage此類消息,因此請務必謹慎,最好不要讓最終用户隨意定義或向消息中添加任何內容SystemMessa

應用程序 , 最終用户 , 模態 , 前端開發 , Javascript

收藏 評論

西洋無悔 - 百度AI開放平台-全球領先的人工智能服務平台

引言 在人工智能技術迅猛發展的浪潮中,自然語言處理(NLP)領域正經歷着前所未有的變革,預訓練語言模型(PLM)已然成為驅動行業創新的核心引擎。百度最新發布的ERNIE-4.5模型系列,憑藉其突破性的架構設計與卓越的跨場景處理能力,迅速在技術社區與產業應用中引發廣泛關注。本文將從技術架構的底層創新、核心功能的場景化落地、多維度性能測評三個層

編碼器 , 數據 , MySQL , 數據庫 , 模態

收藏 評論

mob649e8155b018 - 多模態 Diffusion

在當前的信息時代,多模態 Diffusion 已經成為了人工智能和計算機視覺領域的熱門話題。它的應用包括圖像生成、文本理解和多模態信息處理等領域,同時面臨着如何有效融合和生成不同模態信息的挑戰。本文將對多模態 Diffusion 的背景、原理、架構、源碼及應用場景進行詳細探討,為讀者提供一個全面的理解。 背景描述 隨着人工智能技術的快速發展,多模態 Diffusion 模型因其能

數據 , aigc , 應用場景 , 模態

收藏 評論

叫做長大จุ๊บ - 文心 5.0 登場:打破邊界,定義未來智能新範式,開啓原生全模態智能新時代!

作為一名每天與代碼為伴、重度依賴AI工具的開發者,我經歷過從早期語言模型的稚嫩,到如今大模型混戰的喧囂。就在剛剛GPT推出了5.1而百度推出了文心5.0,當看到ERNIE 5.0發佈時,我的第一反應是:又一個版本更新?但在深入瞭解後,我必須承認——這次,真的不一樣。 一、重新定義"全模態":從概念到生產力 看看這個界面: 文檔區:圖片、

AIGC二三事 , 文心一言 , 數據 , aigc , 開發者 , 模態 , 百度

收藏 評論

wx62088446a1f70 - 多模態深度學習:跨模態理解與生成的融合智能

多模態深度學習:跨模態理解與生成的融合智能 引言 人類通過視覺、聽覺、觸覺等多感官通道協同理解世界,而當前AI系統大多侷限於單一模態處理。多模態深度學習通過建立跨模態的聯合表徵與轉換機制,正推動人工智能向更接近人類認知方式的方向演進。本文將深入探討多模態深度學習的核心算法、統一框架、訓練範式以及前沿應用,呈現這一跨領域研究方向的最新進展與未來趨勢。 一、多模態表徵學習 1

數據 , 深度學習 , 代碼人生 , 模態

收藏 評論

虎斑嘟嘟 - 大模型智能體在醫療影像診斷中的特徵提取與識別

大模型智能體在醫療影像診斷中的特徵提取與識別 隨着人工智能技術的快速發展,大模型智能體在醫療影像診斷領域正掀起一場革命。本文將深入探討大模型智能體如何通過先進的特徵提取與識別技術,改變醫療影像的診斷方式,並提供詳細的代碼實例展示這一過程的具體實現。 醫療影像診斷中大模型智能體的技術基礎 大模型智能體在醫療影像診斷中的核心價值在於其能夠模仿甚至增強人類專家的診斷思

yyds乾貨盤點 , 後端開發 , JAVA , Image , 模態 , 特徵提取

收藏 評論

mob649e81643021 - AIGC 人工智能生成內容

在當今的科技時代,AIGC(人工智能生成內容)已經成為了各種數字產品和服務中的一個重要組成部分。隨着技術的發展,AIGC的應用場景越來越廣泛,從文本生成、圖像處理到音頻合成,各個領域都在不斷探索其潛力。儘管如此,爭論和討論圍繞着AIGC產生的一些問題依然持續,比如內容的生成質量、創作權的歸屬、道德性以及內容的真實性。本文將詳細探討如何有效解決這些AIGC生成內容的問題。 時間軸和尚未

工具鏈 , aigc , 模態 , Python

收藏 評論

mob64ca13fe62db - 【AI理論學習】多模態介紹及當前研究方向_多模態人工智能

你是否還在為AI項目中同時處理文本、圖像和音頻數據而煩惱?面對TensorFlow、PyTorch等不同框架的兼容性問題,以及各種模態數據處理接口的差異,開發效率大打折扣。本文將介紹如何使用Ivy框架(The Unified AI Framework)輕鬆實現多模態數據的統一處理,讓你告別框架切換的痛苦,專注於模型創新。 讀完本文,你將能夠: 瞭解I

數據 , 加載 , 後端開發 , 模態 , Python

收藏 評論

AI科技 - 閃電速遞”來襲!Google Gemini 3 Flash免費全網開放,性能提速3倍、費用僅1/4 Pro!

12月18日,谷歌在全球同步發佈了最新大模型 Gemini 3 Flash,並將其設為 Gemini App、Google Search AI Mode、Vertex AI、Google AI Studio、Antigravity 以及 Gemini CLI 的默認模型。此舉標誌着 Gemini 3 Flash 已在全球範圍內免費向所有用户開放,成為普通用户體驗“旗艦級”智能的第

數字化轉型 , app , google , 模態

收藏 評論

代碼天地 - 別隻盯着模型!AI Agent的成功,是架構、協議、模型、應用的四位一體

如果把過去幾年的大語言模型(LLM)浪潮比作“電力被髮明”的階段,那麼 AI Agent 更像是“電氣化工廠”的開始:電不再只是點燈,而是接入生產線、帶動機器、形成一整套自動化體系。 從 AGI 分級的角度看,AI Agent 通常被視為 L3 級智能體: 不再只是“回答問題的工具”,而是具備明確目標、可持續運行、能主動決策和執行任務的智能實體。 技

服務器 , 數據 , 分佈式 , 模態 , 結構化

收藏 評論

上海拔俗網絡 - AI農情數據要素服務平台:讓農田管理更智慧

在傳統農業中,農民種地主要依靠代代相傳的經驗,但面對今天的氣候變化、市場波動和規模化種植挑戰,單靠經驗已遠遠不夠。AI農情數據要素服務平台應運而生,它像是給農田裝上了“智慧大腦”,讓種地變得更科學、更輕鬆。 數據採集:從“鐵腳板”到“雲端算” 過去,農業補貼核查、作物長勢監測需要農技人員跟着農户靠“鐵腳板”到現場逐一查看,費時費力。現在,AI農情平台通過“遙感+AI+移動互聯網”

數據 , 數據採集 , NLP , 人工智能 , 模態

收藏 評論

全棧技術開發者 - 什麼是「多模態協同決策」?它與多傳感器融合的關係是什麼?知識蒸餾和跨模態蒸餾有什麼關係?不同模態之間的信息衝突應如何解決?

在過去的十餘年中,智能交通與自動駕駛技術的發展被普遍視為人工智能落地應用最具代表性與最具挑戰性的領域之一。人們對自動駕駛的期待不僅僅是“解放雙手”,更是寄希望於其能夠顯著提升道路利用效率,並最後推動社會出行方式的根本變革。然而,當我們深入考察現有的自動駕駛方案時,一個不容迴避的現實逐漸顯現出來:單車智能正在觸碰其發展的瓶頸。 自動駕駛的決策過程高度依賴感知,而感知本質上是車

自動駕駛 , 人工智能 , 深度學習 , 車聯網 , 模態

收藏 評論

freeAngus - 文本向量模型技術報告

embedding模型評測榜單 https://huggingface.co/spaces/mteb/leaderboard 0. 摘要 本報告基於 2025 年主流開源與商用向量模型(BGE-M3、Qwen3-Embedding、Jina-v3/v4)的公開資料、MTEB/MLRB 評測結果與內部復現實驗,系統梳理了:

多任務 , M3 , embedding , RAG , Css , 模態 , 前端開發 , HTML

收藏 評論

上海拔俗網絡 - AI輔助辦案系統:讓技術成為司法的“智慧搭檔”

在基層辦案場景中,“卷宗堆成山、閲卷耗整天”曾是常態。而AI輔助辦案系統的出現,正通過技術手段重構辦案流程,把檢察官、民警從重複性勞動中解放出來,聚焦核心的法律判斷與事實認定。這套系統絕非“炫技工具”,而是紮根辦案需求的“實用幫手”,其核心價值都藏在可落地的技術細節裏。 自然語言處理(NLP)是系統的“文字解碼師”,也是破解卷宗難題的核心技術。傳統人工閲卷需逐頁梳理案情、提取要素,效

音視頻 , NLP , 人工智能 , 模態 , 程序問題

收藏 評論

mob649e8166179a - aigc面試

在當今信息時代,AI生成內容(AIGC)正逐漸成為業務和技術領域的重要驅動力,它不僅改變了我們的工作方式,也為面試過程帶來了新的挑戰與機遇。針對"AIGC面試"的問題,我們將深入探討該面試的背景,技術演進歷程、架構設計、性能優化、故障覆盤以及擴展應用等方面的內容,以期為這個新興領域奠定紮實的基礎。 背景定位 隨着人工智能技術特別是AIGC的快速發展,越來越多的企業開始在招聘過程中

高併發 , 架構設計 , aigc , 模態

收藏 評論

AI科技 - 阿里“千問”正式上線 —— 打造全鏈路AI生活入口的全新佈局!

近日,阿里巴巴在官方渠道正式對外宣佈,基於自研大模型 Qwen 系列的個人 AI 助手 千問 已進入公測階段。阿里將此舉定位為“AI 時代的未來之戰”,並計劃以最先進的模型能力,打造“一款會聊天、能辦事”的全能 AI 應用。 一、千問的核心定位與功能 千問被設計為面向 C 端用户的 AI 超級助手,核心目標是實現“會聊天、能辦事”。在對話層面,千問能夠進行多輪

商業 , 多語言 , 物聯網 , 模態

收藏 評論

mob64ca140bbb8b - NLP語義識別在人工智能領域中的應用與前景_nlp 語義識別

伴隨互聯網信息量呈爆炸式增長,傳統搜索引擎於處理複雜且多模態的用户查詢之際,漸漸顯露出侷限性,人工智能搜索優化技術順勢而生,它藉由引入先進的自然語言處理技術,以及深度學習技術,還有知識圖譜等技術,顯著提高了信息檢索的效率以及準確性。 要點的核心在於人工智能搜索優化,是對搜索過程實施智能化改造的舉措。傳統搜索方式主要依靠關鍵詞匹配,以及頁面權重排名來

搜索 , 後端開發 , 人工智能 , 模態 , Python

收藏 評論

上海拔俗網絡 - AI智慧監管系統:用技術織就全維防控網

在監管領域,“人防+人海戰術”的傳統模式早已難抵海量場景與隱蔽風險。AI智慧監管系統並非簡單的“監控+報警”,而是以技術為經緯,構建起“實時感知、智能研判、閉環處置”的自動化體系,讓監管從“事後追責”躍遷至“事前預警”,精準破解傳統監管的盲區與低效難題。 系統的核心支撐是分層技術底座,就像搭建一套智能“監管中樞”,每一層都有明確分工。最底層是感知與算力層,依託邊緣計算和5G技術打造“

服務器 , 數據 , NLP , 人工智能 , 模態

收藏 評論

wx676be6175e246 - Android中關於AlertDialog交互組件介紹

AlertDialog是Android開發中用於向用户展示重要信息、請求確認或提供選項選擇的模態對話框組件。其設計簡潔高效,能有效提升應用交互體驗。 核心原理與創建方式 AlertDialog繼承自Dialog類,採用構造器模式創建。開發者可以通過AlertDialog.Builder類進行配置,支持設置標題、消息、按鈕(如確定、取消)以及列表等元素,確保用户決策清晰

移動開發 , 易用性 , Android , 開發者 , 模態

收藏 評論

亞拉索第一 - 聚焦行業價值與生態演進:一個開發者眼中的技術躍遷

引言 作為一名深耕行業十年的開發者,我親歷了從傳統瀑布式開發到敏捷迭代的轉型,也見證了AI技術從實驗室走向產業落地的全過程。當對話式AI成為生產力工具的核心入口時,我們不再只是代碼的寫作者,更是人機交互範式的構建者。華為雲推出的MateChat作為面向AIGC場景的對話組件庫,正以務實的技術底座推動行業價值的釋放。以下是我基於實戰經驗,對大模型適配

人機交互 , 大數據 , 數據倉庫 , 開發者 , 模態

收藏 評論