tag 人工智能

標籤
貢獻960
1367
06:37 AM · Oct 27 ,2025

@人工智能 / 博客 RSS 訂閱

嘴巴吃糖了 - 【值得收藏】大模型必備知識:Transformer為何選擇Layer Normalization而非Batch Normalization

前言 無論是 BERT、GPT 還是 ViT,幾乎都不用 Batch Normalization,而是清一色地用 Layer Normalization。 這不是巧合,而是 Transformer 架構中一個非常深層的設計選擇。 一、BN 和 LN 到底在做什麼? BN 和 LN 的出發點其實一樣——穩定訓練,防止梯度

後端開發 , 人工智能 , transformer , batch , 大模型入門 , 大模型學習 , Python

收藏 評論

温柔一刀 - demp編碼

我整理了一下研發近期需要完成和實現的功能供大家參考。 1. 多畫面,流矩陣和大數據,EPG的對接。 2. SDI採集中杜比音頻數據的透傳。 3. 編碼器輸入流信息的展示與輸入流的預覽。 4. 編碼器主,備,墊輸入流或文件可同時配置,目前編碼器只支持 “主輸入流+備輸入流或者主輸入流+墊片文件的方式”。 5. 編碼器主,備,墊配置時可切換主,備

機器學習 , demp編碼 , 數據丟失 , 編碼器 , 人工智能 , 輸入流

收藏 評論

慧星雲 - 當視頻遇上AI:SAM 2 打破想象的界限!

SegmentAnythingModel2 Meta公司推出Llama3.1沒多久,又在今天推出了SegmentAnythingModel2(SAM2),以其強大的實時、可提示對象分割能力,引領了視頻處理領域的一場新風潮。 SAM2不僅支持各種未見過的視覺對象的分割,更為圖像與視頻提供了統一、高效的處理平台。如此突破,無疑為計算機視覺的未來賦予了無窮可能。 功能性大突破 SAM2官

圖像識別 , 雲計算 , 人工智能 , meta , 開源

收藏 評論

爛漫樹林 - devtempfs為什麼會滿

3.15、函數ioctl 1、函數原型:插入圖片 3.16、/dev/fd:重要章節 1、較新的系統都提供名為/dev/fd的目錄,其目錄項是名為0、1/2等的文件,打開文件/dev/fd/n等效於複製描述符n(假定描述符n是打開的)。 2、linux實現中的/dev/fd是個例外。它把文件描述符映射成指向頂底層物理文件的符號鏈接。例如,當打開/dev/f

機器學習 , 插入圖片 , 用户組 , devtempfs為什麼會滿 , 粘着位 , 人工智能

收藏 評論

資源999it點top - 秋葉AI設計變現訓練營2023年8月結課第1期

《秋葉 AI 設計變現首發課:工具 + 思維 + 資源的三維專業變現體系》——超越工具操作,掌握商業變現的底層邏輯 作為一名對 AI 設計充滿熱情,並且希望通過這門《秋葉 AI 設計變現首發課》實現技能變現的學習者,我深知在如今 AI 工具日新月異的時代,僅僅學會怎麼用軟件是遠遠不夠的。Midjourney、Stable Diffusion 等工具的教程在網上俯拾皆是,但“會操作”不等於“能

人工智能

收藏 評論

命中水ヽ - 從懷疑到離不開:我第一個由 AI 深度參與完成的真實項目覆盤

首先説明,我不是專業的前端工程師。 但這次,我一個人完成了一個包含聊天窗口、WebSocket 實時推送、多語言翻譯、複雜 UI 狀態管理的前端項目。 説實話,如果沒有 AI,這個項目我大概率會延期,甚至放棄一些體驗上的細節。 這是我第一次,在一個真實、長期維護、並且已經上線使用的項目中,深度引入 AI 參與開發。 不是 Demo,不是練手,而是一個我必須為穩定性、性能和可維護性負責的系

php , 人工智能 , lavarel , 後端 , 前端

收藏 評論

沃觀態勢感知 - 不止是監控:海外輿情監控平台如何成為企業的全球戰略雷達?

在全球競爭不斷加劇的背景下,海外輿情監控平台正從“信息收集工具”向“全球戰略雷達”加速演變。對於任何正邁向國際市場的企業來説,它們不僅要求及時掌握媒體動向,還必須從複雜的輿論信號中識別風險、洞察趨勢、預測未來。輿情監控已走過單點數據抓取時代,如今的平台需要承擔戰略預警、品牌競爭洞察、用户需求識別以及行業動態分析等更高維度的任務,讓企業在跨文化、多語言、複

人工智能 , 基礎設施 , 用户需求 , 數據分析 , 結構化

收藏 評論

上海拔俗網絡 - AI心理測評管理系統:用技術解鎖精準心理洞察

傳統心理測評多依賴固定量表、人工計分與解讀,不僅效率低下,還易受主觀經驗影響,難以實現大規模篩查與個性化評估。AI心理測評管理系統的核心突破,是用技術重構“測評-分析-解讀-干預”全鏈路,靠算法量化心理特徵、規避主觀偏差,讓心理評估從“小眾專業服務”走向“規模化精準管理”。其技術內核不晦澀,本質是讓系統成為“智能心理分析師”,看得透數據、讀得懂人心。 系統前端技術核心是“多模態數據採

數據 , NLP , 人工智能 , 原始數據 , 模態

收藏 評論

deephub - mmBERT:307M參數覆蓋1800+語言,3萬億tokens訓練

mmBERT是一個純編碼器架構的語言模型,在1800多種語言、3萬億tokens的文本上完成了預訓練。它的架構設計借鑑了ModernBERT,但又加入了不少創新點,比如逆掩碼比率調度和逆温度採樣。而且研究團隊還把1700多種低資源語言放在了衰減階段加入訓練,這個策略帶來了相當不錯的效果提升,充分利用了那些數據量本身就不大的語言資源。 模型架構 整體架構和ModernBERT保持一致,但換成

bert-language-model , 神經網絡 , 人工智能 , 深度學習

收藏 評論

陌上 - AIGC時代,轉檔SDK會被顛覆嗎?不,它是“數據流通”的關鍵樞紐

當人工智能生成內容(AIGC)以革命性姿態重塑數字世界,一個問題自然浮現:在AI能直接創作內容的時代,專注于格式轉換的轉檔SDK是否變得過時?然而,深入觀察AIGC生態系統會發現,轉檔SDK不僅未被邊緣化,反而在數據流通網絡中扮演着越來越核心的角色。 數據預處理:AIGC的“原料精煉廠” AIGC模型的訓練質量直接取決於輸入數據的結構與質量。企業積累的海量數據——歷史文檔、設計圖紙、多媒體資料——

人工智能

收藏 評論

編程小達人 - 深層神經網絡的優點 神經網絡淺層和深層

深層神經網絡 淺層神經網絡和深層神經網絡的主要區別在於隱藏層的多少。隱藏層的層數越多,神經網絡越深。 深層神經網絡的一些符號定義: L L : 神經網絡的層數 n[l]n[l]: 第l l 層的神經單元個數 a[l]=g[l](z[l])a[l]=g[l](z[l]): 第l l 層的激活

deeplearning.ai , 神經網絡 , 激活函數 , 第1課 , 人工智能 , 深層神經網絡的優點

收藏 評論

bigrobin - auto_increment用不了

有些被稱為存儲説明符(storage class specifier)或cv-限定符(cv-qualifier)的C++關鍵字提供了一些有關存儲的信息。下面是存儲所説明符: * auto (在C++11中不再是説明符); * register; * static; * extern; * t

機器學習 , 限定符 , 人工智能 , 編譯器 , auto_increment用不了 , 代碼塊

收藏 評論

此星光明 - NLDAS 主要強迫數據 L4 小時 0.125 x 0.125 度 V2.0 (NLDAS_FORA0125_H) 位於 GES DISC

NLDAS Primary Forcing Data L4 Hourly 0.125 x 0.125 degree V2.0 (NLDAS_FORA0125_H) at GES DISC 簡介 本數據集包含北美陸地數據同化系統(NLDAS-2)第二階段的主要逐時強迫數據“文件 A”。數據採用 1/8 度網格間距,時間範圍從 1979 年 1

機器學習 , 數據 , 人工智能 , 深度學習 , 插值 , Css , 前端開發 , HTML

收藏 評論

HyperAI超神經 - 跨學科創新遠超人類?AI科學家提假設/做實驗/發頂會開啓科學研究新範式

2024 年 8 月,由 Transformer 論文作者之一 Llion Jones 創立的 Sakana AI 公司宣佈推出全球首位「AI 科學家(AI Scientist)」, 通過自主生成研究想法、設計實驗、編寫代碼、執行實驗乃至撰寫論文,並藉助「AI 審稿人」對結果進行評審與改進,形成了完整閉環的科研生態系統。今年 3 月,該系統產出的一篇計算機科學論文通過了 ICLR 202

AI , 人工智能 , 深度學習

收藏 評論

百度安全 - 為千行百業植入“安全基因”!百度加入“內生安全生態夥伴計劃”

11月28日,由紫金山實驗室主辦的第五屆網絡空間內生安全學術大會暨IEEE CRESS 2025國際會議在南京啓幕。大會由中國通信學會、中國計算機學會、中國汽車工程學會、中國網絡空間安全學會指導,紫金山實驗室主辦,以“AI+生態構建新挑戰,安全可信新機遇”為主題,集中展現我國在網絡空間內生安全領域的原創突破與產業實踐成果。同時,大會正式啓動“內生安全生態夥伴計劃”,該計劃聯合了百度、奇安信、深信服

網絡安全 , 人工智能 , 大模型

收藏 評論

上海拔俗網絡 - AI科學研究平台:給科研加“智能引擎”,突破創新瓶頸

傳統科研常陷“海量數據難處理、實驗設計憑經驗、重複勞動耗精力”的困境。而AI科學研究平台的出現,用實打實的技術重構科研邏輯,讓科研人員從繁瑣工作中解放出來,聚焦核心創新,讓科學探索更高效、更精準。 這個平台的技術核心是“數據整合-智能分析-輔助決策”的閉環架構。首先,它靠多源數據融合技術,打通文獻數據庫、實驗儀器、傳感器等各類數據源,不管是文本、數值、圖像還是光譜數據,都能自動抓取、

數據 , 上傳 , NLP , 自定義 , 人工智能

收藏 評論

雨大王 - 工業互聯網工廠大腦:如何從數據混沌到智能協同?

在現代化工廠裏,每天產生的數據量簡直能嚇人一跳。想象一下,一座大型汽車工廠在一天之內,可能就積累了上億條來自設備、生產線、供應鏈等各個系統的數據。這些數據看似龐大,卻往往像散落的拼圖一樣,格式不一、標準缺失,難以形成統一的分析框架。這種情況,就是所謂的“數據混沌”,也是全球製造業數字化轉型中普遍存在的難題。而解決這一問題的關鍵,正是讓數據從“雜亂無章的原材料”轉變為“可直接使用的工業語言”。

人工智能 , 深度學習

收藏 評論

deephub - LLM-as-a-judge有30%評測偏差?這篇論文給出修復方案

用LLM給LLM打分,這個看起來很聰明的做法正在讓AI評估變得不可靠。KRAFTON AI的這個工作直指當前LLM評估體系的軟肋:作為評判者的語言模型本身就帶有系統性偏差,而這種偏差在Chatbot Arena等主流基準測試中可以達到30%左右。也就是説排行榜上那些令人興奮的性能提升,有相當一部分可能是評估方法的偏差。 評判機制的運作方式 LLM-as-a-judge就是讓一個語言模型去評價另一個

llm , 神經網絡 , 人工智能 , 深度學習 , llama

收藏 評論

求知上進 - Python函數中的關鍵字詳細介紹

1.前言 1.1 關鍵字參數的概念與核心價值 在Python函數設計中,關鍵字參數是一種強大而靈活的參數傳遞機制,它允許調用者使用參數名稱來指定值,而非依賴於參數在函數定義中的位置順序。這種設計極大提升了代碼的可讀性和維護性,尤其在處理具有多個可選參數的函數時。關鍵字參數的核心價值在於提供一種明確、意圖-driven的參數綁定方式,避免了位置參數可能帶來的混淆和錯誤。

默認參數 , 人工智能 , 深度學習 , ide , Python

收藏 評論

bingfeng - 大模型 temperature 設置為0

儘管近年來卷積神經網絡很大地促進了計算機視覺的發展,但一個重要方面很少被關注:圖像大小對被訓練的任務的準確性的影響。在本文介紹了一篇谷歌在ICCV2021的工作,作者提出了一個可學習的調整器模型(resizer model)來提高模型的性能。 【寫在前面】 儘管近年來卷積神經網絡很大地促進了計算機視覺的發展,但一個重要方面很少被關注:圖像大小

機器學習 , 算法 , 編程語言 , 人工智能 , 計算機視覺

收藏 評論

wx6464351503832 - GPT-5.1 發佈:更智能也更“人性化“的 AI 助手

2025年11月12日,OpenAI 發佈了 GPT-5 系列的重要更新版本 GPT-5.1,包括 GPT-5.1 Instant(即時版)和 GPT-5.1 Thinking(思維版)兩個變體。這次更新不僅在技術能力上有所提升,更值得關注的是其在對話風格上的顯著變化,而這一變化正在社區中引發激烈討論。 技術升級:智能與效率的平衡 GPT-5

redis , 智能體 , 數據 , gpt , 數據庫 , 人工智能 , 大模型

收藏 評論

程序員阿偉 - 《高質量遊戲攻略與視頻的優先級展示機制構建指南》

深夜的遊戲社區裏,不同需求的玩家都在經歷着相似的困境—剛入坑開放世界遊戲的新手,想找隱藏副本的觸發路徑,刷到的卻是重複剪輯的戰鬥混剪,連關鍵NPC的位置都沒有標註;深耕競技遊戲的核心玩家,渴望學習新版本的戰術拆解,置頂內容卻還是三個月前的基礎操作教學,毫無參考價值;專注單機劇情的玩家,想解鎖隱藏結局的關鍵選擇,搜索結果裏滿是標題黨視頻,點進去全是無關的劇情吐槽。這種優質內容被海量低質信息淹沒的現象

遊戲 , 人工智能

收藏 評論

亞馬遜雲開發者 - 深度探索:EKS MCP Server 與 Amazon Q Developer CLI 集成實踐

“又一次半夜被Kubernetes告警驚醒,我發現自己正在查閲第五個不同的文檔,試圖找出為什麼集羣中的一個關鍵服務突然不可用。”作為一名身處雲原生轉型前線的架構師,這樣的經歷對我而言曾是家常便飯。儘管Amazon EKS讓Kubernetes部署變得更簡單,但運維的複雜性和知識門檻仍然是許多團隊面臨的巨大挑戰。然而,亞馬遜雲科技最新推出的AI驅動運維工具徹底改變了這一現狀。在這篇文章中,我將分享

人工智能

收藏 評論

co_yield - 從0構建深度學習框架——揭秘深度學習框架的黑箱

引言 你有沒有好奇過,當你在 PyTorch 或 TensorFlow 中調用 .backward() 計算梯度時,框架到底在背後做了什麼? 我們每天都在使用這些成熟的深度學習工具,但很少有人真正去探索它們的底層實現——自動微分的魔法、計算圖的構建、張量運算的優化……這些隱藏在API背後的核心原理,才是深度學習的真正基石。 今天,我將向大家介紹一個從零開始實現的輕量級深度學習框架——Needle。

人工智能

收藏 評論