tag 語言模型

標籤
貢獻30
92
08:05 PM · Nov 07 ,2025

@語言模型 / 博客 RSS 訂閱

mb6931254728ff3 - 【學習要記】prompt是怎麼降低LLM幻覺率的

抱歉,這是我對我現有知識做總結的個人筆記,可能會有錯誤,如果你想指正,歡迎提出你的想法,我比較聽勸。 開場先來個題外話 最近通過一陣陣冥想,和對ADHD相關書籍的研究,終於發現自己前額葉活躍度較低的事實。 我曾經一度以為自己很難專注去持續理解一段話是什麼意思的原因是大腦發育不良,畢竟我從小就這樣,那時候我也沒精力去研究這個東西,我只知道

數據 , 語言模型 , AI寫作 , aigc , 參考資料 , 筆記

收藏 評論

上海拔俗網絡 - AI旅遊助手:不是“機器人導遊”,而是你的“智能旅行大腦”

你有沒有發現—— 出門旅遊,查攻略、比價格、訂酒店、排路線……光是準備工作就能耗掉半天? 到了目的地,問路靠地圖、找吃靠點評、改行程靠運氣,一不小心就踩坑? 更別提帶老人孩子、語言不通、突發狀況……整個旅程像在“打怪升級”。 別擔心,這不是你不會玩,而是傳統旅遊方式太“被動”、太“碎片”、太“靠運氣”。現在,一個叫“AI旅遊助手”的技術產品,正悄悄改變這一切——它不取代人,而是幫

對話系統 , 數據 , NLP , 語言模型 , 人工智能

收藏 評論

未聞花名AI - 構建AI智能體:二十七、大模型如何“考出好成績”:詳解內在評測與外在評測方法

一、先知其然 語言模型評測的重要性可以用一個簡單的比喻來理解:就像我們不能僅憑汽車的外觀和參數來判斷其性能一樣,我們也不能僅憑語言模型的參數數量和訓練數據量來評估其實際能力。我們需要通過系統的"路試",即各種評測方法來全面瞭解模型的真實表現。 同樣的,在我們工作中,如果我們需要為公司購買一台新的服務器,我們首先不會僅僅因為銷售員説“它很快”就下單,而是要求看性能測試報

yyds乾貨盤點 , API , NLP , 語言模型 , 人工智能 , 條件概率

收藏 評論

mb690cc2a30bc41 - 使用AI寫小説的設計邏輯概念教程

一、引言 隨着人工智能技術的飛速發展,AI已經在多個創作領域展現出強大的能力。其中,使用AI來輔助小説創作已經成為一個備受關注的話題。本教程將深入探討如何設計一套完整的AI寫小説系統的邏輯框架,幫助讀者理解AI創作的核心概念和實現方法。 二、AI寫小説的核心架構 2.1 整體架構設計 AI寫小説系統主要由以下幾個核心模塊組成: 故事框架生成

軟件研發 , 語言模型 , 架構設計 , 地理位置

收藏 評論

讓世界更美好 - 書生大模型訓練營6期L1 探索大模型能力邊界

你説的“司南”指的是 OpenCompass 司南大模型評測平台,由 上海人工智能實驗室(Shanghai AI Lab) 推出,是一個面向大語言模型(LLM)和多模態模型的 權威評測與對比平台,核心功能包括: ✅ 核心定位 “大模型的競技場” —— 讓模型匿名對戰,用户投票選出更優回答,最終形成 動態更新的 leaderboa

語言模型 , 動態更新 , 人工智能 , Css , 開發者 , 模態 , 前端開發 , HTML

收藏 評論

AI科技 - 谷歌深夜開源“Gemini Deep Research Agent”,實現SOTA並以1/10成本挑戰!GPT‑5 Pro!

12月12日深夜,谷歌在官方博客及合作媒體36氪同步發佈了全新開源項目——Gemini Deep Research Agent(以下簡稱Deep Research Agent)。該項目在谷歌自研基準上取得了領先的SOTA成績,並聲稱其運行成本僅為同類商業模型GPT‑5 Pro的10%,即比後者便宜90%。此舉被業界視為一次“降本增能”的重要里程碑,也標誌着大型語言模型(LLM)生

數字化轉型 , 語言模型 , 緩存 , 開發者

收藏 評論

視頻孿生 - 從語言到世界:空間智能與視頻孿生開啓AI新徵程

11月10日,斯坦福大學教授、World Labs聯合創始人李飛飛發表長文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》(從語言到世界:空間智能是AI的下一個前沿)。李飛飛認為,當前以大型語言模型為代表的AI雖然擅長處理抽象知識,卻如同在“黑暗中行走”,缺乏對物理世界的真實理解。而空間智能——即

機器學習 , 空間智能與視頻孿生 , 語言模型 , 人工智能

收藏 評論

mob64ca13fba42b - 看MindSpore加持下,如何「煉出」首個千億參數中文預訓練語言模型? - 華為雲開發者社區的個人空間 -

AsyPPO: 輕量級mini-critics如何提升大語言模型推理能力 大型語言模型強化學習訓練面臨計算瓶頸,傳統對稱actor-critic架構導致critic模型參數量巨大,訓練成本高昂。本文介紹的Asymmetric Proximal Policy Optimization (AsyPPO)算法通過創新的非對稱架構設計,使用輕量級mini-

llm , 語言模型 , 自然語言處理 , 後端開發 , 人工智能 , Agentic , Python

收藏 評論

mb61c46a7ab1eee - 【文獻分享】依據基於大型語言模型嵌入的蛋白質的 k 均值聚類來探索同源性檢測

文章目錄 介紹 代碼 參考 介紹 從序列信息中推斷蛋白質的同源性對於理解物種進化以及實現能力註釋的轉移至關重要。除了基於相似性的方法外,還構建了多種利用不同方式表示蛋白質素材的機器學習方式。 在這裏,大家使用具有生物學導向的大型語言模型來表示蛋白質,並對嵌入的信息應用 k 均值聚類來提取同源關係。儘管我們的方法缺乏

聚類 , github , 語言模型 , 後端開發 , harmonyos

收藏 評論

修己xj - 從“死記硬背”到“靈活應用”:詳解RAG如何讓AI真正理解並回答問題

當AI不再僅僅是“復讀機”,而是能夠結合最新信息提供準確回答的智能助手——這就是RAG技術帶來的變革。 在人工智能快速發展的今天,我們常常遇到這樣的困境:大型語言模型如GPT-4擁有海量知識,卻無法獲取最新的信息;它能寫出優美的文章,卻無法準確回答你公司內部文檔中的具體問題。這就是所謂的“知識截止日期”問題——模型只能基於訓練時的數據進行回答。 但有一項技術正在徹底

數據 , 搜索 , 語言模型 , aigc , llama

收藏 評論

嘴巴吃糖了 - 【收藏必學】構建深度思考型智能體 RAG 流水線:解決複雜查詢的完整指南

涵蓋規劃、檢索、反思、批判、綜合等多個環節 一個 RAG 系統之所以會失敗,通常不是因為大型語言模型(LLM)不夠智能,而是因為它的架構過於簡單。它試圖用一種線性的、一次性的方法來處理一個循環的、多步驟的問題。 許多複雜查詢需要推理、反思以及在何時採取行動方面的明智決策,這與我們面對問題時檢索信息的方式非常相似。這正是智能體驅動的操作在 RA

大模型教程 , 語言模型 , 後端開發 , 人工智能 , 大模型入門 , harmonyos , 大模型學習

收藏 評論

雲端小夢 - 自學大語言模型的應用程序框架Langchain(初入門)

隨着大型語言模型技術的飛速發展,如何高效地構建基於這些強大模型的複雜、可交互的應用,成為了開發者的核心挑戰。LangChain應運而生,它不僅僅是一個簡單的 API 封裝,而是一個功能強大的開源框架,旨在簡化和加速 LLM 驅動的應用程序的開發。 思維導圖 一、LangChain 簡介 Lang

llm , API , 語言模型 , 後端開發 , langchain , 人工智能 , Python

收藏 評論

流暢kubernetes - 在 Kubernetes 集羣部署大語言模型

背景介紹 隨着大型語言模型 (LLM) 在企業應用程序中的大量使用,在本地運行模型對於數據隱私、成本控制和減少延遲變得至關重要。Ollama 簡化了本地運行 LLM,而Kubernetes則提供生產部署所需的編排。接下來我們看一下如何將大型語言模型部署在 Kubernetes 平台上。 部署 1 創建 ollama 命名空間 ollama-namespac

kubernetes , tcp , 雲計算 , ip , 語言模型

收藏 評論