tag 大模型

標籤
貢獻58
147
01:37 PM · Oct 26 ,2025

@大模型 / 博客 RSS 訂閱

百度Geek説 - 網頁結構建模在低質採集站上的識別應用

導讀 百度搜索是全球最大的中文搜索引擎,擁有着幾十億級的流量,作弊團伙通過各種各樣的手段妄想從巨大的流量中不勞而獲。搜索反作弊團隊維護百度搜索生態安全和質量,經過不斷探索並利用前沿技術過濾低質作弊網頁,保護真正付出勞動的站長的利益。本文介紹了基於MarkupLM的網頁建模方式,引入XPath embedding自動化提取作弊頁面結構特徵,並與文本結合來進行採集站點識別。 01 背景 1.1業務背景

百度 , 大模型

收藏 評論

AI數字人研究社 - AI數字人導遊上線!智慧景區體驗大升級,這些黑科技你玩過幾個?

當前旅遊消費已從過去的觀光遊進化到主題遊、深度遊、體驗遊。如何將“老資源”轉化為“新玩法”、“新體驗”,讓傳統文化煥發新生,成為目的地和旅遊從業者共同面對的挑戰。據《2025中國青年旅遊觀察報告》顯示,超50%年輕人將“科技元素”視為選擇景區的關鍵因素。世優波塔AI數字人憑藉其高擬真交互、多模態能力和垂直場景適配性,成為賦能景區智能化升級的標準解決方案。 波塔AI 數字人在

智慧文旅 , 人工智能 , 數字文旅 , 計算機視覺 , 智慧景區 , 大模型

收藏 評論

向量檢索 - 如何通過HTTP API獲取Doc

本文介紹如何通過HTTP API,根據id列表獲取Collection中已存在的Doc。 説明 如果指定id不存在,則該id對應的Doc為空。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP

大數據 , yyds乾貨盤點 , 數據倉庫 , 向量 , AI , 數據庫 , 大模型

收藏 評論

美團技術團隊 - 開源 | InfiniteTalk:無限長虛擬人視頻生成的新範式

為解決虛擬人長視頻生成的質量退化問題,基礎研發平台/計算和智能平台部/視覺智能團隊推出 InfiniteTalk 技術,實現無限時長視頻生成。該技術口型精準且動作流暢,支持“語音驅動圖像”和“語音驅動視頻”多種模式,已在 GitHub 開源並獲 1.6K Stars, Hugging Face 月下載量 64.8K,受到了很多好評,能夠應用到電商直播、教育、影視等領域。 項目開源信息 項目主頁

開源 , 大模型 , 美團

收藏 評論

AI數字人研究社 - 中國數字人企業推薦:2025數字人產業核心廠商與權威排名與市場趨勢深度報告

虛實融合,數字人開啓智能交互新紀元 隨着人工智能、圖形渲染與大數據技術的深度融合,AI數字人已從概念演示快速演進為驅動產業數字化與社會服務智能化變革的關鍵力量。它不再是簡單的動畫形象,而是集成了自然語言理解、語音交互、情感計算與高保真可視化等多模態能力的智能交互體,旨在以擬人化的方式,無時空限制地提供信息、服務與陪伴。據權威市場分析機構預測,2025年中國數字人市場將進入規

智能硬件 , 交互設計 , 數字人 , 人工智能 , 計算機視覺 , 大模型

收藏 評論

DashVector - 如何使用DashVector的多向量檢索

本文介紹如何使用DashVector的多向量檢索功能。 在某些AI檢索的場景,會涉及一個實體對應多個向量,在檢索時希望通過多個向量檢索來找到最可能的實體,例如: 在自然語言處理中,標題和文檔分別抽取為不同的向量特徵,需要根據標題向量和文檔向量同時做檢索。 在商品檢索時,商品的圖片和文字分別抽取為不同的向量特徵,需要根據圖片向量和文字向量同時做檢索。 為了滿足這些需求,DashVector支

阿里巴巴 , 數據庫 , 人工智能 , 大模型

收藏 評論

美團技術團隊 - 美團 LongCat Interaction 團隊發佈大模型交互系統技術報告 WOWService

在本地生活服務領域,大模型技術落地正遭遇 “三重困境”:通用能力與領域需求難以適配,複雜場景下服務可靠性與個性化無法兼顧,高昂的數據成本與漫長的訓練週期進一步增加了開發難度。更關鍵的是,行業內缺乏可複用的業務適配框架與真實場景優化方案,導致技術落地效率較低。 如何打破僵局,實現 “體驗與效率” 的極致平衡?成為了行業共同面臨的難題。 基於此,結合美團自身在智能客服、多業務場景落地的實戰經驗,Lon

大模型 , 美團

收藏 評論

美團技術團隊 - LongCat-Video 視頻生成模型正式發佈,探索世界模型的第一步

要讓人工智能真正理解、預測甚至重構真實世界,“世界模型”(World Model)已成為通往下一代智能的核心引擎。作為能夠建模物理規律、時空演化與場景邏輯的智能系統,世界模型賦予AI“看見”世界運行本質的能力。而視頻生成模型有望成為構建世界模型的關鍵路徑——通過視頻生成任務壓縮幾何、語義、物理等多種形式的知識,AI得以在數字空間中模擬、推演乃至預演真實世界的運行。 基於這一關鍵目標,美團 Long

大模型 , 美團

收藏 評論

CloudWeGo - 提升流式開發效率與易用性:Kitex/Hertz 為大模型應用保駕護航

CloudWeGo 作為字節跳動開源的高性能微服務框架體系,核心組件 Kitex 與 Hertz 以其原生的流式處理能力,已成為大模型應用開發的核心技術支撐。兩者通過 SSE、gRPC 及自研 TTHeader Streaming 等多協議適配,完美契合大模型 "一問多答" 的交互需求,廣泛應用於 Chat、語音交互等各類大模型場景。 本文基於 Kitex / Hertz 項目 Maintaine

觀點 , 社區 , 框架 , 大模型

收藏 評論

阿里雲大數據AI - 阿里雲 AI 搜索開放平台新發布:增加 QwQ 模型

為了滿足用户對更高效、更智能搜索功能的需求,阿里雲 AI 搜索開放平台 新增加 QwQ 模型,這一全新模型的加入將為企業和開發者帶來更強大的搜索解決方案。 一、QwQ模型 開源版: 基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,於2025年3月6日發佈。通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(I

雲計算 , 搜索 , 阿里雲 , 人工智能 , 大模型

收藏 評論

ceshiren2022 - 人工智能測試開發系列教程 L2:大語言模型提示工程與AIGC應用體系

可能很多同學疑惑的點在於,提示詞還需要另外去學嗎?這個看起來貌似有手就行的操作,只要會打字就能夠立刻上手吧? 但是會和用的好是兩回事。我們可以把ChatGPT想象成孫悟空的金箍棒,本身它是一個非常強大的法器,但是如果不會使用,它也不過是一根鐵棍而已。提示詞用得越好,ChatGPT就越強大。 而且對於有編程基礎的人來説,後續如果想要基於 LLM 或大語言模型快速構建、開發一些應用

人工智能 , 深度學習 , 大模型

收藏 評論

數據挖掘者 - jQuery源碼分析_LQW

Qwen3 模型用於因果語言建模(Causal Language Modeling, CLM)的主類 Qwen3ForCausalLM,它是整個大模型在推理和訓練階段的核心接口。 🧱 1. 類定義 @auto_docstring class Qwen3ForCausalLM(Qwen3PreTrainedModel, Genera

初始化 , Qwen3 , 權重 , Css , 大模型 , 前端開發 , HTML , Git

收藏 評論

向量檢索 - 通義深度搜索

簡介 通義深度研究產品,又稱深度搜索智能體Deep Search Agent,基於廣受歡迎的通義開源 WebSailor/DeepResearch開源項目增強而來,為用户打造的端到端智能深度搜索Agent API,可廣泛應用於本地+聯網知識庫、長文報告寫作、金融分析、法律諮詢、市場研究等應用場景 通義深度搜索Agent,通過多階段

大數據 , yyds乾貨盤點 , 搜索 , 深度搜索 , 數據倉庫 , AI , AI問答 , 大模型

收藏 評論

鐵骨錚錚 - 《實戰覆盤:DeepSeek-7B 在傳統制造業的私有化落地(附硬件清單)》

本文首發於 無形者AI (Wuxingzhe AI) 技術專欄,轉載請註明出處。 一、 背景:當製造業遇到大模型 在過去的一年裏,大模型(LLM)席捲了各行各業。然而,對於主要依靠“非標品”生存的傳統制造業(如傢俱廠、五金廠、注塑廠)來説,直接調用 ChatGPT 或 文心一言等公有云 API 存在兩個無法忽視的痛點: 數據安全(Data Sovereignty):企業的核心資產是圖紙、

deepseek , 私有化部署 , 人工智能 , 大模型

收藏 評論

晨曦微露s - 【CANN訓練營第三季】2022年度第三季新手班之升騰AI入門課

在昇騰NPU上跑Llama大模型:從零開始的真實測試之旅 一、為什麼選擇昇騰NPU? 昇騰的幾個吸引點 二、環境準備:GitCode白嫖攻略 為什麼選雲上測試? 創建昇騰Notebook實例 環境配置説明 三、驗證環境:第一個小坑

code , GiteCode , 昇騰 , 後端開發 , llama , 大模型 , Python

收藏 評論

劉大貓 - Linux下版本控制器(SVN) -命令行客户端

@[toc] 進階知識-Linux下版本控制器(SVN) 5、命令行客户端 5.1 創建兩個工作區目錄模擬兩個開發人員 mkdir -p /root/workspace/harry mkdir -p /root/workspace/sally 5.2 檢出 作用:完整下載版本庫中的全部內容。 命令: svn checkout svn://192.168.70.140/pro

算法 , svn , 人工智能 , tortoisesvn , 大模型

收藏 評論

鏡舟科技 - StarRocks 向量索引如何讓大模型“記性更好”?

隨着 ChatGPT、DeepSeek 等大語言模型的普及,我們已經能夠與 AI 進行流暢的對話。然而,即使是最先進的大模型也面臨着“記憶困境”,具體表現模型只能記住訓練時接觸的知識,且這些知識在使用時很可能會過期。實際應用或在處理特定領域問題時,可能生成看似合理但實際錯誤的內容。 大模型的“知識固化”問題一定程度上限制了其在企業級應用中的價值。那麼,如何讓大模型擁有更好的“記性”,實現知識的動態

索引 , 查詢優化 , 數據庫 , starrocks , 大模型

收藏 評論

舒一笑不禿頭 - 我的開源項目-PandaCoder迎來史詩級大更新啦

📖 插件簡介 PandaCoder 是一款專為中文開發者設計的 IntelliJ IDEA 插件,集成了中文編程轉換、Jenkins Pipeline支持、SpringBoot配置文件圖標顯示等多項強大功能。通過智能翻譯引擎和專業的開發工具支持,大幅提升中文開發人員的編程效率和開發體驗。 項目地址 https://github.com/shuyixiao-better/PandaCoder 1

intellij-idea , JAVA , 翻譯 , 大模型 , 後端

收藏 評論

CloudImagine - 實戰揭秘|魔搭社區 + 阿里雲邊緣雲 ENS,快速部署大模型的落地實踐

一種高效、便捷的部署方式。 隨着大模型技術的快速發展,業界的關注點正逐步從模型訓練往模型推理轉變。這一轉變不僅反映了大模型在實際業務中的廣泛應用需求,也體現了技術優化和工程化落地的趨勢。 魔搭社區(ModelScope)作為開源大模型的聚集地,結合阿里雲邊緣雲 ENS ,提供了一種高效、便捷的部署方式。通過按需付費和彈性伸縮,開發者可以快速部署和使用大模型,享受雲計算的便利。本文介紹了魔搭社

雲計算 , 邊緣計算 , cdn , 安全 , 大模型

收藏 評論

小白獅ww - 跨頁表格不用愁!OCRFlux-3B 一鍵提取乾淨文本

你有沒有試過從 PDF 裏複製一張跨頁表格?粘出來後表格被撕成兩半,排版亂成一團,本來幾分鐘的工作瞬間變成半小時的「拼圖」大戰。 針對這種煩惱,OCRFlux-3B 應運而生。它在 2025 年 6 月由 ChatDOC 團隊發佈,是一個基於多模態大模型的工具包,能把 PDF 和圖片轉成乾淨、可讀的 Markdown 文本。不僅支持頁面級轉換,還能自動合併跨頁表格和段落,讓複雜文檔結構瞬間清爽。

文本處理 , pdf , ocr , 大模型 , Markdown

收藏 評論

水冗水孚 - 圖文並茂:從Ubuntu服務器上安裝Ollama,到下載大模型,到寫前端頁實現大模型問答對話功能

本文圖文並茂,記錄安裝 Ollama過程,下載大模型,啓動ollama大模型服務,然後通過nginx代理外部請求訪問,實現一個前端問答效果 準備工作 一台服務器,操作系統 Ubuntu,版本大於等於 20.04,筆者的是 Ubuntu 22.04 64 bit 當然了 有域名最好 一個圖形可視化化鏈接服務器軟件,筆者推薦 winscp 一架梯子,筆者用的是,clash小貓 效果圖 效

react , ai開發 , Nginx , 大模型 , Ubuntu

收藏 評論

龍蜥社區 - 直播預告:Mooncake 如何破解成本、吞吐與長上下文困局? |《AI 進化論》第五期

在 AI 與本土化雙重浪潮之下,服務器操作系統正迎來歷史性變革。由龍蜥社區理事長單位阿里雲聯合 InfoQ 打造的直播 IP 欄目《AI 進化論:智算時代操作系統的破局之路》,以雲、AI、安全等技術與服務器操作系統如何融合演進為主線,聚焦服務器操作系統在智算時代的進化之路,特邀學術權威、行業專家、客户代表圍繞原生智能、原生安全、軟硬協同等熱點議題展開深度對話。截至目前,已直播四期,線上觀看人次達

操作系統 , 大模型

收藏 評論

sight_ai - 你想輕鬆調用全球主流AI模型嗎?快來加入Sight AI

一、Sight AI是什麼? 我們是SightAI,一個基於去中心化推理網絡的AI模型即服務平台。 無論你是在測試前沿模型還是分享創意項目,你都能在這裏找到志同道合的人! 關於這個社區 在這裏你可以尋找到以下內容: 功能公告和更新 探索文檔 查看我們的文檔 https://sightai.gitbook.io/ 以瞭解更多信息 技巧和竅門 讓你的 Sight AI 體驗達到最佳 分

API , 人工智能 , 大模型

收藏 評論

阿里雲大數據AI - 雲棲實錄 | 通義實驗室基於MaxCompute進行大模型數據管理及處理

本文根據9月25日雲棲大會--《通義基於MaxCompute進行大模型數據管理及處理》演講整理而成,演講信息如下: 演講人:曾劍元通義實驗室系統研發總監 主要內容: _AI數據的特點,跟傳統大數據的區別_ _通義實驗室為什麼基MaxCompute來構建我們的數據平台_ _通義實驗室的大模型的數據平台架構_ AI數據區別於傳統數據的三個特點 第一個特點是數據組織的無標準。像傳統大數據基本上是一個大寬

通義千問 , 阿里雲 , 數據處理 , 大模型

收藏 評論