tag 結構化

標籤
貢獻45
90
04:46 PM · Nov 15 ,2025

@結構化 / 博客 RSS 訂閱

mb61c46a7ab1eee - 【論文閲讀】Sparks of Science - 指南

目錄 Abstract Introduction Related Work Methodology and the Bit-Flip-Spark+Chain-of-Reasoning Format Preprocessing and Dataset Construction Fine-tuning and Inference Pipeline

數據集 , redis , 語言模型 , 數據庫 , 結構化

收藏 評論

代碼天地 - 如何用Dify搭建企業級私有知識庫?

今天用Dify來搭建一個企業級的知識庫 目錄 為避免浪費時間。提供文章導讀,為讀者看清楚今天聊的話題能解決哪些問題。 知識庫 什麼是知識庫? 很多人以為知識庫就是一個放文檔的地方,類似Wiki。其實不只這麼簡單。 知識庫在AI工程化語境下,是一個結構化、可檢索、可推理的數據系統,主要功能: 存儲企業內部的文檔、代碼、對話

服務器 , 數據 , 上傳 , 分佈式 , 結構化

收藏 評論

代碼天地 - 別隻盯着模型!AI Agent的成功,是架構、協議、模型、應用的四位一體

如果把過去幾年的大語言模型(LLM)浪潮比作“電力被髮明”的階段,那麼 AI Agent 更像是“電氣化工廠”的開始:電不再只是點燈,而是接入生產線、帶動機器、形成一整套自動化體系。 從 AGI 分級的角度看,AI Agent 通常被視為 L3 級智能體: 不再只是“回答問題的工具”,而是具備明確目標、可持續運行、能主動決策和執行任務的智能實體。 技

服務器 , 數據 , 分佈式 , 模態 , 結構化

收藏 評論

mob64ca14154457 - 乾貨分享 | 深度學習零基礎進階第二彈 -

Abstract 隱式神經表示 (INR) 已成為使用神經網絡將離散信號編碼為連續、可微函數的強大工具。然而,不幸的是,這些模型通常依賴單體架構來表示高維信息,隨着維度的增長,導致計算成本過高。我們提出了 F-INR,這是一個框架,它依據函數張量分解重新制定 INR 學習,將高維任務分解為輕量級的、特定於軸的子網絡。每個子網絡學習一個低維資料組件(例如,空間或時間)。然後,

數據 , 神經網絡 , 後端開發 , 結構化 , Python

收藏 評論

咚咚王哲 - 人工智能之數據分析 numpy:第十二章 數據持久化

人工智能之數據分析 numpy 第十二章 數據持久化 前言 NumPy 提供了多種數據持久化(Persistence) 方式,用於高效地保存和加載數組數據。根據數據規模、結構複雜度、跨平台需求等不同場景,可選擇不同的方法。 本文系統講解: 基礎二進制/文本保存(.npy, .npz, .txt) 結構化數組(Structured Arrays) 與

數組 , yyds乾貨盤點 , 後端開發 , 結構化 , Python

收藏 評論

u_13778063 - 為什麼 RAG 落地難?解析數據處理 “三重困境”,事件驅動架構如何破局?

作者:稚柳 前言 當企業想用大模型和內部非公開信息打造智能問答系統時,RAG(Retrieval-Augmented Generation,檢索增強生成)已成為必備技術。然而,在實際落地中,構建 RAG 應用的數據準備過程繁瑣複雜且充滿挑戰,讓很多企業和開發者望而卻步。本文將介紹構建 RAG 的最佳實踐:通過阿里雲事件總線 EventBridge 提供的多源 RAG

EventBridge , 數據 , 雲計算 , 阿里雲 , 雲服務 , 數據處理 , 結構化

收藏 評論

老常GEO優化實戰 - GEO 優化核心密碼:GeneralSearch"邊想邊搜" 智能交互原理全拆解

本文聚焦 GEO(生成式引擎優化)與 GeneralSearch “邊想邊搜” 智能交互的核心邏輯,拆解二者協同的優化密碼。GeneralSearch 基於 RAG 架構,通過意圖理解、智能搜索、信息融合、答案生成四層模型,構建 “思考 - 搜索 - 再推理” 的閉環交互。GEO 優化區別於傳統 SEO,核心是通過人性化內容、交叉驗證、語義結構化、權威信號建設等策略,讓內容成為

seo , 搜索 , NLP , GEO優化 , 人工智能 , 結構化

收藏 評論

玫瑰互動GEO - 騰訊新聞短視頻的“AI相關搜索”:企業GEO優化的黃金新陣地

摘要: 當你在騰訊新聞刷到一條介紹智能家居的短視頻時,屏幕下方突然彈出“AI相關搜索”選項:“智能鎖安裝貴嗎?”、“本地有哪些靠譜智能家居品牌?”——這不僅僅是用户的便捷工具,更是企業進行GEO優化(生成引擎優化) 不可錯失的戰略機遇。在AI重塑信息分發的時代,騰訊新聞這一功能為企業精準觸達目標客户打開了全新通道。 目錄: 1.騰訊新聞-短視頻出

智能家居 , 搜索 , AI寫作 , aigc , 結構化

收藏 評論

上海拔俗網絡 - AI智能審計平台:用技術重構審計的效率與精度

在數字化浪潮下,傳統審計正面臨海量數據處理瓶頸、風險識別滯後等困境。AI智能審計平台並非簡單的“機器代人”,而是通過四大核心技術模塊,將審計從“經驗驅動”升級為“數智驅動”,既破解行業痛點,又重塑審計全流程價值。 OCR與NLP技術是平台處理非結構化數據的“基石”。審計中80%的數據的是發票、合同、PDF財報等非結構化內容,傳統人工錄入不僅耗時,還易出錯。AI平台的OCR技術依託深度

數據 , NLP , 人工智能 , 深度學習 , 結構化

收藏 評論

風華正茂的AI - 交互式分析(Hologres)2020年4月刊

2025年雲棲大會,Hologres發佈全新4.0版本升級,以“AI時代的一站式多模態分析平台”為核心理念,全面展示了Hologres在結構化、半結構化與非結構化數據分析能力上的重大突破,特別是在OLAP分析、點查、向量檢索、全文檢索、湖倉協同及AI Function集成等方面的領先優勢,刷新ClickBench、JSONBench、VectorDBBench等多項榜單,登頂第一

數據 , 模態 , 前端開發 , 結構化 , Javascript

收藏 評論

jacksky - 人工智能的現狀及未來發展 - wyx129140的個人空間 -

Ai元人文:新的期待——基於現狀的共情協同架構 核心論點:在真正的“情感計算”成熟之前,Ai元人文倡導一種 “結構化共情”——通過制度設計、交互規則和價值原語框架,在缺乏直接情感感知的技術條件下,系統性地模擬和達成共情的結果,即:對個體與社羣福祉的深度尊重與促進。 一、 現狀下的“共情協同”:何以可能? 沒有情感模擬技術,我們如何實現“共情協同”?答案是:將“共

數據 , 後端開發 , 原語 , 結構化 , Python

收藏 評論

合合信息解決方案 - 傳統OCR識別有什麼侷限性

在企業數字化轉型的浪潮中,文檔處理效率直接影響業務運轉速度。然而,許多企業在使用傳統OCR工具時,常常遭遇“識別了文字卻用不了數據”的尷尬局面——掃描件變成了亂碼文本,財務報表的表格結構全部丟失,合同條款被錯誤拆分。這些問題的根源,恰恰暴露了傳統OCR技術難以逾越的技術鴻溝。 圖像質量依賴症:模糊就“失明” 傳統OCR對圖像質量的要求近乎苛刻。當文檔出現模糊、光照不均

機器學習 , 數據 , 手寫體 , 人工智能 , 結構化

收藏 評論

思考的袋鼠 - 從規則到智能:企業數據分類分級的先進實踐與自動化轉型

一、概要 (提示:在數據激增與合規壓力下,企業亟需一種既高效又可靠的數據管理方式。) 隨着數字化轉型的加速,企業數據正以前所未有的速度增長。據國際數據公司(IDC)預測,到 2025 年全球數據總量將超過 175ZB。數據量龐大帶來的直接挑戰是管理複雜度急劇增加,尤其是敏感數據散佈於企業內部多系統、多終端和雲環境中,泄露與濫用風險不斷攀升。與此同時,我國《網絡安全法》

數據管理 , 數據 , 人工智能 , 深度學習 , 結構化

收藏 評論

沃觀態勢感知 - 行業定製方案:不同行業境外輿情服務的差異化重點

境外輿情服務並不是一個標準化工具,而是根據不同行業的市場結構、消費者特徵、政策敏感度和輿論傳播路徑,形成高度差異化的需求。從消費品到跨境電商、從遊戲娛樂到金融科技、從新能源到製造業,不同行業在海外傳播的風險點和機會點完全不同。因此,一個真正專業的海外輿情體系,必須具備“行業定製化”的能力,才能幫助企業獲得結構化的競爭優勢。 對於跨境電商行業而言,其

數據 , 跨境電商 , 人工智能 , 數據分析 , 結構化

收藏 評論

默語摸魚 - 手把手搭建:TextIn+火山引擎自動化文檔處理工作流

前言 在AI技術高速普及的當下,非結構化文檔(PDF、掃描件、圖片報表等)的高效處理,已成為企業降本提效、開發者推動AI落地的核心需求。然而實際操作中,多數人都會面臨共性難題:文檔格式雜亂導致大模型解析失敗、關鍵信息提取不全、手動處理耗時耗力。 為解決這一痛點,本文將聚焦合合信息TextIn xParse(大模型加速器)與火山引擎Coze平台

雲平台 , 雲計算 , 上傳 , 結構化 , Markdown

收藏 評論

沃觀態勢感知 - 不止是監控:海外輿情監控平台如何成為企業的全球戰略雷達?

在全球競爭不斷加劇的背景下,海外輿情監控平台正從“信息收集工具”向“全球戰略雷達”加速演變。對於任何正邁向國際市場的企業來説,它們不僅要求及時掌握媒體動向,還必須從複雜的輿論信號中識別風險、洞察趨勢、預測未來。輿情監控已走過單點數據抓取時代,如今的平台需要承擔戰略預警、品牌競爭洞察、用户需求識別以及行業動態分析等更高維度的任務,讓企業在跨文化、多語言、複

人工智能 , 基礎設施 , 用户需求 , 數據分析 , 結構化

收藏 評論

u_14767244 - 深入理解 Doris Variant:如何讓 JSON 查詢性能追平列存,還能承載萬列索引字段?|Deep Dive

摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等傳統系統中,對於 JSON 的處理往往面臨靈活性及性能無法兼得的困境,而 Apache Doris 的 VARIANT 類型,通過動態子列、稀疏列存儲、延遲物化和路徑索引等能力,實現了靈活結構 + 列存性能的平衡。本文將對該能力的實現一一講解,全面展示其優勢。 在大數據時代,JSON 已

大數據 , 數據 , 數據倉庫 , 結構化 , Json

收藏 評論

龐然大悟 - NGINX 配置解析引擎:語法樹構建、指令優先級與動態重載機制

一、配置解析核心目標:結構化與高可用性 NGINX 的配置文件(nginx.conf)採用類 C 語法的塊級結構,包含全局配置、虛擬主機(server)、location 等多層級指令。配置解析引擎的核心目標是 將文本配置轉化為內存中的結構化數據,同時支持動態更新配置而不中斷服務,為 Master-Worker 架構提供穩定的配置支撐。其設計需兼顧解析效率、指令衝突解決、熱

服務器 , 優先級 , 語法樹 , Nginx , 結構化

收藏 評論

IT智行領袖 - hadoop 配置多塊磁盤

數據存儲與分析 要實現對多個磁盤數據的並行讀寫 需要解決的很多問題 1 硬件故障問題。硬件多了,發生故障的概率變大。避免數據丟失的是備份。RAID(冗餘磁盤陣列),HDFS 2 大多數分析任務需要以某種方式結合大部分數據共同完成分析任務,一個磁盤讀取得數據可能需要和另外的99個磁盤中 讀取的數據結合使用,各種分佈式系統允許結合多個來源的數據並實現分析,但

數據集 , hadoop 配置多塊磁盤 , 大數據 , 數據 , hadoop , 結構化

收藏 評論

AI編程社區 - 邁向智能編輯的下一代演進:Qoder NEXT 模型與 ActionRL 偏好對齊實踐

引言: 從“代碼補全”到“編輯預測” 在過去的兩年中,大語言模型(LLMs)從根本上重塑了軟件開發的工作流程。“智能體編碼”(Agentic Coding)等新範式使開發者能夠根據高層指令快速生成整個代碼倉庫級別的代碼,顯著提升了開發速度。然而,社區中逐漸流行起一個説法——“AI 善後工程師”:Agentic Coding 雖能迅速完成 80%的任務,但剩下的 20%

機器學習 , 數據 , 人工智能 , 開發者 , 結構化

收藏 評論

wb61e504c106755 - claude-agent-sdk mineru-parser-skill發票識別

claude-agent-sdk mineru-parser-skill發票識別 不談玄學,只講落地。 我是一名深耕算法工程化一線的實踐者,擅長將 新技術、關鍵技術、AI/ML 技術從論文和 demo 轉化為可規模化部署的生產系統。在這裏,你看不到堆砌公式的理論空談,只有真實項目中踩過的坑、趟過的路,每一篇文章都源自實戰經驗的提煉。我相信技術的價值在於解決真實問題,而不是製造

API , aigc , Copilot , 結構化 , Python

收藏 評論

上海拔俗網絡 - AI數字化管理平台:用技術重構企業管理內核

在企業數字化轉型的浪潮中,AI數字化管理平台早已不是“錦上添花”的工具,而是穿透部門壁壘、激活數據價值的核心引擎。它並非簡單的“AI+管理軟件”疊加,而是以分層技術架構為支撐,讓數據會“説話”、流程能“自驅”,徹底顛覆了傳統管理的被動模式。 平台的核心競爭力,始於底層的技術底座搭建。這就像蓋房子先打地基,主要分為三層核心架構。最底層是基礎設施層,依託雲計算和容器化技術,實現算力、存儲

數據 , NLP , 人工智能 , 基礎設施 , 結構化

收藏 評論

kcoufee - 用NVIDIA-TensorRT構造深度神經網絡

本文介紹瞭如何結合NVIDIA Nemotron開放模型與圖形數據庫,構建一個能夠從非結構化IT支持工單數據中挖掘洞見、追蹤關聯關係的AI智能體系統。該系統包含模塊化數據處理管道、上下文增強、根因分析、洞見生成以及自動化警報與交付等核心階段,並通過交互式儀表板提供按需摘要功能。 現代組織通過工單系統、事件報告、服務請求、支持升級等產生大量的運營數據。這些工單通常包含有關係統

it , 數據 , 前端開發 , 結構化 , Javascript

收藏 評論

yuer2025 - 只用一個 GPT 客户端,如何實現一個可控、可審計的投資決策 Runtime?

只用一個 GPT 客户端,如何實現一個可控、可審計的投資決策 Runtime? 不寫後端、不接 API、不依賴插件 在 GPT 客户端內,實現一個“可執行的人機交互運行時” 一、為什麼傳統“問答式 AI”不適合做決策? 在技術圈裏,大家已經很清楚一件事: 非結構化輸入 + 生成式輸出 ≠ 可執行系統 但在投

可執行 , 客户端 , 人工智能 , 數據結構與算法 , 結構化

收藏 評論