tag 數據

標籤
貢獻758
666
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

u_13778063 - 為什麼 RAG 落地難?解析數據處理 “三重困境”,事件驅動架構如何破局?

作者:稚柳 前言 當企業想用大模型和內部非公開信息打造智能問答系統時,RAG(Retrieval-Augmented Generation,檢索增強生成)已成為必備技術。然而,在實際落地中,構建 RAG 應用的數據準備過程繁瑣複雜且充滿挑戰,讓很多企業和開發者望而卻步。本文將介紹構建 RAG 的最佳實踐:通過阿里雲事件總線 EventBridge 提供的多源 RAG

EventBridge , 數據 , 雲計算 , 阿里雲 , 雲服務 , 數據處理 , 結構化

收藏 評論

袋鼠雲數棧 - 某頭部能源集團“數據治理”到“數智應用”躍遷案例剖析

本案例詳細闡述了某能源集團在數據治理與指標體系建設中的實踐歷程,以及如何通過AI技術賦能指標應用,實現從"數據治理"到“數智應用”的關鍵躍遷。案例聚焦項目經營管理為主線,同時涵蓋合同、採購、合規、財務等多業務領域,系統展示了企業如何通過指標體系建設與AI融合應用,解決數據分散、語義混亂、流程不貫通、指標失真等核心痛點,最終構建起全域數據資產的標準化、結構化、貫通化治理能力。 集團痛點深度剖析 火電

數字化轉型 , 能源 , data , 數據 , 指標平台

收藏 評論

百度Geek説 - 維度爆炸背景下uv計算在Feed業務的高效實踐

導讀 本文介紹了優化大數據計算中多維度用户數統計的方法,通過數據打標的方式避免數據膨脹,提高性能並減少計算成本。首先分析了大數據計算中遇到的多維度數據統計問題,然後提出了利用數據打標進行處理的解決方案,詳細闡述了優化方案的實施步驟和效果。通過對比實驗結果,驗證了優化方案在提升性能和降低成本方面的顯著效果。最後,總結了優化方案的優勢和適用場景。 01 背景 Feed是百度App的一個重要業務組成部分

大數據處理 , 數據 , uv

收藏 評論

AI領域佈道師 - 數據入湖 架構

作者 | 蔡芳芳 採訪嘉賓 | 馬進 網易數帆平台開發專家 數據中台也要從離線為主走向實時化,湖倉一體是第一步。 數據從離線到實時是當前一個很大的趨勢,但要建設實時數據、應用實時數據還面臨兩個難題。首先是實時和離線的技術棧不統一,導致系統和研發重複投入,在這之上的數據模型、代碼也不能統一;其次是缺少數據治理,實時數據通常沒有納入

數據 , 數據入湖 架構 , 離線 , 架構 , 後端開發 , 解決方案

收藏 評論

mob64ca14116c53 - QMS-雲質-企業數字化轉型-企業質量數字化案例_質量數碼化

一、數字化轉型背景下的質量管理挑戰 隨着工業4.0時代的深入推進,製造企業面臨的質量管理環境日益複雜。傳統依賴紙質記錄與Excel表格的管理模式存在顯著缺陷:數據完整性不足、人為錯誤頻發、信息孤島林立。據統計,一家中等規模的製造企業通常需要管理超過1萬種原材料,若持續採用人工記錄方式,不僅效率低下,更難以保障數據的準確性與可追溯性。例如,質量信息分散在研發、生產

spark , 大數據 , 數據 , 項目經理 , 質量管理

收藏 評論

wx6218aeded7a51 - 簡易睡眠分析儀

代碼功能概述 這段代碼實現了一個智能睡眠質量分析器應用,專注於監測、分析和改善用户的睡眠質量。主要功能包括: 睡眠記錄追蹤:記錄每日睡眠時間、入睡時間和醒來時間 睡眠質量評估:基於多個維度自動評估睡眠質量 睡眠週期分析:分析深睡、淺睡和REM睡眠分佈 睡眠環境監測:記錄卧室温度、光照和噪音水平 智能建議系統:根據睡眠數據提供個性化改善建議 睡眠

華為 , 微信開發 , 移動開發 , 數據 , lua , text , harmonyos

收藏 評論

blueice - go語言併發原理和機制【二】

目錄 Go語言協程機制詳解 一、協程的基本概念與特點 二、GPM調度模型詳解 1. GPM模型組成 2. 調度機制 3. 調度模型參數 三、協程間通信方式 1. Channel通信 2. 共享內存與鎖 3. 條件變量

sed , 數據 , Css , 前端開發 , go , HTML

收藏 評論

angel - AI:大力出奇跡?Bigger is better?AI下一代浪潮?—人工智能的大語言模型(LLMs)的簡介、發展以及未來趨勢

岐金蘭指出了一個根本性的方向:下一代AI的突破,將不再侷限於“語言理解”的範式內優化,而是邁向“行為理解與生成”的新範式——即“大行為模型”。 這並非簡單的技術升級,而是一場認知架構的範式革命。 以下是對這一構想的剖析與延伸: 一、核心理念:從“符號世界”到“行為世界” · 大語言模型(LLM)的本質侷限:當前LLM本質上是符號(語言)

數據 , 後端開發 , 行為模型 , 原語 , Python

收藏 評論

ceshiren2022 - 【乾貨】如何從軟件測試轉型為AI測試開發?這份面試題指南值得你一看!

你是軟件測試從業者,但想轉向人工智能測試開發崗位嗎? AI 測試崗位不僅考察傳統測試技能,還要求你理解 AI/ML 模型特性、設計測試流程、編寫自動化腳本。 今天,我們整理了一份面試題,從基礎概念到實戰場景,幫你快速掌握 AI 測試面試要點。 一、基礎認知題:AI 面試入門必備 AI、ML、DL 的區別? • ML 是 AI 的子集,通過數據學習規律; • DL 是 ML

面試題 , 數據 , 人工智能 , 深度學習 , 灰度 , ML

收藏 評論

拓端tecdat - 專題:2025中國醫療器械出海現狀與趨勢創新發展研究報告|附160+份報告PDF、數據、可視化模板彙總下載2025全球醫療器械報告-創新與效率平衡之道320+份彙總解讀|附PDF下載

2024年,中國醫療器械行業正站在“從本土領先到全球突圍”的關鍵節點——一邊是邁瑞醫療把監護儀賣到190多個國家,海外營收佔比超48%;一邊是不少企業卡在歐盟MDR認證環節,臨牀數據補了3次仍未通過。這種“一邊風光一邊難”的反差,本質是全球醫療需求擴張與國內競爭加劇的必然結果。 引言 從核心數據看,2024年全

大數據 , 數據 , 腦機接口 , pdf , 人工智能 , 前端開發 , Javascript

收藏 評論

子丶不語 - AI 如何改變我們的日常生活

人工智能(AI)在2026年已深度融入我們的日常,從起牀到入睡,幾乎無處不在。它不僅提升了效率,還帶來了高度個性化和智能化的體驗。根據最新數據,全球AI市場規模已超過5000億美元,許多人每天與AI互動超過100次。下面,我們從更多場景詳解AI的實際影響,結合真實案例和數據,讓內容更豐富生動。 智能助手:一天的智能起點 早晨醒來,你對手機或智能音箱説:“早安,今天的日

AIGC二三事 , 數據 , app , google , AI寫作 , aigc

收藏 評論

上海拔俗網絡 - AI大模型費控系統:用技術重構企業花錢邏輯

對企業而言,費用管控從來不是“算對賬”那麼簡單——人工錄單耗時長、審核靠經驗漏判多、合規風險藏在細節裏,這些痛點長期困擾着財務與業務人員。AI大模型的介入,不是給傳統費控加個“智能插件”,而是用多維度技術重構全流程,讓費控從“事後核對”變成“事前預判、事中管控”。 核心技術支柱之一,是AI驅動的多模態識別與信息處理。傳統OCR僅能提取文字,而融合大模型的費控系統,通過卷積神經網絡(C

機器學習 , 風控 , 數據 , NLP , 人工智能

收藏 評論

mob64ca1411a6fc - python實現實時監控_基於 Python 的交換機實時監控系統的設計與實現_weixin

內容:1.摘要 隨着大數據技術的快速發展,海量數據處理系統的複雜性日益增加,對系統運行狀態的實時監控提出了更高要求。本文設計並實現了一個基於Python Web的大數據系統監控平台,旨在提升系統可觀測性與運維效率。平台採用Flask作為Web框架,結合InfluxDB時序數據庫和Grafana可視化工具,實現了對Hadoop、Spark

經驗分享 , 大數據 , 數據 , 開發語言 , Css , 前端開發 , HTML , Python

收藏 評論

mb58f33267314e7 - AI工具 vs AI夥伴:3個核心差異,幫你重新定義AI使用方式

AI從“能做事”進階到“會懂人”,我們對它的認知也正在經歷一場關鍵迭代——從“工具”到“夥伴”的跨越,不僅是使用場景的拓展,更藏着技術邏輯與交互模式的本質差異。很多人困惑於“同樣是用AI,為什麼有人只把它當效率插件,有人卻能讓它成為成長助力?”核心答案,就藏在“工具式使用”與“夥伴式協作”的底層邏輯裏。今天,我們就從3個核心維度,拆解兩者的差異,幫你重新定義AI的使用方式。

數據 , 職場規劃 , aigc , bard , 迭代

收藏 評論

YDFM - PHP輕鬆處理千萬行數據的方法詳解

説到處理大數據集,PHP 通常不是第一個想到的語言。但如果你曾經需要處理數百萬行數據而不讓服務器崩潰或內存耗盡,你就會知道 PHP 用對了工具有多強大。PHP 高效處理數據流的能力,配合流量控制和生成器等內存管理策略,為處理海量數據集(比如 CSV 文件)開闢了新路徑,既不影響性能也不損害可靠性。 説清楚——一口氣處理 1000 萬行數據可不是小事。挑戰不僅在於處理海量原始

數據 , php , 加載 , Css , 前端開發 , HTML

收藏 評論

mob649e8155b018 - 多模態 Diffusion

在當前的信息時代,多模態 Diffusion 已經成為了人工智能和計算機視覺領域的熱門話題。它的應用包括圖像生成、文本理解和多模態信息處理等領域,同時面臨着如何有效融合和生成不同模態信息的挑戰。本文將對多模態 Diffusion 的背景、原理、架構、源碼及應用場景進行詳細探討,為讀者提供一個全面的理解。 背景描述 隨着人工智能技術的快速發展,多模態 Diffusion 模型因其能

數據 , aigc , 應用場景 , 模態

收藏 評論

lemon - linux hive 重定向到文件

1、數據流重定向:將某個命令執行後應該出現在屏幕上的數據,給它傳輸到其他地方去 2、(1)---標準輸入(stdin):代碼為0,使用 或 ; (2)標準輸出(stdout):代碼為1,使用或者 ; (3)標準錯誤輸出(stderr):代碼為2,使用 2或者 2. 説明:1:以覆蓋的方法將 [正確的數據]輸出到指定的文件或者設備上;    1:以累加的方法將

linux hive 重定向到文件 , 大數據 , 數據 , hive , 重定向 , 標準輸出

收藏 評論

二川bro - 【python 已解決】 ‘ValueError: invalid literal for int() with base 10’解決方案深度解析

【python 已解決】 ‘ValueError: invalid literal for int() with base 10’解決方案深度解析 在Python編程中,ValueError: invalid literal for int() with base 10是一個常見的錯誤,它通常表明在嘗試將字符串轉換為整數時,字符串中包含了無

字符串 , 移動開發 , 數據 , Android , JAVA , html5 , Python

收藏 評論

西洋無悔 - 百度AI開放平台-全球領先的人工智能服務平台

引言 在人工智能技術迅猛發展的浪潮中,自然語言處理(NLP)領域正經歷着前所未有的變革,預訓練語言模型(PLM)已然成為驅動行業創新的核心引擎。百度最新發布的ERNIE-4.5模型系列,憑藉其突破性的架構設計與卓越的跨場景處理能力,迅速在技術社區與產業應用中引發廣泛關注。本文將從技術架構的底層創新、核心功能的場景化落地、多維度性能測評三個層

編碼器 , 數據 , MySQL , 數據庫 , 模態

收藏 評論

數據分析大師 - 為什麼刷rom之前要擴容system

作為FPGA的初學者,在調用IP核時會發現其中的 ROM 和 RAM 是在同一個地方,但是不知道它們到底有什麼區別呢?下列我根據自己的理解説説吧。 RAM 可以理解為緩存吧,就是把系統即將要用到的數據存儲在 RAM 中,以便於在使用時隨時讀取出來。RAM 中的數據可隨時進行寫入和讀取,在斷電後會將數據全部清空,所以 RAM 不能用來長時間儲

機器學習 , 數據 , ip , ROM區別 , 人工智能 , RAM , 為什麼刷rom之前要擴容system

收藏 評論

畢設大神 - 基於協同過濾算法的運動場館服務平台設計與實現-計算機畢業設計源碼+LW文檔

摘要 在運動行業蓬勃發展以及數字化轉型加速的背景下,運動場館服務的高效管理與個性化體驗需求日益凸顯。傳統的運動場館管理方式效率低下,難以滿足用户多樣化需求,而新興的數字化平台能夠整合資源,提升服務質量與運營效率。因此,開發一個功能完善、體驗良好的運動場館服務平台具有重要的現實意義。 本平台的開發有諸多技術要求。後端採用Java語言與Sprin

數據 , 推薦系統 , 後端開發 , 協同過濾算法 , JAVA

收藏 評論

上海拔俗網絡 - AI 大模型數字化監測系統:用智能技術重構監測新範式

傳統數字化監測多是“數據採集 + 簡單統計”,只能被動呈現數據結果,難以及時捕捉隱藏風險、預判趨勢變化。AI 大模型數字化監測系統的核心突破,是讓監測從“看數據”升級為“懂數據、判趨勢、提方案”,靠大模型的語義理解與推理能力,打通“數據採集-智能分析-決策輸出-閉環優化”全鏈路,成為業務管控的“智能大腦”。其技術邏輯不復雜,本質是用大模型賦能監測,實現數據價值的深度挖掘。 系統技術根

數據 , 上傳 , 數據採集 , NLP , 人工智能

收藏 評論

程序員愛釣魚 - Python 編程實戰 · 進階與職業發展:數據分析與 AI(Pandas、NumPy、Scikit-learn)

數據分析與人工智能是 Python 最強的應用領域之一。從基礎的數組運算,到高維數據處理,再到機器學習建模,Python 已經形成了一個完整且成熟的科學計算生態體系。 而這三大工具庫正是核心: NumPy:高性能數值計算基礎 Pandas:結構化數據處理與分析 Scikit-learn:機器學習建模全流程 如果説真實世界的數據分析是一條

數據 , numpy , 後端開發 , Python

收藏 評論

mob64ca140761a4 - 離線使用hanlp裏的模型需要什麼操作

ETL測試分為離線ETL和實時ETL測試。 實時ETL的測試點: 鏈路數據的一致性   主要驗證每個鏈路節點數據消費的一致性,重點確保整個鏈路各個節點的數據處理和消費情況一致,也就是通過對數據消費的分時、分頻率對比完成一致性驗證。    natural-flow:自然消費的數據流,是源於線上真實的數據消息通道,即自然頻率

離線使用hanlp裏的模型需要什麼操作 , 鏈路 , 數據丟失 , 數據 , NLP , 人工智能

收藏 評論