tag 數據

標籤
貢獻758
548
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

laokugonggao - 離線數倉數據採集用户行為hive沒有

一、概述 隨着地理信息數字化的發展,大數據時代的到來。海量數據的傳輸和安全性給我們帶來巨大的困難。海量數據的傳輸受到互聯網技術和硬件的限制,佔用着較多的在線資源和線下存儲空間,產生了能源、空間、人力的成本浪費,而在傳輸數據和存儲過程中,不規範的操作造成的數據泄露,更是數據安全更須要保證或要解決的問題。 2015 年全國

大數據 , 數據 , 谷歌衞星地圖 , 離線 , hive , 離線數倉數據採集用户行為hive沒有

收藏 評論

mob64ca12e5c0c2 - StableDiffusion 臉部修復插件

StableDiffusion 臉部修復插件是一個用於生成和修復圖像中人臉部分的深度學習模型,廣泛應用於圖像編輯領域。由於日常使用中時常會遇到一些問題,因此瞭解問題背景、錯誤現象及解決方案就顯得尤為重要。 問題背景 在實施StableDiffusion臉部修復插件過程中,用户經常會遇到生成的人臉圖像模糊不清,或者是面部特徵扭曲等狀況。這類問題時常影響最終圖像的質量,造成用户體驗大

數據 , 人臉對齊 , aigc , 解決方案

收藏 評論

宇軒辭白 - 基於Redis-Shake實現Redis實時同步

一、前言 Redis-Shake是阿里雲技術團隊開源的一款Redis數據遷移與處理工具,支持數據遷移、備份、恢復和實時同步等多種功能。能夠幫助你在不同Redis環境之間穩定高效的移動數據。 核心功能 sync(同步):支持全量數據遷移和增量數據實時同步,適用於業務不停服遷移、異地容災、多活架構 dump(備份):將源Redis的數據備份到RDB文件中,適用

redis , 數據 , 私藏項目實操分享 , 運維

收藏 評論

u_14767244 - 從 Flink 到 Doris 的實時數據寫入實踐——基於 Flink CDC 構建更實時高效的數據集成鏈路

Flink-Doris-Connector 作為 Apache Flink 與 Doris 之間的橋樑,打通了實時數據同步、維表關聯與高效寫入的關鍵鏈路。本文將深入解析 Flink-Doris-Connector 三大典型場景中的設計與實現,並結合 Flink CDC 詳細介紹了整庫同步的解決方案,助力構建更加高效、穩定的實時數據處理體系。 一、Apache Doris 簡介 A

數據同步 , 大數據 , 數據 , 數據倉庫 , apache

收藏 評論

u_14767244 - 深入理解 Doris Variant:如何讓 JSON 查詢性能追平列存,還能承載萬列索引字段?|Deep Dive

摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等傳統系統中,對於 JSON 的處理往往面臨靈活性及性能無法兼得的困境,而 Apache Doris 的 VARIANT 類型,通過動態子列、稀疏列存儲、延遲物化和路徑索引等能力,實現了靈活結構 + 列存性能的平衡。本文將對該能力的實現一一講解,全面展示其優勢。 在大數據時代,JSON 已

大數據 , 數據 , 數據倉庫 , 結構化 , Json

收藏 評論

u_16366971 - 如何選擇合適的 Diskless Kafka

文章導讀 隨着越來越多企業將 Kafka 遷移至雲原生架構,AutoMQ 正逐漸成為 Kafka 用户的雲端優選。作為兼容 Apache Kafka 協議、專為雲設計的新一代發行版,AutoMQ 憑藉高性能、彈性擴展和極致成本等優勢,在全球範圍內的熱度持續攀升,GitHub Star 數也順勢突破 8k 大關。在海外社區涌現的眾多討論與推文中,我們發現了這樣一篇來自開發者的深度好文,

diskless , 數據 , 雲計算 , 雲原生 , 對象存儲 , kafka

收藏 評論

數據解碼者 - spark 被壓

因特殊業務場景,如大促、秒殺活動與突發熱點事情等業務流量在短時間內劇增,形成巨大的流量毛刺,數據流入的速度遠高於數據處理的速度,對流處理系統構成巨大的負載壓力,如果不能正確處理,可能導致集羣資源耗盡最終集羣崩潰,因此有效的反壓機制(backpressure)對保障流處理系統的穩定至關重要。 Storm和SparkStreaming都提供了反

spark , Streaming , spark 被壓 , 大數據 , 數據 , 執行過程

收藏 評論

mob64ca1405a060 - 一文詳解大規模數據計算處理原理及操作重點_weixin

文章目錄 引言 一、技術演化:大規模數據處理的三個時代 1. 石器時代 —— MapReduce誕生前的混沌狀態 2. 青銅時代 —— MapReduce的革命與標準化 3. 蒸汽機時代 —— FlumeJava/Apache Beam引領新紀元 二、MapReduc

數據 , map reduce , 後端開發 , 數據處理 , harmonyos , 大規模數據處理 , beam

收藏 評論

雲端行者 - hadoop二版本增加了什麼 hadoop2.7.6

Hadoop2.7.6學習 Hadoop的發展史 Google 爬取全球的網站,然後計算頁面的PageRank 要解決網站的問題: a:這些網站怎麼存放 b:這些網站應該怎麼計算 發佈了三篇論文 a:GFS(Google File System) b:MapReduce(數據計算方法)

大數據 , 數據 , hadoop , hadoop二版本增加了什麼 , apache

收藏 評論

mob64ca12e1497a - ollama上面可以根據語義畫圖的模型有哪些

ollama上面可以根據語義畫圖的模型有哪些?在這篇文章中,我將系統地探討這一主題,涵蓋環境準備、集成步驟、配置詳解、實戰應用、性能優化及生態擴展等多個方面,旨在為開發人員提供清晰的指引和操作流程。 環境準備 在開始使用ollama進行語義畫圖模型的開發之前,首先需要確保開發環境的搭建。以下是所需的基本依賴項及其安裝指南。 依賴項 版本

性能優化 , 數據 , aigc , 開發環境

收藏 評論

u_15214399 - 【案例共創】基於spaCy的NER模型構建與深度EDA解析:Twitter情感短語提取

最新案例動態,請查閲【案例共創】基於spaCy的NER模型構建與深度EDA解析:Twitter情感短語提取。小夥伴們快來領取華為開發者空間進行實操吧! 本案例由開發者:天津師範大學協同育人項目–翟羽佳提供 1 概述 1.1 案例介紹 社交媒體已成為全球用户表達情感與觀點的重要平台,Twitter 作為典型代表,每日產生海量文本數據。情感分析作為自然

機器學習 , 數據 , 路徑和 , 人工智能 , 開發者

收藏 評論

萬嶽教育張先生 - 教育系統小程序的架構設計:如何構建高效穩定的教育平台?

隨着教育行業的數字化轉型,教育系統小程序已成為一種重要的教學和管理工具。構建一個高效、穩定的教育平台,需要在架構設計上進行精心的規劃,以確保系統能夠在大流量的用户請求、高併發的操作下,依然能夠穩定運行,同時為用户提供流暢、快速的體驗。本文將從技術層面探討如何設計一個高效穩定的教育系統小程序架構,結合技術代碼和實際應用場景,幫助開發者更好地理解和實現這一目標。 1.

redis , 數據 , 緩存 , 數據庫

收藏 評論

技術極客傳奇 - WCF 中使用 gRPC

一、WCF描述 wcf是一款基於面向服務的架構的通訊框架平台,在分佈式框架中得到了廣泛使用。 wcf入門非常簡單,只要花幾分鐘就能編寫一個完整的wcf程序,而實際上WCF是概念非常多的一門技術,需要花很大精力去深入研究。 二、WCF優點 1、將各種通訊技術進行整合 WCF是對於 Web Service,Net Remoting,Enterprise

數據 , 雲計算 , WCF 中使用 gRPC , 客户端 , wcf , 雲原生

收藏 評論

mb61c46a7ab1eee - 深入解析:YOLOv7自然場景Logo檢測項目yolov7-logo-detection (YOLOv7+Flickr27/LogoDet-3K):雙數據集驗證、模型訓練與工業部署實戰

目錄 yolov7-logo-detection項目概述 一、項目目標與核心概念界定 1. 核心目標 2. 關鍵概念區分 二、技術架構:為何選擇 YOLOv7? 1. YOLOv7 的核心優勢 2. YOLOv7 的三大核心組件 3. YOLOv7 的關鍵改進 三、數據集:從小規模驗證到大規模擴展 1. 兩個數據集的核心

數據集 , redis , 數據 , 數據庫 , Python

收藏 評論

大丸子 - 用C#在Excel工作表中創建數據透視表和數據透視圖

高效處理與分析海量數據是決策中的重要一環。通過C#編程在Excel中自動化創建數據透視表與數據透視圖,能夠將原始數據轉化為可交互的多維度分析表格和圖表。同時,通過編程實現的自動化流程可確保數據更新的同步性與分析結果的一致性,尤其適用於需要定期生成標準化分析報告的場景。相較於靜態表格,數據透視圖表通過動態篩選與鑽取,為決策者提供更多的數據細節,從而進行更深度的分析。本文將介紹如何在.NET框架使用C

數據 , excel , c# , .net , 圖表

收藏 評論

計算機專業指導老師 - 基於VUE的醫院體檢預約系統[VUE]-計算機畢業設計源碼+LW文檔

摘要:隨着大眾健康意識的提升,醫院體檢業務量日益增長,傳統體檢預約方式在效率、信息管理等方面已難以滿足需求。本文介紹基於VUE的醫院體檢預約系統的設計與實現,該系統前端採用VUE框架,結合後端技術構建,具備系統用户管理、新聞數據設置、多種體檢相關管理以及統計功能等。通過實際應用驗證,系統提高了體檢預約的效率和準確性,優化了醫院體檢業務流程,為醫院和患者提供了便捷、高效的體檢預約服

軟件研發 , 字段 , 數據 , ui

收藏 評論

上海拔俗網絡 - AI 智慧檢查綜合管理平台:讓質檢管理從 “碎片化” 變 “全鏈路可控”

在多廠區企業、跨區域項目裏,傳統質檢管理常陷入 “信息孤島” 困境 ——A 車間的檢查數據存在本地表格,B 項目的問題整改進度靠微信同步,總部想彙總分析得花幾天整理數據。而 AI 智慧檢查綜合管理平台,就像一位 “全局指揮家”,靠技術把分散的質檢環節串成線、織成網,讓從檢查發起、問題識別到整改閉環的全流程都清晰可控,徹底告別 “東找數據、西催進度” 的麻煩。 這個平台能實現 “全局管

鏈路 , 數據 , NLP , 人工智能 , 決策模型

收藏 評論

mob64ca1401464d - 如何用下載的json地圖數據在python中繪出

D3學習之地圖 (2017.03.09-03.11) 地圖的意義 在可視化領域中,將數據點投影和關聯到地理區域上,是一個非常關鍵的內容(體現了可視化中利用讀者自身知識常識從而加速吸收信息的原則)。 GeoJSON and TopoJSON GeoJSON是用於描述地圖空間信息的數據格式。GeoJSON不是一種新的格式,其語法規範是符合JSON格式的,

d3 , 數據 , 後端開發 , Json , Python

收藏 評論

GhostLover - portaine 中 操作Volumes

這兩天在做verilog的ds1302,ds1302中有一個端口是輸入/輸出管教。即這個管教即是輸出,同時也可以當輸入。在verilog中有一個特殊的端口與之對應,就是inout。 Inout這個端口,之前用得不多,所以用法也不怎麼記得。但是這個地方要用,所以就要學習下。 在端口申明中,可以申明一個端口為inout,

數據 , 雲計算 , 賦值 , 雲原生 , 實例代碼

收藏 評論

步_步_為營 - 深度探究Span<T>:.NET內存佈局與零拷貝原理及實踐

深度探究SpanT:.NET內存佈局與零拷貝原理及實踐 在.NET開發中,高效的內存管理至關重要,尤其在處理高性能、低延遲的應用場景時。SpanT 類型應運而生,它為開發者提供了一種靈活且高效的內存操作方式,能夠顯著提升程序性能,特別是在涉及字符串、數組等數據處理場景中。深入理解 SpanT 的內存佈局和零拷貝原理,對於編寫高性能的.NET代碼至關重要。 技術背景 傳統的內存

System , 數組 , 數據 , 前端開發 , Javascript

收藏 評論

亢少軍 - 01-從0到1:構建企業級AI Agent框架的完整思路

從0到1:構建企業級AI Agent框架的完整思路 前言 在AI大模型時代,企業面臨着如何將AI能力與自身業務深度結合的挑戰。本文將分享我們從0到1構建企業級AI Agent框架的完整思路,涵蓋技術選型、架構設計、核心功能實現等方面。 適合讀者: 後端開發、AI應用開發者、技術架構師 一、項目背景與痛點 1.1 企業AI應用的核心痛點

數據 , API , server , 人工智能 , 數據分析

收藏 評論

mob64ca13fe9c58 - C# 類class 字段和屬性

屬性 實體特徵的抽象,描述的是狀態信息,不表示具體的存儲位置,有訪問器,聲明格式如下: [修飾符][類型][屬性名] { get {get 訪問器體} set {set訪問器體} } 參數説明 1、修飾符:指定屬性的訪問級別 2、類型:指定屬性的類型,可以是任何的預定義或自定義類型 3、屬性名:一種標

字段 , 數據 , , 屬性 , 後端開發 , c , Python

收藏 評論

mb692901b228770 - 2025年告別熬夜寫論文!推薦4款免費論文神器,一天搞定初稿

寫論文別再焦慮了!這4個免費工具,輕鬆拯救你的論文進度。熬夜趕工、思路卡殼、格式混亂……每一個寫論文的痛,我們都懂。別急,下面這幾個神器或許就是你一直在找的“神助攻”。 ✍️文獻整理神器 幫你自動抓取文獻資料,生成標準引用格式,再也不用一條條手動輸入參考文獻了。 🔄降重潤色小助手 AI輔助改寫句子,調整表達方式,讓語句更學術、邏輯更清晰,還能順便優化重複

功能點 , 數據 , AI寫作 , aigc , 文檔處理

收藏 評論

程序員阿偉 - 《工業邊緣網關進階指南:智慧工廠設備互聯中的協議適配與數據預處理》

參與智慧工廠設備互聯升級項目時,體會到邊緣網關在工業場景中的核心價值與實踐困境。該工廠作為當地老牌製造企業,歷經三次生產線迭代,目前涵蓋三條不同年代的生產線,部署了近千台異構設備,既有上世紀九十年代採用傳統Modbus協議的老舊PLC,也有近年新增的支持OPC UA協議的新型智能傳感器,甚至部分關鍵衝壓設備因硬件限制,仍依賴RS485串口進行數據傳輸。早期採用的集中式數據採集方案,需通過多條超50

數據

收藏 評論