tag 大數據

標籤
貢獻412
478
05:15 PM · Oct 25 ,2025

@大數據 / 博客 RSS 訂閱

開放原子 - 賦能開發者,開放原子全球開源峯會期待你的聲音!

數字時代,開源已經成為全球技術創新和協同發展的重要模式,開源倡導的開放、平等、協作、共享理念正在加速推進相關技術領域的創新活動和產業發展。開源軟件和技術通過開放軟件平台進行協作和發展,推動社會技術創新指數級增長,呈現出向數字技術各領域全面拓展的蓬勃之勢。 開源為開發者提供了更廣泛、更開放的協作平台和創新環境,並連接融合全球社區和開發者的智慧,促進軟件產業高質量發展,推動全球開源開發者持續增長。據《

大數據 , 開源軟件 , 開源硬件 , 開源

收藏 評論

SelectDB技術團隊 - Apache Doris 支持 Arrow Flight SQL 協議,數據傳輸效率實現百倍飛躍

近年來,隨着數據科學、數據湖分析等場景的興起,對數據讀取和傳輸速度提出更高的要求。而 JDBC/ODBC 作為與數據庫交互的主流標準,在應對大規模數據讀取和傳輸時顯得力不從心,無法滿足高性能、低延遲等數據處理需求。為提供更高效的數據傳輸方案,Apache Doris 在 2.1 版本中基於 Arrow Flight SQL 協議實現了高速數據傳輸鏈路,使得數據傳輸性能實現百倍飛躍。 基於 Arro

大數據 , jdbc , MySQL , 數據庫 , 數據傳輸

收藏 評論

數碼精靈abc - fstorm渲染器材質

一、渲染引擎 渲染引擎的職責是……渲染,也就是把請求的內容顯示到瀏覽器屏幕上。 默認情況下渲染引擎可以顯示HTML,XML文檔以及圖片。 通過插件(瀏覽器擴展)它可以顯示其它類型文檔。 二、各種渲染引擎 我們提到的Firefox, Safari兩種瀏覽器構建於兩種渲染引擎之上: Firefox使用Gec

選擇器 , Storm , 大數據 , 渲染引擎 , fstorm渲染器材質 , Css

收藏 評論

事辯天下 - 邁瑞發佈啓元檢驗大模型丨AI檢驗專家已就位!

導語:馭數據萬象,啓智檢新元 11月21日,邁瑞醫療在第八屆南方檢驗醫學學術大會暨2025年廣東省醫學會檢驗醫學學術年會上發佈啓元檢驗大模型,以垂直、可生長的AI科技,解決檢驗科報告審核、解讀、管理、評審等多個關鍵問題。讓關於檢驗科的AI設想,在此刻成為現實。 發佈會現場,重磅嘉賓雲集共襄盛舉。廣東省醫學會常務副會長兼秘書長李國營教授、深圳市衞

大數據 , 數據 , 數據倉庫 , 人工智能

收藏 評論

coolfengsy - YOLOv8 深度解析!一文看懂,快速上手實操(附實踐代碼)

摘要 當前大多數研究主要側重於使用大型模型來提高實驗精度,卻常常忽視了部署的挑戰。在某些遙感設備上,對輕量級算法的需求日益增長。此外,遙感圖像(RSIs)通常包含大量小而密集分佈的目標,這給檢測帶來了巨大挑戰。為了解決這些問題,我們對YOLOv8s網絡進行了改進,開發了一種基於多尺度特徵融合與上下文信息(MFFCI-YOLOv8)的輕量級遙感目標檢

卷積 , v8 , 大數據 , hadoop , 1024程序員節 , 池化

收藏 評論

clougence - 大數據時代,數據脱敏助力企業信息安全

大數據時代,數據已成為許多企業的重要資產與發展基石。然而,由於沒有恰當的保護措施,企業內部員工泄漏數據的情況頻頻發生。有數據顯示,在數據泄露事件中有 80% 為企業內部人員所為,快遞、酒店、銀行、房產中介、教育培訓等各行各業無一倖免。這對數據庫的使用管理提出了更高的要求。團隊開發使用數據庫時如何加強數據安全和隱私保護呢?數據脱敏 提供了一種數據安全防護的新範式。 什麼是數據脱敏 數據脱敏(Data

信息安全 , 大數據 , 數據庫 , 數據安全

收藏 評論

mob64ca1414098d - 內連接join 怎麼走聯合索引

這麼久終於可以靜下來整理一下工作上學到的東西了(主要還是自己太懶了。。) 廢話少説,正文開始 在公司裏,數據庫用的基本都是Oracle,所以就學了一下Oracle的一點知識,現在整理一下自己遇到的問題和學到的一些東西。 先説説自己經常搞混的內連接、外連接(大學裏一直沒搞懂。。) 數據表之間有很多種連接方式,如:內外連接等 一(內連接):

大數據 , 右外連接 , 數據倉庫 , 左外連接 , 內連接join 怎麼走聯合索引 , 外連接

收藏 評論

u_14767244 - 2-5 倍性能提升,30% 成本降低,阿里雲 SelectDB 存算分離架構助力波司登集團實現降本增效

波司登集團作為全球領先的羽絨服公司,每年的銷售旺季集中在四個月間,需高效把握業務機遇以實現高營收。為滿足集團銷售旺季的實時數據分析需求,同時降低淡季數據分析成本,波司登決定升級大數據架構,採用阿里雲數據庫 SelectDB 版升級數倉,基於阿里雲 SelectDB 雲原生存算分離架構,實現了資源隔離與彈性擴縮容,並取得了查詢性能提升 2-5 倍、總體成本降低 30% 以上、效率提升 30

大數據 , 數據 , 離線 , 數據倉庫 , 數據分析

收藏 評論

mob64ca140dc73b - Doris淺略介紹 +部署+使用_doris部署

Apache Doris 4.0 的 AI 功能(LLM 函數 + 向量索引)與 Cloudera CDP 7.3(或類 CDP 的 CMP 7.13 平台,如華為鯤鵬 ARM 版)在銀行信信用卡的操作指南和腳本 針對 國有商業銀行 場景下,Apache Doris 4.0(ARM64 鯤鵬環境)與華為 Cloud Data AI CMP 7.13

大數據 , hive , hadoop , zookeeper , flink , kafka

收藏 評論

事辯天下 - 看遠看近都清晰,激光老視手術來幫您

12月8日,由北京地區副總院長張豐菊教授親自操刀,46歲S先生在北京愛爾新力眼科進行了LBV激光老視矯正手術。   2021年,S先生到院瞭解近視手術,檢查完畢後,因擔心後續的老視問題,暫時放棄了近視手術的想法。   時隔4年,S先生已出現明顯老視症狀,近距離閲讀、手機使用等日常場景常需反覆摘戴眼鏡,為工作生活帶來明顯困擾。為此,再次來到北京愛爾新力眼科尋求個

工作效率 , 大數據 , MDT , 數據倉庫

收藏 評論

網絡安全俠 - alook自定義搜索引擎

owllook是一個在線小説搜索引擎,其目的是讓閲讀更簡單、優雅,讓每位讀者都有舒適的閲讀體驗 owllook是我大學時期編寫的一個Python開源項目,至今維護將近兩年了,以前關於owllook介紹的原文章已經年久失修,再加上一些github用户不知道怎麼安裝使用,因此我將文章重新編輯一番,以作使用指南 介紹

redis , github , 大數據 , 數據倉庫 , alook自定義搜索引擎 , Python

收藏 評論

雲掣科技 - 開源大數據集羣部署(十九)Hbase部署

作者:櫰木 1 HBASE 安裝部署 hbase組件 部署主機 HMaster hd1.dtstack.com,hd2.dtstack.com HRegionServer hd3.dtstack.com,hd2.dtstack.com,hd1.dtstack.com 2 創建hbase Kerberos主體

大數據 , 雲原生 , 集羣

收藏 評論

mob64ca13fb6939 - 獲取張量中為true的索引

1.功能簡介 GIS將地理空間數據表示為矢量數據和柵格數據。矢量數據模型使用點、線和多邊形來表示具有清晰空間位置和邊界的空間要素,如控制點、河流和宗地等,每個要素被賦予一個ID,以便與其屬性相關聯。柵格數據模型使用一個格網和格網元胞(像元)代表空間要素,元胞值表示該元胞位置的空間要素屬性。柵格數據模型適用於表示連續的要素,如海拔和降水量。 [矢

數據集 , 大數據 , 數據 , 數據倉庫 , 數據模型 , 獲取張量中為true的索引

收藏 評論

KPaaS集成擴展平台 - 多系統數據難打通?一文帶你瞭解數據集成的正確方式

在瞬息萬變的數字化時代,企業運營早已不再是單兵作戰。從客户關係管理(CRM)到企業資源規劃(ERP),從供應鏈管理(SCM)到辦公自動化(OA),各類業務系統逐步引入,共同支撐着企業的日常運轉。然而,隨着企業信息系統的日益增多,數據孤島問題愈發嚴重。銷售、採購、財務、人力資源等系統各自為政,數據分散、格式不一、難以打通,導致企業決策效率低下、業務流程受阻。如何高效整合多系統數據,

主數據管理 , 數據管理 , 大數據 , yyds乾貨盤點 , 數據孤島解決方案 , 數據倉庫 , 數據治理 , 數據集成

收藏 評論

編程夢想編織者 - 兩主三從 分佈式hadoop

分佈式系統中的主從複製基本原理 分佈式系統中的主從複製基本原理 複製指在多台機器上保存相同數據的副本,通過數據的複製,人們希望達到以下目的: 使用户使用物理上離他們更近的的數據,降低訪問延遲。 部分組件出現故障,系統仍然可以繼續工作,提高可用性。 擴展至多台機器以令他們同時提供數據訪問服務,提高讀吞吐量。 本文只討論一些簡

觸發器 , 兩主三從 分佈式hadoop , 大數據 , 數據 , 關係型數據庫 , hadoop

收藏 評論

SeaTunnel - Apache SeaTunnel 如何將 CDC 數據流轉換為 Append-Only 模式?

RowKindExtractor 是 Apache SeaTunnel 的一個轉換插件,它能將 CDC 數據流轉為 Append-Only 模式,並提取原始 RowKind 信息為新字段。本文將介紹 RowKindExtractor 的核心功能,其在 CDC 數據同步場景下的使用方法,以及配置選項、注意事項及多種應用示例。 RowKindExtractor RowKindExtractor 轉換

大數據 , 開源 , seatunnel , 開發者

收藏 評論

軟件部長 - 數據可視化之旅,從數據洞察到圖表呈現,可視化的產品設計

圖表作為數據可視化的重要工具,是對原始數據進行深度加工與解讀的有效手段,它助力我們洞悉數據背後的真相,使我們能更好地適應這個由數據驅動的世界。無論是工作彙報、項目實施、產品設計、後台界面還是數據大屏展示,圖表都扮演着至關重要的角色。 然而,在實際工作過程中,我發現許多開發人員或者產品經理對於圖表設計的理解與運用並不深入,同時市場上關於圖表設計的系統化資料也相對不夠系統化,難以形成完整的產品設

bi , 大數據 , 數據可視化 , 圖表工具 , 圖表

收藏 評論

u_14767244 - 十億 JSON 秒級響應:Apache Doris vs ClickHouse,Elasticsearch,PostgreSQL

坦白講,每次看性能測試排行榜,我都會下意識地先找找 Apache Doris 在哪個位置。 這次打開 JSONBench 的榜單,心情一如既往的期待加緊張。 好在結果讓我鬆了一口氣:默認配置下就能排到第三,僅次於維護方 ClickHouse 的兩個版本。 不過,Doris 只能止步於此了嗎?經過一系列優化後,查詢時長能不能再縮短點?和 ClickHouse 的差距在哪裏?

大數據 , 數據 , 數據倉庫 , apache , Json

收藏 評論

阿里雲大數據AI - Fusion引擎賦能:流利説如何用阿里雲Serverless Spark實現數倉計算加速

作者:流利説 Ibson(大數據負責人)/ Bruce(數據工程師) 背景介紹 行業 流利説是領先的科技驅動的教育公司,公司自主研發了領先的英語口語評測、寫作打分引擎和深度自適應學習系統,致力於為用户提供一整套系統性的英語學習解決方案,從聽、説、讀、寫多個維度提升用户的英語水平。 業務特徵 AI 打分:利用大數據和人工智能算法對用户英語口語評測、

spark , 大數據 , 數據庫 , 人工智能 , 數據處理

收藏 評論

爛漫樹林 - xaml 綁定索引

Window、Grid、TextBox、Button等,都叫元素 xaml文檔中,用來定義標籤,標籤可以用來描述元素或元素的屬性,如: Window     Window.Resources     /Window.Resources   /Window Window是元素,Resources是Window的一個屬

xaml 綁定索引 , 命名空間 , 大數據 , 數據倉庫 , xml , ide

收藏 評論

生活測評菌 - 2025 紙巾測評:中順潔柔這款紙巾憑何領跑市場?

紙巾早已告別 “能擦即合格” 的粗放時代,隨着消費升級,安全無添加、乾濕雙耐用、顏值適配家居,成為當代家庭選紙的三大核心訴求。當前市場上紙巾品牌超 300 個,高端市場被進口品牌盤踞,大眾市場多陷 “軟而不韌”“韌而粗糙” 的困境,超六成消費者直呼 “選款難”。本次聚焦潔柔、得寶、維達、心相印、清風五大主流品牌核心系列,從原料、性能、設計三大維度深度實測,最終發現潔柔藝術油畫系列

大數據 , 數據倉庫

收藏 評論

代碼魔術師之手 - Dubbo基本原理

目錄 1. 為什麼需要DefaultFuture機制? 1.1 單一長連接的挑戰 1.2 示例場景 2. DefaultFuture的核心設計 2.1 關鍵組件 2.2 響應匹配流程 2.3 超時處理 3. DefaultFuture的線程安全與

服務端 , 大數據 , hadoop , 客户端 , JAVA

收藏 評論

mob64ca13fdd43c - 究諸經典,探尋大模型演變之蹤跡_人工智能_Baihai IDP

關聯知識庫:# 大語言模型學術史:從分佈式表示到Transformer的演進路徑(Gregory Gundersen 2025) 大語言模型學術史:從分佈式表示到Transformer的演進路徑 發佈時間:2025年10月1日 核心主題:追溯大語言模型背後的核心思想的學術歷史 哲學視角:技術演進中

spark , 大數據 , 神經網絡 , 語言模型 , 並行化

收藏 評論

海豚調度 - 碼住!DolphinScheduler 常見故障 “急救指南”,一文解決服務、調度、連接等難題

概述 Apache DolphinScheduler作為現代化的數據編排平台,在實際部署和使用過程中可能會遇到各種故障和問題。本文將從架構層面深入分析常見故障類型,提供詳細的排查思路和解決方案,幫助運維人員和開發者快速定位並解決問題。 系統架構與核心組件 在開始故障排查前,首先需要了解DolphinScheduler的核心架構: 常見故障分類與排查 1. 服務啓動失敗 症狀描述 服務無

dolphinscheduler , 大數據 , 故障恢復 , 開源 , 技術

收藏 評論