tag 數據倉庫

標籤
貢獻167
282
01:08 PM · Nov 03 ,2025

@數據倉庫 / 博客 RSS 訂閱

事辯天下 - 沃飛長空完成數億元C輪融資,加速商業化進程

近日,沃飛長空宣佈完成數億元人民幣C輪融資。 本輪融資由杭州市實業投資集團有限公司 (簡稱杭實集團)、Prosperity7 Ventures (簡稱P7)、鬆禾資本共同投資,藴盛資本、翱翔天行等老股東追加投資。 此次融資匯聚了國內外頂尖產業資源,其背後是市場對沃飛長空硬實力的高度認可和對eVTOL全球化前景的共識。依託杭實集團深耕本土的產業根基,能助力企業更精

商業模式 , it , 大數據 , 數據倉庫 , 人工智能

收藏 評論

編程小達人之心 - 302狀態碼搜索引擎

官方解釋: 301 redirect: 301 代表永久性轉移(Permanently Moved) 302 redirect: 302 代表暫時性轉移(Temporarily Moved ) 共同點: 301和302狀態碼都表示重定向,就是説瀏覽器在拿到服務器返回的這個狀態碼後會自動跳轉到一個新的URL地址,這個地址可以從響應的Loc

搜索引擎 , 302狀態碼搜索引擎 , 大數據 , google , 數據倉庫 , 重定向

收藏 評論

阿里雲大數據AI技術 - EMR Serverless Stella 1.0 技術分享:StarRocks企業級版本內核重大突破

在今年雲棲大會上,EMRServerlessStella1.0正式發佈,這是一款面向企業級場景深度優化的高性能數據分析引擎。阿里雲開源大數據平台OLAP引擎負責人周康系統性地分享了Stella在存算分離架構、Lakehouse場景以及全文檢索等三大核心場景下的深度優化經驗,為業界提供了大規模OLAP系統工程化實踐的寶貴參考。Stella引擎的發佈將為企業級用户提供更加專業、高效的

大數據 , 數據倉庫 , 阿里雲 , Lakehouse , starrocks , Stella , olap

收藏 評論

技術極客傳奇 - 搜索引擎爬蟲導致網站流量飆升如何解決

教程一:Python爬蟲學習系列教程 這個博主的這個爬蟲學習系列教程,很詳細啊,從入門到實戰、進階等都有詳細的文檔介紹,對爬蟲感興趣的小夥伴推薦一看。 教程二:學習網站上的爬蟲教程 實驗樓的爬蟲教程不是太多,但是都有詳細的講解和代碼,而且有在線開發環境,對於學習者是非常不錯的。其中最喜歡的就是那個 爬豆瓣熱門電影的教程 ,因為我自己超喜

知乎 , 大數據 , 數據倉庫 , 反爬蟲 , 搜索引擎爬蟲導致網站流量飆升如何解決 , Python

收藏 評論

u_14767244 - 從 Flink 到 Doris 的實時數據寫入實踐——基於 Flink CDC 構建更實時高效的數據集成鏈路

Flink-Doris-Connector 作為 Apache Flink 與 Doris 之間的橋樑,打通了實時數據同步、維表關聯與高效寫入的關鍵鏈路。本文將深入解析 Flink-Doris-Connector 三大典型場景中的設計與實現,並結合 Flink CDC 詳細介紹了整庫同步的解決方案,助力構建更加高效、穩定的實時數據處理體系。 一、Apache Doris 簡介 A

數據同步 , 大數據 , 數據 , 數據倉庫 , apache

收藏 評論

u_14767244 - 深入理解 Doris Variant:如何讓 JSON 查詢性能追平列存,還能承載萬列索引字段?|Deep Dive

摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等傳統系統中,對於 JSON 的處理往往面臨靈活性及性能無法兼得的困境,而 Apache Doris 的 VARIANT 類型,通過動態子列、稀疏列存儲、延遲物化和路徑索引等能力,實現了靈活結構 + 列存性能的平衡。本文將對該能力的實現一一講解,全面展示其優勢。 在大數據時代,JSON 已

大數據 , 數據 , 數據倉庫 , 結構化 , Json

收藏 評論

Aloudata - 企業級 VS 個人級:智能問數的“集團軍”與“單兵作戰”的差異解析

智能問數正迅速成為企業數據消費的新入口。從初創公司到世界 500 強,眾多組織嘗試通過“一句話問數”的方式,降低數據分析門檻、提升決策效率。理想很豐滿,但現實很骨感,“問不準”、“不靈全”、“問不深”成為大量嚐鮮用户的普遍感受。 表面上看,這類失敗常被歸因於技術瓶頸——例如模型準確性不足、SQL 生成錯誤、響應延遲等。但深入剖析後不難發現,問題的根

大數據 , 數據倉庫 , 智能歸因 , 智能報告 , 數據分析 , 智能問數 , chatbi

收藏 評論

u_15444077 - 從random隨機數看驗證碼重複數字

本文分享自天翼雲開發者社區《從random隨機數看驗證碼重複數字》.作者:王****淋 ## 推導: 1. 有6個不同數字 - (0個重複數字: 1+1+1+1+1+1): $$p(6) = C_{10}^6 * 6! \div 10^6$$ 2. 有5個不同數字 - (某個數字重複了2次: 1+1+1+1+2): $$p(5) = (\

大數據 , 數據倉庫

收藏 評論

colddawn - DB where 字段 is null 會走索引嘛

1.對查詢進行優化,要儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 最好不要給數據庫留NULL,儘可能的使用NO

字段 , 大數據 , 存儲過程 , 數據倉庫 , bc

收藏 評論

u_14767244 - Apache Doris 在小米統一 OLAP 和湖倉一體的實踐

小米早在 2019 年便引入 Apache Doris 作為 OLAP 分析型數據庫之一,經過五年的技術沉澱,已形成以 Doris 為核心的分析體系,並基於 2.1 版本異步物化視圖、3.0 版本湖倉一體與存算分離等核心能力優化數據架構。本文將詳細介紹小米數據中台基於 Apache Doris 3.0 的查詢鏈路優化、性能提升、資源管理、自動化運維、可觀測等一系列應用實踐。

大數據 , 數據 , 運維 , 數據倉庫 , 物化視圖

收藏 評論

温柔一刀 - goland索引建立

gocolly是用go實現的網絡爬蟲框架,目前在github上具有3400+星,名列go版爬蟲程序榜首。gocolly快速優雅,在單核上每秒可以發起1K以上請求;以回調函數的形式提供了一組接口,可以實現任意類型的爬蟲;依賴goquery庫可以像jquery一樣選擇web元素。 gocolly的官方網站是http://go-colly.org/,提供

github , 大數據 , 數據倉庫 , text , 示例代碼 , goland索引建立

收藏 評論

vivo互聯網 - vivo Celeborn PB級Shuffle優化處理實踐

作者: vivo 互聯網大數據團隊-Wang Zhiwen、Cai Zuguang vivo大數據平台通過引入RSS服務來滿足混部集羣中間結果(shuffle 數據)臨時落盤需求,在綜合對比後選擇了Celeborn組件,並在後續的應用實踐過程中不斷優化完善,本文將分享vivo在Celeborn實際應用過程中對遇到問題的分析和解決方案,用於幫助讀者對相似問題進行參

大數據 , 私藏項目實操分享 , shuffle , RSS , 數據倉庫 , Celeborn

收藏 評論

mob64ca14040d22 - 什麼是收錄索引名稱

seo與檢索密不可分相接,檢索是排行的基本,沒檢索就必須沒排行,選用科學研究的方式查尋儘量精確的百度收錄狀況,是人們從業seo的基礎工作中。如何查尋百度收錄?方式各種各樣,提議各種各樣方法綜合性應用。某些簡易的方法均可查詢系統的實際檢索總數,包含但是不限於應用百度搜索引擎命令,網頁搜索資源服務平台數據庫索引量小工具,普遍的seo查尋小工具等。 一、

搜索引擎 , 大數據 , 數據倉庫 , 什麼是收錄索引名稱 , 百度 , 數據庫索引

收藏 評論

mb69410ac31213c - 華為雲Flexus AI智能體,讓每家企業都擁有開箱即用的AI超能力

AI落地的最後一公里,卡在"用不起來" 2024年,不談AI的企業已被時代拋下。但真正試過的人都知道:大模型很強,落地很難。招不到AI工程師、搞不懂複雜參數、擔心數據泄露、算力成本燒不起……這些痛點讓90%的企業在智能化門口徘徊。Flexus AI智能體的出現,正是要撕掉"高門檻"的標籤——無需開發經驗,無需鉅額投入,20+款經過華為雲驗證的行業Agent,一鍵部署即可讓A

大數據 , 數據 , 數據倉庫 , 調優 , 模態

收藏 評論

誤會一場 - 搜索分詞器和索引分詞器

三大主流分詞方法:基於詞典的方法、基於規則的方法和基於統計的方法。 1、基於規則或詞典的方法 定義:按照一定策略將待分析的漢字串與一個“大機器詞典”中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功。 按照掃描方向的不同:正向匹配和逆向匹配 按照長度的不同:最大匹配和最小匹配 1.1

最大匹配 , 大數據 , 中文分詞 , NLP , 數據倉庫 , 未登錄詞 , 搜索分詞器和索引分詞器

收藏 評論

夢想啓航吧 - 150g存儲會消耗多少存儲建立索引

給你100M空間你可以做多少事?一起來分析吧!100M的網站空間到底能放多少內容?" 很多用户對此問題還不甚瞭解,下面我就就此問題解釋一下吧! 100M的空間,就目前的存儲設備來説,簡直微不足道。但對於一般建站的用户來説,還是可以的。雖不敢説綽綽有餘,但放一個小型網站還是足夠了的。 下面我們一起來具體分析一下這100M的空間到

150g存儲會消耗多少存儲建立索引 , 大數據 , 建站 , 數據倉庫 , 數據庫 , bc

收藏 評論

阿森CTO - Linux管理文件與處理數據

@TOC 📝前言 本文將介紹Linux系統中的常用命令:mv、cat、echo、重定向、head和tail,主要用於文件管理和數據處理。重點講解mv命令和重定向的示例,最後演示如何用head和tail快速提取大型文件中的指定行。 🌠 mv指令(重要): mv命令是move的縮寫,可以用來移動文件或者將文件改名(move (rename) fil

文件描述符 , 大數據 , yyds乾貨盤點 , 數據倉庫 , 重定向 , 標準輸出

收藏 評論

lu952450497 - 數據開發中的技術選型:從業務訴求到方案落地的全流程思考

企業的數據開發體系,往往伴隨着業務規模增長逐步演進。數據的產生源頭複雜、數據量不斷擴大、業務部門對數據的依賴程度提高,導致數據開發能力是否合理選型,將直接影響數據平台的穩定性、擴展性以及成本投入。 一、需求分析是技術選型的起點 在很多實際項目中,技術選型失敗主要不是因為技術不好,而是對實際訴求理解不清。技術選型之前應明確以下問題: 數據規

技術選型 , 大數據 , 數據 , hive , 數據倉庫

收藏 評論

cnolnic - 關係型數據庫能換成分佈式數據庫麼

在SQL Server中的關係型數據倉庫分區策略(1) http://developer.51cto.com 2007-02-27 17:01 Gandhi Swaminathan 51CTO.com 我要評論(0) 分區,在Microsoft SQL Server中,便於

大數據 , 數據倉庫 , microsoft , 關係型數據庫能換成分佈式數據庫麼 , 磁盤 , SQL Server

收藏 評論

liutao988 - HSSFColor的索引顏色

本文介紹和比較幾種常見圖片文件格式的優缺點,並介紹不同的文件格式對Web應用程序性能的影響。 有損vs無損 圖片文件格式有可能會對圖片的文件大小進行不同程度的壓縮,圖片的壓縮分為有損壓縮和無損壓縮兩種。 有損壓縮。指在壓縮文件大小的過程中,損失了一部分圖片的信息,也即降低了圖片的質量,並且這種損失是不可逆的,我們不可能從有一個有損壓縮過的圖片中恢復出全

HSSFColor的索引顏色 , 大數據 , 圖片格式 , 數據倉庫 , 文件大小 , svg

收藏 評論

雲端創新夢想家 - 【HBZ分享】數倉裏面的概念-寬表-維度表-事實表概念講解_維表 事實表 寬表

引言 在數據倉庫(Data Warehouse)設計中,事實表(Fact Table)和 事實寬表(Wide Fact Table)是兩種常見的存儲度量數據的表格。它們在結構、查詢效率、存儲方式等方面有所不同,選擇合適的設計模式對於提高查詢性能、減少存儲開銷以及滿足業務需求至關重要。本文將詳細介紹事實表與事實寬表的定義、區別及應用場景,並通過實際的

spark , 大數據 , 數據 , 數據倉庫 , 外鍵

收藏 評論

廣分檢測院王經理 - 膠水/粘合劑運輸條件鑑定書辦理流程

貨物運輸條件鑑定書辦理 海運運輸危險性鑑定書(通常指《貨物運輸條件鑑定書》)是用於判斷貨物是否屬於危險品及其運輸分類的重要文件,由中國海關、海事局或認可的機構出具。 這個多元化由第三方機構辦理,流程如下: 選擇鑑定機構:廣分檢測院王經理 準備送檢樣品和資料: 樣品:約100-2000克(毫升)的最終銷售包裝產品。具體數量

包裝類 , 大數據 , 數據倉庫

收藏 評論

事辯天下 - 智控雲端,安全護航!沃飛長空 AE200 系列重塑低空出行新標杆

在智能化浪潮席捲各行各業的今天,低空出行領域正迎來一場技術革命。沃飛長空 AE200 系列以 “極致簡化” 與 “極致安全” 為核心,打造出兼具智慧與可靠性的飛行 “大腦”,讓飛行變得更直覺、更安心,為低空出行美好未來注入強勁動力。 不同於傳統航空器單一飛行模式,傾轉旋翼eVTOL融合多旋翼垂直起降與固定翼高速巡航雙重特性,操縱難度呈幾何級提升。AE200 系列的飛控系統採

人機交互 , 大數據 , 數據倉庫 , 異構

收藏 評論

事辯天下 - 2025年CSR中國教育榜各大獎項正式揭曉 124家企業入圍“最佳責任企業品牌”

2025年11月26日,“責任100|2025年第九屆CSR中國教育榜”獎項正式發佈。共有124家企業入圍“最佳責任企業品牌”,超過100家全國媒體、地方媒體和專業媒體共同發佈。本屆教育榜共有272家國內外領先企業參與申報,經嚴格評審,124家企業的142個優秀項目脱穎而出。 典範項目引領實踐,戰略融合成關鍵趨勢 在多輪次評審中,立邦中國、TCL科技集團股份有

大數據 , 數據倉庫 , 人工智能 , 保護地

收藏 評論