tag 數據倉庫

標籤
貢獻167
306
01:08 PM · Nov 03 ,2025

@數據倉庫 / 博客 RSS 訂閱

u_14767244 - Apache Doris AI 能力揭秘(三):AI_AGG 與 EMBED 函數深度解析

在初步探索了 AI 函數的可能性之後,本次我們將目光投向兩個更為核心的函數:AI_AGG 和 EMBED。我們將深入解析這兩個函數的設計理念、實現原理及其在業務場景中的應用,展示 Apache Doris 如何通過原生的函數設計,將文本聚合與語義向量分析無縫集成到 SQL 中,為用户提供更強大、更易用的智能數據分析體驗。 相關閲讀: Apache Doris 4.0 AI 能力揭

數據庫Apache Doris , 大數據 , app , 數據倉庫 , SQL , ci

收藏 評論

mob64ca140d61c6 - h2過濾條件使用大於小於會使用索引嗎

1.結論 對於輸入過濾條件後BOS報“列名不正確”的過濾條件,要在列名前增加x2標識 無效的過濾 FNumber in (002,003,004,005,011,020) 正確的過濾 x2.FNumber in (002,003,004,005,011,020) 2.完全可以不看的探索過程 有客户需要我

標識符 , 字段 , 大數據 , h2過濾條件使用大於小於會使用索引嗎 , 數據 , 數據倉庫

收藏 評論

KPaaS集成擴展平台 - 跨境電商企業如何打通領星ERP與金蝶雲星空?接口字段與同步邏輯

對於使用領星ERP進行跨境電商運營管理,同時依賴金蝶雲星空處理財務與供應鏈等核心業務的企業而言,打通兩個系統之間的數據壁壘,實現高效、穩定、實時的數據同步,成為亟待解決的技術挑戰。 本文將從技術視角出發,深入探討領星ERP與金蝶雲星空之間常見的集成場景及對應接口參數,並結合數據集成平台解決方案,分析如何以更靈活、低代碼的方式構建穩定可靠的數據通道。 典型集成場景與數據

異構數據源管理 , ETL工具 , 大數據 , yyds乾貨盤點 , 數據倉庫 , 異構數據整合 , 系統集成 , 數據集成與應用集成

收藏 評論

u_15444077 - 警惕大數據處理中的“檢查者悖論”

本文分享自天翼雲開發者社區《警惕大數據處理中的“檢查者悖論》.作者:王****淋 什麼是檢查者悖論: 觀察的角度不同,得出的統計結論也不同。有時又稱為"候車悖論", "等待時間悖論" 為了形象説明,我們設計了一種模擬場景: 班級人數統計,來用實例説明這個問題 模擬場景: 班級人數統計 小明與小華要完成一個任務:統計學校中的 平均班級人數。但二

大數據 , 數據倉庫

收藏 評論

u_14767244 - 字節跳動:Apache Doris + AI 一站式融合數據引擎的探索與實踐

隨着人工智能技術在業務中的滲透,我們逐漸意識到:AI 不僅是提升效率的工具,更是重構數據處理與消費方式的核心驅動力。在這一背景下,我們思考:能否構建一款「AI + Data」一站式融合的數據引擎? 它不僅能夠統一處理文本、音視頻等非結構化數據與傳統結構化數據,還能為算法工程師提供流暢的數據開發體驗,實現數據處理與 AI 模型無縫銜接,並能確保數據處理負載與在線服務負載完全隔離。這是 20

大數據 , 數據 , 搜索 , 數據倉庫 , AI , 人工智能 , Python

收藏 評論

南大通用GBase - 南大通用GBase 8a v952-兼容模式-對混合節點和純data節點縮容操作手順

説明 本文僅從功能驗證角度來進行流程操作,gbase v952 兼容模式對混合節點和純data節點縮容。 縮容目標 集羣目前有四個節點,兩個管理節點,四個data節點,其中兩台機器是混合部署。現在準備縮容一台混合節點一台純data節點。 集羣現狀gcadmi信息如下: [gbase@node1 gcinstall]$ gcadmin CLU

sed , GBase 8a , 大數據 , ip , 數據倉庫 , ci

收藏 評論

建投數據 - 以“居安思危”之智,夯實數字時代業務連續性基石——建投數據通過ISO22301再認證

近日,建投數據順利通過ISO22301業務連續性管理體系再認證。這標誌着建投數據在系統性風險管控、應急響應與業務連續運營能力等方面,持續符合國際標準,其數字化服務的可靠性與韌性再次獲得權威認可。 業務連續性管理作為一套科學系統的管理流程,旨在引導企業主動識別關鍵業務運營中的潛在威脅,構建從預案制定、資源儲備到響應恢復的全方位彈性體系。通過持續規劃、演練、評審與改進,

大數據 , 系統故障 , 數據倉庫 , 最小化 , 解決方案

收藏 評論

碼農小哥 - 論文收錄索引和收錄號

SCI (《科學引文索引》,英文全稱為 Science Citation Index )是美國科學情報研究所( Institute for Scientific Information ,簡稱 ISI )出版的一部世界著名的期刊文獻檢索工具,其出版形式包括印刷版期刊和光盤版及聯機數據庫,現在還發行了互聯網上 Web 版數據庫。 SCI 收錄全世界出

大數據 , 數據倉庫 , 論文收錄索引和收錄號 , 數據庫 , 常用詞 , ci

收藏 評論

阿森CTO - STM32的USART串口通信

@TOC 一、通信接口 通信的目的:將一個設備的數據傳送到另一個設備,擴展硬件系統通信協議︰制定通信的規則,通信雙方按照協議規則進行數據收發 二、串口通信 串口是一種應用十分廣泛的通訊接口,串口成本低、容易使用、通信線路簡單,可實現兩個設備的互相通信 單片機的串口可以使單片機與單片機、單片機與電腦、單片機與各式各樣的模塊互相通信,極大地擴展

串口 , 大數據 , yyds乾貨盤點 , 數據 , 數據倉庫 , 寄存器

收藏 評論

u_15015752 - 什麼是圖數據庫(Graph Database)?一文了解圖數據庫

圖數據庫(Graph Database)是一種以“圖結構”為核心的數據管理系統,通節點(Node)、關係(Edge)和屬性(Property)來表示和存儲數據,重點描述數據之間的關聯關係。與傳統關係型數據庫以表和外鍵為中心不同,圖數據庫將關係進行直接存儲和計算,能夠高效地進行多跳關聯查詢和複雜關係分析,特別適合用於社交網絡、推薦系統、知識圖譜、風控反欺詐等以關係密集型數據為核心的

圖數據庫 , 大數據 , 數據 , 數據倉庫 , 關係數據庫

收藏 評論

mob64ca1403c772 - id字段作為數據庫索引

id 屬性 id屬性指定 HTML 元素的唯一 ID。id屬性的值在 HTML 文檔中必須是唯一的。 id屬性用於指向樣式表中的特定樣式聲明。JavaScript 也可使用它來訪問和操作擁有特定 ID 的元素。 id 的語法是:寫一個井號 (#),後跟一個 id 名稱。然後,在花括號 {} 中定義 CSS 屬性。

大數據 , 數據倉庫 , id字段作為數據庫索引 , HTML , 前端

收藏 評論

亞拉索第一 - 用 DevUI MateChat 搭一個企業知識庫 Copilot

企業裏做知識庫 Copilot 這件事,在 2025 年幾乎已經成了中後台產品的標配需求。 研發同學想快速查接口規範、排查流程和上線 checklist 客服想一鍵找到話術模板和工單歸因口徑;運營想問動 SOP @和數據口徑 大家都知道模型側可以接,但是真正拖慢落地的反而是前端交互:用户不知道該怎麼問、也不知道系統能答什麼 LLM

大數據 , 數據倉庫 , 開發者 , 結構化 , HTML

收藏 評論

阿森CTO - Linux多線程

@TOC 📝進程和線程 進程是資源分配的基本單位 線程是調度的基本單位 線程共享進程數據,但也擁有⾃⼰的⼀部分數據: 線程ID 一組寄存器 棧 errno 信號屏蔽字 調度優先級 🌠 進程的多個線程共享 同⼀地址空間,因此TextSegment、DataS

全局變量 , 大數據 , yyds乾貨盤點 , include , 數據倉庫 , i++

收藏 評論

mb69410ac31213c - 華為雲Flexus AI智能體:讓企業智能化轉型“輕裝快跑”

當AI技術的浪潮席捲各行各業,“如何讓AI真正落地到業務場景”,成了無數企業的共同命題。有的企業困於技術門檻,有的卡在成本高企,有的愁於落地效率——而華為雲推出的Flexus AI智能體,正以“一站式平台”的姿態,把這些難題變成了“輕量級操作”。它不是冰冷的技術工具,更像一位懂業務的“智能夥伴”,讓企業從“AI圍觀者”變成“AI實踐者”。 從“技術門檻”到“零成本上手”:A

業務邏輯 , 大數據 , 數據倉庫 , 數據安全 , 官網

收藏 評論

一線數智 - AI 項目越做越亂?你缺的其實是新一代數據治理體系

【一線數智評論】最近在梳理客户標籤時發現,基於過去的大數據的客户標籤算法和管理方式,在今天有AI加持下,多模態的數據管理,存在缺失,AI時代,數據治理必須重做一遍   過去十幾年,企業對“數據治理”的理解大多停留在:建數據倉庫、做數據質量、統一指標口徑、管權限、查血緣。   這當然重要,但在 AI 浪潮面前,這套思維已經不夠用了。   因為今天企業面臨的是:

大數據 , 數據 , 數據倉庫 , 自動生成 , 模態

收藏 評論

事辯天下 - 數據驅動人力資源新生態:從“人才星球”啓航到“數紐中心”揭牌

數據要素正以前所未有的力量重塑產業格局,人力資源領域率先迎來關鍵突破。在短短兩天內,一場圍繞“數據驅動”的系列重磅活動在上海舉行,從民間生態的盛大啓航到官方平台的權威賦能,清晰勾勒出人力資源產業轉型升級的未來路徑,標誌着行業正式邁入“星聯數紐”的新紀元。 11月12日:生態聚變,“人才星球”啓航共創產業新生態 系列活動的序幕,於11月12日在上海張江V

大數據 , 數據 , 數據倉庫 , 解決方案 , 數據驅動

收藏 評論

向量檢索 - 如何通過HTTP API檢索Doc

本文介紹如何通過HTTP API在Collection中進行相似性檢索。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP POST https://{Endpoint}/v1/collections/

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 人工智能 , 大模型

收藏 評論

mob64ca14193248 - 大數據培訓hive數倉存儲格式詳解_hive一次能insert多少條

5.1.5 數據倉庫存儲格式選擇 選擇合適的存儲格式,需要在查詢性能、寫入性能、存儲成本、壓縮效率、模式演化支持、生態系統兼容性等多個維度進行權衡。現代數據倉庫(尤其是基於數據湖的架構)提供了多種列式存儲格式作為首選。 一、 核心存儲格式對比 以下是目前主流的、適用於數據倉庫場景的存儲格式:

大數據 , 數據 , hive , 數據倉庫 , 元數據 , 後端開發 , Python

收藏 評論

clghxq - dify進行嵌入式索引很慢

列表list 元素可以放各種類型,字符串,數字,bool元組,列表,字典,對象 列表是有序的,可以索引可以切片,跟字符串的索引和切片是一樣的操作 如果是取單個的元素,元素本身是什麼類型取出來就是什麼類型,如果是切片,取出來依然是列表 li = ['haha',123,[14,5,6],''] print(li[0]) print(li[1:4])

dify進行嵌入式索引很慢 , 大數據 , 字符串 , 數據倉庫 , 迭代 , for循環

收藏 評論

事辯天下 - 2025中國上海國際童書展圓滿落幕 全球兒童內容產業在滬呈現蓬勃活力

2025中國上海國際童書展(CCBF,以下簡稱上海童書展)於11月16日在上海世博展覽館圓滿落幕。本屆展會吸引了來自35個國家和地區的474家參展商亮相,集中展示超過2萬種中外最新童書。根據主辦方統計,截止稿件發佈,本屆展會促成近1000項版權交易意向,實現圖書銷售碼洋約1500萬元,文創和衍生品銷售額接近200萬元。 展會三天共迎來42,387名觀眾,其中包括15

商業 , 大數據 , ip , 數據倉庫 , 類圖

收藏 評論

程序猿追 - 基於亮數據MCP與AI的全球電商實時監控與動態定價實踐

https://www.bilibili.com/video/BV15xUCBNEzi/?vd_source=8c987e288018fae8f95831d231306b93 在全球電商的激烈競爭中,信息差就是利潤差。對手的一次悄然降價、一個突然出現的負面評價,或是一款熱門商品的斷貨,都可能讓您措手不及,導致訂單流失或庫存積壓。傳統的監控方式效率低

商業 , 大數據 , 監控方式 , 數據倉庫 , 解決方案

收藏 評論

建投數據 - 建投數據再度獲評國家級“高新技術企業”

近日,建投數據順利通過由北京市科學技術委員會、北京市財政局、國家税務總局北京市税務局聯合評審,再度獲評國家級“高新技術企業”。自2016年首度獲得該項資質以來,建投數據已連續第四次通過評審,持續保持國家高新技術企業資格。 國家高新技術企業認定,是在國家重點支持的高新技術領域內,對持續進行研究開發與技術成果轉化形成企業核心自主知識產權,並以此為基礎開展經營活動的企業的

大數據 , 數據倉庫 , 科研項目 , 研發管理 , 解決方案

收藏 評論

colddawn - 磁盤數據塊和磁盤索引塊什麼關係

  這幾天在學文件系統的移植,一大堆大小概念弄得我一臉懵逼,所以趕緊補了補基礎知識,別小看基礎知識,它可以在很大程度上幫助我們撩小姐姐(手動狗頭) 以下解釋出自百度百科:   扇區是磁盤最小的物理存儲單元,但由於操作系統無法對數目眾多的扇區進行尋址,所以操作系統就將相鄰的扇區組合在一起,形成一個簇,然後再對簇進行管理。每個簇可以包括2、4、8、16、32或

大數據 , 文件系統 , 讀取數據 , 磁盤控制器 , 數據倉庫 , 磁盤數據塊和磁盤索引塊什麼關係

收藏 評論

字節小舞神 - xz2 空間索引

SQL Server 2008 引入了對空間數據和空間索引的支持。“空間索引”是一種擴展索引,允許您對空間列編制索引。空間列是包含空間數據類型(如geometry或geography)數據的表列。本節中的主題介紹了空間索引。 SQL Server 2008 及更高版本支持空間數據。這包括對平面空間數據類型geometry的支持,該數據類型支持歐幾里得座標系統中的幾何

數據類型 , 大數據 , 數據倉庫 , 空間索引 , xz2 空間索引 , 層次結構

收藏 評論