tag 大數據

標籤
貢獻412
482
05:15 PM · Oct 25 ,2025

@大數據 / 博客 RSS 訂閱

u_14767244 - Apache Doris AI 能力揭秘(三):AI_AGG 與 EMBED 函數深度解析

在初步探索了 AI 函數的可能性之後,本次我們將目光投向兩個更為核心的函數:AI_AGG 和 EMBED。我們將深入解析這兩個函數的設計理念、實現原理及其在業務場景中的應用,展示 Apache Doris 如何通過原生的函數設計,將文本聚合與語義向量分析無縫集成到 SQL 中,為用户提供更強大、更易用的智能數據分析體驗。 相關閲讀: Apache Doris 4.0 AI 能力揭

數據庫Apache Doris , 大數據 , app , 數據倉庫 , SQL , ci

收藏 評論

qbit - 面向學科領域的網絡信息資源深度聚合與服務研究——Part6(qbit學習記錄)

圖書信息 《面向學科領域的網絡信息資源深度聚合與服務研究》 項目背景 本書是國家社科基金重大項目“面向學科領域的網絡信息資源深度聚合與服務研究”的結項成果, 孫建軍教授是該項目的首席專家。 回目錄 第六部分 學科網絡資源導航機制及可視化 12 網絡導航建設現狀 12.1 國內學科導航建設現狀 12.2 國外學科導航建設現狀 12.2.1 國外學科導航系統簡介 12.2.2

大數據

收藏 評論

wei_shuo - GLM-4.7 & MiniMax M2.1 限免上線!工程級 Agent 模型正式接入 AI Ping

前言:從"能生成"到"能長期跑"的工程級大模型 大模型產業落地階段,工程交付穩定性與長時 Agent 運行效率成為核心衡量標準,GLM-4.7 與 MiniMax M2.1 作為國產模型兩條差異化成熟路線的代表,跳出單輪生成質量侷限,聚焦真實場景長期穩定運行能力。AI Ping 平台整合多供應商資源,實現兩款旗艦模型免費開放與統一調度,通過標準化測試、可視化看板與智

大數據 , API , hadoop , 3d , Max

收藏 評論

茗鶴APS和MES - APS系統在汽車零部件廠的應用:實現高效、精準生產排產

汽車零部件製造具有組件工藝精密、同一零部件客户需求多樣、供應鏈需響應迅速的行業特性,其核心生產環節的協同效率直接影響產品質量與企業交付能力。APS系統通過構建"需求-產能-物流"的一體化調度模型,將離散的生產要素轉化為協同聯動的有機整體,為零部件廠解決多工藝銜接難題、平衡客户優先級、穩定產線運行提供了系統性解決方案。 產品工藝路線協同 汽車零部件的原材準備、成型加工、

數字化轉型 , 大數據 , 精益生產 , 生產計劃

收藏 評論

mob64ca14154457 - E2.在shell中正確退出當前表達式

Shell Daily 2025-12-19: 優雅退場 (Trap) 寫腳本時,我們通常會在末尾寫上一句 rm /tmp/data_export.tmp 來清理現場。但如果腳本執行中途報錯退出了?或者用户不耐煩按了 Ctrl+C 強行終止?那行清理代碼永遠不會執行,垃圾文件就會日積月累。 要想寫出“死得體面”、不留垃圾的健壯腳本,你不能只關注開始,更要關注結束。這時

大數據 , 刪除文件 , hadoop , 臨時文件 , shell

收藏 評論

mob64ca140d61c6 - h2過濾條件使用大於小於會使用索引嗎

1.結論 對於輸入過濾條件後BOS報“列名不正確”的過濾條件,要在列名前增加x2標識 無效的過濾 FNumber in (002,003,004,005,011,020) 正確的過濾 x2.FNumber in (002,003,004,005,011,020) 2.完全可以不看的探索過程 有客户需要我

標識符 , 字段 , 大數據 , h2過濾條件使用大於小於會使用索引嗎 , 數據 , 數據倉庫

收藏 評論

KPaaS集成擴展平台 - 跨境電商企業如何打通領星ERP與金蝶雲星空?接口字段與同步邏輯

對於使用領星ERP進行跨境電商運營管理,同時依賴金蝶雲星空處理財務與供應鏈等核心業務的企業而言,打通兩個系統之間的數據壁壘,實現高效、穩定、實時的數據同步,成為亟待解決的技術挑戰。 本文將從技術視角出發,深入探討領星ERP與金蝶雲星空之間常見的集成場景及對應接口參數,並結合數據集成平台解決方案,分析如何以更靈活、低代碼的方式構建穩定可靠的數據通道。 典型集成場景與數據

異構數據源管理 , ETL工具 , 大數據 , yyds乾貨盤點 , 數據倉庫 , 異構數據整合 , 系統集成 , 數據集成與應用集成

收藏 評論

u_15444077 - 警惕大數據處理中的“檢查者悖論”

本文分享自天翼雲開發者社區《警惕大數據處理中的“檢查者悖論》.作者:王****淋 什麼是檢查者悖論: 觀察的角度不同,得出的統計結論也不同。有時又稱為"候車悖論", "等待時間悖論" 為了形象説明,我們設計了一種模擬場景: 班級人數統計,來用實例説明這個問題 模擬場景: 班級人數統計 小明與小華要完成一個任務:統計學校中的 平均班級人數。但二

大數據 , 數據倉庫

收藏 評論

ApacheFlink - Forrester發佈流式數據平台報告:Flink 創始團隊躋身領導者行列,實時AI能力獲權威認可

近日,全球權威研究機構 Forrester 正式發佈《The Forrester Wave™: Streaming Data Platforms, Q4 2025》報告(後簡稱“報告”),Ververica 首次進入領導者象限,成為該年度報告中最受關注的"新晉領導者"。 Ververica 由 Apache Flink 的創始團隊建立,這一突破性成就標誌着 Ververica 在全球流式數據平台領

大數據 , flink , 實時計算

收藏 評論

bingfeng - stormsniffer貓眼抓包購票教學

分享您對 Ambire 錢包的真實看法,並獲得獨家數字藝術作品。 G2 平台是我們的合作伙伴之一,現在他們正在舉行一個特別的活動。限量版 NFT 正在搶購中,你所需要做的就是在 G2 上對 Ambire 錢包做出評價。 如何在你的投資組合中免費獲得一個獨特的數字藝術作品,下文將詳細展開説明! Ambire 用户,獲得 NFT 只

sed , 電子郵件地址 , Storm , 大數據 , 區塊鏈 , 上傳 , nft

收藏 評論

u_14767244 - 字節跳動:Apache Doris + AI 一站式融合數據引擎的探索與實踐

隨着人工智能技術在業務中的滲透,我們逐漸意識到:AI 不僅是提升效率的工具,更是重構數據處理與消費方式的核心驅動力。在這一背景下,我們思考:能否構建一款「AI + Data」一站式融合的數據引擎? 它不僅能夠統一處理文本、音視頻等非結構化數據與傳統結構化數據,還能為算法工程師提供流暢的數據開發體驗,實現數據處理與 AI 模型無縫銜接,並能確保數據處理負載與在線服務負載完全隔離。這是 20

大數據 , 數據 , 搜索 , 數據倉庫 , AI , 人工智能 , Python

收藏 評論

思否編輯部 - 共歲寒之約!VeloxCon China 2025 參會攻略出爐

作為全球 Velox 社區的重要年度活動,這是 VeloxCon 首次來到中國。 大會不僅邀請到 Meta 核心開發團隊,更特別聚焦中國技術生態,邀請了來自螞蟻集團、阿里雲、騰訊、小紅書等企業的工程師與技術負責人,分享 Velox 在本土業務中的真實應用。 從大模型訓練的數據 pipeline 優化、湖倉一體下的查詢加速,到流批融合執行與 GPU 資源協同。這些實踐源於高併發、強實時、大規模的生產

大數據 , gpu , 開發者

收藏 評論

衞斯理 - spark sql中over函數range和rows框架

本文基於 sqlite3 進行測試,準備工作如下 import sqlite3 conn = sqlite3.connect('window.db') cur = conn.cursor() ##### 原始數據 sql = '''select * from window;''' cur.execute(sql) print(cur.fetchall()) #

spark , 大數據 , sqlite , SQL , 窗口函數

收藏 評論

南大通用GBase - 南大通用GBase 8a v952-兼容模式-對混合節點和純data節點縮容操作手順

説明 本文僅從功能驗證角度來進行流程操作,gbase v952 兼容模式對混合節點和純data節點縮容。 縮容目標 集羣目前有四個節點,兩個管理節點,四個data節點,其中兩台機器是混合部署。現在準備縮容一台混合節點一台純data節點。 集羣現狀gcadmi信息如下: [gbase@node1 gcinstall]$ gcadmin CLU

sed , GBase 8a , 大數據 , ip , 數據倉庫 , ci

收藏 評論

建投數據 - 以“居安思危”之智,夯實數字時代業務連續性基石——建投數據通過ISO22301再認證

近日,建投數據順利通過ISO22301業務連續性管理體系再認證。這標誌着建投數據在系統性風險管控、應急響應與業務連續運營能力等方面,持續符合國際標準,其數字化服務的可靠性與韌性再次獲得權威認可。 業務連續性管理作為一套科學系統的管理流程,旨在引導企業主動識別關鍵業務運營中的潛在威脅,構建從預案制定、資源儲備到響應恢復的全方位彈性體系。通過持續規劃、演練、評審與改進,

大數據 , 系統故障 , 數據倉庫 , 最小化 , 解決方案

收藏 評論

碼農小哥 - 論文收錄索引和收錄號

SCI (《科學引文索引》,英文全稱為 Science Citation Index )是美國科學情報研究所( Institute for Scientific Information ,簡稱 ISI )出版的一部世界著名的期刊文獻檢索工具,其出版形式包括印刷版期刊和光盤版及聯機數據庫,現在還發行了互聯網上 Web 版數據庫。 SCI 收錄全世界出

大數據 , 數據倉庫 , 論文收錄索引和收錄號 , 數據庫 , 常用詞 , ci

收藏 評論

ApacheSeaTunnel - 深陷 Sqoop+Canal 困境?中控技術用 SeaTunnel 打造高效數據採集破局方案

核心數據一致性達99.99%、開發效率提升50%、運維成本降低70%——這是中控技術採用 Apache SeaTunnel 構建數據採集框架及相關數據服務體系後的實測成效。 上週 Apache SeaTunnel 線上 Meetup 上,中控技術工程師崔俊樂分享了這家大型工業 AI 平台型公司的實踐經驗。我們已將視頻內容整理成文,供行業同仁參考借鑑。 作者簡介 崔俊樂,中控技

spark , 大數據 , 運維 , 開源 , seatunnel , apache

收藏 評論

mob64ca13f7ecc9 - Python 入門教程

什麼是 MCP? Model Context Protocol (MCP) 直譯就是“模型上下文協議”,其實它就是一個標準接口,讓大模型可以像插 USB-C 接口一樣,去訪問你的工具、代碼庫和數據源。在 Claude Code 中,可以通過MCP連接到數百個外部工具和數據源。 當工具變成一個 MCP 服務器,Claude Code 這類客户端就能發現這個工具(

github , 大數據 , AI編程 , chatgpt , 前端開發 , qwen , Javascript

收藏 評論

mob64ca140234eb - yarn run serve打包帶前綴

在linux下最常見的壓縮文件通常都是以.tar.gz為結尾的,除此之外還有.tar, .gz, .bz2, .zip等等。以前也介紹過linux系統中的後綴名其實要不要無所謂,但是對於壓縮文件來講必須要帶上。這是為了判斷壓縮文件是由哪種壓縮工具所壓縮,而後才能去正確的解壓縮這個文件。以下介紹常見的後綴名所對應的壓縮工具。 .gz

文件名 , 大數據 , yarn , 壓縮文件 , 解壓縮 , yarn run serve打包帶前綴

收藏 評論

WL - hadoop 大數據學習03(hadoop生態以及非高可用集羣搭建)

hadoop 大數據主要生態組成架構圖以及描述 HDFS 高吞吐量的分佈式文件系統 YARN 用於任務調度和資源管理及分配的框架 MapReduce 運行與YARN之上,用於並行處理大數據的框架 Zookeeper 高性能的分佈式應用協調服務 Flume 日誌收集服務,用於將大量日誌數據衝不同的來源收集、聚合、最終移動到一個具體中心進行存續 Sqoop 用於將關係型數據庫與hado

hdfs , 大數據 , yarn , hadoop

收藏 評論

阿森CTO - STM32的USART串口通信

@TOC 一、通信接口 通信的目的:將一個設備的數據傳送到另一個設備,擴展硬件系統通信協議︰制定通信的規則,通信雙方按照協議規則進行數據收發 二、串口通信 串口是一種應用十分廣泛的通訊接口,串口成本低、容易使用、通信線路簡單,可實現兩個設備的互相通信 單片機的串口可以使單片機與單片機、單片機與電腦、單片機與各式各樣的模塊互相通信,極大地擴展

串口 , 大數據 , yyds乾貨盤點 , 數據 , 數據倉庫 , 寄存器

收藏 評論

u_15015752 - 什麼是圖數據庫(Graph Database)?一文了解圖數據庫

圖數據庫(Graph Database)是一種以“圖結構”為核心的數據管理系統,通節點(Node)、關係(Edge)和屬性(Property)來表示和存儲數據,重點描述數據之間的關聯關係。與傳統關係型數據庫以表和外鍵為中心不同,圖數據庫將關係進行直接存儲和計算,能夠高效地進行多跳關聯查詢和複雜關係分析,特別適合用於社交網絡、推薦系統、知識圖譜、風控反欺詐等以關係密集型數據為核心的

圖數據庫 , 大數據 , 數據 , 數據倉庫 , 關係數據庫

收藏 評論

無風何其浪 - 《數字化破局抖音電商:從爆品打造到閉環運營實戰》 第三章 第一節

前言 第一部分 盈利思維與運營基礎 第1章 抖音電商盈利思維 1.1 盈虧平衡點分析:C一年半實戰覆盤 1.2 抖音電商的四種盈利模式及適用場景 1.3 IT思維做運營:數據驅動、系統思考、敏捷迭代 1.4 構建運營的“安全區”與“加速器”:與平台共生 第2章 抖音電商全景認知 2

經驗分享 , redis , 數據挖掘 , 大數據 , 信息可視化 , 數據庫 , 數據分析

收藏 評論

mob64ca1403c772 - id字段作為數據庫索引

id 屬性 id屬性指定 HTML 元素的唯一 ID。id屬性的值在 HTML 文檔中必須是唯一的。 id屬性用於指向樣式表中的特定樣式聲明。JavaScript 也可使用它來訪問和操作擁有特定 ID 的元素。 id 的語法是:寫一個井號 (#),後跟一個 id 名稱。然後,在花括號 {} 中定義 CSS 屬性。

大數據 , 數據倉庫 , id字段作為數據庫索引 , HTML , 前端

收藏 評論