@starrocks

Stories List
@hangzhoukaiyunjizhikejiyouxiangongsi

百草味數據架構升級實踐:打造 Always Ready 的企業級數據平台

朱齊天,百草味數據部負責人 前言 百草味是國內知名的休閒零食品牌,業務覆蓋線上電商平台與線下零售渠道,服務用户超過 2 億。隨着商品 SKU 數量劇增和渠道多元化發展,百草味在供應鏈、運營、銷售等環節積累了海量數據,對數據的依賴也日益增強。 在這一背景下,百草味選擇與 CloudCanal 合作,構建統一的數據集成平台,支撐數據驅動的業務運營與決策。 業務背景 百草味的業務涵蓋從原料採購、生

@starrocks

淘寶閃購實時分析黑科技:StarRocks + Paimon撐起秋天第一波奶茶自由

作者:馬龍傑(澄諾) 阿里巴巴中國電商事業羣-餓了麼-DIC數據智能中心-數據研發流量組 摘要:實時湖倉架構賦能即時零售,在多端流量與億級營銷投入下支撐分鐘級決策與體驗升級。 導讀: 當“秋天的第一杯奶茶”衝上熱搜時,很多人看到的是用户的熱情與訂單的暴漲,而在背後,技術團隊同樣在全力以赴。自 4 月 30 日淘寶閃購上線以來,短短 100 天,業務團隊創造了一個奇蹟,技術團隊則在高併發與

starrocks Avatar

@starrocks

Nickname StarRocks

@starrocks

StarRocks:Connect Data Analytics with the World

作者:StarRocks TSC Member、鏡舟科技 CTO——張友東 本文基於鏡舟科技 CTO、StarRocks TSC 成員張友東在 StarRocks Connect 2025 活動上的主題分享整理而成。圍繞大會的核心主題——“數據與世界的連接”,本文將從三個維度進行闡述: 過去:StarRocks 通過開源的力量,將全球的社區用户緊密聯繫在一起。 現在:StarRo

starrocks Avatar

@starrocks

Nickname StarRocks

@mirrorship

誰能更快交付,誰就能更快贏得市場

隨着新能源汽車新品持續進化,全球消費者再次感受到了科技與速度的結合。 2025 年的汽車市場,“內卷”已成常態,不確定性持續增加。如何每年去交付數百萬新增客户的整車,以及近數千萬存量客户的備件,並且提升全流程的交付體驗,是企業面臨的核心課題之一。 這一挑戰的本質,是如何在龐大且複雜的產供銷體系中實現敏捷響應。而在數字化浪潮中,企業對數據平台的要求,與汽車行業如出一轍:誰能更快交付,誰就能更快贏得

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

StarRocks 向量索引如何讓大模型“記性更好”?

隨着 ChatGPT、DeepSeek 等大語言模型的普及,我們已經能夠與 AI 進行流暢的對話。然而,即使是最先進的大模型也面臨着“記憶困境”,具體表現模型只能記住訓練時接觸的知識,且這些知識在使用時很可能會過期。實際應用或在處理特定領域問題時,可能生成看似合理但實際錯誤的內容。 大模型的“知識固化”問題一定程度上限制了其在企業級應用中的價值。那麼,如何讓大模型擁有更好的“記性”,實現知識的動態

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

StarRocks × Tableau 連接器完整使用指南 | 高效數據分析從連接開始

一、導語:為什麼選擇 StarRocks Tableau 連接器? 在當今數據驅動的商業環境中,企業不僅需要一個能夠處理海量數據的高性能分析數據庫,還需要一個直觀、強大的可視化工具來解讀數據背後的故事。StarRocks 作為新一代極速全場景 MPP 數據庫,以其卓越的 OLAP 分析能力著稱;而 Tableau 則是數據可視化領域的領導者。 [1] StarRocks Tableau 連接器正是

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

什麼是 Tableau?深入解析數據可視化工具與StarRocks集成

Tableau:企業級數據可視化的標杆工具 Tableau 是一款專業的數據可視化與商業智能平台,通過直觀的拖拽操作界面,將複雜的數據轉化為易於理解的可視化圖表。作為市場上廣泛認可的 BI 工具之一,Tableau 憑藉其強大的可視化能力和用户友好的操作界面,被各行各業廣泛應用於數據分析、報告生成和業務決策支持。 Tableau 的核心優勢在於其低代碼的操作方式。用户無需編寫複雜的 SQL 查詢或

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@starrocks

StarRocks 助力印度領先即時零售平台 Zepto 構建實時洞察能力

導讀: 開源無國界,在本期 “StarRocks 全球用户精選案例” 中,我們走進印度即時零售品牌 Zepto。 這家以 “10 分鐘送達” 聞名的公司,業務已覆蓋 50+ 城市、45,000+ 商品,品類橫跨生鮮雜貨、電子產品、美妝個護、服飾、玩具等。憑藉前沿技術與戰略佈局的前置倉網絡,Zepto 在短短几年間徹底改變了印度的即時零售格局。 隨着規模擴張,Zepto 藉助 StarRo

starrocks Avatar

@starrocks

Nickname StarRocks

@chunzhendegaoshan

通過ETL工具,同步SQLserver數據至starrocks數據庫

在數字化進程不斷深入的今天,越來越多的企業正面臨“數據孤島”的挑戰——數據分散在多個系統和數據庫中,難以統一整合與管理。而有效的數據集成與同步,已成為釋放數據價值、支持業務決策的關鍵一環。 ETLCloud作為一款零代碼的ETL工具,正是為解決這類問題而生。它能夠快速連接各類數據源與應用系統,無需編寫代碼,即可實現高效、穩定的數據同步與傳輸。本文將以從 SQL Server 到 StarRocks

chunzhendegaoshan Avatar

@chunzhendegaoshan

Nickname RestCloud

@elhix0bg

從“開源開放”走向“高效智能”:阿里雲 EMR 年度重磅發佈

EMR發展歷程回顧 自2016年首次發佈以來,阿里雲EMR始終以開源生態為基石,逐步構建起覆蓋Hadoop、Hive、Spark、StarRocks等主流開源計算和存儲引擎的公有云大數據平台。九年間,EMR產品技術不僅支撐了阿里巴巴集團內部如淘寶閃購、A+等核心業務的海量數據處理需求,也服務了互聯網、金融、零售、製造等眾多行業的公有云客户。從最初的開源組件版本和服務管控,到如今面向湖倉一體、實時智

elhix0bg Avatar

@elhix0bg

Nickname 阿里雲大數據AI

@mirrorship

什麼是 MPP 數據庫?解鎖海量數據分析的關鍵技術

為什麼需要 MPP 數據庫? 在數據爆炸的時代,傳統數據庫處理 TB 甚至 PB 級數據時往往力不從心,查詢緩慢,無法支撐實時分析需求。這種情況下,MPP 數據庫成為解決大規模數據分析性能瓶頸的關鍵技術。 想象一下:一個電商平台在大促期間,原本穩定的系統突然卡死;一個數據彙總應用在處理全年數據時崩潰。這些都是我們在高併發、高吞吐量場景下常見的問題。為什麼會這樣?因為系統設計時沒有考慮極限情況下的數

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@starrocks

Airtable 如何用 StarRocks 構建數據驗證系統

摘要:歸檔冷數據至 S3,藉助 StarRocks 實現一致性驗證與存儲降本 作者:Riley ,Airtable 數據基礎設施團隊 導讀: 開源無國界,在本期“StarRocks 全球用户精選案例”專欄中,我們將介紹總部位於舊金山的雲端協作服務公司 Airtable。作為一家致力於讓用户像操作表格一樣輕鬆構建數據應用的企業,Airtable 在 2025 年完成

starrocks Avatar

@starrocks

Nickname StarRocks

@starrocks

從多引擎到統一平台:去哪兒網的 StarRocks 實踐

作者:任志民,2023 年加入去哪兒旅行數據平台團隊,主要負責數據平台 OLAP 引擎基礎建設和相關數據產品研發工作。 導讀: 在去哪兒網新一代數據平台架構中,StarRocks 作為統一 OLAP 引擎,替代了原有的 Trino、Presto、Druid、Impala、Kudu、Iceberg、ClickHouse 等多個引擎。如今,去哪兒網 StarRocks 集羣覆蓋全司業務線,支撐

starrocks Avatar

@starrocks

Nickname StarRocks

@mirrorship

告別 T+1!解密金融級實時數據平台的構建與實踐

在數字金融浪潮下,數據處理的“實時性”已不再是加分項,而是逐漸成為決定業務價值的核心競爭力。 然而,金融機構在追求實時的道路上,往往陷入一個新的困境:實時分析系統與離線大數據平台形成了兩套獨立的“煙囱”,數據孤島、口徑不一、運維複雜、成本高昂等問題隨之而來。如何打破壁壘,在統一的平台上實現對實時流數據和海量歷史數據的統一管理與高性能分析,成為了當下金融機構的核心訴求。 一、業務困境:傳統“T+1”

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

2025 年非關係型數據庫全面指南:類型、優勢

非關係型數據庫的分類與特點 隨着數據量呈指數級增長和數據類型日益多樣化,傳統關係型數據庫在處理海量非結構化數據時面臨着嚴峻挑戰。非關係型數據庫(NoSQL)應運而生,它摒棄了傳統關係模型的約束,採用更靈活的數據存儲方式,為大數據時代的多樣化需求提供瞭解決方案。 2025 年,非關係型數據庫已經發展成為數據基礎設施的重要組成部分,根據其數據模型和存儲特點,可以將非關係型數據庫分為以下幾大類型: 鍵

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

什麼是關係型數據庫?全面解析 RDBMS 核心原理與應用實踐

關係型數據庫基礎:定義與核心概念 關係型數據庫(Relational Database)是一種基於關係模型的數據庫管理系統,它以表格(table)的形式存儲數據,並通過結構化查詢語言(SQL)進行數據操作。作為當今最主流的數據庫類型,關係型數據庫以其嚴格的數據一致性、完整性和可靠性,成為企業信息系統的基石。 關係型數據庫的核心特徵 關係型數據庫區別於其他類型數據庫的關鍵特徵包括: 表格化數據結

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

數據湖典型架構解析:2025 年湖倉一體化解決方案

數據湖架構概述:從傳統模型到 2025 年新範式 數據湖作為存儲海量異構數據的中央倉庫,其架構設計直接影響企業數據價值的釋放效率。傳統數據湖架構主要關注數據的存儲和管理,而 2025 年的數據湖架構已經演變為更加智能化、自動化的綜合性數據平台。 數據湖本質上是一個存儲庫,允許企業以原生格式存儲各類數據,包括結構化、半結構化和非結構化數據。與傳統數據倉庫相比,數據湖採用“讀時模式”(schema-o

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

什麼是列存儲(Columnar Storage)?深度解析其原理與應用場景

列存儲的基本概念:顛覆傳統的數據組織方式 列存儲(Column Storage)是一種革命性的數據庫存儲技術,它通過按列而非按行組織數據,從根本上改變了數據的物理存儲結構。與傳統行存儲數據庫不同,列式數據庫將每一列的數據連續存儲在一起,而不是將每一行的數據存儲在一起。這種看似簡單的存儲結構變化,卻為分析型查詢帶來了質的飛躍。 要理解列存儲的本質,我們可以通過一個簡單的例子來説明。假設有一個包含用户

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@mirrorship

載譽而歸!鏡舟科技亮相2025 OSCAR開源產業大會,榮獲“開源+商業化產品”獎

10月28日,2025 OSCAR 開源產業大會在北京圓滿落幕。憑藉其在開源技術創新與商業化落地方面的卓越成就,鏡舟科技榮獲“2025年度開源+商業化產品”獎項。該獎聚焦開源技術的工程化能力與商業落地價值,旨在表彰那些不僅在開源社區擁有強大技術影響力,更成功地將開源技術轉化為成熟、可靠的商業產品,並創造出顯著市場價值的標杆企業。 本屆大會上,圍繞湖倉一體架構帶來的降本增效、國產化適配下的自主可

mirrorship Avatar

@mirrorship

Nickname 鏡舟科技

@starrocks

實戰|StarRocks 通過 JDBC Catalog 訪問 MongoDB 的數據

方案介紹 本文檔介紹如何通過 StarRocks 的 JDBC Catalog 功能,結合 MongoDB BI Connector,將 MongoDB 數據便捷接入 StarRocks,實現數據打通和 SQL 查詢分析,以下是整體流程圖。 前提條件 StarRocks 環境:版本 ≥ 3.0,支持 JDBC Catalog 功能。 MongoDB BI Connector:已安裝並運行,

starrocks Avatar

@starrocks

Nickname StarRocks

@starrocks

告別 Hadoop,擁抱 StarRocks!政採雲數據平台升級之路

作者:李進勇 政採雲研發中心數據平台負責人 導讀: 在當下數字化轉型的浪潮中,數據早已從輔助資源躍升為核心生產資料和決策基礎。政府提升治理效能,企業優化運營、創新服務,都深度依賴對海量數據的實時洞察與高效處理。 政採雲平台作為政府採購數字化的創新典範,集監管、交易、服務於一體,經過近九年的發展,已成為行業內服務範圍最廣、用户數量最多、交易最活躍、監管產品最豐富的跨區域、跨層級、跨領域的一

starrocks Avatar

@starrocks

Nickname StarRocks

@starrocks

StarRocks 4.0:Real-Time Intelligence on Lakehouse

回顧 StarRocks 的進化之路,每一次大版本迭代都緊扣時代對數據分析的核心訴求。 StarRocks 1.x,打造極速查詢性能,解決 BI 報表、數據探尋慢的痛點問題。 StarRocks 2.x,解決‘實時分析’的難題,幫助用户更快的洞察業務。 StarRocks 3.x,升級存算分離架構,打造極速統一的湖倉分析能力,讓數據分析更加的簡單高效。 在新的 AI 時代,模型訓練推理與

starrocks Avatar

@starrocks

Nickname StarRocks

@starrocks

從 ClickHouse 到 StarRocks 存算分離: 攜程 UBT 架構升級實踐

作者:魏寧 攜程大數據平台開發專家 導讀: 在攜程龐大的數據體系中,UBT(User Behavior Tracking,用户行為追蹤系統)承擔着核心的用户行為採集與分析任務,日新增數據量高達 30 TB。為應對不斷增長的業務與性能需求,攜程技術團隊將 UBT 從 ClickHouse 遷移至 StarRocks 存算分離架構。 遷移後,系統實現了查詢性能從秒級到毫秒級的跨越——平均查詢耗

starrocks Avatar

@starrocks

Nickname StarRocks