tag shuffle

標籤
貢獻1
8
10:04 PM · Nov 22 ,2025

@shuffle / 博客 RSS 訂閱

阿里雲大數據AI - MaxCompute聚簇優化推薦功能發佈,單日節省2PB Shuffle、7000+CU!

Shuffle優化利器|聚簇優化推薦 在MaxCompute每日EB級規模的計算場景中,Join、Group By、Window等算子所產生的Shuffle數據流量已佔據整體網絡傳輸的60%以上,成為影響大數據計算成本的核心因素。以阿里內部某業務為例,單日Shuffle數據量高達2 PB,直接消耗7000+ CU資源——這一數字僅是問題的冰山一角。 MaxCompute 哈希聚簇(Hash Clu

hash , shuffle

收藏 評論