tag 集羣

標籤
貢獻40
147
11:17 AM · Nov 03 ,2025

@集羣 / 博客 RSS 訂閱

大成鵬通信 - 10G~800G Infiniband物理層吞吐量、線速度、編碼開銷、帶寬整理

Infiniband專為高性能計算設計,採用原生RDMA技術,提供超低延遲和高吞吐量,支持無阻塞Fat-Tree拓撲,在大型模型訓練(如千卡GPU集羣)中能顯著減少通信瓶頸,但其有別於以太網的物理層標準,對光模塊設計研發提出了不一樣的要求。今天整理40G~800G IB物理層吞吐量、線速度、編碼開銷、帶寬,為各位在IB設備選型提供快速參考。IB物理層通道數支持1/2/4/8/12

服務器 , 數據 , 高性能計算 , 集羣

收藏 評論

星融元Asterfusion - 800G光模塊:SR8、DR8、FR4、LR4與ZR技術對比

邁向800G:技術演進、核心突破與未來展望 儘管400G數據中心時代正全面展開,但技術發展的腳步並未停歇。800G的實現並非一蹴而就,而是在400G堅實技術基礎上持續演進,並通過創新突破應對新挑戰。本文將從技術驅動、核心突破、部署策略及未來趨勢等方面,系統闡述800G的技術發展路徑。 從400G到800G:技術演進的堅實基礎 PAM4編碼的深化應用:在400G中

服務器 , 800G , 數據中心 , 光模塊 , 集羣

收藏 評論

修狗 - VastbaseG100集羣部署實操

背景 近日的工作涉及到數據庫的集羣部署,為了熟悉過程,參考VastgbaseG100官方文檔進行部署。 參考文檔 https://docs.vastdata.com.cn/zh/docs/VastbaseG100Ver2.2.15/do... 實操 這裏採用HAS+DCS+Vastbase的解決方案,詳情可參考 海量智庫第8期|Vastbase G100核心技術介紹之高可用軟件實現原理 概述

數據庫 , 集羣

收藏 評論

阿里雲開發者 - 構建集羣runner併發數在哪裏設置呢?

在雲效中,構建集羣的 Runner 併發數可以在構建集羣的設置中進行配置。具體操作步驟如下: 登錄雲效控制枱,進入構建集羣頁面。 找到需要配置的構建集羣,點擊其對應的“管理”按鈕。 在構建集羣的設置頁面中,可以看到“Runner 併發數”設置項。 在“Runner 併發數”設置項中,可以設置該構建集羣中 Runner 的最大併發數。默認情況下,該值為 1,即每次只能執行一個構建任務。 完整內容請點

構建工具 , 雲計算 , 阿里雲 , 集羣

收藏 評論

SelectDB技術團隊 - Doris Catalog 已上線!性能提升 200x,全面優於 JDBC Catalog,跨集羣查詢邁入高性能分析時代

“統一”是 Apache Doris 長期以來秉持的設計理念之一。在這一理念指引下,構建完善的 Catalog 生態是實現異構數據源統一查詢分析的關鍵。目前,Doris 已支持 Iceberg、Paimon、Hudi 等數據湖 Catalog,以及 JDBC Catalog,用户無需遷移數據,即可對不同數據湖和傳統數據庫進行聯邦查詢分析。 本文聚焦 Doris 多集羣間的查詢分析。實現跨 Dori

數據庫 , apache-doris , dorisdb , 集羣

收藏 評論

Cosann - 修復helm部署cilium卸載重裝後分配網段和K8s網段不一致的問題

一、k8s初始化 在使用kubeadm初始化k8s節點時,使用了指定了POD的IPV4 CIDR範圍 --pod-network-cidr=10.42.0.0/16 APISERVER_IP="192.168.56.10" NODE_NAME="k8s-master-1" sudo kubeadm init \ --kubernetes-version=v1.28.15

Helm , K8s , 服務器 , cilium , 集羣

收藏 評論

lenglingx - 一些常見的監控工具

一些常見的監控工具集 1. Zabbix Zabbix是一款開源的企業級網絡監控解決方案,提供分佈式監控、實時監控、網絡發現和Web界面等功能。它支持多種數據收集方式,包括SNMP、IPMI、JMX等,具有強大的報警機制和可視化功能。Zabbix一開始就是更多服務於網絡設備、服務器的監控,適合傳統IT基礎設施監控 。 2. Prometheus Prome

服務器 , 數據 , 網絡監控 , 集羣 , 監控工具

收藏 評論

雲掣科技 - 開源大數據集羣部署(八)Ranger編譯部署

作者:櫰木 在hd1.dtstack.com主機root權限下操作。 1、 編譯ranger ranger二進制包編譯過程在本次過程中不做詳細説明。簡單説明如下: 在pom.xml中更改對應hadoop集羣組件版本。 ranger2編譯前提條件是python3和mvn已安裝完成。 編譯命令: mvn clean compile package install -Pranger-jd

部署 , 大數據 , 集羣

收藏 評論

flydean - 在wildfly 21中搭建cluster集羣

簡介 wildfly是一個非常強大的工具,我們可以輕鬆的使用wildfly部署應用程序,更為強大的是,wildfly可以很方便的部署cluster應用。 今天我們通過一個例子來講解下wildfly如何構建cluster應用。 下載軟件和相關組件 假如我們有兩個host,一個稱為master,一個稱為slave,我們需要在兩個機子上面安裝wildfly,構建成domain模式。然後需要在Domain

集羣管理系統 , 服務器 , 集羣 , web服務器 , cluster

收藏 評論

INSVAST - 毅碩HPC | Lustre文件系統在HPC集羣中的部署實戰

在高性能計算(HPC)領域,計算能力(算力)與數據吞吐能力(I/O)始終是相輔相成的。隨着並行計算規模的擴大,傳統的NAS存儲往往會成為系統的瓶頸。Lustre作為一種開源的、分佈式並行文件系統,憑藉其卓越的可擴展性和極高的I/O吞吐量,成為了全球Top 500超算中心的首選。 一、 為什麼HPC離不開Lustre? 在典型的HPC任務中(如氣象預報、基因測序

部署 , 服務器 , HPC , 高性能計算 , 集羣 , Lustre

收藏 評論

kuaidata - 蘇州老闆別踩坑!企業服務器選購“避雷”全攻略,省心又省錢

在數字經濟浪潮下,服務器已成為蘇州企業,無論是智能製造、生物醫藥還是現代服務業的“數字心臟”。一次錯誤的採購,可能導致業務卡頓、數據風險或預算失控。作為在蘇州本土服務器採購和託管行業深耕近二十年的專業服務商,蘇州勝網本文專為蘇州企業梳理,從需求到售後,教你做出明智決策。 企業採購服務器如何選型? 第一章:需求自檢——買之前

服務器 , 數據 , 公有云 , 集羣

收藏 評論

PingCAP - 月活超 1.1 億,用户超 4 億,你也在用的「知乎」是如何在超大規模 TiDB 集羣上玩轉多雲多活的?來聽聽知乎代曉磊的答案!

導讀 代曉磊,知乎數據庫負責人,同時也是 TiDB 社區北京地區組織者,一位有着 13 年數據庫從業經驗的數據庫老兵,對數據庫運維及 TiDB 有着豐富的實踐經驗。在“2024 新年圍爐茶會”中,他分享了《TiDB 在知乎實踐的那些事》話題,回顧了最近兩年知乎 TiDB 實踐的最新進展 ,以及對數據庫未來發 展方向的個人觀點,本文根據代曉磊老師的演講實錄進行整理。 視頻鏈接: https://ww

數據庫 , 集羣 , tidb

收藏 評論

INSVAST - 毅碩HPC | 一文詳解HPC環境中的MPI並行計算

一、MPI 是什麼? 1. 並行計算的三種模式 模式 特點 典型工具 共享內存(Shared Memory)

服務器 , HPC , MPI , 安裝教程 , 高性能計算 , 毅碩科技 , 集羣

收藏 評論

雲掣科技 - 開源大數據集羣部署(二十)Trino部署

作者:櫰木 1 解壓trino的包到opt目錄 cd /root/bigdata tar -xzvf trino-server-389.tar.gz -C /opt/ ln -s /opt/trino-server-389 /opt/trino 2 創建trino用户,並配置專屬jdk11 useradd trino su – trino chown -R trino:hadoop /opt/tr

大數據 , 雲原生 , 集羣

收藏 評論

ICollection - 達夢數據庫V8數據守護集羣配置[2]

4 創建數據庫實例   配置數據守護集羣,需要先在主機和備機上創建數據庫實例。創建數據庫實例可以使用圖形方式創建,也可以使用文本方式創建。考慮操作的連續性,一般配置數據守護集羣,一般採用文本方式創建數據庫實例。 4.1 圖形方式創建   使用dameng用户運行dmdbms/tool/dbca.sh,出現數據庫配置助手。選擇創建數據庫實例。   配置數據守護集

集羣 , 達夢數據庫

收藏 評論

夢裏憂鬱 - k8s證書過期問題解決

維護 K8s 集羣,證書過期問題是繞不過去的坎,特別是控制平面,嚴重依賴一套 PKI 證書來保證組件間的安全通信,而一旦核心證書過期(如 APIServer),無論使用雲方案還是私有化部署,都可能導致 APIServer 拒絕連接,Kubelet 節點失聯等。 一、查看證書 openssl x509 -in /etc/kubernetes/pki/apise

證書過期 , 服務器 , 安全通信 , 重啓 , 集羣

收藏 評論

企業任務調度平台 - CDH集羣管理:如何用技術簡化複雜性?

大數據集羣搭建及管理 問題:需要搭建1000 台服務器的集羣,其中集羣包含Hive、Hbase、Flume、Kafka、Spark 等集羣,需要多長時間搭建好? 思考: 搭建四台集羣與搭建1000 台集羣的區別?比較相似。 解決問題:(以搭建HDFS為例) 集羣環境規劃 首先我們需要進行集羣基礎環境的規劃:比如每台節點的網絡 ip 規劃,節點時間同步,每台節點的名稱,每台節點安裝 jdk,節點之間

集羣管理系統 , 大數據處理 , cloudera , hadoop , 集羣

收藏 評論