截至 2025 年 11 月,DataEase(v2.10+ 版本) 作為一款國產開源、可私有化部署的 BI 可視化工具,已支持對接多種 CMP 7.3 生態及其他主流大數據源。其核心連接方式為 JDBC/ODBC 或原生驅動,適用於金融、政務、製造等行業的混合數據架構。

以下是 DataEase 官方支持或經社區驗證可穩定連接 的 CMP 7.3 及相關hadoop大數據源清單:


✅ 一、CMP 7.3 生態核心組件

數據源

支持方式

驅動要求

備註

Apache Hive

JDBC

hive-jdbc-*.jar(推薦使用集羣配套版本)

支持 HiveServer2,兼容 CDH / CMP / MRS 等發行版

Impala

JDBC(自定義)

Cloudera 官方 ImpalaJDBC42.jar

需手動上傳驅動,填寫自定義 JDBC URL

Spark SQL

Thrift Server (JDBC)

spark-thriftserver-jdbc.jar  hive-jdbc

需啓動 Spark Thrift Server

HBase

⚠️間接支持

通過 Phoenix JDBC

需部署Apache Phoenix提供 SQL 接口

Kudu

不直接支持

可通過 Impala 查詢 Kudu 表(間接支持)

💡 提示:Hive 和 Impala 是 DataEase 在 CMP 7.3 場景中最成熟、最常用的數據源。


✅ 二、其他主流大數據/分析型數據庫(非 CMP 7.3 但常共存)

數據源

支持方式

驅動要求

兼容性説明

ClickHouse

原生支持

內置 JDBC 驅動

v2.1+ 起官方集成,性能優異

Doris / Apache Doris

原生支持

內置 MySQL 協議驅動

通過 MySQL JDBC 連接(Doris 兼容 MySQL 協議)

StarRocks

原生支持

內置 MySQL JDBC

Doris,使用 MySQL 方式連接

Presto / Trino

JDBC

trino-jdbc-*.jar

需上傳驅動,URL 格式:jdbc:trino://host:8080/catalog

Kylin

JDBC

kylin-jdbc-*.jar

查詢構建好的 Cube,適合預聚合場景

Elasticsearch

⚠️有限支持

通過 JDBC 插件(如 elasticsearch-sql-jdbc

社區方案,複雜查詢可能受限

MongoDB

不支持

SQL 接口,無法通過 JDBC 直連(需 ETL 到關係庫)


✅ 三、傳統關係型 & 雲數倉(常與 CMP 7.3 混合使用)

數據源

支持情況

MySQL / PostgreSQL / Oracle / SQL Server

原生內置,開箱即用

華為 GaussDB

支持(通過 PostgreSQL MySQL 模式)

阿里雲 AnalyticDB

支持(MySQL PostgreSQL 版本)

Snowflake

⚠️理論可行(JDBC),但國內網絡和許可證限制

Redshift

⚠️需上傳 Amazon JDBC 驅動,海外環境適用


🔧 四、連接通用方法(以 CMP 7.3 生態為例)

步驟 1:獲取對應 JDBC 驅動

  • Hive / Spark SQL:從集羣管理平台(如 CDH Manager、MRS Client)下載配套
  • Impala:從 Cloudera 官網 下載
  • Trino:從 Trino 官網 獲取

步驟 2:在 DataEase 中註冊驅動

  • 路徑:系統設置 → 數據源驅動 → 新增驅動
  • 類型選擇:
  • Hive / Spark SQL → 選
  • Impala / Trino / Kylin → 選 “自定義
  • 上傳 JAR 文件,填寫驅動類(如 org.apache.hive.jdbc.HiveDriver)

步驟 3:創建數據源

  • 填寫 JDBC URL、用户名、密碼
  • 示例(Hive on MRS):

Text

編輯

1jdbc:hive2://zk1:2181,zk2:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2


📊 五、典型混合架構支持場景

開源AI、BI工具DataEase 連接Cloudera CMP 7.3(或類 CDP 的 CMP 7.13 平台,如華為鯤鵬 ARM 版)支持Hadoop大數據源_MySQL

✅ DataEase 可同時連接上述多個數據源,並在儀表板中跨源聯動(需通過“關聯數據集”功能)。


⚠️ 六、注意事項

  • Kerberos 認證:DataEase 不原生支持 Kerberos,若 CMP 7.3 集羣啓用 Kerberos,建議:
  • 使用LDAP 賬號直連(關閉 Kerberos)
  • 或通過Knox 網關代理(JDBC over HTTPS + LDAP)
  • 複雜嵌套類型:Hive 中的 STRUCT/ARRAY 字段需在 SQL 中展開(如 col.field),否則無法識別;
  • 查詢性能:避免在 DataEase 中執行全表掃描,建議在 Hive/Impala 中預計算或分區裁剪。

✅ 總結:DataEase 對 CMP 7.3 生態的支持矩陣

組件

是否支持

推薦度

連接方式

Hive

強支持

⭐⭐⭐⭐⭐

JDBCHiveServer2

Impala

支持

⭐⭐⭐⭐

自定義 JDBC

Spark SQL

支持

⭐⭐⭐⭐

Thrift Server JDBC

HBase

⚠️間接

⭐⭐

通過 Phoenix

Kudu

不支持

需走 Impala 查詢