截至 2025 年 11 月,DataEase(v2.10+ 版本) 作為一款國產開源、可私有化部署的 BI 可視化工具,已支持對接多種 CMP 7.3 生態及其他主流大數據源。其核心連接方式為 JDBC/ODBC 或原生驅動,適用於金融、政務、製造等行業的混合數據架構。
以下是 DataEase 官方支持或經社區驗證可穩定連接 的 CMP 7.3 及相關hadoop大數據源清單:
✅ 一、CMP 7.3 生態核心組件
|
數據源 |
支持方式 |
驅動要求 |
備註 |
|
Apache Hive |
✅ JDBC |
hive-jdbc-*.jar(推薦使用集羣配套版本) |
支持 HiveServer2,兼容 CDH / CMP / MRS 等發行版 |
|
Impala |
✅ JDBC(自定義) |
Cloudera 官方 ImpalaJDBC42.jar |
需手動上傳驅動,填寫自定義 JDBC URL |
|
Spark SQL |
✅ Thrift Server (JDBC) |
spark-thriftserver-jdbc.jar 或 hive-jdbc |
需啓動 Spark Thrift Server |
|
HBase |
⚠️間接支持 |
通過 Phoenix JDBC |
需部署Apache Phoenix提供 SQL 接口 |
|
Kudu |
❌不直接支持 |
— |
可通過 Impala 查詢 Kudu 表(間接支持) |
💡 提示:Hive 和 Impala 是 DataEase 在 CMP 7.3 場景中最成熟、最常用的數據源。
✅ 二、其他主流大數據/分析型數據庫(非 CMP 7.3 但常共存)
|
數據源 |
支持方式 |
驅動要求 |
兼容性説明 |
|
ClickHouse |
✅原生支持 |
內置 JDBC 驅動 |
v2.1+ 起官方集成,性能優異 |
|
Doris / Apache Doris |
✅原生支持 |
內置 MySQL 協議驅動 |
通過 MySQL JDBC 連接(Doris 兼容 MySQL 協議) |
|
StarRocks |
✅原生支持 |
內置 MySQL JDBC |
同 Doris,使用 MySQL 方式連接 |
|
Presto / Trino |
✅ JDBC |
trino-jdbc-*.jar |
需上傳驅動,URL 格式:jdbc:trino://host:8080/catalog |
|
Kylin |
✅ JDBC |
kylin-jdbc-*.jar |
查詢構建好的 Cube,適合預聚合場景 |
|
Elasticsearch |
⚠️有限支持 |
通過 JDBC 插件(如 elasticsearch-sql-jdbc) |
社區方案,複雜查詢可能受限 |
|
MongoDB |
❌不支持 |
— |
無 SQL 接口,無法通過 JDBC 直連(需 ETL 到關係庫) |
✅ 三、傳統關係型 & 雲數倉(常與 CMP 7.3 混合使用)
|
數據源 |
支持情況 |
|
MySQL / PostgreSQL / Oracle / SQL Server |
✅原生內置,開箱即用 |
|
華為 GaussDB |
✅支持(通過 PostgreSQL 或 MySQL 模式) |
|
阿里雲 AnalyticDB |
✅支持(MySQL 或 PostgreSQL 版本) |
|
Snowflake |
⚠️理論可行(JDBC),但國內網絡和許可證限制 |
|
Redshift |
⚠️需上傳 Amazon JDBC 驅動,海外環境適用 |
🔧 四、連接通用方法(以 CMP 7.3 生態為例)
步驟 1:獲取對應 JDBC 驅動
- Hive / Spark SQL:從集羣管理平台(如 CDH Manager、MRS Client)下載配套
- Impala:從 Cloudera 官網 下載
- Trino:從 Trino 官網 獲取
步驟 2:在 DataEase 中註冊驅動
- 路徑:系統設置 → 數據源驅動 → 新增驅動
- 類型選擇:
- Hive / Spark SQL → 選
- Impala / Trino / Kylin → 選 “自定義
- 上傳 JAR 文件,填寫驅動類(如 org.apache.hive.jdbc.HiveDriver)
步驟 3:創建數據源
- 填寫 JDBC URL、用户名、密碼
- 示例(Hive on MRS):
Text
編輯
1jdbc:hive2://zk1:2181,zk2:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2
📊 五、典型混合架構支持場景
✅ DataEase 可同時連接上述多個數據源,並在儀表板中跨源聯動(需通過“關聯數據集”功能)。
⚠️ 六、注意事項
- Kerberos 認證:DataEase 不原生支持 Kerberos,若 CMP 7.3 集羣啓用 Kerberos,建議:
- 使用LDAP 賬號直連(關閉 Kerberos)
- 或通過Knox 網關代理(JDBC over HTTPS + LDAP)
- 複雜嵌套類型:Hive 中的 STRUCT/ARRAY 字段需在 SQL 中展開(如 col.field),否則無法識別;
- 查詢性能:避免在 DataEase 中執行全表掃描,建議在 Hive/Impala 中預計算或分區裁剪。
✅ 總結:DataEase 對 CMP 7.3 生態的支持矩陣
|
組件 |
是否支持 |
推薦度 |
連接方式 |
|
Hive |
✅強支持 |
⭐⭐⭐⭐⭐ |
JDBC(HiveServer2) |
|
Impala |
✅支持 |
⭐⭐⭐⭐ |
自定義 JDBC |
|
Spark SQL |
✅支持 |
⭐⭐⭐⭐ |
Thrift Server JDBC |
|
HBase |
⚠️間接 |
⭐⭐ |
通過 Phoenix |
|
Kudu |
❌不支持 |
⭐ |
需走 Impala 查詢 |