第一篇:Power BI數據可視化概述

閲讀目錄
•前言
•Power BI的主要功能
•Power BI的主要特點
•Power BI Vs 其他同類產品
•Power BI可視化思想
•獲取方法
•小結

回到頂部

前言

本文向大家介紹微軟公司最近發佈的可視化神器 - PowerBI。將重點講解它的主要功能、和同類可視化工具的對比、以及基本使用方法。

    本系列後面文章則將針對該工具的具體使用進行詳細深入的講解。

Power BI的主要功能

顧名思義,PowerBI是一款BI(商務智能)工具,能在較短時間內生成各種酷炫的報表。所以它主要完成下面三個工作:

    1. 報表製作與發佈

    2. 報表製作與發佈

    3. 報表製作與發佈

    重要的事情説三遍,哈哈~

回到頂部

Power BI的主要特點

世面上的BI工具那麼多,為何筆者重點推薦這款BI工具呢?這主要是因為它具備下面幾大特點:

    1. 打通各類數據源

    Power BI能夠從各種數據源中抓取數據進行分析,除了支持微軟自家產品如Excel,SQL Server等,各類數據庫如Oracle,My SQL,IBM DB2等,還支持從R語言腳本,Hdfs文件系統,Spark平台等等地方導數據。下圖是Power BI的數據導入窗口:

derby 數據可視化_數據庫


Power BI還支持直接從網頁抓取數據。下篇中會演示以網頁抓取的方式獲取數據。比較高大上吧:)

2. 易用性(無需編程)

    筆者給自己的定位是一枚數據科學家,因此不會也不能將過多精力放在可視化工作上。畢竟數據庫/數據倉庫系統架構,數據挖掘算法研究等工作更是重中之重。而Power BI採用的拖拉控件式圖形化開發模式,將我從可視化的泥潭中解放出來,把更多精力投放到數據管理,算法研究,業務溝通上。下圖展示了Power BI乾淨而清爽的工作界面:

derby 數據可視化_數據庫_02

這裏展示的僅僅是一個方面,絕大多數商業公司出品的軟件在易用性方面完爆開源產品。

    3. 圖表顏值高

    下面這些圖是筆者10分鐘不到就做好,稍加美化就能達到大部分客户在顏值上的要求了:
要知道同樣的工作使用R語言的ggplot2至少要2小時(含調試),使用Python的matplotlib就更久了。嗯,暫時就説這幾點,再説有打廣告的嫌疑了......

回到頂部

Power BI Vs 其他同類產品

1. Power BI VS Excel

    都是微軟自家產品,但Excel更全面且更專注於數據分析,而Power BI則比較精簡且更更專注於報表可視化。另外這兩個產品也是相互打通的,據説最新版本的Excel集成了Power BI插件,而Power BI裏的數據分析功能也和Excel相似。

    2. Power BI VS R語言ggplot2

    ggplot2其實是R語言的可視化包,因此對於熟悉R語言的人來説,使用ggplot2會非常得心應手。同時由於ggplot2是由編程語言R驅動,因此它在定製化方面肯定做得比Power BI要好。但這也帶來了一些代碼量,不是每個人都喜歡。

    本人也是ggplot2的忠實粉絲,博客裏有R語言ggplot2可視化教程:點擊進入

    3. Power BI VS Python matplotlib

    相對Power BI而言,matplotlib更受程序員羣體的歡迎。一個特點是代碼量較大,筆者本人非常討厭,真不知道為什麼那麼多人支持 = =#。那些用matplotlib做的比較好看的圖,代碼量動輒幾十行上百行,説好的"人生苦短我用python"呢???當然,如果您確實需要經常做一些精細定製化的圖形,也可以考慮使用它。

    4. Power BI VS echarts

    echarts專用於網頁圖表製作,對瀏覽器兼容特別好。但它一般是給前端程序員用的,需要編程語言javascript驅動,不推薦數據分析師使用。

    5. Power VS 其他商用BI工具(如Tableau等)

    這些商用BI工具的技術通常來説比較專有化,這也就意味着很難找到人交流學習。因此,使用這類工具要慎重,請仔細考慮好具體使用環境和詳細業務場景是否合適後再購買學習吧。

    綜上所述,這些可視化工具並沒有單純的優劣之分,用哪種得具體問題具體分析。一句話,如果你想糙,快,猛地製作還不錯的報表,那麼就快快學習Power BI吧。

回到頂部

Power BI可視化思想

使用Power BI進行可視化的總體步驟如下:

derby 數據可視化_python_03

1. 首先從數據源導入數據。Power BI支持的數據源格式非常多,前文已説明;

    2. 然後在Power BI後台區進行數據塑性。數據導入後,必須確定好數據列名,數據類型是否正確,是否需要進行切分工作,是否需要生成彙總表等等;

    3. 最後在Power BI的圖表區進行報表繪製。具體工作中,這步和上一步工作迭代進行,我們需要不斷對數據進行塑性,並基於塑性好的數據繪製出各種報表;

    這裏讀者只需知道個大概,隨着教程的深入,我會進行具體詳細的説明。

獲取方法

下載地址:http://www.microsoft.com/zh-cn/download/details.aspx?id=45331

小結

有些人可能會對商業軟件帶有一種排斥觀念,個人覺得這是比較幼稚的。商業軟件固然需要花錢,但劣質的開源軟件更可能浪費大家的寶貴時間。顯然我們應該將精力更多的投放到數據和算法本身以及具體業務上,工具只不過是工具罷了。

    這個觀點比較主觀,不過請不要糾結,因為Power BI是免費的。