Apache Spark最初在2009年誕生於美國加州大學伯克利分校的APM實驗室,並於2010年開源,如今是Apache軟件基金會下的頂級開源項目之一。Spark的目標是設計一種編程模型,能夠快速地進行數據分析。Spark提供了內存計算,減少了IO開銷。另外Spark是基於Scala編寫的,提供了交互式的編程體驗。經過10年的發展,Spark成為了炙手可熱的大數據處理平台,目前