博客 / 列表

去碼頭整點薯條 - 利用 Python 進行數據分析 —— 4 數據的導入導出

在數據分析中,我們一般不會像前幾篇文章那樣自己創造數據,而是需要利用外部數據。本篇要解決兩個問題: 如何將外部數據導入,並轉換為 DataFrame? 如何將 DataFrame 導出為常用的文件格式? 4.1 讀取文本數據 本篇文章用到的數據,可以從 GitHub 上下載:https://github.com/wesm/pydat... 4.1.1 csv 數據:處理標題行 我們可以從

讀書筆記 , pandas , 數據分析 , Python

去碼頭整點薯條 - 利用 Python 進行數據分析 —— 3 pandas 入門

上一篇我們瞭解了 NumPy 的基本功能,本篇引入一個新的 python 數據處理庫——pandas。 NumPy 更適合處理統一的數值數組數據。Pandas 是基於 NumPy 數組構建的,專門處理表格和混雜數據。接下來,讓我們來了解一下 pandas 的基本使用吧。 首先讓我們導入 pandas 庫: import pandas as pd import numpy as np # 後續也會

讀書筆記 , pandas , 數據分析 , Python

去碼頭整點薯條 - 爬蟲:越滑越多的動態網頁列表流數據(通過 Ajax 獲取微博個性化推薦內容)

在瀏覽社交媒體時,我們所看的內容彷彿是無窮無盡的。 我們常常滑動到頁面底端,以為沒有內容了,卻發現新的內容又一下子刷新出來。內容越滑越多,這種數據被稱作列表流數據。 有趣的是,當頁面不斷為我們提供新的內容時,網頁卻還是原來的網頁——URL 並沒有改變。這是怎麼回事? 1 Ajax 在同一個頁面中,網頁是如何源源不斷的展現新內容的呢? 如果打開瀏覽器的開發者模式,當我們滑動到頁面底端時,我們可以在

微博 , Ajax , 爬蟲 , Python

去碼頭整點薯條 - 利用 Python 進行數據分析 —— 2 NumPy 基礎

什麼是 NumPy?根據其官方文檔的介紹: NumPy 是Python中科學計算的基礎包。它是一個Python庫,提供多維數組對象,各種派生對象(如掩碼數組和矩陣),以及用於數組快速操作的各種API,有包括數學、邏輯、形狀操作、排序、選擇、輸入輸出、離散傅立葉變換、基本線性代數,基本統計運算和隨機模擬等等。 NumPy 的核心是一個特殊的數組對象——ndarray 對象。當運算涉及到 nda

numpy , 讀書筆記 , 數據分析 , Python

去碼頭整點薯條 - 利用 Python 進行數據分析 —— 1 數據結構、函數和文件

本文是我個人學習《利用 Python 進行數據分析》一書的筆記。整個系列於今日起連載。 1.1 數據結構 Python 的基本數據結構包括元組、列表、字典、集合,此外還有一些特殊的數據結構(如 range 對象、字符串等)。 1.1.1 元組(tuple) 什麼是元組?元組是固定長度、內容不可改變的序列。 如何創建元組? # 用逗號分隔是創建元組最簡單的方法 tup = 1, 2, 3 tup =

讀書筆記 , 數據分析 , Python