tag pandas

標籤
貢獻16
108
04:55 AM · Oct 28 ,2025

@pandas / 博客 RSS 訂閱

deephub - 一份寫給數據工程師的 Polars 遷移指南:將 Pandas 速度提升 20 倍代碼重構實踐

在大數據處理領域,性能和效率始終是核心問題。 polars 作為新一代數據處理框架,通過利用Rust語言的底層實現和現代化的並行計算架構,在處理大規模數據集時展現出顯著的性能優勢。根據性能測試文章的數據顯示,在CSV文件讀取操作中, polars 的處理速度可達 pandas 的20倍。這種性能提升主要得益於其優化的內存管理機制和並行計算能力。 本文將系統地介紹如何從 pandas 遷移到 po

機器學習 , 人工智能 , pandas , Python

收藏 評論

Jing_H - pandas使用相關問題記錄

1-na值相關。na值有多種,這是較為完善的一種判斷: if value in (None, pd.NaT, np.nan) or pd.isna(value): 因為遇到一種情況,print出來是nan,type是class 'float',但就是沒有進入if裏面。 問了ai,加了or後面的內容,才進入if。 2-切片問題

numpy , pandas , Python

收藏 評論

deephub - 向量化操作簡介和Pandas、Numpy示例

Pandas是一種流行的用於數據操作的Python庫,它提供了一種稱為“向量化”的強大技術可以有效地將操作應用於整個列或數據系列,從而消除了顯式循環的需要。在本文中,我們將探討什麼是向量化,以及它如何簡化數據分析任務。 什麼是向量化? 向量化是將操作應用於整個數組或數據系列的過程,而不是逐個遍歷每個元素。在Pandas中可以對整個列或Series執行操作,而無需編寫顯式循環。這種高效的方法利用了

機器學習 , numpy , 人工智能 , pandas , Python

收藏 評論

mob64ca14147fe3 - 人工智能之數據分析 Pandas:第四章 常用函數

文章目錄 人工智能之數據分析 Pandas 前言 一、數據創建與讀取 二、數據基本信息查看 三、數據選擇與篩選 四、排序(Sorting) 自定義排序示例:

字符串 , 數據 , 後端開發 , 人工智能 , pandas , 數據分析 , Python

收藏 評論

flybirdfly - df 根據索引其中之一篩選 根據索引名得到索引號

第三章 索引 本章數據: import numpy as np import pandas as pd 一、索引器 1. 表的列索引 列索引是最常見的索引形式,一般通過[]來實現。通過[列名]可以從DataFrame中取出相應的列,返回值為Series,例如從表中取出姓名一列:

機器學習 , 大數據 , 數據倉庫 , pandas , 數據分析 , df 根據索引其中之一篩選 , Python

收藏 評論

deephub - Pandas GroupBy 的 10 個實用技巧

很多人把 groupby 理解成單純的求和、計數這類操作,比如説算算總收入、數數用户量,然後就沒了。實際上它的應用場景要廣得多:計算組內特徵、數據標準化、構造滾動指標、合併不同維度的統計結果,甚至處理一些複雜的嵌套數據結構。 所以本文將介紹10個實際工作中比較有用的技巧,文章的代碼都是可以直接拿來用。 1、一次性應用多個聚合函數 import pandas as pd df = p

機器學習 , 人工智能 , pandas , Python

收藏 評論

deephub - 使用Pandas進行數據清理的入門示例

數據清理是數據分析過程中的關鍵步驟,它涉及識別缺失值、重複行、異常值和不正確的數據類型。獲得乾淨可靠的數據對於準確的分析和建模非常重要。 本文將介紹以下6個經常使用的數據清理操作: 檢查缺失值、檢查重複行、處理離羣值、檢查所有列的數據類型、刪除不必要的列、數據不一致處理 第一步,讓我們導入庫和數據集。 # Import libraries import pandas as pd # Re

機器學習 , 數據清洗 , pandas , Python

收藏 評論

去碼頭整點薯條 - 利用 Python 進行數據分析 —— 3 pandas 入門

上一篇我們瞭解了 NumPy 的基本功能,本篇引入一個新的 python 數據處理庫——pandas。 NumPy 更適合處理統一的數值數組數據。Pandas 是基於 NumPy 數組構建的,專門處理表格和混雜數據。接下來,讓我們來了解一下 pandas 的基本使用吧。 首先讓我們導入 pandas 庫: import pandas as pd import numpy as np # 後續也會

讀書筆記 , pandas , 數據分析 , Python

收藏 評論

deephub - Pandas數據合併:10種高效連接技巧與常見問題

在數據分析工作中,我們經常需要處理來自多個來源的數據集。當合並來自20個不同地區的銷售數據時,可能會發現部分列意外丟失;或在連接客户數據時,出現大量重複記錄。如果您曾經因數據合併問題而感到困擾,本文將為您提供系統的解決方案。 Pandas庫中的merge和join函數提供了強大的數據整合能力,但不恰當的使用可能導致數據混亂。基於對超過1000個複雜數據集的分析經驗,本文總結了10種關鍵技術,幫助您

機器學習 , 人工智能 , pandas , 數據分析 , Python

收藏 評論

小宋 - 多樣本反向傳播矩陣推導及其MLP的代碼實現

一.多樣本反向傳播矩陣推導 二.MLP代碼實現 # @time : 2025/1/8 10:53 # @author : specier import numpy as np import pandas as pd import datetime import pickle class MultipleLayerPerception: def __in

pickle , 神經網絡 , numpy , pandas , 深度學習

收藏 評論

大蟲小囈 - Python 處理 Excel 數據 pandas 和 openpyxl 哪家強?

前言 雖然javascript才是我的編程母語,但經常需要使用python來處理各種格式的數據文件(如.txt、.json、.xlsx .csv、.sav等等)。當然處理得最多的還是Excel文件。為啥用python?好用啊!有各種開箱即用的工具庫,如 pandas 和 openpyxl 這倆個好哥們都是我的碼中常客。 "大蟲小囈"全網同名,歡迎關注! pandas 和 openpyxl 哪家強?

excel , pandas , openpyxl , Python

收藏 評論