標籤 "pandas入門" 下的文章

pandas排序操作：sort_values函數入門與實戰

2025-12-09 123 閱讀 pandas教程 pandas sort_values 數據排序 Python數據分析 DataFrame排序 pandas入門

本文介紹pandas中`sort_values`函數的排序方法，適用於DataFrame/Series數據排序。核心參數：`by`指定排序列（必填），`ascending`控制升/降序（默認升序True），`inplace`決定是否修改原數據（默認False，返回新數據）。基礎用法：單列排序，如按“語文”升序（默認）或“數學”降序；多列排序，可傳入列名列表及對應升序/降序方向（如先語文升序、再數學降序）。`inplace=True`直接修改原數據，建議優先保留原數據（默認False）。實戰示例：新增“總分”列後按總分降序排序，清晰展示綜合成績排名。注意事項：多列排序需保證`by`和`ascending`列表長度一致；操作數據安全，避免意外覆蓋原數據。通過示例掌握核心參數和常見場景，排序是數據處理基礎，結合後續分析（如TopN）更顯重要。

閱讀全文

pandas數據統計：5個常用函數幫你快速掌握基礎分析

2025-12-09 64 閱讀 pandas教程 pandas數據分析 Python數據處理 pandas統計函數數據基礎分析 pandas入門

pandas是Python處理表格數據的強大工具，文章介紹5個基礎統計函數，助初學者快速掌握數據分析技能。 **sum()**：計算總和，自動忽略缺失值（NaN），`axis=1`可按行求和，用於統計總量（如總分）。 **mean()**：求平均值，反映集中趨勢，但易受極端值影響，適合無極端值場景。 **median()**：計算中位數，抗極端值干擾，更能反映“大多數數據真實水平”。 **max()/min()**：分別返回最大/最小值，用於統計極值（如最高分、最低分）。 **describe()**：一站式統計，輸出count（數量）、mean（均值）、std（標準差）、分位數等，全面瞭解數據分佈與波動。這些函數可回答“總量、平均、中間水平、極值”等基礎問題，是數據分析的“基本功”。後續可進階學習分組統計（groupby）等技能。

閱讀全文

pandas DataFrame入門：3步快速上手數據選擇與篩選

2025-12-09 80 閱讀 pandas教程 pandas DataFrame教程 Python數據分析數據選擇篩選 iloc loc用法 pandas入門

本文介紹pandas DataFrame數據選擇與篩選的3個核心步驟，適合初學者快速掌握。第一步：列選擇。單列用`df['列名']`返回Series，多列用`df[['列名1','列名2']]`返回DataFrame。第二步：行選擇。提供`iloc`（按位置，整數索引）和`loc`（按標籤，自定義索引）：`df.iloc[行範圍]`或`df.loc[行標籤]`。第三步：條件篩選。單條件用`df[條件]`，多條件用`&`（且）/`|`（或）連接，每個條件需加括號。關鍵提醒：多條件篩選必須用`&`/`|`代替`and`/`or`，且條件加括號。通過三步操作可完成基礎數據提取，爲後續分析奠基。

閱讀全文