標籤 "Python數據分析" 下的文章

pandas排序操作：sort_values函數入門與實戰

2025-12-09 123 閱讀 pandas教程 pandas sort_values 數據排序 Python數據分析 DataFrame排序 pandas入門

本文介紹pandas中`sort_values`函數的排序方法，適用於DataFrame/Series數據排序。核心參數：`by`指定排序列（必填），`ascending`控制升/降序（默認升序True），`inplace`決定是否修改原數據（默認False，返回新數據）。基礎用法：單列排序，如按“語文”升序（默認）或“數學”降序；多列排序，可傳入列名列表及對應升序/降序方向（如先語文升序、再數學降序）。`inplace=True`直接修改原數據，建議優先保留原數據（默認False）。實戰示例：新增“總分”列後按總分降序排序，清晰展示綜合成績排名。注意事項：多列排序需保證`by`和`ascending`列表長度一致；操作數據安全，避免意外覆蓋原數據。通過示例掌握核心參數和常見場景，排序是數據處理基礎，結合後續分析（如TopN）更顯重要。

閱讀全文

pandas超實用技巧：數據清洗入門，新手也能輕鬆搞定

2025-12-09 73 閱讀 pandas教程 pandas數據清洗 Python數據分析數據預處理缺失值處理重複值處理

數據清洗是數據分析的關鍵，pandas是高效處理工具。文章教新手用pandas完成核心清洗：先安裝導入數據（`pd.read_csv()`或創建示例DataFrame），用`head()`、`info()`初步檢查。處理缺失值：用`isnull()`識別，`dropna()`刪除或`fillna()`（均值/中位數）填充；重複值用`duplicated()`識別，`drop_duplicates()`刪除；異常值通過`describe()`統計或邏輯篩選（如收入≤20000）；數據類型轉換用`astype()`或`to_datetime()`。新手流程：導入→檢查→處理缺失→重複→異常→類型轉換。強調多動手練習，靈活應用工具解決實際數據問題。

閱讀全文

pandas數據合併：merge與concat基礎操作，新手也能學

2025-12-09 87 閱讀 pandas教程 pandas數據合併 merge操作 concat拼接 Python數據分析 pandas教程

本文介紹pandas的`merge`和`concat`兩個數據合併工具，適合新手快速掌握。 **concat**：無關聯鍵，直接拼接，分行/列方向。行拼接（`axis=0`）適合結構相同表（如多月份數據），需注意用`ignore_index=True`重置索引避免重複；列拼接（`axis=1`）需行數一致，用於按行標識合併（如學生信息+成績表）。 **merge**：基於共同鍵（如姓名、ID）合併，類似SQL JOIN，支持四種方式：`inner`（默認，保留共同鍵）、`left`（保留左表）、`right`（保留右表）、`outer`（保留所有）。鍵名不同時用`left_on`/`right_on`指定，默認合併方式爲`inner`。 **關鍵區別**：concat無鍵直接拼接，merge按鍵匹配。新手需注意：concat列拼接行數需一致，merge用`how`參數控制合併範圍，避免索引重複和鍵名不匹配問題。

閱讀全文

新手必看！pandas基礎操作：創建、查看與修改數據

2025-12-09 75 閱讀 pandas教程 pandas基礎教程 Python數據分析 DataFrame操作 Series創建數據修改方法

本文介紹pandas基礎操作，涵蓋數據創建、查看與修改。 **數據創建**：核心結構爲Series（一維帶索引）和DataFrame（二維表格）。Series可通過列表（默認0,1…索引）或自定義索引（如['a','b']）創建；DataFrame可用字典（鍵=列名，值=列數據）或二維列表（需指定columns）創建。 **數據查看**：`head(n)`/`tail(n)`預覽前/後n行（默認5行）；`info()`查看數據類型與非空值，`describe()`統計數值列（計數、均值等）；`columns`/`index`分別查看列名和行索引。 **數據修改**：單元格修改用`loc[標籤,列名]`或`iloc[位置,列位置]`；新增列直接賦值（如`df['班級']='一班'`）或基於現有列計算；刪除列用`drop(列名, axis=1, inplace=True)`；修改索引可直接賦值`index`/`columns`或用`rename()`重命名。核心是“定位數據”，需區分`loc

閱讀全文

pandas DataFrame入門：3步快速上手數據選擇與篩選

2025-12-09 80 閱讀 pandas教程 pandas DataFrame教程 Python數據分析數據選擇篩選 iloc loc用法 pandas入門

本文介紹pandas DataFrame數據選擇與篩選的3個核心步驟，適合初學者快速掌握。第一步：列選擇。單列用`df['列名']`返回Series，多列用`df[['列名1','列名2']]`返回DataFrame。第二步：行選擇。提供`iloc`（按位置，整數索引）和`loc`（按標籤，自定義索引）：`df.iloc[行範圍]`或`df.loc[行標籤]`。第三步：條件篩選。單條件用`df[條件]`，多條件用`&`（且）/`|`（或）連接，每個條件需加括號。關鍵提醒：多條件篩選必須用`&`/`|`代替`and`/`or`，且條件加括號。通過三步操作可完成基礎數據提取，爲後續分析奠基。

閱讀全文

Numpy數組變形：reshape與flatten零基礎教程

2025-12-09 79 閱讀 Numpy教程 Numpy數組變形 reshape用法 flatten方法 Python數據分析數組展平

本文介紹Numpy中數組變形的兩個實用方法：`reshape`和`flatten`，用於滿足不同數據處理需求。核心前提是變形前後數組元素總數必須一致。 `reshape`方法可改變數組形狀（如1維轉2維），語法爲`arr.reshape(new_shape)`，支持元組指定形狀，用`-1`可自動計算缺失維度（如3行自動算列數），返回新數組不修改原數組。 `flatten`方法將多維數組展平爲1維，返回新數組（副本），避免修改原數組，與`ravel`（返回視圖）不同，推薦優先使用`flatten`。常見錯誤是“元素總數不匹配”，需確保`reshape`參數乘積等於原數組大小（`原數組.size`）。總結：`reshape`靈活調整形狀，`flatten`安全展平爲1維，掌握兩者可高效處理數組變形，爲數據處理（如機器學習）奠定基礎。

閱讀全文

Numpy統計分析：mean、sum與max函數速上手

2025-12-09 80 閱讀 Numpy教程 NumPy統計分析 mean函數 sum函數 max函數 Python數據分析

這篇文章介紹了NumPy中`mean`（平均值）、`sum`（求和）和`max`（最大值）三個常用統計函數的使用方法。NumPy作爲Python數據分析核心工具，提供高效多維數組及統計函數。三個函數均支持`axis`參數控制計算方向：`axis=0`按列（垂直方向）計算，`axis=1`按行（水平方向）計算，不指定則計算整體。 - **mean**：計算數組元素算術平均值，一維數組整體平均，二維數組可按列/行求平均。 - **sum**：計算元素總和，與mean類似，通過`axis`指定行列求和。 - **max**：查找數組最大值，同樣支持行列方向最大值查找。文章以一維/二維數組爲例演示基礎用法，並通過學生成績數據（3學生×3課程）實戰：計算每門課平均分、每個學生總分及最高分，驗證函數實用性。總結指出，掌握這三個函數及`axis`參數是數據分析的基礎，爲後續複雜分析奠基。

閱讀全文

Numpy數組詳解：shape、索引與切片全攻略

2025-12-09 77 閱讀 Numpy教程 Numpy數組 Python數據分析 shape屬性數組索引數組切片

Numpy數組是Python數據分析的基礎，提供高效多維數組對象，核心操作包括數組創建、shape、索引和切片。創建方法：常用np.array()從列表生成數組；zeros/ones創建全0/1數組；arange類似range生成序列。 shape是數組維度標識，用.shape查看，reshape()可調整維度（總元素數需不變），-1表示自動計算維度。索引：1維數組同列表（0開始，支持正負索引）；2維數組用[i,j]雙索引。切片：語法[start:end:step]，1維/2維分別截取子數組，切片默認返回視圖（修改影響原數組），需用.copy()生成獨立拷貝。掌握shape、索引和切片是核心，建議通過實踐練習鞏固這些基礎操作。

閱讀全文