pandas排序操作:sort_values函數入門與實戰
本文介紹pandas中`sort_values`函數的排序方法,適用於DataFrame/Series數據排序。核心參數:`by`指定排序列(必填),`ascending`控制升/降序(默認升序True),`inplace`決定是否修改原數據(默認False,返回新數據)。 基礎用法:單列排序,如按“語文”升序(默認)或“數學”降序;多列排序,可傳入列名列表及對應升序/降序方向(如先語文升序、再數學降序)。`inplace=True`直接修改原數據,建議優先保留原數據(默認False)。 實戰示例:新增“總分”列後按總分降序排序,清晰展示綜合成績排名。注意事項:多列排序需保證`by`和`ascending`列表長度一致;操作數據安全,避免意外覆蓋原數據。 通過示例掌握核心參數和常見場景,排序是數據處理基礎,結合後續分析(如TopN)更顯重要。
閱讀全文pandas數據統計:5個常用函數幫你快速掌握基礎分析
pandas是Python處理表格數據的強大工具,文章介紹5個基礎統計函數,助初學者快速掌握數據分析技能。 **sum()**:計算總和,自動忽略缺失值(NaN),`axis=1`可按行求和,用於統計總量(如總分)。 **mean()**:求平均值,反映集中趨勢,但易受極端值影響,適合無極端值場景。 **median()**:計算中位數,抗極端值干擾,更能反映“大多數數據真實水平”。 **max()/min()**:分別返回最大/最小值,用於統計極值(如最高分、最低分)。 **describe()**:一站式統計,輸出count(數量)、mean(均值)、std(標準差)、分位數等,全面瞭解數據分佈與波動。 這些函數可回答“總量、平均、中間水平、極值”等基礎問題,是數據分析的“基本功”。後續可進階學習分組統計(groupby)等技能。
閱讀全文pandas DataFrame入門:3步快速上手數據選擇與篩選
本文介紹pandas DataFrame數據選擇與篩選的3個核心步驟,適合初學者快速掌握。 第一步:列選擇。單列用`df['列名']`返回Series,多列用`df[['列名1','列名2']]`返回DataFrame。 第二步:行選擇。提供`iloc`(按位置,整數索引)和`loc`(按標籤,自定義索引):`df.iloc[行範圍]`或`df.loc[行標籤]`。 第三步:條件篩選。單條件用`df[條件]`,多條件用`&`(且)/`|`(或)連接,每個條件需加括號。 關鍵提醒:多條件篩選必須用`&`/`|`代替`and`/`or`,且條件加括號。通過三步操作可完成基礎數據提取,爲後續分析奠基。
閱讀全文