當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pandas的apply函数解析

發布時間：2023/12/4 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 pandas的apply函数解析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

apply函數

apply函數是pandas里面所有函數中自由度最高的函數。該函數如下：

DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)

該函數最有用的是第一個參數，這個參數是函數，相當于C/C++的函數指針。

這個函數需要自己實現，函數的傳入參數根據axis來定，比如axis = 1，就會把一行數據作為Series的數據結構傳入給自己實現的函數中，我們在函數中實現對Series不同屬性之間的計算，返回一個結果，則apply函數會自動遍歷每一行DataFrame的數據，最后將所有結果組合成一個Series數據結構并返回。

apply常用于數據預處理

這塊的主要工作就是利用pandas里面的函數，去查看一下剛特殊操作后的數據。

def data_handle():data = pd.read_csv('C:\\Users\\happy\\Desktop\\old_data.csv')#print(data.describe()) #查看統計信息,發現最小值有-10000的異常數據#print((data.isnull()).sum()) #查看是否存在缺失值#print((data.duplicated()).sum()) #重復值def change_zero(x):if x == -10000:return 0else :return xdata['values'] = data['values'].apply(lambda x: change_zero(x))#利用均值填充缺失值mean = data['values'].mean()def change_mean(x):if x == 0:return meanelse:return xdata['values'] = data['values'].apply(lambda x: change_mean(x))#保存處理過的數據data.to_csv('C:\\Users\\happy\\Desktop\\new_data.csv',index=0)print('new data is existing')

總結

以上是生活随笔為你收集整理的pandas的apply函数解析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： BZOJ.3052.[WC2013]糖果
下一篇： Pandas - 查看DataFrame