groupby的用法
生活随笔
收集整理的這篇文章主要介紹了
groupby的用法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
?
?
import pandas as pd import numpy as npdf = pd.DataFrame({'key1':['a', 'a', 'b', 'b', 'a'],'key2':['one', 'two', 'one', 'two', 'one'],'data1':np.random.randn(5),'data2':np.random.randn(5)})我們得到數據如下:
| a | one | -1.226642 | -1.894700 |
| a | two | 0.616199 | -1.456702 |
| b | one | -0.090901 | 0.791127 |
| b | two | -0.079490 | 0.880053 |
| a | one | -1.210563 | -0.713896 |
接下來有兩種常見的用法,
一種是:
means = df.groupby(['key1'])['data1'].transform('mean')#某個key1值對應的所有data1數據做平均后返回 print(means)得到:
0 -0.607002 1 -0.607002 2 -0.085196 3 -0.085196 4 -0.607002 Name: data1, dtype: float64?
還有一種是:
means = df['data1'].groupby([df['key1']]).mean()#這個可以當做dict來使用 print(means) key1 a -0.607002 b -0.085196 Name: data1, dtype: float64?
總結
以上是生活随笔為你收集整理的groupby的用法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: lightgbm的GPU版本和CPU版本
- 下一篇: 直接获取submission结果