python sample函数_Python pandas.DataFrame.sample函数方法的使用
DataFrame.sample(n=None,?frac=None,?replace=False,?weights=None,?random_state=None,?axis=None)[source]
從對象軸返回隨機的項目樣本。
您可以使用random_state來實現重現性。
參數:n:int, 可選
從軸返回的項目數。 不能與frac一起使用。
如果frac = None,則Default = 1。
frac:float, 可選
要返回的軸項的Fraction。不能與n一起使用。
replace:bool, 默認為 False
允許或不允許對同一行進行多次抽樣。
weights:?str或ndarray-like, 可選
默認的‘None’將導致相等的概率權重。
如果傳遞了一個Series,將與目標對象上的索引對齊。
權重中未被采樣對象發現的索引值將被忽略,
權重中未被采樣對象的索引值將被賦值為零。
如果在DataFrame上調用,
將在axis = 0時接受列的名稱。
除非權值是一個Series,
否則權值必須與被采樣的軸線長度相同。
如果權重的和不是1,它們將被規范化為和為1。
weights列中缺失的值將被視為零。不允許無限值。
random_state?:int,array-like,
BitGenerator, np.random.RandomState, 可選
如果int,array-like,或BitGenerator (NumPy>=1.17),
種子為隨機數生成器,如果np.random。隨機狀態,用作numpy隨機狀態對象。
在版本1.1.0中改變:array-like和BitGenerator(用于NumPy>=1.17),
對象現在作為種子傳遞給np.random.RandomState()
axis?:{0或 ‘index’, 1或 ‘columns’, None}, 默認為 None
從軸返回的項目數。 不能與frac一起使用。 如果frac = None,
則Default = 1。
返回值:Series或 DataFrame
與調用者相同類型的新對象,
包含從調用者對象中隨機取樣的n項。
Notes
如果frac >1,則應將replacement設置為True。
例子>>> df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
... 'num_wings': [2, 0, 0, 0],
... 'num_specimen_seen': [10, 2, 1, 8]},
... index=['falcon', 'dog', 'spider', 'fish'])
>>> df
num_legs num_wings num_specimen_seen
falcon 2 2 10
dog 4 0 2
spider 8 0 1
fish 0 0 8
從中提取3個隨機元素Series?df['num_legs']:請注意,我們使用random_state來確保示例的可重復性>>> df['num_legs'].sample(n=3, random_state=1)
fish 0
spider 8
falcon 2
Name: num_legs, dtype: int64
隨機DataFrame替換的50%樣品:>>> df.sample(frac=0.5, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 4 0 2
fish 0 0 8
DataFramewith替換的upsample樣本:請注意,對于frac參數> 1?,replace參數必須為True>>> df.sample(frac=2, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 4 0 2
fish 0 0 8
falcon 2 2 10
falcon 2 2 10
fish 0 0 8
dog 4 0 2
fish 0 0 8
dog 4 0 2
使用DataFrame列作為權重。num_specimen_seen列中值較大的行?更可能被采樣>>> df.sample(n=2, weights='num_specimen_seen', random_state=1)
num_legs num_wings num_specimen_seen
falcon 2 2 10
fish 0 0 8
總結
以上是生活随笔為你收集整理的python sample函数_Python pandas.DataFrame.sample函数方法的使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel 表格有重复内容怎么办?
- 下一篇: Python:sample函数 如何使用