dataframe在特定列 插入_DataFrame在任意处添加一列或者多列的方法
很多時候我們需要在任意處添加一列,而非末尾添加一列,下面就介紹一下幾種方法
1.df.insert但是這個允許插入一列
DataFrame.insert(loc,column,value,allow_duplicates = False)
參數
loc:?int,插入索引。必須驗證0 <= loc <= len(columns)
column:str, number, or hashable object,插入列的標簽
value:int, Series, or array-like
allow_duplicates:bool, 可選
前面三個是必選,后面的可選
值得注意的是,如果你不知道value的值,可以使用np.nan代替,后續再賦值
data = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])
data.insert(2,'c',value=np.nan)'''a b c
0 1 2 NaN
1 3 4 NaN'''
2.pd.concat,df.reindex和list.insert(index, obj)配合,可以在任意處插入一列或者多列
首先,如果要在df的后面添加一列,只需要data['c']=xx,但是如果你想一次性添加兩列級以上,df[['D','E']] == None ,結果報錯
所以接下來我想介紹這種認為比較簡便的方法:
利用pd.concat 在DataFrame后面添加兩列,這種方法的缺點是不能指定位置
pd.concat([df, pd.DataFrame(columns=list('DE'))]),然后利用 reindex來重排和增加列名df.reindex(columns=list('ABCDE')),
當然這里舉的例子比較簡單,在實際運用中,列名可能都比較長,都敲出來肯定不方便,所以我們需要更強大的方法,運用到 list.insert的方法list.insert(index, obj)
col_name =df.columns.tolist()
col_name.insert(1,'D')
df.reindex(columns=col_name)#或者不用數字索引,直接在某列前面或后面插入,利用 list.index的方法
col_name =df.columns.tolist()
col_name.insert(col_name.index('B'),'D')#在 B 列前面插入
df.reindex(columns=col_name)
col_name=df.columns.tolist()
col_name.insert(col_name.index('B')+1,'D') #在 B 列后面插入
df.reindex(columns=col_name)
這樣子就基本能滿足所有要求了
總結
以上是生活随笔為你收集整理的dataframe在特定列 插入_DataFrame在任意处添加一列或者多列的方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: git 文件全部标红_git冲突解决,代
- 下一篇: qgraphicsitem 复制副本_如