【Pandas库】(5) 索引操作--增、删
各位同學(xué)好,今天我向大家介紹一下pandas庫中的索引操作--增、刪。
1. 增加
1.1 對series操作
方法一:在原有數(shù)據(jù)上增加,改變原有數(shù)據(jù)。
Series名[新標簽名] = 新標簽名對應(yīng)的值
????????創(chuàng)建Series類型數(shù)據(jù)ps1,它的標簽為'a'到'e',對應(yīng)的值為0到4,原標簽不存在'g',使用ps1['g']=9,在原數(shù)組的最后追加一個標簽'g',以及它對應(yīng)的值9。
import pandas as pd
# 創(chuàng)建一個Series類型數(shù)據(jù),標簽為'a'到'e',對應(yīng)的值為0到4
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
# 新標簽'g',對應(yīng)的值為9
ps1["g"] = 9
?方法二:增加數(shù)據(jù)并賦值給新變量,不影響原來的數(shù)據(jù)
新變量 = Series名.append(Series類型數(shù)據(jù))
? ? ? ? 創(chuàng)建一個Series類型數(shù)據(jù)ps1,使用字典創(chuàng)建一個被追加的Series數(shù)據(jù),append()函數(shù)不會對原數(shù)據(jù)修改,需要用一個新變量來接收這個追加后的結(jié)果。
import pandas as pd
# 創(chuàng)建一個Series類型數(shù)據(jù)
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
# 利用字典創(chuàng)建一個需要添加的Series類型數(shù)據(jù)
s1 = pd.Series({'f':999})
# 將s1追加到ps1后面
ps2 = ps1.append(s1)
?1.2 對DataFrame操作
(1)對列操作
????????在最后一列后面追加一列:?
???????變量名.[新標簽] = 新標簽對應(yīng)的值
? ? ? ? 該方法會直接對原數(shù)據(jù)修改。如下,使用numpy創(chuàng)建一個1到9的一維數(shù)組,使用shape(行數(shù),列數(shù))函數(shù)變成3行3列的二維數(shù)組,再轉(zhuǎn)換成DataFrame類型。pd1[4]=9,追加一列的新列標簽名是4,這一列的值都是9。注意的是,此處的列標簽名4是int類型,而pd1中的'A'、'B'等都是str類型。
import pandas as pd
import numpy as np
# 在最后一列后面追加一列
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
# 追加一列的列標簽名是4,這一列的值都是9
pd1[4] = 9
# 追加一列的列標簽名是4,這一列的值與列表對應(yīng)
pd1[4] = [11,12,13]
????????在指定位置插入一列:
???????變量名.insert(下標索引位置前, 索引名, 列數(shù)據(jù))
????????該方法會直接對原數(shù)據(jù)修改。首先下標索引位置是指位置索引標簽,即0、1、2等。插入的索引名和值是插在自己指定的下標位置索引前面一列。如下,我指定位置索引是0,即我想在第1列前面插入一列。我定義的插入的一列的列索引名是'E'。
import pandas as pd
import numpy as np
# 在指定位置插入一列
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
# 插入一列的列位置索引號是0,在0前插入標簽E
pd1.insert(0,"E",[100,100,100])
?(2)對行操作
? ? ? ? 在最后一行的后面追加一行,方法一:
????????變量名.loc[標簽名] = 行數(shù)據(jù)
????????利用標簽索引loc操作,涉及高級索引,后續(xù)章節(jié)會詳述。該方法會直接對原數(shù)據(jù)修改。loc指定行,在原數(shù)據(jù)最后一行后面,新增行標簽'k',及其對應(yīng)的行數(shù)據(jù)。
import pandas as pd
# 在最后一行追加一行
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
pd1.loc["k"] = [77,88,99]
????????在最后一行的后面追加一行,方法二:
? ? ? ? 新變量 = 變量名.append(字典, ignore_index = True)
????????該方法不會直接對原數(shù)據(jù)修改,需使用新變量接收。如下,我有一行數(shù)據(jù)想追加到DataFrame后面,但是直接追加的話,字典的key和dataframe的列標簽名不對應(yīng),無法直接追加,此時使參數(shù)ignore_index = True,使字典的key和dataframe的列標簽自動匹配進行追加。
import pandas as pd
import numpy as np
# 在最后一行追加一行
pd1 = pd.DataFrame(np.arange(1,10).reshape(3,3),index=["a","b","c"],columns=["A","B","C"])
# 創(chuàng)建一個字典,字典的key和pd1的列標簽不對應(yīng),需要調(diào)整位置
row = {"B":0,"A":6,"C":7}
# 使字典的key和列標簽自動匹配進行追加
pd2 = pd1.append(row,ignore_index=True)
?2. 刪除
2.1 對Series操作
(1)在原始數(shù)據(jù)上刪除:
????????del Series名[索引名]
????????刪除索引名所對應(yīng)的一行數(shù)據(jù)
import pandas as pd
# 刪除一行數(shù)據(jù)
ps1 = pd.Series(range(5),index=["a","b","c","d","e"])
del ps1['c'] #刪除c所在的一行
(2)不影響原始數(shù)據(jù)的刪除:
? ? ? ??新變量 = series名.drop(索引名1, 索引名2)
? ? ? ? 需要一個新變量來接收結(jié)果。可以刪除多行,自行輸入需要刪除的行索引名。
import pandas as pd
ps1 = pd.Series(range(5),index=["a","b","c","d","e"]) #創(chuàng)建一個series類型
# 刪除'a'所在的一行
ps2 = ps1.drop('a')
?2.2 對DataFrame操作
(1)刪除一行:
????????新變量 = 變量名.drop(行索引名)
(2)刪除多行
????????新變量 = 變量名.drop([行索引名1, 行索引名2])
import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,26).reshape(5,5),index=["a","b","c","d","e"],columns=["A","B","C","D","E"])
# 刪除一行
pd_d1 = pd1.drop('a')
# 刪除多行
pd_d2 = pd1.drop(['a','c'])
?(3)刪除一列:
? ? ? ??新變量 = 變量名.drop(索引名, axis = 1)
????????新變量 = 變量名.drop(索引名, axis = 'columns')
?(4)刪除多列:
? ? ? ??新變量 = 變量名.drop([索引名1,索引名2], axis = 1)
????????新變量 = 變量名.drop([索引名1,索引名2], axis = 'columns')
? ? ? ? 該方法需要有變量接收返回值。對列操作需要指定軸axis,axis=1代表列方向,axis=0代表行方向。
import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,16).reshape(3,5),index=["a","b","c"],columns=["A","B","C","D","E"])
# 刪除一行
pd2 = pd1.drop("A",axis=1)
# 刪除多行
pd3 = pd1.drop(["A","C"],axis='columns')
?(5)inplace屬性:
????????變量名.drop(行索引名, inplace=True)
????????可直接在原數(shù)據(jù)上修改,不需要新變量來接收返回結(jié)果。
import pandas as pd
import numpy as np
pd1 = pd.DataFrame(np.arange(1,13).reshape(4,3),index=["a","b","c","d"],columns=["A","B","C"])
# 刪除一行
pd1.drop("a",inplace=True)
總結(jié)
以上是生活随笔為你收集整理的【Pandas库】(5) 索引操作--增、删的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Pandas库】(4) 索引操作--重
- 下一篇: 【机器学习入门】(1) K近邻算法:原理