python数据科学实战_Python数据科学实战第三讲作业HW4
先完成作業(yè),再看老師解答,若有不同的地方或出錯(cuò)之處再來修改。
作業(yè)要求:
使用auto_ins作如下分析
1、首先對(duì)loss重新編碼為1/0,有數(shù)值為1,命名為loss_flag
2、對(duì)loss_flag分布情況進(jìn)行描述分析
3、分析是否出險(xiǎn)和年齡、駕齡、性別、婚姻狀態(tài)等變量之間的關(guān)系(提示:使用分類盒須圖,堆疊柱形圖)
在spyder中完成第三講作業(yè)HW4:
# In[1]:
#導(dǎo)入模塊
from stack2dim import *
####################################################################
# # 1.首先對(duì)loss重新編碼為1/0,有數(shù)值為1,命名為loss_flag
auto_ins['loss_flag'] = auto_ins['Loss'].apply(lambda x: 0 if x==0 else 1)
print(auto_ins,'\n')
# In[2]:
####################################################################
# # 2.對(duì)loss_flag分布情況進(jìn)行描述分析
import matplotlib.pyplot as plt
auto_ins['loss_flag'].value_counts().plot(kind = 'bar')
plt.title('loss_flag的分布')
plt.ylabel('頻數(shù)')
plt.xlabel('loss_flag')
plt.show()
# In[3]:
###################################################################
# # 3.分析是否出險(xiǎn)和年齡、駕齡、性別、婚姻狀態(tài)等變量之間的關(guān)系
#???? (提示:使用分類盒須圖,堆疊柱形圖)
# # 3.1 是否出險(xiǎn)與年齡的關(guān)系
#--------------------------------------錯(cuò)誤繪圖方式---------------------------------------------
auto_ins.groupby('loss_flag').Age.mean().plot(kind = 'bar')
plt.title('Age vs loss_flag')
plt.ylabel('Age')
plt.xlabel('loss_flag')
plt.show()
'''
據(jù)圖可看出,出險(xiǎn)與年齡無關(guān)
'''
# In[4]:
# # 3.2 是否出險(xiǎn)與駕齡的關(guān)系
auto_ins.groupby('loss_flag').vAge.mean().plot(kind = 'bar')
plt.title('vAge vs loss_flag')
plt.ylabel('vAge')
plt.xlabel('loss_flag')
plt.show()
'''
據(jù)圖可看出,出險(xiǎn)與駕齡有關(guān)
'''
#-------------------------------------------------------------------------------------------------
#%%
#------------------------------------------ 正確解答 --------------------------------------------
'''
老師講解后修改
'''
'''
年齡Age和駕齡exp為連續(xù)變量,loss_flag為分類變量,
分類變量與連續(xù)變量的描述統(tǒng)計(jì)關(guān)系圖用分類盒須圖
'''
fig = plt.figure()
ax1 = fig.add_subplot(1,2,1)
ax2 = fig.add_subplot(1,2,2)
#是否出險(xiǎn)與年齡
import seaborn
seaborn.boxplot(x='loss_flag',y='Age',data=auto_ins,ax=ax1)
#是否出險(xiǎn)與駕齡
seaborn.boxplot(x='loss_flag',y='exp',data=auto_ins,ax=ax2)
'''
據(jù)分類盒須圖可看出,年齡中位數(shù)幾乎相等,駕齡中位數(shù)相差明顯
所以,出險(xiǎn)與年齡無關(guān),和駕齡有關(guān)
'''
#------------------------------------------------------------------------------------------------
# In[5]:
# # 3.3 是否出險(xiǎn)與性別的關(guān)系
stack2dim(auto_ins, 'loss_flag','Gender')
'''
據(jù)圖可看出,出險(xiǎn)與性別有關(guān)
'''
# In[6]:
# # 3.4 是否出險(xiǎn)與婚姻狀態(tài)的關(guān)系
stack2dim(auto_ins,'Marital','loss_flag')
'''
據(jù)圖可看出,出險(xiǎn)與婚姻狀態(tài)有關(guān)
'''
# In[7]:
# # 3.5 是否出險(xiǎn)與汽車出產(chǎn)國(guó)的關(guān)系
stack2dim(auto_ins, 'loss_flag', 'import')
'''
據(jù)圖可看出,出險(xiǎn)與汽車出產(chǎn)國(guó)無關(guān)
'''
#%%
###################################################################
'''
根據(jù)上面的分析,可得出:出險(xiǎn)與駕齡、性別、婚姻狀態(tài)有關(guān)
'''
總結(jié)
以上是生活随笔為你收集整理的python数据科学实战_Python数据科学实战第三讲作业HW4的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开源http协议库curl和wget的区
- 下一篇: Python基础班---第一部分(基础)