日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【python数据分析】亚太地区的商学院(商务与经济统计案例3-3)数据分析

發(fā)布時間:2023/12/20 python 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【python数据分析】亚太地区的商学院(商务与经济统计案例3-3)数据分析 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

數(shù)據(jù)分析學了幾個星期了,中間一直在學習模仿別人的代碼,所以沒什么原創(chuàng)可寫。今天看《商務與經(jīng)濟統(tǒng)計》,想拿個案例來練練手。案例數(shù)據(jù)也不大:

Business SchoolFull-Time EnrollmentStudents per FacultyLocal Tuition ($)Foreign Tuitiion ($)Age%ForeignGMATEnglish TestWork ExperienceStarting Salary ($)
Melbourne Business School200524,42029,6002847YesNoYes71,400
University of New South Wales (Sydney)228419,99332,5822928YesNoYes65,200
Indian Institute of Management (Ahmedabad)39254,3004,300220NoNoNo7,100
Chinese University of Hong Kong90511,14011,1402910YesNoNo31,000
International University of Japan (Niigata)126433,06033,0602860YesYesNo87,000
Asian Institute of Management (Manila)38957,5629,0002550YesNoYes22,800
Indian Institute of Management (Bangalore)38053,93516,000231YesNoNo7,500
National University of Singapore14766,1467,1702951YesYesYes43,300
Indian Institute of Management (Calcutta)46382,88016,000230NoNoNo7,400
Australian National University (Canberra)42220,30020,3003080YesYesYes46,600
Nanyang Technological University (Singapore)5058,5008,5003220YesNoYes49,300
University of Queensland (Brisbane)1381716,00022,8003226NoNoYes49,600
Hong Kong University of Science and Technology60211,51311,5132637YesNoYes34,000
Macquarie Graduate School of Management (Sydney)12817,17219,7783427NoNoYes60,100
Chulalongkorn University (Bangkok)200717,35517,355256YesNoYes17,600
Monash Mt. Eliza Business School (Melbourne)3501316,20022,5003030YesYesYes52,500
Asian Institute of Management (Bangkok)3001018,20018,2002990NoYesYes25,000
University of Adelaide201916,42623,1003010NoNoYes66,000
Massey University (Palmerston North, New Zealand)301513,10621,6253735NoYesYes41,400
Royal Melbourne Institute of Technology?30713,88017,7653230NoYesYes48,900
Jamnalal Bajaj Institute of Management Studies (Bombay)24091,0001,000240NoNoYes7,000
Curtin Institute of Technology (Perth)98159,47519,0972943YesNoYes55,000
Lahore University of Management Sciences701411,25026,300232.5NoNoNo7,500
Universiti Sains Malaysia (Penang)3052,2602,2603215NoYesYes16,000
De La Salle University (Manila)44173,3003,600283.5YesNoYes13,100

?2.導入數(shù)據(jù)

import pandas as pd import numpy as np data = pd.read_csv('H:/商務與經(jīng)濟統(tǒng)計(原書第12版)/數(shù)據(jù)文件/第3章/Asian.CSV') data.head()

3.對數(shù)據(jù)集中的每一個變量進行匯總,根據(jù)最大值,最小值等進行評價和解釋

data.describe()

?

可以知道一共有25個business school,平均錄取名額為165人,最多的學校錄取463人,最少12人,差別還是挺大的。每個學院平均錄取8人,最多19人最少2人,差別還行,不是太大,50%以上的學校都錄取7人。平均年齡28歲,最大37歲,最小22歲。平均錄取外國人的比例28%,最大達到90%,最少的為0,干脆不招外國人。新見解?感覺年齡都比較大,不同學校錄取人數(shù)差別大,但是平均每個學院人數(shù)又差不太多,估計是有的學校學院比較多吧。有的學校外國學生比例很大,有的根本沒有,差別還是挺大的,不知道是不是排外或者在外地知名度不高。

這里學費和起薪都沒有算作數(shù)量變量,可見后面要進行處理。

4.本國學生和外國學生學費的差別

這里發(fā)現(xiàn)列名寫錯了先用rename進行更正。

然后把金額里的逗號給去掉,并改成float型。

抽取本國學生和外國學生學費的列,plot畫圖。

#本國學生和外國學生學費的差別#列名寫錯了,先改掉 data = data.rename(columns={'Foreign Tuitiion ($)':'Foreign Tuition ($)'}) #把數(shù)字的逗號去掉 data['Local Tuition ($)'] = data['Local Tuition ($)'].apply(lambda x:x.replace(',','')if ','in str(x)else x) data['Foreign Tuition ($)'] = data['Foreign Tuition ($)'].apply(lambda x:x.replace(',','')if ','in str(x)else x) data['Local Tuition ($)'] = data['Local Tuition ($)'].apply(lambda x:float(x)) data['Foreign Tuition ($)'] = data['Foreign Tuition ($)'].apply(lambda x:float(x)) subset = data[['Local Tuition ($)','Foreign Tuition ($)']] subset.plot(title = 'The difference between local tuition and foreign tuition')

這個圖還是挺簡單的,可以看出來國外學生的學費基本上比本國學生的學費要高。

5.用pyecharts畫更精細的圖。

#用昨天剛學的pyecharts試試 from pyecharts import Bar#x軸是學校名稱 school = data['Business School'] #y軸表示當?shù)厝说膶W費和外國人的學費 local_tuition = data['Local Tuition ($)'] foreign_tuition = data['Foreign Tuition ($)'] #標題和副標題 bar = Bar('Tuition', 'From 25 Business School') #畫第一個當?shù)厝说膶W費的條形圖,用虛線表示平均值,并標注最大和最小值 bar.add('local_tuition',school,local_tuition,mark_line=['average'],mark_point=['max','min']) #畫第二個外國人的學費的條形圖,用虛線表示平均值,并標注最大和最小值,x軸的標注旋轉-45° bar.add('foreign_tuition',school,foreign_tuition,xaxis_rotate = -45,mark_line=['average'],mark_point=['max','min']) bar

可以得到這樣一個圖,原圖是動態(tài)的(我不知道為什么沒法顯示完整,再研究研究吧)

從這張圖可以知道國外學生的學費和本國學生的學費的最高值都是33060,在International University of Japan (Niigata),最低都是1000,在Jamnalal Bajaj Institute of Management Studies (Bombay)。本國學生學費的平均值為12374.92,外國學生學費的平均值為16581.8。單位都是美元。如果我們想知道國外學生的學費和本國學生的學費的差距是多少,可以再加入一條折線圖。

6.記錄差值

difference = [0 for i in range(len(school))] for i in range(len(school)):difference[i]=foreign_tuition[i]-local_tuition[i] print(difference)

7.畫折線圖

from pyecharts import Line,Overlap line = Line() line.add('difference between foreign_tuition and local_tuition ',school,difference)overlap = Overlap() overlap.add(bar) overlap.add(line,yaxis_index=1,is_add_yaxis=True)overlap

可以看到有些學校對本國學生和國外的學生一視同仁,學費一樣。有的學校差距就特別大。?

?

8.要求工作經(jīng)驗和不要求工作經(jīng)驗的學校學生平均起薪的差別

#要求工作經(jīng)驗和不要求工作經(jīng)驗的學校學生平均起薪的差別 #分組 data["Starting Salary ($)"] = data["Starting Salary ($)"].apply(lambda x:x.replace(',','')if ','in str(x)else x) data["Starting Salary ($)"] = data["Starting Salary ($)"].apply(lambda x:float(x)) data["Starting Salary ($)"].head() data.groupby('Work Experience')["Starting Salary ($)"].mean() Work Experience No 24583.333333 Yes 41305.263158 Name: Starting Salary ($), dtype: float64

有工作經(jīng)驗的平均起薪明顯要比沒有工作的平均起薪高得多。?

?

9.要求英語測試和不要求英語測試的學校學生起薪的差別

畫boxplot(箱型圖)

#要求英語測試和不要求英語測試的學校學生起薪的差別 import seaborn as sns from matplotlib import pyplot as plt g = sns.catplot(x="English Test",y="Starting Salary ($)",data=data, kind="box", height = 5 ,palette = "Set1") g.despine(left=True) g.set_xticklabels() plt.title('Boxplot of Starting Salary ($) of English Test',size = 15)

?

?可以看出,沒有英語測試的學校,學生起薪差距較大,有英語測試的學校,學生起薪差距較小。沒有英語測試的學校,學生起薪的平均值低于有英語測試的學校的學生起薪的平均值。但是沒有英語測試的學校,學生起薪的最高值要高于有英語測試的學校。個人認為,可能沒有英語測試的學校,門檻更低,可能會招一些素質不好的學生,但是同時有些英語不好但是專業(yè)知識好的學生也會招來,因此會有學生起薪差距大的情況。

?

10.起薪和學費的關系

第一個是線性回歸曲線,我不知道怎么加legend

#起薪與學費有關嗎? plt.figure(figsize = (5,5)) g = sns.regplot(x="Local Tuition ($)", y="Starting Salary ($)",color = 'orange', data=data) g2 = sns.regplot(x="Foreign Tuition ($)", y="Starting Salary ($)",color = 'green', data=data) plt.xlabel('tuition')

?

?也可以分別畫。

#起薪與學費有關嗎? plt.figure(figsize = (5,5)) g = sns.lmplot(x="Local Tuition ($)", y="Starting Salary ($)", data=data) g2 = sns.lmplot(x="Foreign Tuition ($)", y="Starting Salary ($)", data=data)

?

可以發(fā)現(xiàn)起薪和學費基本上是正相關的。

THE END.?

總結

以上是生活随笔為你收集整理的【python数据分析】亚太地区的商学院(商务与经济统计案例3-3)数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯,歡迎將生活随笔推薦給好友。