日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

python数据分析面试_python数据分析面试

發(fā)布時間:2023/11/27 生活经验 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python数据分析面试_python数据分析面试 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1. 如何利用SciKit包訓練一個簡單的線性回歸模型

利用linear_model.LinearRegression()函數(shù)

# Create linear regression object

regr = linear_model.LinearRegression()

# Train the model using the training sets

regr.fit(data_X_train, data_y_train)

2. 例舉幾個常用的python分析數(shù)據(jù)包及其作用

數(shù)據(jù)處理和分析:NumPy, SciPy, Pandas

機器學習:SciKit

可視化: Matplotlib, Seaborn

3. 如何利用Numpy對數(shù)列的前n項進行排序

使用argsort()函數(shù):x[x [: n-1].argsort ()]

4. 如何檢驗一個數(shù)據(jù)集或者時間序列是隨機分布的

畫lag plot(Correlogram:相關(guān)圖),如果圖上的點呈散亂分布,則為隨機

5. 在python中如何創(chuàng)建包含不同類型數(shù)據(jù)的dataframe

利用pandas包的DataFrame函數(shù)的serias創(chuàng)建列然后用dtype定義類型:

df = pd.DataFrame({'x': pd.Series(['1.0', '2.0', '3.0'], dtype=float), 'y': pd.Series(['1', '2', '3'], dtype=int)})

6. Pandas中使用的標準數(shù)據(jù)缺失標志是什么

NaN

7. 描述numpy array比python list的優(yōu)勢

a. numpy array比python list更緊湊,存儲數(shù)據(jù)占的空間小,讀寫速度快。(這是由于python list儲存的是指向?qū)ο?至少需要16個字節(jié))的指針(至少4個字節(jié));而array中儲存的是單一變量(比如單精度浮點數(shù)為4個字節(jié),雙精度為8))

b. array可以直接使用vector和matrix類型的處理函數(shù),非常方便。

8. 如何檢驗numpy的array為空

使用size函數(shù), 比如

a = np.array([])

print a.size # 0

9. 如何檢驗pandas dataframe為空?

使用empty函數(shù)

10.如何對list中的item進行隨機重排

使用shuffle()函數(shù)

10.裝飾器的作用

裝飾器可用于修飾函數(shù)或類。通過裝飾器可以包裹函數(shù)或類使之執(zhí)行之前或之后調(diào)用裝飾器函數(shù),從而達到抽離出大量函數(shù)中與函數(shù)功能本身無關(guān)的雷同代碼并繼續(xù)重用的目的。比較經(jīng)典的廚力場景有檢驗權(quán)限,追蹤參數(shù),日志登陸等

11.以下代碼的輸出?

def multipliers():

return [lambda x: i * x for i in range(4)]

print [m(2) for m in multipliers()]

輸出為[6,6,6,6]。 這個的原因是 Python 的閉包的后期綁定導致的 late binding,這意味著在閉包中的變量是在內(nèi)部函數(shù)被調(diào)用的時候被查找。所以結(jié)果是,當任何 multipliers() 返回的函數(shù)被調(diào)用,在那時,i 的值是在它被調(diào)用時的周圍作用域中查找,到那時,無論哪個返回的函數(shù)被調(diào)用,for 循環(huán)都已經(jīng)完成了,i 最后的值是 3,因此,每個返回的函數(shù) multiplies 的值都是 3。因此一個等于 2 的值被傳遞進以上代碼,它們將返回一個值 6 (比如: 3 x 2)。

11.如何處理缺失數(shù)據(jù)?(如果缺失的數(shù)據(jù)不可得,將采用何種手段收集?)

首先判斷缺失數(shù)據(jù)是否有意義,如果沒有意義或者缺失數(shù)據(jù)的比例超過80%直接去掉。

如果缺失數(shù)據(jù)有規(guī)律,則需根據(jù)其變化規(guī)律來推測次缺失值;

如果數(shù)據(jù)沒有規(guī)律,則用其他值代替:

如果數(shù)據(jù)符合正態(tài)分布,缺失值用期望值代替

如果數(shù)據(jù)是類型變量,則用默認類型值代替缺失值

總結(jié)

以上是生活随笔為你收集整理的python数据分析面试_python数据分析面试的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。