日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

python统计分析---6.主成分分析

發(fā)布時(shí)間:2023/12/15 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python统计分析---6.主成分分析 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

  • 1. 主成分分析

1. 主成分分析

#導(dǎo)入包 import numpy as np import pandas as pd import statsmodels.formula.api as smf from sklearn import linear_model import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline#使用pandas讀取數(shù)據(jù)支持xls和xlsx data=pd.read_excel("bankloan_binning.xlsx") data.head(6)#顯示數(shù)據(jù)開(kāi)頭6行

主成分分析自帶的案例

import mglearn mglearn.plots.plot_pca_illustration()

可能需要先導(dǎo)入mglearn包

pip install mglearn

  • 主成分分析特點(diǎn)
  • 降維:將高維降為低維

  • 降維導(dǎo)致信息量損失

  • 降維損失達(dá)到70%以?xún)?nèi)就能達(dá)到要求

  • PCA相當(dāng)于一種特殊的回歸


  • 主成分幾個(gè)標(biāo)準(zhǔn)
    1. Z1>50%;
    2. Z1+Z2>70%;
    3. Z1/Z2>3;
    4. 盡量壓縮到前兩個(gè)主成分Z1和Z2(理想的情況下),因?yàn)樵谧鰯?shù)據(jù)展示的時(shí)候二維空間更好的表達(dá)圖形
    5. 不管有多少維度盡量用兩個(gè)維度來(lái)表達(dá)


    降維到2到3個(gè)為最佳

    from sklearn.decomposition import PCA #PCA主成分分析,n_components保留幾個(gè)主成分,可以保留個(gè)數(shù)或者百分比n_components=6(個(gè)數(shù)也可以) pca=PCA(n_components=0.8).fit(zraw1) pca.explained_variance_ #主成分特征值 pca.explained_variance_ratio_#主成分的解釋方差百分比 # pca.components_#特征向量#保存主成分 #累計(jì)貢獻(xiàn)率,保存幾個(gè)主成分,可以保存主成分的貢獻(xiàn)率達(dá)到多少保留,也可以保留主成分的個(gè)數(shù) pca = PCA(n_components=2).fit_transform(zraw1)#保存兩個(gè)主成分 raw[["z1","z2"]]=pd.DataFrame(pca) raw.head(2)

    Z1和Z2不是特征變量的任何一個(gè),而是這些變量整合而來(lái)的共同成分,整合到一起的兩個(gè)主要特征。

    大數(shù)據(jù)的包實(shí)現(xiàn)主成分分析

    from sklearn.decomposition import PCA

    小數(shù)據(jù)的包實(shí)現(xiàn)主成分分析

    from statsmodels.multivariate.pca import PCA # 小數(shù)據(jù)的包實(shí)現(xiàn)主成分分析

    兩個(gè)包都能實(shí)現(xiàn)主成分分析,但是適用場(chǎng)景會(huì)不一樣。

    • 大數(shù)據(jù)分析
    from sklearn.decomposition import PCA #大數(shù)據(jù)的包實(shí)現(xiàn)主成分分析 #PCA主成分分析,n_components保留幾個(gè)主成分,可以保留個(gè)數(shù)或者百分比n_components=6(個(gè)數(shù)也可以) pca=PCA(n_components=0.8).fit(zraw1) pca.explained_variance_ #主成分特征值 pca.explained_variance_ratio_#主成分的解釋方差百分比 # pca.components_#特征向量
    • 小數(shù)據(jù)分析
    #---------對(duì)比多變量主成分-------- from statsmodels.multivariate.pca import PCA # 小數(shù)據(jù)的包實(shí)現(xiàn)主成分分析 stat_pca=PCA(zraw1,ncomp=3,standardize=True,method='eig') stat_pca.factors#主成分得分 stat_pca.loadings#載荷 stat_pca.coeff#系數(shù) stat_pca.rsquare#解釋比例 創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

    總結(jié)

    以上是生活随笔為你收集整理的python统计分析---6.主成分分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。