日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

R语言-岭回归的代码与案例解读

發布時間:2024/1/8 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 R语言-岭回归的代码与案例解读 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

應用嶺回歸的場景有很多。
本文介紹的是 在應用多元線性回歸時 遇到多重共線性問題,且無法刪除變量或者增加樣本量的情況下,應用嶺回歸的情況。

  • 案例:互聯網經濟對中國經濟增長影響
  • 基礎模型:C-D生產函數:Y=A*L^α *K^β
  • 應用模型:嶺回歸
  • 使用工具:r語言
  • 使用程序包:‘MASS’、‘xlsx’、‘car’
  • 準備數據:Y:國民生產總值、K:固定資產投資;L:年期末就業人數;A:互聯網綜合發展水平
  • 數據處理:為了模型的穩定性與計算的簡易性,分別對兩端取對數,變成線性關系,得到最終模型:lnY=γlnA+αlnL+βlnk
  • 變量解釋與結果推測:綜合考慮互聯網經濟的指標體系和數據的可得性,采用因子分析的方法估計綜合技術水平A(詳情可點擊)。γ、α、β表示互聯網經濟產出彈性系數、勞動力彈性和資本彈性系數,本文推測,生產彈性系數會符合以下估計:
    (1)α+β+γ>1,表示最終經濟規模呈遞增趨勢;
    (2)α<1、β<1,表示邊際收益遞減的規律性,γ>1,表示互聯網經濟的邊際收益遞增性,符合互聯網經濟的特征。

對數線性化與多重共線性判別

#加載程序包與數據 library(MASS) library(xlsx) library(car) y <- read.xlsx("D:/RData/sets/Y.xlsx",1,encoding = "UTF-8") l <- read.xlsx("D:/RData/sets/L.xlsx",1,encoding = "UTF-8") a <- read.xlsx("D:/RData/sets/A.xlsx",1,encoding = "UTF-8") k <- read.xlsx("D:/RData/sets/K.xlsx",1,encoding = "UTF-8") dataY <-(y,a,l,k) #得到相關系數矩陣:變量之間呈同向變動的關系,符合經濟發展的規律 scatterplotMatrix(dataY,spread=FALSE,smoother.args=list(lty=2),main="Scatter Plot Matrix")

#數據對數化 ly <- log(y) la <- log(a) ll <- log(l) lk <- log(k) dY <-data.frame(ly,la,ll,lk) #做最小二乘回歸 fit <- lm(gdp~a+l+k,data=dataY) fit summary(fit)

用最小二乘法建立計量模型,由(表6)看到,雖然模型的擬合優度足夠高,F值也很大,整體擬合效果好,但是模型系數檢驗不顯著。顯而易見考慮模型的多重共線性問題

  • 多重共線性是指在除了因變量與自變量的關系外,在解釋變量之間也存在線性相關關系的一種形式。多重共線性導致gdp與互聯網綜合發展水平、勞動和資本之間的關系不顯著。
#應用vif值的開方來判斷是否存在多重共線性 library(car) vif(fit) sqrt(vif(fit))>2 #vif值開方遠大于2,存在多重共線性。
  • 嶺回歸是一種有偏估計,雖然對數據的無偏估計不準確,但是可以更準確的得到α,β,γ之間的系數關系。
#首先用嶺跡圖判斷k值區間并使用GCV值來進行嶺回歸估計 plot(lm.ridge(dY[,1]~dY[,2]+dY[,3]+dY[,4],data = dY,lambda = seq(0,0.5,0.001))) #確定k至的估計區間在0-0.5間

#確定k值并選擇GCV值=0.127.做嶺回歸。 select(lm.ridge(dY[,1]~dY[,2]+dY[,3]+dY[,4],data = dY,lambda = seq(0,0.5,0.001))) ridge1 <- lm.ridge(dY[,1]~dY[,2]+dY[,3]+dY[,4],data = dY,lambda =0.127) ridge1 <- lm.ridge(gdp~a+l+k,data = dY,lambda =0.127) ridge1

結果分析

從系數符號看,符合我們前面對本模型的系數估計。即彈性系數之和大于1,互聯網技術彈性系數大于1,勞動力彈性系數和資本彈性系數小于1。從整體來看,α+β+γ大于1,表明了邊際產量遞增的趨勢,符合當前經濟發展的現狀,當國家投入勞動力和資本和技術時,經濟發展水平總量增加。
(分別具體的每個系數分析在這里不做過多講述)
本文結論為:我國正處于技術推動經濟發展的新時代,應以互聯網技術為核心,結合信息與知識,對我國經濟發展做出貢獻。

總結

本文以具體案例為例子,講解了嶺回歸模型的r語言實現過程,并對案例進行一定程度的分析。希望可以對大家有幫助。

在本文中對互聯網綜合發展指數的因子分析求解可以看該連接
因子綜合得分求解

總結

以上是生活随笔為你收集整理的R语言-岭回归的代码与案例解读的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。