日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > 循环神经网络 >内容正文

循环神经网络

matlab 最小二乘法拟合_计量与论文串讲:最小二乘法

發(fā)布時(shí)間:2023/12/13 循环神经网络 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 matlab 最小二乘法拟合_计量与论文串讲:最小二乘法 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

點(diǎn)

為什么要用R

計(jì)量經(jīng)濟(jì)學(xué)作為經(jīng)濟(jì)大類下一門非常實(shí)用的學(xué)科有很強(qiáng)的實(shí)踐意義。盡管內(nèi)容龐雜但基本的指導(dǎo)思想?yún)s很簡單,因此通過一門統(tǒng)計(jì)編程語言學(xué)習(xí)、掌握計(jì)量經(jīng)濟(jì)學(xué)有很大的益處。

目前,市面上已經(jīng)有多款統(tǒng)計(jì)編程語言和統(tǒng)計(jì)軟件,實(shí)證分析領(lǐng)域中STATA始終坐穩(wěn)第一把交椅,相關(guān)的書籍與課程也汗牛充棟。(陳強(qiáng) 2015)(趙西亮 2017)但STATA畢竟是一個(gè)在學(xué)術(shù)圈范圍內(nèi)比較熱門的商業(yè)軟件,在未來可遷移至工作中的效率便不是很高,同時(shí)STATA在處理一些復(fù)雜的數(shù)據(jù)或時(shí)間序列時(shí),軟件的限制也會(huì)導(dǎo)致工作效率的下降。而R語言在此類問題上便有較大的優(yōu)勢(shì),在處理高頻時(shí)間序列時(shí)其效率便遠(yuǎn)高于STATA,對(duì)于大數(shù)據(jù)操作而言,也不會(huì)受到STATA不同發(fā)行版本的限制。

隨著RStudio的發(fā)布以及Rmarkdown的開發(fā)日趨成熟,利用R進(jìn)行可復(fù)用,甚至整合數(shù)據(jù)操作與文章寫作變成了可能,本文也是利用Rmarkdown完成的教學(xué)參考資料,其數(shù)據(jù)操作與統(tǒng)計(jì)分析皆在Rmarkdown中完成。

考慮到上述的優(yōu)點(diǎn),筆者認(rèn)為利用R語言學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)是一種效率高、回報(bào)高的學(xué)習(xí)過程。本文主要關(guān)注R語言在計(jì)量經(jīng)濟(jì)學(xué)中的應(yīng)用,以及在數(shù)據(jù)挖掘中的應(yīng)用(如果以后想寫的話),因此對(duì)于R語言本身的特性不做系統(tǒng)性展開,但會(huì)在需要的時(shí)候進(jìn)行適當(dāng)?shù)慕忉屌c說明。

回歸:計(jì)量經(jīng)濟(jì)學(xué)的靈魂

我發(fā)現(xiàn)空手道不是掌握那4000個(gè)動(dòng)作就能學(xué)好的。想要學(xué)好它,關(guān)鍵在于你能不能把那些基本動(dòng)作不斷反復(fù)地操練4000遍。

對(duì)于計(jì)量經(jīng)濟(jì)學(xué)而言,這個(gè)“基本動(dòng)作”有兩種普遍的觀點(diǎn)。第一種是由(Angrist and Pischke 2014) 主推的隨機(jī)試驗(yàn)方法, 第二種則是大部分計(jì)量經(jīng)濟(jì)學(xué)教材中采用的,將線性回歸作為計(jì)量經(jīng)濟(jì)學(xué)的基礎(chǔ)。從實(shí)用性的角度來說,線性回歸是非常優(yōu)秀的解釋方案,而隨機(jī)試驗(yàn)與匹配統(tǒng)計(jì)則顯得挖掘的太過深入,不適合作為本文的邏輯起點(diǎn)。

不要問,問就是做個(gè)回歸

為什么線性回歸那么受人喜愛,最主要的原因在于線性回歸的可解釋性是目前為止最直觀,最清晰的。另一方面,線性回歸的解決方案到目前為止也是最清晰、最簡明的方案。不妨考慮勞動(dòng)經(jīng)濟(jì)學(xué)的經(jīng)典案例,即教育水平對(duì)工資的影響(Wooldridge 2016):

在理想狀態(tài)下(即滿足了線性回歸的假設(shè)條件后),系數(shù)\beta_1可以解釋為每增加1年教育,工資的增量。但現(xiàn)實(shí)狀態(tài)下,工資顯然不僅僅受到教育年限的影響,這時(shí)候線性回歸的另一個(gè)優(yōu)勢(shì)就顯現(xiàn)了出來,即線性回歸的系數(shù)\beta_1(在理想狀態(tài)下)代表了在控制了其他因素不變的情況下,對(duì)于工資的影響。其理論推導(dǎo)也很簡單,不妨引入另一個(gè)會(huì)對(duì)工資產(chǎn)生影響的變量,工作年限workingAge,上述方程即變?yōu)?/p>

此時(shí),系數(shù)beta1代表了教育年限的邊際影響,不受到工作年限的影響,即有:

如何估計(jì)線性回歸的系數(shù)?目前最通用、最優(yōu)的方案依然還是最小二乘法(OLS)。(陳強(qiáng) 2015)

牛刀小試,我們做個(gè)回歸

針對(duì)上述討論的內(nèi)容,通過R語言便可以很容易實(shí)現(xiàn)。對(duì)R語言而言,完成一個(gè)統(tǒng)計(jì)回歸一般分為以下3步:

  • 導(dǎo)入數(shù)據(jù)
  • 清洗數(shù)據(jù)
  • 做個(gè)回歸
  • 這個(gè)例子中并不涉及清洗數(shù)據(jù),因此只需要導(dǎo)入數(shù)據(jù)即可。

    library(haven) #read_dta使用了haven包,因此需要導(dǎo)入haven
    #導(dǎo)入數(shù)據(jù),數(shù)據(jù)來源為伍德里奇《計(jì)量經(jīng)濟(jì)學(xué)導(dǎo)論-現(xiàn)代觀點(diǎn)》中的數(shù)據(jù)集
    WAGE1 "WAGE1.DTA",sep = ""))

    完成數(shù)據(jù)導(dǎo)入后,由于本節(jié)不涉及清洗數(shù)據(jù),因此直接對(duì)方程進(jìn)行回歸。

    wage_LM #回歸方程命令
    summary(wage_LM) #回歸結(jié)果##
    ## Call:
    ## lm(formula = wage ~ educ + exper, data = WAGE1)
    ##
    ## Residuals:
    ## Min 1Q Median 3Q Max
    ## -5.5532 -1.9801 -0.7071 1.2030 15.8370
    ##
    ## Coefficients:
    ## Estimate Std. Error t value Pr(>|t|)
    ## (Intercept) -3.39054 0.76657 -4.423 1.18e-05 ***
    ## educ 0.64427 0.05381 11.974 < 2e-16 ***
    ## exper 0.07010 0.01098 6.385 3.78e-10 ***
    ## ---
    ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    ##
    ## Residual standard error: 3.257 on 523 degrees of freedom
    ## Multiple R-squared: 0.2252, Adjusted R-squared: 0.2222
    ## F-statistic: 75.99 on 2 and 523 DF, p-value: < 2.2e-16

    到這一步為止,我們已經(jīng)完成了一次回歸,但有兩個(gè)亟待解決的問題。

  • 回歸結(jié)果很難看,不直觀
  • 上述情況下都是理想狀態(tài),那么什么是不理想狀態(tài)?
  • 第一個(gè)問題很容易解決,可以通過引入其他美化輸出結(jié)果的工具解決。第二個(gè)問題則留到下一節(jié)進(jìn)行分析。

    library(stargazer) #引入stargazer包,類似于STATA中的outreg2
    stargazer(wage_LM, title = "線性回歸結(jié)果",
    header = F, type = "latex")

    什么是不理想狀態(tài)?

    一般來說,不理想狀態(tài)有四種狀態(tài),其中內(nèi)生性由于可以單獨(dú)成冊(cè)、且與最小二乘法無本質(zhì)聯(lián)系故按下不表,其他三個(gè)與最小二乘法密切相關(guān)。這三個(gè)分別是:

  • 共線性
  • 自相關(guān)
  • 異方差
  • 共線性

    共線性是所有不理想狀態(tài)中影響最低的一個(gè)因素,一般來說,只要變量之間不存在完全的共線性,即對(duì)于變量x1與x2而言,只要x1=a+b x2不嚴(yán)格成立,即可以避免完全共線性的影響。

    自相關(guān)

    自相關(guān)往往伴隨著兩種情況出現(xiàn)。第一種情況是時(shí)間序列中的自相關(guān),舉例來說,今天的股票價(jià)格變動(dòng)很可能和昨天的股票價(jià)格變動(dòng)有關(guān)系。這種自相關(guān)是時(shí)間序列中要解決的一大問題,一般通過滯后項(xiàng)解決。第二種情況是空間溢出中的自相關(guān),舉例來說,上海地區(qū)的房價(jià)本身就會(huì)存在相關(guān)性。這種自相關(guān)直接導(dǎo)致了空間計(jì)量經(jīng)濟(jì)學(xué)(Spatial Econometrics)的誕生,但也可以通過其他的方式,如增加控制變量解決。一般來說,當(dāng)自相關(guān)出現(xiàn)時(shí)除了上述的兩個(gè)解決方案以外,還可以通過聚類穩(wěn)健標(biāo)準(zhǔn)誤的方法解決。

    異方差

    異方差的分析在初級(jí)計(jì)量經(jīng)濟(jì)學(xué)中占據(jù)了大量篇幅,之所以如此,是因?yàn)楫惙讲畛霈F(xiàn)會(huì)導(dǎo)致對(duì)系數(shù)檢驗(yàn)的統(tǒng)計(jì)量失效,即導(dǎo)致了后續(xù)置信度的變化。如果單純只是關(guān)心系數(shù),那么異方差并不會(huì)影響結(jié)果,得出的系數(shù)依然無偏估計(jì)量。異方差直觀來說,便是擾動(dòng)項(xiàng)方差不再是一個(gè)常數(shù),而是依賴于i。定性來說,同方差條件下,殘差基本是隨機(jī)的;異方差條件下,殘差則會(huì)出現(xiàn)明顯的函數(shù)特性。

    對(duì)于上文回歸的結(jié)果,同樣可以通過作圖的方式定性地看其是否符合同方差假設(shè)。從圖中不難發(fā)現(xiàn),上文回歸的結(jié)果還是存在異方差的情況。

    plot(wage_LM, which = 1)

    對(duì)于異方差的解決則存在多種方法。從理論的角度來看,廣義最小二乘法(GLS)才是BLUE(最優(yōu)線性無偏統(tǒng)計(jì)量)。但從實(shí)操的角度來看,這個(gè)方法可能并不經(jīng)濟(jì)。之所以說其不經(jīng)濟(jì)的原因在于通過最小二乘法獲得的結(jié)果是無偏的,只是其檢驗(yàn)統(tǒng)計(jì)量無效,因此更換統(tǒng)計(jì)檢驗(yàn)量便可以解決該問題。目前,做實(shí)證分析的數(shù)據(jù)往往已經(jīng)有充足的數(shù)據(jù)量,因此直接采用穩(wěn)健標(biāo)準(zhǔn)誤(Eicker 1967)修正統(tǒng)計(jì)量的有效性即可。

    經(jīng)典:電力部門的規(guī)模報(bào)酬

    每每寫到實(shí)證論文部分,尤其是利用最小二乘法的文章,Nerlove(1961)是一篇完全無法回避的經(jīng)典文章,這篇文章也成為了諸多計(jì)量經(jīng)濟(jì)學(xué)教材中必定錄取的參考文獻(xiàn)。(Nerlove 1963)(Wooldridge 2016)(Hayashi 2000) 這篇文章想要度量的是美國電力供應(yīng)行業(yè)規(guī)模報(bào)酬效應(yīng)(Nerlove 1963),對(duì)應(yīng)的產(chǎn)出范圍又是多少。由于本文十分經(jīng)典,其數(shù)據(jù)集也已經(jīng)成為了公開數(shù)據(jù)集,可以直接在R內(nèi)引用。

    psych::describe(nerlove)[,c("n","mean","sd","median","min","max")]

    n

    mean

    sd

    median

    min

    max

    tc14512.976096519.79457676.75400020.08200001.394220e+02
    q1452133.08275862931.94213101109.00000002.00000001.671900e+04
    pl1451.97655170.23004042.00000001.50000002.300000e+00
    pf14526.17655177.876071426.899999610.30000024.280000e+01
    pk145174.496551718.2094771170.0000000138.00000002.330000e+02
    lntc1451.72466331.42172341.9101349-2.50103594.937505e+00
    lnq1456.55665111.91279247.01121380.69314729.724301e+00
    lnpf1453.20885840.35890023.29212622.33214403.756538e+00
    lnpk1455.15677680.10038985.13579854.92725375.451038e+00
    lnpl1450.67437320.11975220.69314720.40546518.329091e-01

    1-10 of 10 rows

    數(shù)據(jù)中,tc為總成本,q為產(chǎn)出數(shù)量,pl為勞動(dòng)價(jià)格,pf為燃油價(jià)格,pk為資本價(jià)格。在估計(jì)的過程中,Nerlove從Cobb-Douglas產(chǎn)出函數(shù)開始設(shè)定模型。

    模型中,Q代表了i公司的產(chǎn)出,L代表了i公司的勞動(dòng)投入,K代表了i公司的資本投入,F代表了i公司為了發(fā)電投入的燃油。A則代表了不同公司的不可觀察的產(chǎn)出效率。方程 衡量了規(guī)模效應(yīng)。由于電力部門的產(chǎn)出即為需求,因此電力部門的收益最大化即成本最小化,可以概述為以下的優(yōu)化條件:

    于是對(duì)于公司i而言,其Cobb-Douglas成本函數(shù)便為:

    minLiKiFiTCi=pilLi+pikKi+pifFis.t.AiLiα1Kiα2Fiα3=Qi" role="presentation" style=" box-sizing: border-box; line-height: normal; font-size: 14px; word-spacing: normal; overflow-wrap: normal; float: none; direction: ltr; max-width: none; max-height: none; min-width: 0px; min-height: 0px; border-width: 0px; border-style: initial; border-color: initial; display: table-cell !important; width: 10000em !important; text-align: left; ">利用自然對(duì)數(shù)函數(shù)的特征,便可以將上述函數(shù)變?yōu)榫€性函數(shù)。

    在設(shè)定了模型之后,便是對(duì)最小二乘法的適用性展開討論。這也是本文之所以作為經(jīng)典論文最主要的原因。

  • 線性假設(shè):模型形式已經(jīng)可以說明滿足線性假設(shè)
  • 隨機(jī)抽樣:沒有理由懷疑這條不滿足
  • 不存在完全共線性:這條也是顯然的,否則無法回歸
  • 條件均值為0:這是本文的核心亮點(diǎn),作者從電力行業(yè)的特征入手。一方面,對(duì)于投入而言,由于要素價(jià)格與公司效率是無關(guān)的,因此可以假定要素價(jià)格與e_i是獨(dú)立的。另一方面對(duì)于產(chǎn)出而言,電力行業(yè)的產(chǎn)出等于需求,而產(chǎn)出價(jià)格是由utility commission決定的,根據(jù)行業(yè)管制的要求來看,這也是與公司效率相獨(dú)立的。因此可以認(rèn)為滿足零條件均值假設(shè)。
  • 同方差性:這條其實(shí)不滿足,但并不影響系數(shù)估計(jì),可以看下文的處理。
  • library(zoo)
    library(lmtest)
    library(sandwich)
    base_reg print(summary(base_reg))##
    ## Call:
    ## lm(formula = lntc ~ lnq + lnpl + lnpk + lnpf, data = nerlove)
    ##
    ## Residuals:
    ## Min 1Q Median 3Q Max
    ## -0.97203 -0.23377 -0.01091 0.16185 1.80985
    ##
    ## Coefficients:
    ## Estimate Std. Error t value Pr(>|t|)
    ## (Intercept) -3.56651 1.77938 -2.004 0.047 *
    ## lnq 0.72091 0.01743 41.352 < 2e-16 ***
    ## lnpl 0.45596 0.29980 1.521 0.131
    ## lnpk -0.21515 0.33983 -0.633 0.528
    ## lnpf 0.42581 0.10032 4.244 3.97e-05 ***
    ## ---
    ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    ##
    ## Residual standard error: 0.3923 on 140 degrees of freedom
    ## Multiple R-squared: 0.926, Adjusted R-squared: 0.9239
    ## F-statistic: 437.9 on 4 and 140 DF, p-value: < 2.2e-16

    上面是直接回歸得到的結(jié)果,為了檢驗(yàn)是否滿足同方差假設(shè)條件,不妨從圖示入手。從圖中容易發(fā)現(xiàn),殘差項(xiàng)的確無法滿足同方差條件,而是呈現(xiàn)出了二次函數(shù)的狀態(tài)。

    plot(base_reg, which = 1)

    為此,進(jìn)一步考慮采用穩(wěn)健統(tǒng)計(jì)量進(jìn)行處理。容易發(fā)現(xiàn),通過穩(wěn)健統(tǒng)計(jì)量進(jìn)行處理后,估計(jì)的系數(shù)的確沒有變化,而是t統(tǒng)計(jì)量產(chǎn)生了差異。

    Nerlove也正是通過對(duì)最小二乘法中高斯馬爾科夫定理成立的五大條件的細(xì)致論述,將他的論文流芳百世。對(duì)于論文作者而言,Nerlove(1963)最重要的啟示是通過產(chǎn)業(yè)或研究的數(shù)據(jù)集的實(shí)際情況對(duì)計(jì)量模型適用性進(jìn)行分析,分析的過程越充分,那么結(jié)果也就越具備說服力,也就可以發(fā)更好的期刊。同樣細(xì)致分析模型的文章還有白重恩(2012)對(duì)遺漏變量的解釋(白重恩, 李宏彬, and 吳斌珍 2012),未來在分析面板數(shù)據(jù)模型的時(shí)候,也會(huì)講到這篇文章。

    結(jié)語

    本文回顧了計(jì)量經(jīng)濟(jì)學(xué)中最基礎(chǔ)的線性回歸與最小二乘法,并通過Nerlove(1963)的經(jīng)典論文大致闡述了一篇優(yōu)秀的所需要具備的基本條件。通過本文,讀者應(yīng)當(dāng)能夠利用R語言在借助優(yōu)質(zhì)的數(shù)據(jù)集,通過最小二乘法完成一篇相關(guān)的計(jì)量文章復(fù)現(xiàn)。

    參考文獻(xiàn)

  • Angrist, Joshua D., and J?rn-Steffen Pischke. 2014. Mastering’metrics: The Path from Cause to Effect. Princeton University Press.
  • Eicker, Friedhelm. 1967. “Limit Theorems for Regressions with Unequal and Dependent Errors.” In Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1:59–82. 1. Berkeley, CA: University of California Press.
  • Hayashi, Fumio. 2000. “Econometrics. 2000.” Princeton University Press. Section 1: 60–69.
  • Nerlove, Marc. 1963. “Returns to Scale in Electricity Supply. En ‘Measurement in Economics-Studies in Mathematical Economics and Econometrics in Memory of Yehuda Grunfeld’, Edited by Carl F. Christ.” Stanford University. Press.
  • Wooldridge, Jeffrey M. 2016. Introductory Econometrics: A Modern Approach. Sixth edition. Boston, MA: Cengage Learning.
  • 白重恩, 李宏彬, and 吳斌珍. 2012. “醫(yī)療保險(xiǎn)與消費(fèi): 來自新型農(nóng)村合作醫(yī)療的證據(jù).” 經(jīng)濟(jì)研究 2: 41–53.
  • 趙西亮. 2017. 基本有用的計(jì)量經(jīng)濟(jì)學(xué). 北京大學(xué)出版社.
  • 陳強(qiáng). 2015. 計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用. 北京: 高等教育出版社.
  • 總結(jié)

    以上是生活随笔為你收集整理的matlab 最小二乘法拟合_计量与论文串讲:最小二乘法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。