【定量分析、量化金融与统计学】R语言:多元线性回归实例
今天來做一個R語言的多元線性回歸的實例:
題目是這樣的:
練習:度假村排名
旅游勝地,專門介紹高級度假和住宿的雜志《Spas》在“讀者選擇”評選的世界20家獨立海濱精品酒店中榜上有名。所顯示的數(shù)據(jù)是這些酒店根據(jù)Resorts溫泉年度讀者選擇調(diào)查。每個分數(shù)代表了在三個標準(舒適、設施和內(nèi)部餐飲)之一上認為一家酒店優(yōu)秀或非常優(yōu)秀的受訪者的百分比。報告中還報告了總分,并用來對酒店進行排名。排名最高的酒店是穆里海灘奧德賽酒店(Muri Beach Odyssey),總分為94.3分,其中內(nèi)部餐飲得分最高,為97.7分。
需求與問題:
- A.根據(jù)舒適度、設施和內(nèi)部餐飲的評分,確定可用于預測總體得分的多元線性回歸方程。
- B.采用f檢驗來確定回歸關系的總體顯著性。0.01顯著性水平下的結論是什么?
- C.采用t檢驗來確定每個自變量的顯著性。在0.01顯著性水平下,每個檢驗的結論是什么?
- D.從估計的回歸方程中去除所有在0.01顯著性水平上不顯著的自變量。你估計的回歸方程是什么?
數(shù)據(jù)集截圖:
解題:
讀文件并做線性回歸:
?
?結果:
?
A:估計的多元線性回歸方程為:
B:模型的整體顯著性:F(15.98,16), p=0.000(另一種方式:您可以使用ANOVA表的F_value代替)與整體回歸關系的F檢驗相關的p值為4.52386E-05。因為這個p-value小于0.01顯著性水平,所以我們拒絕β1 =β 2 = β3 = 0的假設。我們得出結論,在0.01顯著性水平上存在整體回歸關系。
C:
(1)與估計的回歸參數(shù)b1相關的p值為0.4117。
因為這個p值大于0.01顯著性水平,所以我們不拒絕β1 = 0的假設。
我們的結論是,在控制設施和內(nèi)部餐飲時,在0.01顯著性水平上,舒適度得分和總得分之間沒有關系。
(2)與估計回歸參數(shù)b2相關的p值為3.69454E-05。
因為這個p值小于0.01顯著性水平,所以我們拒絕β2 = 0的假設。
我們得出這樣的結論:有一個分數(shù)在設施之間的關系和整體得分在0.01水平的意義,和我們最好的估計是,如果我們保持舒適和內(nèi)部餐廳的分數(shù)不變,增加一個點設施對應的分數(shù)在總體得分增加了0.2443。
(3)與估計的回歸參數(shù)b3相關的p值為0.0011。
最后結論:
因為這個p值小于0.01顯著性水平,所以我們拒絕β3 = 0的假設。
我們認為有一個分數(shù)之間的關系內(nèi)部餐飲和意義的總體得分在0.01水平,和我們最好的估計是,如果我們保持舒適和便利設施上的分數(shù)不變,增加一點分數(shù)上內(nèi)部的餐廳在總分對應增加0.2443。
如果舒適、設施和內(nèi)部餐飲的評分與總分相關,那么這種關系應該是正相關的。結果與對這三種關系的預期一致。?
D:
fitmodi =lm(ranking$Overall~+ranking$Amenities+ranking$In.House.Dining) summary(fitmodi)?
估計的多元線性回歸方程為:
模型的總體顯著性:F (24.02,17), p=0.000(另一種方式:您可以使用ANOVA表的F_value代替)與總體回歸關系的F檢驗相關的p值為1.1123E-05。
因為這個p-value小于0.01顯著性水平,所以我們拒絕β1 = β2 = β0的假設。
我們得出結論,在0.01顯著性水平上存在整體回歸關系。
與估計回歸參數(shù)b1(現(xiàn)在對應于便利設施)相關的p值是1.32524E-05。
因為這個p值小于0.01顯著性水平,所以我們拒絕β1 = 0的假設。
我們認為有一個分數(shù)在設施之間的關系和整體得分在0.01水平的意義,和我們最好的估計是,如果我們保持內(nèi)部餐廳的分數(shù)不變,增加一點分數(shù)設施對應增加0.2526總分。
與估計回歸參數(shù)b2(現(xiàn)在相當于內(nèi)部用餐)有關的p值是0.0009。
因為這個p值小于0.01顯著性水平,所以我們拒絕β2 = 0的假設。
我們認為有一個分數(shù)之間的關系內(nèi)部餐飲和意義的總體得分在0.01水平,和我們最好的估計是,如果我們保持設施上的分數(shù)不變,增加一點分數(shù)內(nèi)部餐廳對應增加總體得分0.2483。
對于該多元線性回歸模型,整體回歸關系顯著,估計的回歸系數(shù)b1和b2顯著,符合預期。
該模型的決定系數(shù)為R2 = 0.7387。
(a)中包含三個自變量(舒適度、便利設施和內(nèi)部餐飲)的模型具有R2 = 0.7498的倍數(shù)決定系數(shù),
這模型解釋了更多的變異1%多一點在樣本總體評級比獨立變量的模型,該模型只包括設施和內(nèi)部餐廳作為一個獨立變量(即刪除舒適度導致?lián)p失的更多解釋變異在總分的1%)。
因此,首選(d)部分中開發(fā)的更簡單的多元回歸模型。?
總結
以上是生活随笔為你收集整理的【定量分析、量化金融与统计学】R语言:多元线性回归实例的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用js将div高度设置为一直保持100
- 下一篇: Jquery选择器之可见性选择器、属性过