日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《深入浅出数据分析》第十章第十一章

發布時間:2023/12/15 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《深入浅出数据分析》第十章第十一章 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • R語言
  • 一、散點圖
  • 二、補充


R語言

從上一章開始,就都涉及到R語言的內容了,在這記錄一下,就當給自己做的筆記。


一、散點圖

這次要繪制的是散點圖,并且求出它的回歸方程。

  • 首先,還是加載csv文件。和上一個一樣就不多寫了。
  • 之后就可以直接繪制散點圖了。
    這個圖主要是比較職員期望的加薪幅度和實際的加薪幅度,并且依據數據建立回歸模型,用來分析加薪幅度,以便獲取大幅度的加薪。
  • plot(x, y)


    最后圖片長這樣。

  • 計算相關系數r
    r用來量度變量的相關性。r的范圍為-1~1,0表示無相關性,1和-1則表示這兩個變量完全相關。
  • cor(x, y)
  • 創建回歸方程
    每當R創建一個線性模型,R就會在記憶庫里創建一個對象,這個對象有一長串屬性,其中包括回歸方程的系數。知道了系數就能寫出回歸方程咯。
  • myLm <- lm(x~y, data=你加載出來的數據) myLm$coefficients
  • 對該對象進行匯總
  • summary(myLm)


    這里出現均方根誤差(又稱機會誤差或σ),這是第十一章的內容。
    在使用回歸方程進行預測的時候,難免會出現誤差,我們可以用均方根誤差來定量表示殘差分布,即表現出觀察結果相對于回歸線的平均偏移量。

    也可以直接通過代碼語句直接查看均方根誤差的值。

    summary(myLm)$sigma
  • 分割數據
    從上面的散點圖可以看出來,左側的數據誤差很小,二右側的數據誤差較大。所以直接計算出來的回歸方程的誤差就會較大。因此為了減小誤差,我們選擇分割數據,將左側和右側的數據分割開,分別計算各自的回歸曲線及均方根誤差。
    這里就直接展示拆分后對比了。
  • 二、補充

    • lm函數

    lm函數用于擬合回歸模型,是擬合回歸模型里面最基本的函數。
    格式如下:

    lm(formula, data)

    formula指要擬合的數據模型;
    data指用于擬合的數據。
    之后返回的對象中包含該擬合模型的信息。

    • plot()
    plot(x=x軸數據,y=y軸數據,main="標題",sub="子標題",type="線型",xlab="x軸名稱",ylab="y軸名稱",xlim = c(x軸范圍,x軸范圍),ylim = c(y軸范圍,y軸范圍))

    總結

    以上是生活随笔為你收集整理的《深入浅出数据分析》第十章第十一章的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。