日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

r语言electricity数据集_R语言学习-数据集

發布時間:2025/4/16 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 r语言electricity数据集_R语言学习-数据集 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據集通常是由數據構成的一個矩形數組,行表示觀測,列表示變量,對數據集的操作是數據分析的第一步

R語言的數據結構通常有以下幾種:標量,向量,矩陣,數組,數據框和列表

向量

向量是用于存儲數字型、字符型或邏輯型數據的一維數組。執行組合功能的函數c()可用來創建向量

> a

> b

> a

[1] 1 2 3 4 5 6

> b

[1] "one" "two" "three"

通常在方括號中給定元素所處位置的數值,對向量中的元素進行檢索

> a

> a[5]

[1] "c"

> a[c(1,3,5)]

[1] "k" "h" "c"

> a[2:6]

[1] "j" "h" "a" "c" "m"

矩陣

矩陣是一個二維數組,每個元素的類型相同,通過函數matrix()創建矩陣

> y

> y

[,1] [,2] [,3] [,4]

[1,] 1 6 11 16

[2,] 2 7 12 17

[3,] 3 8 13 18

[4,] 4 9 14 19

[5,] 5 10 15 20

> cells

> rnames

> cnames

> mymatrix

> mymatrix

C1 C2

R1 1 26

R2 24 28

#這個矩陣中,byrow=TRUE是選擇行填充,dimnames是指定行名和列名

同樣矩陣元素的檢索也是用到方括號

X[i,]是選擇矩陣的第i行,X[,j]是選擇矩陣的第j列,X[i,j]選擇矩陣第i行第j列的元素

> x

> x

[,1] [,2] [,3] [,4] [,5]

[1,] 1 3 5 7 9

[2,] 2 4 6 8 10

> x[2,]

[1] 2 4 6 8 10

> x[,5]

[1] 9 10

> x[2,5]

[1] 10

數組

數組與矩陣類似,到那時數組的維度可以大于2,數組可以通過array創建,一般格式如下

myarray

vector包含了數組中的數據,dimensions是一個數值型向量,表示了維度的大小,dimnames則是指定維度的名稱

> dim1

> dim2

> dim3

> z

> z

, , C1

B1 B2 B3

A1 1 3 5

A2 2 4 6

, , C2

B1 B2 B3

A1 7 9 11

A2 8 10 12

, , C3

B1 B2 B3

A1 13 15 17

A2 14 16 18

, , C4

B1 B2 B3

A1 19 21 23

A2 20 22 24

數組的檢索與矩陣的檢索相似,通過方括號檢索

數據框

數據框是R語言中最常用的數據集,它不同的列可以包含不同的數據類型

數據框可以通過data.frame創建

mtdata

其中列向量col1,col2,col3可以為任何類型

> patienID

> age

> diabetes

> status

> patientData

> patientData

patienID age diabetes status

1 1 25 Type1 Poor

2 2 34 Type2 Improved

3 3 28 Type1 Excellent

4 4 52 Type1 Poor

數據框的檢索方式如下

> patientData[1,2]

[1] 25

> patientData[1:2]

patienID age

1 1 25

2 2 34

3 3 28

4 4 52

> patientData[c("diabetes","status")]

diabetes status

1 Type1 Poor

2 Type2 Improved

3 Type1 Excellent

4 Type1 Poor

> patientData$age

[1] 25 34 28 52

# $用于選區給定數據框中某個特定的變量

因子

變量可分為名義型變量,有序型,連續型變量

名義型變量是沒有順序之分的類別型變量,如糖尿病的類型

有序型變量代表一種順序關系,而非數量關系,比如病情的好壞,壞

連續型變量則同時表示了順序和數量

名義型變量和有序型變量在R中稱為因子

factor函數可以將變量轉化為因子,如果要排序,則需要ordered=TRUE參數,levels可以指定排序順序

> patientID

> age

> diabetes

> status

> diabetes

> status

> patientData

Error: object 'patientData' not found

> patientData

> str(patientData)#顯示數據結構

'data.frame': 4 obs. of 4 variables:

$ patientID: num 1 2 3 4

$ age : num 25 34 28 52

$ diabetes : Factor w/ 2 levels "Type1","Type2": 1 2 1 1

$ status : Ord.factor w/ 3 levels "Excellent"

> summary(patientData)#統計數據框各變量

patientID age diabetes

Min. :1.00 Min. :25.00 Type1:3

1st Qu.:1.75 1st Qu.:27.25 Type2:1

Median :2.50 Median :31.00

Mean :2.50 Mean :34.75

3rd Qu.:3.25 3rd Qu.:38.50

Max. :4.00 Max. :52.00

status

Excellent:1

Improved :1

Poor :2

列表

列表是R中數據集最為復雜的一種,是一些對象的有序集合

可以使用list()函數創建列表

mylist

> g

> h

> j

> k

> mylist

> mylist

$title

[1] "My Frist List"

$ages

[1] 25 26 18 39

[[3]]

[,1] [,2]

[1,] 1 6

[2,] 2 7

[3,] 3 8

[4,] 4 9

[5,] 5 10

[[4]]

[1] "one" "two" "three"

總結

以上是生活随笔為你收集整理的r语言electricity数据集_R语言学习-数据集的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。