常用的UCI数据集
1.Hill_Valley(分辨地形中的“隆起”或“凹陷”)
數據集信息:
每條記錄表示二維圖形上的 100 個點。當按順序(從 1 到 100)繪制為 Y 坐標時,這些點將創建一個山丘(地形中的"凸起")或一個山谷(地形中的"傾斜")。
可供下載的有六個文件,如下所示:
1.前兩個數據集(無噪聲)是一個訓練/測試集對,其中丘陵或山谷具有平滑過渡。
(a) Hill_Valley_without_noise_Training.data
(b) Hill_Valley_without_noise_Testing.data
2.接下來的兩個數據集(帶噪聲)是一個訓練/測試集對,其中地形不平坦,仔細觀察山丘或山谷不那么明顯。
(c) Hill_Valley_with_noise_Training.data
(d) Hill_Valley_with_noise_Testing.data
3.示例 ARFF 文件對于設置實驗很有用,但不是必需的。
(e) Hill_Valley_sample_arff.text
4.此圖形文件顯示了數據中的兩個示例實例。
(f) Hill_Valley_visual_examples.jpg
屬性信息:
1-100:標記為"X##"。浮點值(數字)
101:標記為"類"。二進制 {0, 1} 表示 {山谷, 山丘}
下載Hill_Valley
2.wine(利用化學分析確定葡萄酒的原產地)
數據集信息:
這些數據是對意大利同一地區種植但來自三個不同品種的葡萄酒進行化學分析的結果。該分析確定了在三種葡萄酒中的每一種中發現的13種成分的數量。
屬性包含
1.酒精
2.蘋果酸
3.灰分
4.灰分的堿度
5.鎂
6.總酚
7.類黃酮
8.非黃酮酚類
9.原花青素
10.顏色強度
11.色調
12.稀釋葡萄酒的 OD280/OD315
13.脯氨酸
屬性信息:
第一個屬性是類標識符(1-3)
下載wine
3.ionosphere(電離層雷達回波分類)
數據集信息:
目標是電離層中的自由電子。“良好”的雷達回波是那些顯示電離層中某種結構的證據。“壞”回報是那些沒有的回報。
屬性信息:
第 35 個屬性是“好”或“壞”。是一個二元分類任務。
下載ionosphere
4.Glass(玻璃分類)
屬性信息:
1.編號:1 到 214
2.RI:折射率
3.Na:鈉(單位測量:相應氧化物中的重量百分比,屬性 4-10 也是如此)
4.Mg:鎂
5.Al:鋁
6.Si:硅
7.K:鉀
8.Ca:鈣
9.Ba:鋇
10.Fe:鐵
11.玻璃類型:(類屬性)
1)building_windows_float_processed
2)building_windows_non_float_processed
3)vehicle_windows_float_processed
4)vehicle_windows_non_float_processed (none in this database)
5)containers
6)tableware
7)headlamps
下載Glass
5.sonar(區分從金屬圓柱體反彈的聲納信號和從圓柱形巖石反彈的聲納信號)
數據集信息:
文件“sonar.mines”包含 111 種模式,這些模式是通過在各種角度和各種條件下從金屬圓柱體上反射聲納信號而獲得的。文件“sonar.rocks”包含在類似條件下從巖石中獲得的 97 種模式。。該數據集包含從各種不同角度獲得的信號,圓柱體跨越 90 度,巖石跨越 180 度。
屬性信息:
如果對象是巖石,則與每條記錄關聯的標簽類別為“R”,如果是金屬圓柱體,則類別為“M”。標簽中的數字按角度的遞增順序排列,但它們不直接編碼角度。
下載sonar
6.Vowel(元音識別)
下載vowel
7.WDBC(診斷威斯康星乳腺癌數據庫)
屬性信息:
ID 號
診斷(M = 惡性,B = 良性)
為每個細胞核計算十個特征:
a) 半徑(從中心到周邊點的距離的平均值)
b) 紋理(灰度值的標準偏差)
c) 周長
d) 面積
e) 平滑度(半徑長度的局部變化)
f) 緊湊性(周長^2 / 面積 - 1.0)
g) 凹度(輪廓凹入部分的嚴重程度)
h ) 凹點(輪廓的凹入部分的數量)
i) 對稱性
j) 分形維數
下載wdbc
總結
- 上一篇: 获CNNVD感谢信!知道创宇以专业漏洞研
- 下一篇: Qt 串口类QSerialPort 使用