日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

转:UCI数据集和源代码数据挖掘的数据集资源

發布時間:2025/3/20 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 转:UCI数据集和源代码数据挖掘的数据集资源 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

《UCI數據集和源代碼》

UCI數據集是一個常用的標準測試數據集,下載地址在

http://www.ics.uci.edu/~mlearn/MLRepository.html

我的主頁上也有整理好的一些UCI數據集(arff格式):

http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip

在看別人的論文時,別人使用的數據集會給出數據集的出處或下載地址(除非是很機密的數據,例如與國家安全有關)。如果你看的論文沒有給出數據集的出處,請立即停止看這篇論文,并且停止看刊發這篇論文的期刊上的所有文章。因為可以斷定這些文章質量很差。

關于源代碼,網上有很多公開源碼的算法包,例如最為著名的Weka,MLC++等。Weka還在不斷的更新其算法,下載地址:

http://www.cs.waikato.ac.nz/ml/weka/

很多的機器學習的經典算法都在里面。而且公布源程序,易于修改。

如果作者沒有公布源程序,可以到作者主頁找找,也可以寫信給作者要,一般論文開頭都會有作者的email地址。寫信的時候要注意要很有禮貌,否則作者,尤其是著名學者,很有可能不會理睬。如果算法簡單,可以自己實現。

關于論文的下載,如果能夠訪問電子圖書館是最好的,很多學校都買了IEEE,?Elsevier,?Kluwer等,上面的期刊都不錯。有一些很好的期刊是免費的,像JAIR和JMLR,分別在:

http://www.cs.washington.edu/research/jair/home.html

http://www.jmlr.org/

如果能訪問的免費期刊太少,可以到CiteSeer上搜索(http://citeseer.ist.psu.edu/?),上面搜集了很多免費論文(但是要注意,論文的質量參差不齊),或者用Googlewww.google.com?)搜索。

再囑咐兩點,要做研究,首先要打好基礎,例如數學基礎和程序設計能力,要學會熟練使用google等搜索引擎,還有一定要看高質量的論文。

《數據挖掘的數據集資源》

大家做數據挖掘研究時,常常為找不到合適的數據而發愁。在KDNuggets上有Datasets欄目,提供一些數據集,網址為:http://www.kdnuggets.com/datasets/

還有另外一個很好的資源網址為:http://kdd.ics.uci.edu/?,里面包含的數據資源如下(按應用領域劃分):

Direct Marketing

? KDD CUP 1998 Data

GIS

? Forest CoverType

Indexing

? Corel Image Features

? Pseudo Periodic Synthetic Time Series

Intrusion Detection

? KDD CUP 1999 Data

Process Control

? Synthetic Control Chart Time Series

Recommendation Systems

? Entree Chicago Recommendation Data

Robots

? Pioneer-1 Mobile Robot Data

? Robot Execution Failures

Sign Language Recognition

? Australian Sign Language Data

? High-quality Australian Sign Language Data

Text Categorization

? 20 Newsgroups Data

? Reuters-21578 Text Categorization Collection

? NSF Research Awards Abstracts 199 0-2003

World Wide Web

? Microsoft Anonymous Web Data

? MSNBC Anonymous Web Data

? Syskill Webert Web Data

?轉:http://blogger.org.cn/blog/more.asp?name=DMman&id=24043

1、氣候監測數據集?http://cdiac.ornl.gov/ftp/ndp026b

2、幾個實用的測試數據集下載的網站

http://www.cs.toronto.edu/~roweis/data.html

http://www.cs.toronto.edu/~roweis/data.html

http://kdd.ics.uci.edu/summary.task.type.html

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/

http://www.phys.uni.torun.pl/~duch/software.html

在下面的網址可以找到reuters數據集http://www.research.att.com/~lewis/reuters21578.html

以下網址上有各種數據集:

http://kdd.ics.uci.edu/summary.data.type.html

進行文本分類,還有一個數據集是可以用的,即rainbow的數據集

http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

3、找了很多測試數據集,寫論文的同志們肯定需要的,至少能用來檢驗算法的效果

可能有一些不能訪問,但是總有能訪問的吧:

UCI收集的機器學習數據集

ftp://pami.sjtu.edu.cn/

http://www.ics.uci.edu/~mlearn//MLRepository.htm

statlib

http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm

http://lib.stat.cmu.edu/

樣本數據庫

http://kdd.ics.uci.edu/

http://www.ics.uci.edu/~mlearn/MLRepository.html

關于基金的數據挖掘的網站

http://www.gotofund.com/index.asp

http://lans.ece.utexas.edu/~strehl/

reuters數據集

http://www.research.att.com/~lewis/reuters21578.html

各種數據集:

http://kdd.ics.uci.edu/summary.data.type.html

http://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.html

http://lib.stat.cmu.edu/datasets/

http://dctc.sjtu.edu.cn/adaptive/datasets/

http://fimi.cs.helsinki.fi/data/

http://www.almaden.ibm.com/software/quest/Resources/index.shtml

http://miles.cnuce.cnr.it/~palmeri/datam/DCI/

進行文本分類&WEB

http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

http://www.w3.org/TR/WD-logfile-960221.html

http://www.w3.org/Daemon/User/Config/Logging.html#AccessLog

http://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.html

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/

http://www.web-caching.com/traces-logs.html

http://www-2.cs.cmu.edu/webkb

http://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdf

http://www.cs.cornell.edu/projects/kddcup/index.html

時間序列數據的網址

http://www.stat.wisc.edu/~reinsel/bjr-data/

apriori算法的測試數據

http://www.almaden.ibm.com/cs/quest/syndata.html

數據生成器的鏈接

http://www.cse.cuhk.edu.hk/~kdd/data_collection.html

http://www.almaden.ibm.com/cs/quest/syndata.html

關聯:

http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar

http://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData

WEKA:

http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar

1。A jarfile containing 37 classification problems, originally obtained from the UCI repository

http://prdownloads.sourceforge.net/weka/datasets-UCI.jar

2。A jarfile containing 37 regression problems, obtained from various sources

http://prdownloads.sourceforge.net/weka/datasets-numeric.jar

3。A jarfile containing 30 regression datasets collected by Luis Torgo

http://prdownloads.sourceforge.net/weka/regression-datasets.jar

癌癥基因:

http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi

金融數據:

http://lisp.vse.cz/pkdd99/Challenge/chall.htm

?

另一個人提供的

http://www.cs.toronto.edu/~roweis/data.html

http://kdd.ics.uci.edu/summary.task.type.html

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/

http://www.phys.uni.torun.pl/~duch/software.html

在下面的網址可以找到reuters數據集

http://www.research.att.com/~lewis/reuters21578.html

以下網址上有各種數據集:

http://kdd.ics.uci.edu/summary.data.type.html

進行文本分類,還有一個數據集是可以用的,即rainbow的數據集

http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

Download the Financial Data (~17.5M zipped file, ~67M unzipped data)

Download the Medical Data (~2M zipped file, ~6M unzipped data)

http://lisp.vse.cz/pkdd99/Challenge/chall.htm

kdnuggets 相關鏈接數據集(借花獻佛了):

http://www.kdnuggets.com/datasets/index.html

你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017

察看kdnuggets 數據集資源的詳細介紹。

數據挖掘相關比賽以及數據集

2005 University of California data mining contest?, predicting bad accounts and their churn date using real-world CRM data, deadline June 30, 2005.

ILP 2005 Challenge?, on the prediction of functional classes of genes.?KDD Cup 2005?, on classifying internet user search queries, deadline July 8.?Data Mining Cup 2005 (Chemnitz, Germany)?, for students; topic: How data mining can ascertain the risk of loss of payments and reduce this risk.?KDD Cup 2004?, focuses on data-mining for a several performance criteria using datasets from bioinformatics and quantum physics.?InfoVis 2004 Contest?, The History of InfoVis.?DATA MINING CUP 2004 (Chemnitz, Germany)?, for students.?InfoVis 2003 Contest: Visualization and Pair Wise Comparison of Trees?, results announced Sep 5, 2003.?KDD Cup 2003?, focuses on problems motivated by network mining and the analysis of usage logs.?DATA MINING CUP 2003 (Chemnitz, Germany)?. The task is to identify spam emails before they reach the user′s mailbox.?KDD Cup 2002?, focus on data mining in molecular biology.?Student Data Mining Cup (2002)?, Chemnitz University and Prudential Systems. 下載?

k-means聚類(使用數據集:iris)

12-29 使用java語言在數據集iris上實現k-means聚類 下載?

UCI數據集(數據挖掘)

11-14 很全的uci數據集,格式為arff,希望有用

從0到1學好區塊鏈開發,一年編程經驗學完月薪可達40K+

立即申請試學,成為時代顛覆者

UCI數據集整理(附論文常用數據集)

?2.7萬

摘要:UCI數據集作為標準測試數據集經常出現在許多機器學習的論文中,為了更方便使用這些數據集有必要對其進行整理,這里整理了論文中經常出現的數據集,并詳細介紹如何使用MATLAB將數據集文件整...來自: 橋上風景樓上的你

優化機器學習不平衡數據集的八大策略

?2642

什么是不平衡數據不平衡對于分類問題來說是指數據集中樣本的類別不平均。比如, 對于一個樣本總數為100的二分類問題來說,80個樣本被標為類別1,剩下的20個樣本被標為類別2.這是一個不平衡的數據集,因為...來自: lime1991的專欄

下載?

常見聚類數據集人工數據和UCI數據都有

01-26 這里面是機器學習里面聚類所需的數據集,分為人工的二維數據集,如月牙形,雙螺旋型等,和UCI真實數據集,是我搜集好久才弄出來的,有一些二維數據集是自己生成的,提供給大家做算法實驗。

一些用于聚類和分類問題的數據集

?150

畢業設計時簡單研究了聚類和分類問題,整理了一下用到的數據集,有需要的可以參考一下。。。 聚類數據集信息 序號 數據集 記錄數 特征數 類別 簡單分布 是否有ove...來自: 繩子的博客

下載?

聚類分析常用數據集

03-26 聚類分析常用的人工數據集,包括:UCI:wine、Iris、yeast,還有4k2_far、leuk72_3k等數據集。它們在聚類分析、數據挖掘、機器學習、模式識別領域經常用到。

聚類算法之K-means算法-UCI數據集上的java實現

?3473

本文主要分析了K-means聚類算法的基本原理,時間復雜度以及優缺點,最后用UCI數據集進行了測試,包含java實現代碼,適合初學者參考。...來自: 笑*容的博客

下載?

聚類分析、機器學習及數據挖掘中常用數據集

09-02 在聚類分析、機器學習、數據挖掘中常用到的數據集,包括:UCI的數據集wine,yeast,iris等,還有USPS數據集,4k2_far,leuk72_3k數據集等。

Weka訓練數據集.arff大合集

?6712

Weka是機器學習中的一個非常好的開源工具,對于熟悉Java的同學們來說是一個非常好的選擇。Weka幾乎包含了所有常見機器學習算法的Java實現,Weka中支持的數據格式主要是arff,雖然weka官...來自: jiajia333666的博客

文章熱詞
數據挖掘模型是什么 數據挖掘算法大全 excel 實現數據挖掘 數據挖掘數據缺失 數據挖掘的功能分類
相關熱詞
uci數據?uci端口?uci軟件包?uci打不開?uci使用說明

博主推薦

換一批
wonder4

關注?639篇文章

Eastmount

關注?310篇文章

fengbingchun

關注?729篇文章

uci聚類測試數據集

下載

09-15

該文件有六百條數據,每100條是一類??捎糜诰垲惖臏y試。... *詳細原因: 取??消 提??交 uci聚類測試數據集 3積分 立即下載 ...

UCI數據集數據的分析 ——葡萄酒數據

?1485

1、前言? ? ?葡萄酒是一種成分復雜的酒精飲料,不同產地、年份和品種的葡萄酒成分不同,這也是導致質量差異過大的重要因素。至今,質量評價主要還是依靠專家的感官。味道是最難理解的一種感官,因此用味蕾評價...來自: X_dmword的博客

UCI數據集

下載

09-19

是arff 格式的數據,應該非常有用,可以測試一些數據挖掘分類算法的準確度,對學習...常見聚類數據集人工數據和UCI數據都有 97 2018-01-26 chenguangchun1993 VIP...

如何使用UCI數據集

?4865

UCI數據集是一個常用的機器學習標準測試數據集。 地址: http://www.ics.uci.edu/~mlearn 以Iris鳶尾花數據集為例: 1.Iris數據集在右邊方框【Most...來自: 繩子的博客

UCI數據集使用

?2.1萬

UCI數據庫目前共有187個數據集,其數目還在不斷增加,UCI數據集是一個常用的標準測試數據集。 UCI數據可以使用Matlab的dlmread或textread讀取,不過,需要先將不是數字的類別用...來自: 小倔驢

寶貴數據集——用于數據挖掘、機器學習、文本挖掘

?2328

1、氣候監測數據集 http://cdiac.ornl.gov/ftp/ndp026b2、幾個實用的測試數據集下載的網站 http://www.cs.toronto.edu/~roweis/data...來自: XingLiu's Blog

開放數據集

?5697

商業敏感數據雖然難以獲取,但好在仍有相當多有用數據可公開訪問。它們中的不少常用來作為特定機器學習問題的基準測試數據。常見的有以下幾個: UCL機器學習知識庫 包括近300個不同大小和類...來自: ForestCat的專欄

zz 數據挖掘, 機器學習的測試數據集 - 美國UCI數據集

?974

UCI數據集是一個常用的標準測試數據集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數據集: h...來自: 精力極有限,人生極短暫

數據挖掘常用的心臟病數據(From UCI)

?3001

http://archive.ics.uci.edu/ml/machine-learning-databases/statlog/heart/?該數據經常作為數據挖掘的示例。?This databas...來自: wonder的地下室

UCI數據集與相關論文和源代碼

?1427

UCI 數據集是一個常用的標準測試數據集,下載地址在 ? http://www.ics.uci.edu/~mlearn/MLRepository.html ?? 我的主頁上也有整理好...來自: mayanyun2013的專欄

下載?

用機器學習算法對UCI上的三個數據集做預測

02-07 1. 在UC Irvine Machine Learning數據集上選擇三個數據 2. 編寫一種機器學習算法預測結果,并使用十次、十折交叉驗證 3. 撰寫報告,包含對數據集、算法、結果的描述以及源代碼

《UCI數據集和源代碼》

?1076

UCI數據集是一個常用的標準測試數據集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數據集(arf...來自: Mittens 的專欄

下載?

arff數據集全集

08-25 目錄列表: 2dplanes.arff abalone.arff ailerons.arff Amazon_initial_50_30_10000.arff anneal.arff anneal.OR

python中使用k-means對鳶尾花數據集聚類

?5695

代碼和結果:import matplotlib.pyplot as plt import numpy as np from sklearn.cluster import KMeans from...來自: masbbx123的博客

下載?

聚類測試數據

08-15 two_cluster、three_cluster、five_cluster為不同簇數的點集,適用于Kmeans聚類 spiral、Twomoons、ThreeCircles分別為螺旋分布、月牙分布、

ML:教你聚類并構建學習模型處理數據(附數據集)

?309

本文將根據41個描述性分類特征的維度,運用無監督主成分分析(PCA)和層次聚類方法對觀測進行分組。將數據聚類可以更好地用簡單的多元線性模型描述數據或者識別更適合其他模型的異常組。此方法被編寫在pyth...來自: weixin_40581617的博客

下載?

數據挖掘聚類分析技術實驗常用真實數據集

03-19 全部為txt文檔數據,數據挖掘聚類分析技術,算法實驗過程中,經常用到的經典UCI、UPSP等真實數據集,常用于算法的實驗驗證。文檔中注有相應的數據量、屬性等信息,可直接進行使用。

UCI數據集和源代碼

?5703

UCI數據集是一個常用的標準測試數據集,下載地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主頁上也有整理好的一些UCI數據集: h...來自: 學習亦游戲

UCI數據集數據的分析(補充)——葡萄酒數據

?505

1、提出問題? ? ?在前面,我們已經學了影響紅白葡萄酒質量的相關因素以及兩種酒的物理化學性質的差異。那么我們該怎么運用物理化學性質來確定一種酒是紅葡萄酒還是白葡萄酒呢?2、分析問題? ? 根據前面的...來自: X_dmword的博客

對adult數據集建立樸素貝葉斯模型評估并可視化(awk+hive+java+mysql+echarts)

?1609

總結下這段時間的收獲 分為三部分 linux echarts 數據挖掘 最近做了個課設,要給adult數據集建立合適的分類器,并對分類器評估 分享一下成果,有好多問題完成后才知道,僅供和我一樣的初學...來自: 呵少俠的博客

聚類算法實踐(五)——真實Dataset測試

?2927

在之前的文章里,討論了一些聚類算法的基本思路,并針對人為構造的數據進行了測試。然而,真實的數據畢竟不同于人工數據。在對現實數據進行聚類的時候,有時候不知道哪些特征才是最關鍵的,因此多少會摻雜一些無關的...來自: Entropy

下載?

K-means聚類數據.rar

11-16 詳見博文:http://blog.csdn.net/hujingshuang/article/details/49867455 下載?

二維聚類數據集

09-30 用于聚類方法的數據集,包括不同數目的塊狀聚類、月牙形、同心環形及螺旋形分布,可用于Kmeans、譜聚類等聚類方法的測試。 下載?

常用聚類分析數據集

07-01 聚類分析常用的人工數據集,包括:UCI:wine、Iris、yeast,還有4k2_far、leuk72_3k等數據集。它們在聚類分析、數據挖掘、機器學習、模式識別領域經常用到。 下載?

adult數據集分析

02-15 adult數據集數據挖掘,基于python語言的決策樹算法,源碼+數據adult數據集數據挖掘,基于python語言的決策樹算法,源碼+數據adult數據集數據挖掘,基于python語言的決策樹算法,源碼+數據adult數據集數據挖掘,基...

[035]Java實現SVM對乳腺癌檢測數據分類分析

?1679

背景簡介:最近在做SVM分類的學習,查看網上大多相關內容都是SVM原理介紹、推導和用終端命令行使用svm-train,svm-predict。具體數據分析實現很少。通過查找資料發現了一個很好的開發庫L...來自: friendpengyou的專欄

【Python數據挖掘課程】五.線性回歸知識及預測糖尿病實例

?1.3萬

今天主要講述的內容是關于一元線性回歸的知識,Python實現,包括以下內容: 1.機器學習常用數據集介紹 2.什么是線性回顧 3.LinearRegre...來自: 楊秀璋的專欄

機器學習案例——鳶尾花數據集分析

?1655

????前幾天把python基礎知識過了一遍,拿了這個小例子作為練手項目,這個案例也有師兄的幫助,記錄完,發現代碼貼的很多,文章有點長,為了節省篇幅,有一些說明就去掉了,畢竟鳶尾花數據集比較經典,網上...來自: 劉小緒同學的博客

聚類

?1.5萬

4、聚類 聚類分析提供由個別數據對象到數據對象所指派到簇的抽象。此外,一些聚類技術使用簇原型(即代表簇中其他對象的數據對象)來刻畫簇的特征。聚類分析是研究發現最具有代表性的簇原型的技術?;貧w和P...來自: rosenor1的博客

下載?

多視圖聚類數據集mfeat

09-08 該mfeat數據集主要用于多視圖聚類算法研究,其中已經有標簽,可以用于對最終聚類算法分出來的類簇進行評估。

四種主流聚類方法

?3.4萬

四種聚類方法之比較 2015-07-29?SOTON數據分析 聚類分析是一種重要的人類行為,早在孩提時代,一個人就通過不斷改進下意識中的聚類模式來學會如何區分貓狗、動物植物。目前在許多領域都...來自: Alex_luodazhi的博客

【分享】聯合聚類算法標準測試數據集

?1533

該數據集為A. Lomet等人提供的,可作為聯合聚類算法的標準測試數據集,可針對不同的聚類數目、規模、聚類任務難度等進行對比驗證分析,可應用于協同過濾算法等的測試。 ? ?數據堂免費提供數據...來自: 數據堂-科研數據共享平臺

下載?

聚類常用數據集

12-29 聚類常用數據集 下載?

常用UCI數據集

06-04 常用的UCI數據集,可直接用于機器學習,數據挖掘,直接實現

機器學習UCI數據庫

?1.6萬

http://archive.ics.uci.edu/ml/ ? 數據庫是加州大學歐文分校(UniversityofCaliforniaIrvine)提出的用于機器學習的數據庫,這個數據庫目前共有...來自: loadstar_kun的專欄

UCI 機器學習數據集(分類)

?7758

113 Data SetsUCI數據集NameData TypesDefault TaskAttribute Types# Instances# AttributesYear來自: BeachBOY的完美世界

用樸素貝葉斯對wine數據集分類

?7766

該實驗的數據集是MostPopular Data Sets(hits since 2007)中的wine數據集,這是是對在意大利同一地區生產的三種不同品種的酒,做大量分析所得出的數據。這些數據包括了三...來自: 圖像處理與模式識別

UCI 數據集

?1781

filename='.\iris\iris.data';%使用 , 分割符分割每列數據; ‘'headerlines’:表示忽略前N行,從N+1行開始讀取數據集 [attrib1, attrib2, ...來自: dataningwei的博客

下載?

重疊聚類數據集

07-28 可直接在matlab中用,已經處理好! 20Newsgroup.mat emotions.mat scene.mat yeast2417.mat movie_taa.mat …… 下載?

聚類、分類所用數據集

09-06 做聚類、分類時很經典的測試數據集,可以很好的檢測你所設計的算法。我所上傳的數據集格式是.mat格式,用load命令就可以加載。

沒有更多推薦了,返回首頁

轉載于:https://www.cnblogs.com/lm3306/p/9798572.html

總結

以上是生活随笔為你收集整理的转:UCI数据集和源代码数据挖掘的数据集资源的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。