日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

benchmark datasets是什么

發(fā)布時間:2023/12/8 编程问答 61 豆豆
生活随笔 收集整理的這篇文章主要介紹了 benchmark datasets是什么 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

The benchmarking datasets are the basis of fair comparison and validation of computational methods.

什么是 benchmark datasets

benchmark datasets(基準(zhǔn)數(shù)據(jù)庫)是公平比較和驗證計算方法的基礎(chǔ),基準(zhǔn)數(shù)據(jù)集用于基準(zhǔn)測試,是一個算法模型性能的衡量基準(zhǔn),很多特定機器學(xué)習(xí)問題都需要基準(zhǔn)測試數(shù)據(jù)。

算法在數(shù)據(jù)集上跑可以理解為跑分,基準(zhǔn)數(shù)據(jù)集就是作為一個評價標(biāo)準(zhǔn)的數(shù)據(jù)集,大家很多都在上面跑,用來評價一個算法模型的好壞。否則大家都在不同的數(shù)據(jù)集上跑,如何評價誰的算法好,誰的算法壞呢?

benchmark datasets 和 baseline 有什么區(qū)別

benchmark 是一個過程,baseline 是 benckmark 這個過程中的一次實例。

baseline 可以理解為最低的標(biāo)準(zhǔn),即低于這個標(biāo)準(zhǔn)肯定是不行的;而 benchmark 可以理解為”某一刻度”,這個刻度可高可低,所以 benchmark 本身沒有好壞,單純用來進(jìn)行比較。

baseline 是客觀的,原始數(shù)據(jù)要扣除 baseline 才是最終的 value。而 benchmark 相對主觀,是一個標(biāo)準(zhǔn)值,視依據(jù)而定,主要用來平行比較。

個人理解

高中我們就學(xué)過,科學(xué)實驗的一個重要原則在于控制變量,benchmark 和 baseline 其實都是控制變量而已。

我的理解,一般用 benchmark data 做實驗,測試 A B C D 四個模型,然后以結(jié)果最差的一個模型,假設(shè)是 C,作為 baseline,看看其他模型相對 C 提高了多少。

baseline 的目的是比較提出算法的性能或者用以比較彰顯提出算法的優(yōu)勢。

一些基準(zhǔn)數(shù)據(jù)庫

  • 1 UCL 機器學(xué)習(xí)知識庫
  • 2 Amazon AWS 公開數(shù)據(jù)集
  • 3 Kaggle
  • 4 KDnuggets
  • 5 美國聯(lián)邦政府?dāng)?shù)據(jù)集
  • 6 來自 infochimps 公司的數(shù)據(jù)集
  • 7 百萬歌曲數(shù)據(jù)庫
  • 8 蛋白質(zhì)信息資源數(shù)據(jù)集
  • 9 手寫數(shù)字圖像數(shù)據(jù)集
  • 10 人臉識別數(shù)據(jù)庫
  • 11 一些貝葉斯網(wǎng)
  • 12 kdd99 數(shù)據(jù)集
  • 13 數(shù)據(jù)集索引
  • 14 華盛頓大學(xué)
  • 15 搜狗數(shù)據(jù)資源

參考文章

baseline 和 benchmark 有什么區(qū)別?

Special Issue : Benchmarking Datasets in Bioinformatics - MDPI

總結(jié)

以上是生活随笔為你收集整理的benchmark datasets是什么的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。