日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

大数据挖掘简介

發(fā)布時(shí)間:2023/12/31 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 大数据挖掘简介 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

大數(shù)據(jù)挖掘涉及如下的課程:機(jī)器學(xué)習(xí),統(tǒng)計(jì)學(xué),人工智能,數(shù)據(jù)庫(kù)等,但是更多的注重如下的特性:

1)可擴(kuò)展性(Scalability)(大數(shù)據(jù))

2)算法和架構(gòu)

3)自動(dòng)的處理大數(shù)據(jù)


我們需要學(xué)習(xí)挖掘不同類(lèi)型的數(shù)據(jù):

1)高維的數(shù)據(jù)

2)圖數(shù)據(jù)

3)無(wú)限的(infinite/never-ending)數(shù)據(jù)

4)貼有標(biāo)簽的數(shù)據(jù)


同時(shí)我們還要學(xué)習(xí)不同的計(jì)算模型:

1)MapReduce算法

2)流和在線(xiàn)(Streams and Online)算法

3)Single machine in-memory


然后,還要學(xué)習(xí)解決現(xiàn)實(shí)中的問(wèn)題,像:

1)推薦系統(tǒng)

2)關(guān)聯(lián)規(guī)則

3)鏈接分析

4)重復(fù)檢測(cè)

等等。


還要學(xué)習(xí)各種“工具",像:

1)線(xiàn)性代數(shù)(SVD,推薦系統(tǒng)等)

2)優(yōu)化(隨機(jī)梯度下降)

3)動(dòng)態(tài)規(guī)劃(頻繁項(xiàng)集)

4)Hashing(LSH,Bloom filters)


以上所有的內(nèi)容可以通過(guò)如下的圖關(guān)聯(lián)在一起來(lái)展示,如下:



在學(xué)習(xí)大數(shù)據(jù)挖掘之前,需要有如下的預(yù)備知識(shí):

1)算法方面的知識(shí)(CS161)——?jiǎng)討B(tài)規(guī)劃,基本的數(shù)據(jù)結(jié)構(gòu)等

2)基本的概率論方面的知識(shí)(CS109)——矩(Moments),典型的分布,最大似然估計(jì)(MLE)等

3)編程方面的知識(shí)(CS107)——C++或Java將非常有用


內(nèi)容來(lái)自于:http://www.stanford.edu/class/cs246/slides/01-mapreduce.pdf

總結(jié)

以上是生活随笔為你收集整理的大数据挖掘简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。