日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

【分布式计算】MapReduce的替代者-Parameter Server

發(fā)布時(shí)間:2025/4/5 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【分布式计算】MapReduce的替代者-Parameter Server 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

首先還是要聲明一下,這個(gè)文章是我在入職阿里云1個(gè)月以來(lái),對(duì)于分布式計(jì)算的一點(diǎn)膚淺的認(rèn)識(shí),可能有些地方不夠妥善,還請(qǐng)看官可以指出不足的地方,共同進(jìn)步。

一.背景

隨著互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)量的增大,很多對(duì)于數(shù)據(jù)的處理工作(例如一些推薦系統(tǒng)、廣告推送等)都遷移到了云端,也就是分布式計(jì)算系統(tǒng)上。衍生了很多牛逼的分布式計(jì)算的計(jì)算模型,比較著名的就是MapReduce、MPI、BSP等。后來(lái)也產(chǎn)生了一些分布式計(jì)算系統(tǒng),大家耳熟能詳?shù)腍adoop就是基于MapReduce實(shí)現(xiàn)的。

本文的主人公是Parameter Server,其實(shí)也不算是新寵了,這個(gè)模型已經(jīng)被提出好幾年了,只不過(guò)在國(guó)內(nèi)還不是特別熱。不過(guò)最近一些云服務(wù)巨頭們開(kāi)始了對(duì)于PS的深入開(kāi)發(fā)和研究。

引用一位算法大神的話簡(jiǎn)單描述下什么事Parameter Server:總結(jié)是一種計(jì)算模型SSP+一種分布式設(shè)計(jì)看板模式Client+Server(partitioned table)+基于算法的調(diào)度策略(Scheduler)??赡苡行┩瑢W(xué)還不太理解這句話,沒(méi)關(guān)系,下面通過(guò)一個(gè)實(shí)例來(lái)介紹一下PS。

二.場(chǎng)景

因?yàn)槲以趯W(xué)習(xí)PS的過(guò)程中是對(duì)照Map Reduce來(lái)學(xué)習(xí)的。所以也通過(guò)一個(gè)機(jī)器學(xué)習(xí)算法的并行計(jì)算的實(shí)例,來(lái)比較Map Reduce和PS。為了更好地突出PS的優(yōu)勢(shì),這里用到的算法是一個(gè)梯度逼近最佳結(jié)果的一種算法-邏輯回歸(Logical Regression)。

為了更好地幫大家理解這些內(nèi)容,我也羅列了一些必須的知識(shí)儲(chǔ)備:
1.邏輯回歸算法-最好fork里面的代碼看一下
2.隨機(jī)梯度下降SGD
3.李沐大神實(shí)現(xiàn)的一個(gè)PS開(kāi)源庫(kù),上面有一個(gè)論文,一定要讀
4.并行邏輯回歸-等會(huì)會(huì)借用里面的內(nèi)容來(lái)講
5.ps開(kāi)源代碼網(wǎng)站

三.Work Flow

首先還是要補(bǔ)充幾句,Map-Reduce在實(shí)現(xiàn)并行算法的過(guò)程中有它的優(yōu)勢(shì),但是也有很大的弊端,它在處理梯度問(wèn)題上沒(méi)有很好的效率。這一點(diǎn)PS通過(guò)client+server的模式很好的解決了這個(gè)問(wèn)題。


1.Map-Reduce處理LR

首先來(lái)看下Map-Reduce是如何解決邏輯回歸(下文統(tǒng)一稱為L(zhǎng)R)的。首先是map的過(guò)程,將很大的數(shù)據(jù)切割成key-value的形式,我們?cè)谶@里假設(shè)所有的數(shù)據(jù)都是稠密的。比如說(shuō)你有100行數(shù)據(jù),切割成5份,那么每一個(gè)worker就處理其中的20行數(shù)據(jù)。Reduce主要是負(fù)責(zé)統(tǒng)一worker的計(jì)算結(jié)果。下面具體到LR的算法實(shí)現(xiàn)來(lái)講解下Map-Reduce的過(guò)程。

先來(lái)看看整體的流程圖:

第一步:首先是進(jìn)行map階段對(duì)于長(zhǎng)尾數(shù)據(jù)的分割,我們假設(shè)數(shù)據(jù)是稠密非稀疏的。邏輯回歸的并行計(jì)算的數(shù)據(jù)分割,可以按行分、按列分或者行列一起分。分好的數(shù)據(jù)通過(guò)key-value的形式傳到每一個(gè)worker中,對(duì)應(yīng)上圖的map phase階段的worker。當(dāng)然,map里也包含LR的計(jì)算邏輯,邏輯請(qǐng)大家看上面的資料自己學(xué)習(xí)下。分割圖如下:

第二步:利用隨機(jī)梯度(SGD)方法逼近最優(yōu)解,在凸函數(shù)中LR是可以無(wú)限接近最優(yōu)模型的,可以通過(guò)限定循環(huán)次數(shù)和收斂條件來(lái)實(shí)現(xiàn)。這其中就有一個(gè)問(wèn)題,認(rèn)真研究LR的同學(xué)可能會(huì)發(fā)現(xiàn),如果我們使用SGD的話,因?yàn)閣orker之間雖然有一定的通信機(jī)制,但是并不是實(shí)時(shí)同步的,所以每一個(gè)worker并不知道對(duì)方的梯度是多少,形象的描述一下就是我們可以把SGD看成一個(gè)下坡問(wèn)題。

每個(gè)worker都在往終點(diǎn)方向下山(收斂模型),但是它們彼此間并不能實(shí)時(shí)協(xié)作,也就是說(shuō)A不知道B爬到哪里,C不知道A爬到哪里。傳入一個(gè)路徑,我就接著向下爬一點(diǎn),可能會(huì)走重復(fù)的路徑。所以說(shuō)Map-Reduce的SGD是一種范圍的梯度。每個(gè)worker不一定一直往下走,可能走走停停甚至往后走一點(diǎn),但是因?yàn)閿?shù)據(jù)量巨大總是可以走到終點(diǎn)的。 但是這樣就會(huì)浪費(fèi)了很多效率,這也就是Parameter Server重點(diǎn)解決的問(wèn)題。

第三步:負(fù)責(zé)reduce的服務(wù)器統(tǒng)一出一個(gè)模型輸出。


2.Parameter Server的一些機(jī)制

下面我們看下Parameter Server是怎么解決這個(gè)問(wèn)題。首先看下PS的總體架構(gòu),PS是由client和server組成的,client對(duì)應(yīng)于上文的worker,負(fù)責(zé)計(jì)算。server是負(fù)責(zé)統(tǒng)一所有的client它們的參數(shù),server間是聯(lián)通的。
如下圖:

總體來(lái)看,PS的優(yōu)勢(shì)是通過(guò)server來(lái)協(xié)同client的輸出,如上一節(jié)的下山問(wèn)題,PS可以協(xié)同每一個(gè)client按照一個(gè)方向直線下山,從而提高了效率。而這其中也有很多的技術(shù)細(xì)節(jié)需要考慮。

1).并行化設(shè)計(jì)
PS可以運(yùn)用很多并行化的思想從而提高效率。
(1)首先在client端,計(jì)算和上傳數(shù)據(jù)是采用的多線程機(jī)制,計(jì)算和數(shù)據(jù)傳輸在不同的線程中進(jìn)行從而增加了效率。同時(shí)server并不是等待所有參數(shù)都上傳完成,才向下分發(fā)的。如果一個(gè)client_a計(jì)算比較慢,server可以暫時(shí)不采用client_a的數(shù)據(jù),而采用歷史數(shù)據(jù)。
(2)數(shù)據(jù)上傳也可以用樹(shù)狀結(jié)構(gòu)代替直接上傳,在client和server之間增加一層樹(shù)狀結(jié)構(gòu)可以提高數(shù)據(jù)傳輸效率,節(jié)約server的處理資源??梢詮南聢D的左邊,變?yōu)橛疫叀?

2).pull和push機(jī)制
首先,是在client端應(yīng)該上傳怎樣的數(shù)據(jù),因?yàn)槊總€(gè)client節(jié)點(diǎn)都會(huì)不停的接受和反饋數(shù)據(jù)給server,那么到底應(yīng)該push怎樣的數(shù)據(jù)上去呢?這個(gè)一般來(lái)講是選擇步長(zhǎng)最長(zhǎng)的參數(shù),也就是最大的梯度值的參數(shù)push上去。

3).server端的異構(gòu)形式
因?yàn)槊總€(gè)client只處理一部分參數(shù),server端需要將這些參數(shù)拼接起來(lái),所以server端是一個(gè)異構(gòu)的組成形式。


3.Parameter Server處理LR

上面講了很多PS的機(jī)制,這里具體說(shuō)一下PS怎么實(shí)現(xiàn)LR。因?yàn)長(zhǎng)R的輸出是一個(gè)線性的回歸模型。輸出的結(jié)果是下面的這種式子:
z=w1*x1+w2*x2…..+w10*x2+….
我們要求的是里面的w1,w2,w3….這些參數(shù),在PS中每個(gè)client計(jì)算的是其中的某些△w。通過(guò)server將這些△w同步上去,然后再push下去繼續(xù)迭代計(jì)算。這樣的好處是對(duì)于梯度問(wèn)題,每個(gè)client可以沿著一個(gè)方向走。


后話:我的理解還很淺,具體實(shí)現(xiàn)還有非常多的技術(shù)細(xì)節(jié)要敲定,部署在集群上也會(huì)出現(xiàn)各種問(wèn)題,如:log怎么輸出,有的client掛了怎么辦等等。建議有空可以看下李沐的開(kāi)源項(xiàng)目的代碼,還有上面提到的一些文檔。

作者微信公眾號(hào):凡人機(jī)器學(xué)習(xí)

長(zhǎng)期分享機(jī)器學(xué)習(xí)實(shí)戰(zhàn)相關(guān)信息,感謝關(guān)注!

本文來(lái)自博客 “李博Garvin“
轉(zhuǎn)載請(qǐng)標(biāo)明出處:http://blog.csdn.net/buptgshengod]

總結(jié)

以上是生活随笔為你收集整理的【分布式计算】MapReduce的替代者-Parameter Server的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 黄色复仇草 | 国产综合婷婷 | av中字在线| 国产a一级| 狠狠躁18三区二区一区视频 | 亚洲天堂成人在线 | 无码人妻精品一区二 | 女人裸体又黄 | 强制高潮抽搐哭叫求饶h | 中文字幕在线天堂 | 男生和女生一起差差差很痛的视频 | 国产毛片毛片毛片毛片 | 久久少妇网 | 国产三区精品 | 成人区一区二区 | 成人欧美一区二区三区黑人免费 | a级一a一级在线观看 | 正在播放国产精品 | 视频在线观看一区 | 国产高清视频免费观看 | h片在线免费观看 | 成人免费视频一区二区三区 | 高清久久久久久 | 337p日本欧洲亚洲鲁鲁 | www亚洲色图 | 国产熟妇乱xxxxx大屁股网 | 久久激情小说 | 久久亚洲精华国产精华液 | 激情福利视频 | a级片在线视频 | 久久精品国产一区二区 | 日韩伦理中文字幕 | 亚洲成人网在线 | 少妇被狂c下部羞羞漫画 | www.射 | 北条麻妃在线一区 | 成人欧美一区二区三区黑人动态图 | 一区二区视频免费 | 最新网址av | 色原网 | 国产精品电影院 | 色吊丝一区二区 | 大学生高潮无套内谢视频 | 午夜精品久久99蜜桃的功能介绍 | 在线看一区二区 | 一区二区韩国 | 中文字幕第七页 | 91av视频在线播放 | 日韩美在线 | 国产精品人 | 免费播放片大片 | 天天射日日干 | 日韩精品一区二区三区中文在线 | 国产盗摄精品一区二区酒店 | 成人欧美一区二区三区在线观看 | 开心六月婷婷 | 国产一区二区四区 | 日本电影成人 | 亚洲激情中文字幕 | 国产尤物av尤物在线看 | 毛片成人网 | 深夜视频在线观看免费 | 在线波多野结衣 | 日韩av在线资源 | 久久男女视频 | av动态| 日韩在线视频观看免费 | 国产最新精品视频 | 成人在线免费看视频 | 成人免费黄色av | 精品无码人妻一区二区三 | www.jizz国产 | 久久精彩视频 | 国产精品二| 少妇精品偷拍高潮白浆 | 国产夜夜操 | 夜久久| 三级欧美视频 | 免费无遮挡在线观看视频网站 | √资源天堂中文在线视频 | 国产高清毛片 | 亚洲欧美精品一区二区 | 欧美老女人bb | 日本aⅴ在线观看 | 亚洲国产精品成人av | 超碰首页 | 全球av在线 | 国产在线日韩 | 9l视频自拍九色9l视频 | 99热思思| a极黄色片 | 中文字幕精品一区二区三区视频 | 亚洲视频在线观看免费 | www久久99 | 欧美手机在线 | 国产精品成人一区二区三区电影毛片 | 久久综合久久鬼 | 日韩aaaaaa | 污网站免费观看 |