日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PageRank算法改进

發(fā)布時間:2024/3/7 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PageRank算法改进 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

PageRank算法的應用

PageRank 算法是 Google 搜索引擎進行網(wǎng)頁排名的一種算法,那么它如何映射到其他領域?

比如,我們?nèi)绾卧谖墨I排名中應用PageRank算法呢?

對文獻的質(zhì)量進行排序是對文獻價值進行評估的一種重要手段,目的是為了方便人員在檢索時查閱。

統(tǒng)計文獻的被引次數(shù)是一種非常直觀的統(tǒng)計方式,在此基礎之上,我們引入了 PageRank算法:該算法基于網(wǎng)頁之間的鏈接關系評估網(wǎng)頁的價值,由于互聯(lián)網(wǎng)與文獻引用網(wǎng)絡之間存在著較大的相似性,所以基于文獻之間的引用網(wǎng)絡使用 PageRank 算法可以更合理的對于文獻的價值評估。

該算法基于一種投票關系:A 文對 B 文進行了引用是因為 A 文認為 B 文質(zhì)量較高,即通過引用的方式給B文投票,之后再通過投票關系對文獻進行排名。

根據(jù)PageRank的原理,在文獻排名的過程中,PageRank 算法同樣遵循以下兩個基本假設:

  • 數(shù)量假設。如果一篇文獻 A 被其他文獻引用,說明其他文獻認為文獻 A 比較重要,也就是其他文獻將自己的 PageRank 值貢獻給 A。表明 A 是一篇有質(zhì)量的文獻,所以文獻 A 的 PageRank 值會比較高。
  • 質(zhì)量假設。如果一篇高 PageRank 值的文獻引用了一篇其他的文獻,則被引用的文獻的 PageRank 值也因此而提高。
  • 算法的公式形式不變,如下所示,但是其中各個量的含義會發(fā)生變化。

    其中 p 代表某個待評價的學術文獻,d是阻尼系數(shù)。CTotal 是文獻總量。N 表示 N 篇引用了 p 的文獻,Xi 表示第 i 個引用了 p的文獻,C(Xi)表示 Xi 這篇文獻總的參考文獻數(shù)目。

    看下面的例子,假如這是迭代過程中的一個片段,PR值的分配傳遞過程如下圖所示:

    偽代碼如下:

    PageRank算法基于時間的改進和迭代優(yōu)化

    針對傳統(tǒng) PageRank 算法迭代過程復雜、時效性不強、執(zhí)行速度慢等缺點,可以進行了優(yōu)化迭代過程、增加時間因子影響函數(shù)、并行化三點改進。

    我們將改進的算法稱為NTMP 算法——在優(yōu)化迭代過程時,通過對于被引文獻的特征進行統(tǒng)計,按照權威度的方式進行 NTMP 值分配。根據(jù)文獻被引半衰期這一特征,使用時間因子影響函數(shù)更好的對文獻價值進行評價。最后將改進后的算法進行了基于MapReduce 計算框架的并行化處理,最終構成 NTMP 算法。

    加入時間影響因子

    NTMP 算法進行文獻評價時有如下三點假設:

    1)數(shù)量假設

    2)質(zhì)量假設

    3)影響力衰減假設:一篇文章的影響力不是一成不變的,其影響力會根據(jù)時間的推移進行適當衰減。如果不對文獻的影響力在時間上進行約束,就會造成在文獻排名時,影響力較大的總是那些發(fā)表時間久遠、被引次數(shù)多的文獻,新發(fā)表的文獻不能被很好的評價,這就導致了新發(fā)表的文獻在排名時一直處于比較靠后的位置,不能受到很好的重視。所以僅考慮文獻之間的引用關系而忽略時間因素在文獻排名過程中的不利影響是不夠的。尤其研究者們應該重視那些新發(fā)表的文獻,這些文獻代表著當前研究趨勢、研究熱點。

    這里引入了文獻半衰期的概念。

    半衰期是指放射性元素的原子核有半數(shù)發(fā)生衰變時所需要的時間。

    這里給出的定義如下:在 N 年(某一年時間內(nèi))被引用的文獻中,較新的一半是在最近 X 內(nèi)發(fā)表的。這個 X 就是文獻被引半衰期。例如某一年,整個數(shù)據(jù)集中共發(fā)表文獻 176922 篇,其中累積引用計算機學科文獻 289421 頻次,再根據(jù)定義求得文獻被引半衰期為 6.78 年。

    根據(jù)定義:

    其中,W 是所求的被引半衰期,U 是累積百分比小于且最接近 50%的年數(shù),X 為統(tǒng)計年至 U 年的被引累積百分比,Y 為統(tǒng)計年至 U+1 年的被引累計百分比。

    有了這個半衰期的定義,我們建立一個時間影響因子函數(shù):

    其中,HL(t)為文獻價值剩余百分比,CTotal 代表的是該數(shù)據(jù)集中初始時刻(t=0 )所有文獻的數(shù)量,t 是衰變時間,T 為計算機學科文獻被引半衰期。時間因子影響函數(shù)HL(t)的含義是在計算機學科中,某一篇文獻從發(fā)表(t=0 )開始,經(jīng)過 t 時間后,文獻的剩余價值變?yōu)樵瓉淼?HL(t)倍。

    迭代優(yōu)化

    在進行 PR 值的傳遞時,傳統(tǒng)算法會將每篇文獻的 PR 值平均分給該文獻所引用的其他文獻。

    ?NTMP算法的改進:將NTMP 值向著那些重要的文獻流動,提升分配效率和收斂速度。

    BC_Sum是文獻集合R(X)中所有文獻 Pj 的被引次數(shù)之和。

    W(X,p)是計算集合R(X)某一篇文獻 P 被引次數(shù)的所占比重,可以理解為文獻 P 在分配 X 的 NTMP 值時所占權重。

    NTMP 算法的輸入是基礎文獻信息,包括文獻發(fā)表時間,文獻引用關系等,輸出是各待評價樣本的 NTMP 值,可以根據(jù) NTMP 值對待評價樣本進行排名。

    根據(jù)上述改進方法,NTMP 算法的公式為:

    其中 xi 引用了文獻 P 的施引文獻,NTMP(xi)表示上一次迭代結束后 x 的 NTMP值,函數(shù) W(Xi,P)是之前提出的 NTMP 值分配方式,函數(shù) HL(t)是時間因子影響函數(shù),d 是阻尼系數(shù)一般取 0.85,CTotal 是數(shù)據(jù)集中的文獻總量。

    PageRank算法在分布式集群中的應用

    Map階段:計算出每條樣本給其參考文獻所貢獻的 NTMP 值

    Reduce階段:將 Map 階段所傳出的每一篇 Xi 為 P所貢獻的 NTMP 值相加,再乘以阻尼 d,之后加上調(diào)整項即為文獻 P 的 NTMP 值

    具體過程如下:

    map階段:

    reduce階段:

    本文參考論文《基于Hadoop的學術文獻排名及作者影響力評價算法》崔景洋

    總結

    以上是生活随笔為你收集整理的PageRank算法改进的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: mm1313亚洲国产精品美女 | 久久金品 | 精品国偷自产国产一区 | 天天色天天操天天 | 不卡av中文字幕 | 91中文字幕在线视频 | 西西4444www大胆无视频 | 日本美女全裸 | 欧美日韩在线播放视频 | 美女被男人插 | 嫩草在线观看 | 亚洲免费毛片 | 影音先锋精品 | 香港三级在线视频 | 国产香蕉97碰碰碰视频在线观看 | 少妇又紧又色又爽又刺激视频 | 久久www视频 | 久久久久国产精品视频 | 最近2019中文字幕大全第二页 | 精品一区二区三区毛片 | 毛片2 | 天天影视综合 | 国产精品亚洲专区无码牛牛 | 伊人狠狠| 国产又黄又猛 | 免费a v在线 | 涩涩视频网站在线观看 | 欧美一区二区三区四区在线观看 | 国产精品久久久免费视频 | 1区2区3区视频 | 亚洲九九爱 | 成年人在线视频免费观看 | 午夜伦理剧场 | 亚洲性xxxx | 狼人色综合| 欧洲成人精品 | 农村老熟妇乱子伦视频 | 激情婷婷综合 | 欧美性一区二区 | 欧美激情一二三 | 一级片在线播放 | 伊人草 | 欧美毛片视频 | 日韩日b视频 | 久久中文字幕在线观看 | 黄色a∨ | 91视频高清 | 欧美激情福利 | 26uuu亚洲国产精品 | 中文字幕.com | 中文字幕精品三级久久久 | 手机看片在线观看 | 日韩香蕉网| 不卡av一区二区 | 18成人免费观看网站 | 男女网站免费 | 日韩精品系列 | 男女69视频 | 午夜视频网站在线观看 | 一女二男一黄一片 | 91香蕉视频在线观看免费 | 亚洲大尺度在线观看 | 中国妇女做爰视频 | 青草视频免费看 | 成熟了的熟妇毛茸茸 | 久久九九色 | 成人小说亚洲一区二区三区 | 国产精品一品二区三区的使用体验 | 伊人中文字幕在线观看 | 欧美一区二三区 | 日韩bbw| 亚洲天堂黄 | 夜夜免费视频 | 无码人妻一区二区三区av | 精品人妻av一区二区 | 免费av成人 | 国产精品有码 | 男女日批在线观看 | 捆绑中国女人hd视频 | 老女人乱淫 | 打开免费观看视频在线 | 麻豆成人91精品二区三区 | www.黄色网址.com | 大肉大捧一进一出好爽动态图 | 五月天校园春色 | 视频在线观看免费大片 | 在线观看视频毛片 | 国产欧美一区二区三区视频在线观看 | 欧美日韩激情 | 色婷婷小说 | 在线观看一区视频 | 亚洲欧洲免费无码 | 精品96久久久久久中文字幕无 | 久久精品99国产精品日本 | 国产精品第九页 | 成人午夜免费福利 | 韩国久久久久 | 用力插视频 | 狠狠插影院 |