日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Word2Vec学习笔记(三)续

發(fā)布時(shí)間:2025/3/15 编程问答 15 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Word2Vec学习笔记(三)续 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

三、(續(xù))Skip-gram模型介紹

????Skip-gram模型并不是和CBOW模型相反的,它們的目的都是計(jì)算出詞的向量,只不過在作者的論文中給出的圖看樣子是反的而已。Skip-gram模型是用每個(gè)當(dāng)前詞去預(yù)測一定范圍內(nèi)除當(dāng)前詞之外前后的詞。同樣的,此模型也是輸出一顆huffman樹,如下圖所示:此圖也借用下圖借用
http://blog.csdn.net/itplus/article/details/37969979

Skip-gram模型的目標(biāo)函數(shù)

????由于Skip-gram的模型輸入是當(dāng)前詞,目的是預(yù)測它周圍的詞,因此,此任務(wù)的目標(biāo)函數(shù)如下所示:

L=wClogP(context(w)|w)
由于 context(w) 是一個(gè)句子,因此,可以將 P(context(w)|w)寫成如下形式:
P(context(w)|w)=ucontext(w)P(u|w)
根據(jù)hierarchical softmax的討論:
P(u|w)=j=2luP(duj|v(u);θj?1)
那么:最終的目標(biāo)函數(shù)可以寫為:
L=wClogucontext(w)j=2luP(dwj|v(u);θj?1)

這里,θ,v(w)的更新公式先留著,待推導(dǎo)完再進(jìn)行補(bǔ)充。
今天推導(dǎo)了一下,其實(shí)和上節(jié)中的推導(dǎo)差不多,現(xiàn)將推導(dǎo)過程記錄一下

L=wClogucontext(w)j=2luP(dwj|v(u);θj?1)=wCucontext(w)j=2lulogP(dwj|v(u);θj?1)=wCucontext(w)j=2lulog{[1?σ(v(w)Tθuj?1)]dujσ(v(w)Tθuj?1)]1?duj}=wCucontext(w)j=2lu{dujlog[1?σ(v(w)Tθuj?1)]+(1?duj)log[σ(v(w)Tθuj?1)]}
f=dujlog[1?σ(v(w)Tθuj?1)]+(1?duj)log[σ(v(w)Tθuj?1)],則分別求出 f對(duì)θj v(w)求偏導(dǎo)數(shù):
?f?θuj?1=[1?duj?σ(v(w)Tθuj?1)]v(w)?f?v(w)=[1?duj?σ(v(w)Tθuj?1)]θuj?1
那么 θ v(w)的更新公式如下:
θuj?1:=θuj?1+η[1?duj?σ(v(w)Tθuj?1)]v(w)v(w):=v(w)+ucontext(w)j=2lu[1?duj?σ(v(w)Tθuj?1)]θuj?1

Word2Vec 的重點(diǎn)參考文獻(xiàn)

  • Efficient Estimation of Word Representations in Vector Spaceh. http://arxiv.org/pdf/1301.3781v3.pdf
  • Distributed Representations ofWords and Phrases and their Compositionality. https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf
  • Exploiting Similarities among Languages for Machine Translation. http://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/44931.pdf
  • http://blog.csdn.net/itplus/article/details/37969979
  • http://www.cnblogs.com/neopenx/p/4571996.html
  • http://blog.csdn.net/zhoubl668/article/details/24319529
  • 總結(jié)

    以上是生活随笔為你收集整理的Word2Vec学习笔记(三)续的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。