TransE解读
Paper地址
1 目標(biāo)
學(xué)習(xí)三元組的向量表達(dá)
2 算法
大致思路:
- 初始化+歸一化
- 遍歷數(shù)據(jù)
- 構(gòu)造錯(cuò)誤樣本
- 訓(xùn)練計(jì)算loss函數(shù)
- 根據(jù)loss優(yōu)化三元組的向量表達(dá)
3 優(yōu)化方法
這個(gè)是loss函數(shù)的計(jì)算方法和負(fù)樣本的挑選方法
- loss函數(shù)(優(yōu)化目標(biāo)):正確的三元組比假造的三元組頭向量+關(guān)系向量-尾向量的差小,優(yōu)化正確三元組的$ d(h+l,t) 減去假的三元組的減去假的三元組的減去假的三元組的 d(h{’}+l,t{’}) $
- 假的三元組的生成是隨機(jī)替換正確的三元組的頭或者尾部,不同時(shí)替換。
- 學(xué)習(xí)的目標(biāo)是向量表達(dá),所以迭代一次,計(jì)算loss,loss是代表正確樣本和錯(cuò)誤樣本的距離差,這個(gè)值是個(gè)負(fù)數(shù),越小代表約好,所以根據(jù)loss優(yōu)化三元組的向量表達(dá)。
4 實(shí)驗(yàn)
將上述embedding做鏈接預(yù)測(cè)
疑問(wèn):測(cè)試數(shù)據(jù)如何構(gòu)成,測(cè)試數(shù)據(jù)從哪里來(lái)?
https://github.com/thunlp/OpenKE
這里面說(shuō)到去掉了訓(xùn)練集中出現(xiàn)的可能測(cè)試集會(huì)出現(xiàn)的三元組,所以說(shuō)測(cè)試集就是另外一部分三元組的數(shù)據(jù),從訓(xùn)練集中剝離出來(lái)了,然后拿訓(xùn)練集的數(shù)據(jù)做訓(xùn)練,測(cè)試集直接拿score做排序,然后計(jì)算@hist10得到評(píng)分,所以鏈接預(yù)測(cè)就是學(xué)了個(gè)embedding,然后直接就排序了,如何體現(xiàn)是預(yù)測(cè)不存在的關(guān)系呢?難道把top5的都當(dāng)作正確的關(guān)系???
總結(jié)
- 上一篇: TransE模型的简单介绍TransE模
- 下一篇: 【TransE模型】基于分布式表示推理