文本挖掘(part7)--Word2vec
生活随笔
收集整理的這篇文章主要介紹了
文本挖掘(part7)--Word2vec
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必糾
文章目錄
- 文檔信息的向量化
- word2vec: CBOW(連續(xù)詞袋)
- word2vec降低運算量的方式(分層softmax、負例采樣)
- 分層softmax
- 負例采樣
- word2vec對文本中信息的學習效果:關(guān)系類比
- word2vec對文本中信息的學習效果:語義理解
- Word2Vec存在的問題
文檔信息的向量化
word2vec: CBOW(連續(xù)詞袋)
word2vec使用上下文詞匯同時預(yù)測中間詞,其本質(zhì)上只是一個線性分類器. 顯然,短語料不適合用word2vec來分析.
- word2vec的結(jié)構(gòu)
輸入層:仍然直接使用BOW(bag of ward)方式表示.
投射層:對向量直接求和(平均),以降低向量維度; 實質(zhì)上是去掉了投射層.
隱含層:直接去除.
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的文本挖掘(part7)--Word2vec的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 矩阵求逆(LUP分解算法)
- 下一篇: 机器学习实验中的编程技术(part4)-