主题模型 LDA,Dirichlet分布 和朴素贝叶斯算法
生活随笔
收集整理的這篇文章主要介紹了
主题模型 LDA,Dirichlet分布 和朴素贝叶斯算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
主題模型
主題模型(topic model)是以非監督學習的方式對文集的隱含語義結構(latent semantic structure)進行聚類(clustering)的統計模型。
主題模型主要被用于自然語言處理(Natural language processing)中的語義分析(semantic analysis)和文本挖掘(text mining)問題,例如按主題對文本進行收集、分類和降維;也被用于生物信息學(bioinfomatics)研究 。隱含狄利克雷分布Latent Dirichlet Allocation, LDA)是常見的主題模型
LDA
2003年,David M.Blei、Andrew Ng和Jordan I. Michael提出了隱含狄利克雷分布(Latent Dirichlet Allocation, LDA) 。LDA得到了廣泛使用
舉例而言,在“狗”主題中,與該主題有關的字符,例如“狗”、“骨頭”等詞會頻繁出現;在“貓”主題中,“貓”、“魚”等詞會頻繁出現。若主題模型在分析一篇文章后得到10%的“貓”主題和“90%”的狗主題,那意味著字符“狗”和“骨頭”的出現頻率大約是字符“貓”和“魚”的9倍。
總結
以上是生活随笔為你收集整理的主题模型 LDA,Dirichlet分布 和朴素贝叶斯算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我国歼20战机到底多少钱呢?
- 下一篇: 商品销售额预测