日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Good-Turning Smothing 学习

發(fā)布時間:2024/1/18 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Good-Turning Smothing 学习 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

使用場景

語言模型平滑化等

公式

沒有出現(xiàn)過的單詞出現(xiàn)的概率

P m l e = 0 P_{mle}=0 Pmle?=0 (mle的方式)

P g t = N 1 N P_{gt}=\frac{N_1}{N} Pgt?=NN1?? (good-turning的方式)

出現(xiàn)過的單詞出現(xiàn)的概率

P m l e = c N P_{mle}=\frac{c}{N} Pmle?=Nc?(mle的方式)

P g t = ( c + 1 ) N c + 1 N c × N P_{gt}=\frac{(c+1)N_{c+1}}{N_c\times N} Pgt?=Nc?×N(c+1)Nc+1??(good-turning的方式:網(wǎng)絡上的公式分母沒有乘以N,這里的解釋是:分母不乘以N計算的是預計出現(xiàn)的次數(shù),分母乘以N后就是在全部次數(shù)N中出現(xiàn)的概率)

舉例說明

例:假設在摸球,已經(jīng)摸了22個球了。其中10個球是白色,5個是黑色,3個球是灰色,2個球是褐色,1個是紅色,1個是綠色,1個是黃色。

需要先計算出出現(xiàn)的次數(shù):

N = 22 N=22 N=22 (一共摸了22次)
N 10 = 1 N_{10}=1 N10?=1 (有一個顏色的球出現(xiàn)了10次)
N 5 = 1 N_5=1 N5?=1 (有一個顏色的球出現(xiàn)了5次)
N 3 = 1 N_3=1 N3?=1 (有一個顏色的球出現(xiàn)了3次)
N 2 = 1 N_2=1 N2?=1 (有一個顏色的球出現(xiàn)了2次)
N 1 = 3 N_1=3 N1?=3 (有三個顏色的球出現(xiàn)了1次)

問題1.求摸到紫色球的概率:

mle的方式只考慮過去,沒有出現(xiàn)的顏色概率是0

P m l e ( 紫 色 ) = 0 P_{mle}(紫色)=0 Pmle?()=0


摸第20個球的時候出現(xiàn)了紅色,這時的紅色相當于新的顏色 類比可以把出現(xiàn)一次的紅色、綠色、黃色看做新的顏色

P g t ( 新 的 顏 色 ) = P g t ( 紫 色 ) = N 1 N = 3 22 P_{gt}(新的顏色)=P_{gt}(紫色)=\frac{N_1}{N}=\frac{3}{22} Pgt?()=Pgt?()=NN1??=223?


問題2. 摸到紅球的概率:

P m l e ( 紅 色 ) = 1 22 P_{mle}(紅色)=\frac{1}{22} Pmle?()=221?

P g t ( 紅 色 ) = ( c + 1 ) N c + 1 N c × N = ( 1 + 1 ) N 1 + 1 N 1 × N = 2 N 2 N 1 × N = 2 × 1 3 × 22 = 1 33 P_{gt}(紅色)=\frac{(c+1)N_{c+1}}{N_c\times N}=\frac{(1+1)N_{1+1}}{N_1\times N}=\frac{2N_{2}}{N_1\times N}=\frac{2\times1}{3\times 22}=\frac{1}{33} Pgt?()=Nc?×N(c+1)Nc+1??=N1?×N(1+1)N1+1??=N1?×N2N2??=3×222×1?=331?

可能遇到的問題

舉個例子,在日常使用中,如預計文章中單詞出現(xiàn)的頻率時。
比如有2個單詞在文章中出現(xiàn)了115次,但是不一定有單詞恰好出現(xiàn)了116次。而通過gt的方式預計115次單詞出現(xiàn)個數(shù)時候是需要116次單詞的數(shù)據(jù)的。這時就沒有辦法計算了。

計算已經(jīng)出現(xiàn)115次的某個單詞出現(xiàn)個數(shù)應使用公式:

P g t = ( c + 1 ) N c + 1 N c = ( 115 + 1 ) N 116 N 115 P_{gt}=\frac{(c+1)N_{c+1}}{N_c}=\frac{(115+1)N_{116}}{N_{115}} Pgt?=Nc?(c+1)Nc+1??=N115?(115+1)N116??

可以通過一些其他方式補上缺失的數(shù)據(jù),比如機器學習算法。

ps

內(nèi)容來自日常學習中的一些教程,網(wǎng)上的資料等。個人也還是初學者,如有問題期望指正!

總結

以上是生活随笔為你收集整理的Good-Turning Smothing 学习的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。