日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

kl散度定义_Kullback-Leibler(KL)散度介绍

發布時間:2024/9/19 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 kl散度定义_Kullback-Leibler(KL)散度介绍 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在這篇文章中,我們將探討一種比較兩個概率分布的方法,稱為Kullback-Leibler散度(通常簡稱為KL散度)。通常在概率和統計中,我們會用更簡單的近似分布來代替觀察到的數據或復雜的分布。KL散度幫助我們衡量在選擇近似值時損失了多少信息。

讓我們從一個問題開始我們的探索。假設我們是太空科學家,正在訪問一個遙遠的新行星,我們發現了一種咬人的蠕蟲,我們想研究它。我們發現這些蠕蟲有10顆牙齒,但由于它們不停地咀嚼,很多最后都掉了牙。在收集了許多樣本后,我們得出了每條蠕蟲牙齒數量的經驗概率分布:

雖然這些數據很好,但我們有一個小問題。我們離地球很遠,把數據寄回家很貴。我們要做的是將這些數據簡化為一個只有一兩個參數的簡單模型。一種選擇是將蠕蟲牙齒的分布表示為均勻分布。我們知道有11個可能的值,我們可以指定1/11的均勻概率

顯然,我們的數據不是均勻分布的,但是看起來也不像我們所知道的任何常見分布。我們可以嘗試的另一種選擇是使用二項分布對數據進行建模。在這種情況下,我們要做的就是估計二項分布的概率參數。我們知道如果我們有n次試驗,概率是p,那么期望就是E[x]= np。在本例中n = 10,期望值是我們數據的平均值,計算得到5.7,因此我們對p的最佳估計為0.57。這將使我們得到一個二項分布,如下所示:

將我們的兩個模型與原始數據進行比較,我們可以看出,兩個都沒有完美匹配原始分布,但是哪個更好?

現如今有許多錯誤度量標準,但是我們主要關注的是必須使發送的信息量最少。這兩個模型都將我們的問題所需的參數量減少。最好的方法是計算分布哪個保留了我們原始數據源中最多的信息。這就是Kullback-Leibler散度的作用。

我們分布的熵

KL散度起源于信息論。信息論的主要目標是量化數據中有多少信息。信息論中最重要的指標稱為熵,通常表示為$H$。概率分布的熵的定義是:

如果在我們的計算中我們使用log_2,我們可以把熵解釋為“我們編碼信息所需要的最小比特數”。在這種情況下,根據我們的經驗分布,信息將是每個牙齒計數的觀察結果。根據我們觀察到的數據,我們的概率分布的熵為3.12比特。比特的數目告訴我們,在單一情況下,我們平均需要多少比特來編碼我們將觀察到的牙齒數目。

熵沒有告訴我們可以實現這種壓縮的最佳編碼方案。信息的最佳編碼是一個非常有趣的主題,但對于理解KL散度而言不是必需的。熵的關鍵在于,只要知道所需位數的理論下限,我們就可以準確地量化數據中有多少信息。現在我們可以對此進行量化,當我們將觀察到的分布替換為參數化的近似值時,我們丟失了多少信息。

使用KL散度測量丟失的信息

Kullback-Leibler散度只是對我們的熵公式的略微修改。不僅僅是有我們的概率分布p,還有上近似分布q。然后,我們查看每個log值的差異:

本質上,我們用KL散度看的是對原始分布中的數據概率與近似分布之間的對數差的期望。再說一次,如果我們考慮$log_2$,我們可以將其解釋為“我們預計有多少比特位的信息丟失”。我們可以根據期望重寫公式:

查看KL散度的更常見方法如下:

??因為

利用KL散度,我們可以精確地計算出當我們近似一個分布與另一個分布時損失了多少信息。讓我們回到我們的數據,看看結果如何。

比較我們的近似分布

現在我們可以繼續計算兩個近似分布的KL散度。對于均勻分布,我們發現:

對于我們的二項式近似:

如我們所見,使用二項式分布所損失的信息大于使用均勻分布所損失的信息。如果我們必須選擇一個來代表我們的觀察結果,那么最好還是堅持使用均勻分布。

KL散度不是距離

將KL散度視為距離度量可能很誘人,但是我們不能使用KL散度來測量兩個分布之間的距離。這是因為KL散度不是對稱的。例如,如果我們將觀察到的數據用作近似二項式分布的方式,我們將得到非常不同的結果:

使用KL散度進行優化

當我們選擇二項分布的值時,我們通過使用與數據匹配的期望值來選擇概率參數。但是,由于我們正在進行優化以最大程度地減少信息丟失,因此這可能并不是選擇參數的最佳方法。當我們更改此參數的值時,我們可以通過查看KL散度的變化方式來仔細檢查我們的工作。以下是這些值如何一起變化的圖表:

如你所見,我們對二項式分布的估計(由點標記)是使KL散度最小的最佳估計。

假設我們要創建一個臨時分布來對數據建模。我們將數據分為兩部分。0-5顆牙齒的概率和6-10顆牙齒的概率。然后,我們將使用單個參數來指定總概率分布的百分比落在分布的右側。例如,如果我們為參數選擇p=1,則6-10的概率分別為0.2,0-5組中的所有事物的概率均為0。:

注意:因為 log在0點未定義,我們唯一允許為零的概率是當p(xi)=0,可以推出q(xi)=0

我們如何才能找到我們組合在一起的這個奇怪模型的最佳參數?我們需要做的就是像以前一樣最大程度地減少KL差異:

我們發現在以下情況下找到的KL散度的最小值是0.338,當p = 0.47。最小KL散度的值應該看起來很熟悉:它幾乎與我們均勻分布得到的值相同!當我們用p的理想值繪制出我們的分布的值時,我們發現它幾乎是均勻的:

由于我們不會使用臨時分布來保存任何信息,因此最好使用更熟悉,更簡單的模型。

這里的關鍵點是,我們可以將KL散度作為目標函數來找到我們可以得出的任何近似分布的最優值。盡管此示例僅優化單個參數,但我們可以輕松想象將這種方法擴展到具有許多參數的高維模型。

變分自動編碼器和變分貝葉斯方法

如果你熟悉神經網絡,那么你可能已經猜到了上一節之后的去向。在最一般的意義上,神經網絡是函數近似器。這意味著你可以使用神經網絡來學習各種復雜的功能。使神經網絡學習的關鍵是使用目標函數,該函數可以告知網絡運行狀況。你可以通過最小化目標函數的損失來訓練神經網絡。

如我們所見,我們可以使用KL散度來最小化近似分布時的信息損失量。將KL散度與神經網絡相結合,可以讓我們學習非常復雜的數據近似分布。一種常見的解決方法稱為“變分自編碼器”,它學習了近似數據集中信息的最佳方法。以下鏈接一個很棒的教程,深入探討了構建變分自編碼器的細節:https://arxiv.org/abs/1606.05908。

更一般的是變分貝葉斯方法領域。在其他文章中,我們看到了蒙特卡洛模擬可以有效解決一系列概率問題。盡管蒙特卡洛模擬可以幫助解決貝葉斯推理所需的許多難解積分,但即使這些方法在計算上也非常昂貴。包括變分自動編碼器在內的變分貝葉斯方法使用KL散度來生成最佳近似分布,從而可以對非常困難的積分進行更有效的推斷。要了解有關變分推理的更多信息,可以查看python的Edward庫:http://edwardlib.org/。

總結

以上是生活随笔為你收集整理的kl散度定义_Kullback-Leibler(KL)散度介绍的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美国产专区 | 风韵少妇性饥渴推油按摩视频 | 成人激情免费视频 | sese综合| www.17c.com喷水少妇 | 亚洲视频一二三区 | 经典三级在线视频 | 国模私拍xvideos私拍 | 先锋av在线资源 | 四虎国产精品永久免费观看视频 | 中文字幕在线观看免费视频 | 无码人妻精品中文字幕 | 亚洲国产一区视频 | 亚洲av综合色区无码一二三区 | 玖玖爱在线观看 | 精品国产区一区二 | 国产激情对白 | 国产精品边吃奶边做爽 | 国产精品久久99 | 无码国产69精品久久久久网站 | 一级网站在线观看 | 日本aaa视频| 中文字幕在线免费视频 | 特级西西人体444www高清 | 国产三区在线观看 | 久久亚洲精品中文字幕 | 国产无精乱码一区二区三区 | 伊人网国产| 国产又黄又粗又爽 | 黄色av播放 | 午夜精| 无码人妻精品一区二区三区99v | 公侵犯人妻中文字慕一区二区 | 在线观看黄色片 | 国产在线观看成人 | 日本精品免费在线观看 | 超碰97国产 | 亚洲污视频 | 久久久精品国产sm调教网站 | 国产精品自产拍高潮在线观看 | 欧美色图网址 | 在线观看日本一区二区 | 久草网在线观看 | 九九精品久久 | 米奇影音| 国产精品jizz视频 | 日韩精品无码一区二区 | 在线免费观看黄色小视频 | 色网站观看| 国产美女无遮挡永久免费 | 黄色网页免费看 | 久久精品99北条麻妃 | 一道本久在线中文字幕 | 国产精品一区二区在线观看 | 色哟哟在线视频 | 国内激情视频 | 午夜亚洲 | 日韩中文字幕免费视频 | 日韩黄片一区二区三区 | 欧美激情视频一区二区三区不卡 | 少妇诱惑av | 综合久久亚洲 | 成人黄色片在线观看 | 98在线视频 | 特级精品毛片免费观看 | 日韩bbw| 日日骚一区二区 | 精品久久久视频 | www.av在线.com| 日韩精品视频一区二区在线观看 | 久久久久九九九九 | 国产一区二区三区福利 | 激情免费网站 | 天天干天天插 | 中文字幕一二三四区 | 亚州欧美在线 | 粉嫩小箩莉奶水四溅在线观看 | 伊人亚洲综合 | 四川丰满妇女毛片四川话 | 超碰婷婷 | 亚洲 在线| 成人h片| 亚洲成人黄色 | 亚洲老老头同性老头交j | 日韩va亚洲va欧美va久久 | 亚洲春色av| 精品无码成人久久久久久免费 | 黄色尤物视频 | 黄色福利网站 | 91爱爱com | 精品一区二区在线播放 | 神马午夜久久 | 偷拍精品一区二区三区 | 精品视频一区二区三区四区五区 | 一级黄色大片视频 | 在线免费激情视频 | av在线亚洲天堂 | 538在线精品 | 日本一级黄色 |