日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文阅读——《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》

發(fā)布時(shí)間:2025/3/20 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文阅读——《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

論文閱讀——《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》

  • 《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》
    • 1. 曝光評(píng)價(jià)標(biāo)準(zhǔn)——熵權(quán)梯度
      • 2.1 什么是圖像熵?
      • 2.2 為什么用圖像熵?
      • 2.3 怎么使用圖像熵?
      • 2.4 評(píng)價(jià)效果怎么樣?
    • 2. 自動(dòng)曝光控制——貝葉斯優(yōu)化
      • 2.1 什么是貝葉斯優(yōu)化?
      • 2.2 貝葉斯優(yōu)化是如何進(jìn)行?

《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》

最近這是一篇在2018年ICRA上發(fā)表的會(huì)議論文,主要內(nèi)容是提出一種新的曝光評(píng)價(jià)標(biāo)準(zhǔn),以及一種新的自動(dòng)曝光控制策略,關(guān)于自動(dòng)曝光的其他文章可以參考我之前的這篇博客:
圖像傳感器與信號(hào)處理——自動(dòng)曝光算法
我之前這篇博客分享了兩篇2017年發(fā)表的利用梯度進(jìn)行自動(dòng)曝光的文章,這篇文章中在相關(guān)工作中也提到了,說之前的那兩篇只考慮了梯度信息,對(duì)于過曝光和欠曝光的處理效果不佳,這篇文章對(duì)于這個(gè)問題則有更好的解決方案。

1. 曝光評(píng)價(jià)標(biāo)準(zhǔn)——熵權(quán)梯度

所謂“熵權(quán)梯度”就是用圖像熵來作為梯度的權(quán)值

2.1 什么是圖像熵?

這個(gè)熵是以像素為單位來定義的(參考《A mathematical theory of communication》),其計(jì)算公式是:Hi=?∑kP(ik)log?2(P(ik))H_{i}=-\sum_{k} P\left(i_{k}\right) \log _{2}\left(P\left(i_{k}\right)\right) Hi?=?k?P(ik?)log2?(P(ik?))其中P(?)P(\cdot)P(?)是和像素梯度級(jí)數(shù)kkk相關(guān)的概率,因此在計(jì)算這個(gè)概率之前需要先計(jì)算像素iii的梯度∥?I(i)∥2\|\nabla I(i)\|^{2}?I(i)2圖像熵可以描述這個(gè)像素周圍紋理復(fù)雜程度,圖像熵大則說明這個(gè)像素周圍紋理復(fù)雜。

2.2 為什么用圖像熵?

文中說利用圖像熵一方面可以最小化圖像梯度噪聲,另一方面可以建立一個(gè)飽和區(qū)域蒙版,減小過曝光或欠曝光區(qū)域來提升圖片整體效果。

2.3 怎么使用圖像熵?

這就是最重要的,首先曝光評(píng)價(jià)標(biāo)準(zhǔn)的計(jì)算公式為:Gewg?=∑giG_{\text {ewg }}=\sum g_{i} Gewg??=gi?其中,gig_igi?就是熵權(quán)梯度,這里先給出熵權(quán)梯度的定義公式:gi=Wi∥?I(i)∥2+π(Hi)Mi(Hi)Wi1N∑j=0N?1∥?I(j)∥2g_{i}=W_{i}\|\nabla I(i)\|^{2}+\pi\left(H_{i}\right) M_{i}\left(H_{i}\right) W_{i} \frac{1}{N} \sum_{j=0}^{N-1}\|\nabla I(j)\|^{2} gi?=Wi??I(i)2+π(Hi?)Mi?(Hi?)Wi?N1?j=0N?1??I(j)2可以看出,這個(gè)圖像熵公式由兩部分構(gòu)成,第一部分Wi∥?I(i)∥2W_{i}\|\nabla I(i)\|^{2}Wi??I(i)2是主要部分,第二部分π(Hi)Mi(Hi)Wi1N∑j=0N?1∥?I(j)∥2\pi\left(H_{i}\right) M_{i}\left(H_{i}\right) W_{i} \frac{1}{N} \sum_{j=0}^{N-1}\|\nabla I(j)\|^{2}π(Hi?)Mi?(Hi?)Wi?N1?j=0N?1??I(j)2就是通過建立蒙版來減小過曝光或欠曝光區(qū)域的,下面分別解析:

(1)第一部分Wi∥?I(i)∥2W_{i}\|\nabla I(i)\|^{2}Wi??I(i)2
權(quán)重WiW_{i}Wi?的定義公式如下:Wi=wi∑i=0N?1wiW_{i}=\frac{w_{i}}{\sum_{i=0}^{N-1} w_{i}} Wi?=i=0N?1?wi?wi??其中wi=1σexp?{(Hi?mean?(Hi))22σ2}w_{i}=\frac{1}{\sigma} \exp \left\{\frac{\left(H_{i}-\operatorname{mean}\left(H_{i}\right)\right)^{2}}{2 \sigma^{2}}\right\} wi?=σ1?exp{2σ2(Hi??mean(Hi?))2?}其中σ\sigmaσ是方差,iii是像素位置。根據(jù)公式,大的圖像熵將獲得較大的權(quán)值,反之則權(quán)值較小。

(2)第二部分π(Hi)Mi(Hi)Wi1N∑j=0N?1∥?I(j)∥2\pi\left(H_{i}\right) M_{i}\left(H_{i}\right) W_{i} \frac{1}{N} \sum_{j=0}^{N-1}\|\nabla I(j)\|^{2}π(Hi?)Mi?(Hi?)Wi?N1?j=0N?1??I(j)2
激活函數(shù)π(Hi)\pi\left(H_{i}\right)π(Hi?)的定義公式如下:π(Hi)=21+exp?(?αHi+τ)?1,0≤Hi≤1\pi\left(H_{i}\right)=\frac{2}{1+\exp \left(-\alpha H_{i}+\tau\right)}-1,0 \leq H_{i} \leq 1 π(Hi?)=1+exp(?αHi?+τ)2??1,0Hi?1其中參數(shù)α\alphaα控制像素iii的圖像熵和梯度的之間的關(guān)系,如果α\alphaα較大時(shí)則考慮更多圖像熵的因素,飽和區(qū)域會(huì)更快被控制,如果α\alphaα較小時(shí)則考慮更多梯度的因素。參數(shù)τ\tauτ控制可以被視作飽和區(qū)域像素的最小圖像熵水平,激活函數(shù)隨這兩個(gè)參數(shù)變化的圖像如下圖所示:
這里指的注意的是,激活函數(shù)輸入的是像素的圖像熵,從圖像上可以很直觀的看到,小的圖像熵激活函數(shù)輸出負(fù)值,大的則輸出正值。
蒙版函數(shù)Mi(Hi)M_{i}\left(H_{i}\right)Mi?(Hi?)的定義公式如下:Mi(Hi)={0,Hthres≤Hi≤11,0≤Hi<HthresM_{i}\left(H_{i}\right)=\left\{\begin{array}{ll} {0,} & {H_{\text {thres}} \leq H_{i} \leq 1} \\ {1,} & {0 \leq H_{i}<H_{\text {thres}}} \end{array}\right. Mi?(Hi?)={0,1,?Hthres?Hi?10Hi?<Hthres??通過公式可以看出,當(dāng)圖像熵較大時(shí),蒙版輸出為0,當(dāng)圖像熵較小時(shí),蒙版輸出為1。也就說蒙版只對(duì)圖像熵小的像素進(jìn)行限制。
結(jié)合激活函數(shù)和蒙版函數(shù)的特性知道,過曝光或者欠曝光區(qū)域像素圖像熵通常較小,第二部分因此在這些像素上輸出小值或者負(fù)值,使得過曝光或者欠曝光的圖像按照曝光評(píng)價(jià)標(biāo)準(zhǔn)計(jì)算出來更小。

2.4 評(píng)價(jià)效果怎么樣?

文中給了這樣一幅圖:其中紅色標(biāo)記和紅色曲線為本文的評(píng)價(jià)標(biāo)準(zhǔn),可以看出來最優(yōu)的曝光圖片其過曝光區(qū)域確實(shí)相對(duì)較小。

2. 自動(dòng)曝光控制——貝葉斯優(yōu)化

有了曝光評(píng)價(jià)函數(shù)后就需要考慮如果通過曝光評(píng)價(jià)函數(shù)來進(jìn)行自動(dòng)曝光控制,以獲取最優(yōu)曝光,目前我看過好幾種算法了,例如在《Active Exposure Control for Robust Visual Odometry in HDR Environments,2017》中,文中采用的是通過就曝光評(píng)價(jià)函數(shù)對(duì)曝光時(shí)間的偏導(dǎo),然后通過高斯牛頓法獲取最優(yōu)曝光。在《Gradient-based Camera Exposure Control for Outdoor Mobile Platforms,2018》中是通過最優(yōu)γ\gammaγ矯正來獲取最優(yōu)曝光。本文提出一種基于貝葉斯優(yōu)化的自動(dòng)曝光控制算法,挺有意思。

2.1 什么是貝葉斯優(yōu)化?

貝葉斯優(yōu)化算法通常用在機(jī)器學(xué)習(xí)中尋找最優(yōu)超參數(shù)的問題中,具體問題可以這么描述,如下:X?=arg?x∈Smax?f(x)X^{*}=\arg _{x \in S} \max f(x) X?=argxS?maxf(x)其實(shí)就是在集合SSS中選擇參數(shù)xxx使得函數(shù)f(x)f(x)f(x)最大,最核心的問題就是函數(shù)fff是未知且不一定是凸函數(shù),對(duì)應(yīng)到我們自動(dòng)曝光過程中,參數(shù)xxx就是曝光程度,而函數(shù)fff就是曝光評(píng)價(jià)隨曝光程度的變化趨勢(shì)

2.2 貝葉斯優(yōu)化是如何進(jìn)行?

文中這幅圖就很形象地說明了貝葉斯優(yōu)化的過程:

貝葉斯優(yōu)化算法最核心的內(nèi)容主要有兩部分構(gòu)成,分別是Prior FunctionAcquisition Function,下面分別進(jìn)行說明:

(1)Prior Function
前面提到,我們要求的函數(shù)fff是完全未知的,因此我們就要通過模型建立Prior Function,在上圖中,藍(lán)色曲線就是我們要求的函數(shù)fff,而"紫色柵格"就是基于高斯模型建立的Prior Function,基于高斯模型建立的Prior Fuction這個(gè)函數(shù)的自變量對(duì)應(yīng)的不是一個(gè)標(biāo)量,而是一個(gè)高斯分布。從上圖中可以看到,貝葉斯優(yōu)化的過程實(shí)際上就是不斷采樣使得Prior Fuction不斷逼近函數(shù)fff(如何采樣就和Acquisition Function有關(guān)),其具體公式如下:μ(x?)=k?T(K+σn2I)?1yσ2(x?)=k(x?,x?)?k?T(K+σn2I)?1k?\begin{aligned} \mu\left(x_{*}\right) &=\mathbf{k}_{*}^{T}\left(K+\sigma_{n}^{2} I\right)^{-1} \mathbf{y} \\ \sigma^{2}\left(x_{*}\right) &=k\left(x_{*}, x_{*}\right)-\mathbf{k}_{*}^{T}\left(K+\sigma_{n}^{2} I\right)^{-1} \mathbf{k}_{*} \end{aligned} μ(x??)σ2(x??)?=k?T?(K+σn2?I)?1y=k(x??,x??)?k?T?(K+σn2?I)?1k???其中,內(nèi)核矩陣K=[k(xi),k(xj)]xi,xj∈xK=\left[k\left(x_{i}\right), k\left(x_{j}\right)\right]_{x_{i}, x_{j} \in \mathbf{x}}K=[k(xi?),k(xj?)]xi?,xj?x?k?=[k(xi,x?)]xi∈x\mathbf{k}_{*}=\left[k\left(x_{i}, x^{*}\right)\right]_{x_{i} \in \mathbf{x}}k??=[k(xi?,x?)]xi?x?,其中x\mathbf{x}x是已有的采樣點(diǎn)集合,k(?,?)k(\cdot, \cdot)k(?,?)是內(nèi)核函數(shù),本文采用的是平方指數(shù)函數(shù)。那么μ(x?)\mu\left(x_{*}\right)μ(x??)σ2(x?)\sigma^{2}\left(x_{*}\right)σ2(x??)分別是函數(shù)在自變量x?x_{*}x??處的均值方差。

(2)Acquisition Function
前文提到要如何進(jìn)行采樣,Acquisition Funtion就是根據(jù)當(dāng)前的Prior Function獲取下一階段采樣的算法,文中分為MAXVAR\text{MAXVAR}MAXVAR算法和MAXMI\text{MAXMI}MAXMI算法.

那么論文中整個(gè)控制算法的偽代碼如下圖所示,我覺得有了前面的理解,對(duì)偽代碼的閱讀就沒那么困難了,只是可能復(fù)現(xiàn)出來還有一定難度:


其中x=(x0,?,xm)\mathbf{x}=\left(x_{0}, \cdots, x_{m}\right)x=(x0?,?,xm?)y=(y0,?,ym)\mathbf{y}=\left(y_{0}, \cdots, y_{m}\right)y=(y0?,?,ym?),我按照對(duì)算法的理解繪制了如下流程圖,便于理解:

最后實(shí)驗(yàn)結(jié)果部分就不介紹了,反正很牛逼就對(duì)了,這里是實(shí)驗(yàn)結(jié)果視頻,好啦,那么這篇paper就總結(jié)到這兒,不知道2019和2020有沒得更新的成果,花時(shí)間去找找,有問題歡迎交流~

總結(jié)

以上是生活随笔為你收集整理的论文阅读——《Exposure Control using Bayesian Optimization based on Entropy Weighted Image Gradient》的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。