变换编码(DCT)基本理解
圖像變換編碼是指將以空間域中像素形式描述的圖像轉換至變換域,以變換系數的形式加以表示。
大部分圖像是平坦區域和內容變換緩慢的區域,即大部分是直流和低頻,高頻比較少,所以適當的變換可以使圖像能量在空間域的分散分布轉換為在變換域的相對集中分布,以達到去除冗余的目的,結合量化,“z”掃描和熵編碼等其他編碼技術,可以獲得對圖像信息的有效壓縮。
DCT變換的基本思路是將圖像分解為8×8的子塊或16×16的子塊,并對每一個子塊進行單獨的DCT變換,然后對變換結果進行量化、編碼。隨著子塊尺寸的增加,算法的復雜度急劇上升,因此,實用中通常采用8×8的子塊進行變換,但采用較大的子塊可以明顯減少圖像分塊效應。
目前DCT是構成主流緩和編碼框架的一項基本技術,因為DCT變換形式與輸入信號無關且存在快速實現算法,HEVC沿用了H264的整數DCT,并進行了不同尺寸變換形式推廣,此外,為適應不同預測方式下殘差的分布情況,HEVC還引入了DST離散正弦變換。
傅里葉變換表明,任何信號都能表示為多個不同振幅和頻率的正弦波和余弦波信號的疊加,如果采用的是余弦就是余弦變換,若輸入信號是離散的就是離散余弦變換。
下圖給出了二維8*8DCT基圖像,其中左上角小圖像表示水平和垂直空間頻率均為0時的基圖像,在任一方向都木有灰度值的變化;其余小圖像分別對應于不同水平和垂直空間頻率的基圖像,如基圖像右下角小圖像對應于最高的水平和垂直頻率,這里像素灰度在水平和垂直方向發生連續變化,因此離散余弦變換可以解釋為:將任一8*8像素塊表示為下圖的64個基圖像中子像素塊的加權和,其權值即為對應位置的DCT系數。
HEVC使用了4種不同尺寸的整數DCT,分別為4*4、8*8、16*16、32*32
總結
以上是生活随笔為你收集整理的变换编码(DCT)基本理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图像编解码:CRF(质量/码率控制)和Q
- 下一篇: 对YUV4:2:0认识理解