音频识别知识:采样
1 音頻采樣 AD
????????數(shù)碼音頻系統(tǒng)是通過(guò)將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)據(jù)來(lái)再現(xiàn)原始聲音的,實(shí)現(xiàn)這個(gè)步驟使用的設(shè)備是模/數(shù)轉(zhuǎn)換器(A/D)它以每秒上萬(wàn)次的速率對(duì)聲波進(jìn) 行采樣,每一次采樣都記錄下了原始模擬聲波在某一時(shí)刻的狀態(tài),稱之為樣本。將一串的樣本連接起來(lái),就可以描述一段聲波了,把每一秒鐘所采樣的數(shù)目稱為采樣 頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當(dāng)于音調(diào)),可以用數(shù)字波形表示。以波形表示的頻 率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數(shù)和采樣的頻率。?
2 采樣位數(shù) 采樣精度
????????采樣位數(shù)可以理解為采集卡處理聲音的解析度。這個(gè)數(shù)值越大,解析度就越高,錄制和回放的聲音就越真實(shí)。我們首先要知道:電腦中的聲音文件是用數(shù)字0和1來(lái) 表示的。所以在電腦上錄音的本質(zhì)就是把模擬聲音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)。反之,在播放時(shí)則是把數(shù)字信號(hào)還原成模擬聲音信號(hào)輸出。采集卡的位是指采集卡在采集和 播放聲音文件時(shí)所使用數(shù)字聲音信號(hào)的二進(jìn)制位數(shù)。采集卡的位客觀地反映了數(shù)字聲音信號(hào)對(duì)輸入聲音信號(hào)描述的準(zhǔn)確程度。8位代表2的8次方--256,16 位則代表2的16次方--64K。比較一下,一段相同的音樂(lè)信息,16位聲卡能把它分為64K個(gè)精度單位進(jìn)行處理,而8位聲卡只能處理256個(gè)精度單位, 造成了較大的信號(hào)損失,最終的采樣效果自然是無(wú)法相提并論的。?
3 音頻采樣頻率 Fs
????????數(shù)碼音頻系統(tǒng)是通過(guò)將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)據(jù)來(lái)再現(xiàn)原始聲音的,實(shí)現(xiàn)這個(gè)步驟使用的設(shè)備是模/數(shù)轉(zhuǎn)換器(A/D)它以每秒上萬(wàn)次的速率對(duì)聲波進(jìn) 行采樣,每一次采樣都記錄下了原始模擬聲波在某一時(shí)刻的狀態(tài),稱之為樣本。將一串的樣本連接起來(lái),就可以描述一段聲波了,把每一秒鐘所采樣的數(shù)目稱為采樣 頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。 采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。在當(dāng)今的主流采集卡上,采樣頻率一般共分為 22.05KHz、44.1KHz、48KHz三個(gè)等級(jí),22.05 KHz只能達(dá)到FM廣播的聲音品質(zhì),44.1KHz則是理論上的CD音質(zhì)界限,48KHz則更加精確一些。對(duì)于高于48KHz的采樣頻率人耳已無(wú)法辨別出 來(lái)了,所以在電腦上沒(méi)有多少使用價(jià)值
4 WAV音頻格式文件大小、播放時(shí)間換算
????????采樣率一般是44.1K,16bit采樣精度,存儲(chǔ)成WAV格式大小 = 44.1KHz(采樣率) X 16bit(采樣精度) X 2(雙聲道) X ?播放時(shí)間
????????WAV格式是沒(méi)有壓縮無(wú)損的,MP3格式是按1:12壓縮保存的,所以MP3格式大小等于上式的1/12。
總結(jié)
- 上一篇: 人工智能简史(Rockwell Anyo
- 下一篇: halcon知识:图标对象如何存盘和读入