日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

声音编码

發(fā)布時(shí)間:2023/12/18 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 声音编码 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.脈沖編碼調(diào)制PCM文件格式簡(jiǎn)介

將音頻數(shù)字化,其實(shí)就是將聲音數(shù)字化。最常見的方式是透過脈沖編碼調(diào)制PCM(Pulse Code Modulation) 。運(yùn)作原理如下。首先我們考慮聲音經(jīng)過麥克風(fēng),轉(zhuǎn)換成一連串電壓變化的信號(hào),如圖一所示。這張圖的橫座標(biāo)為秒,縱座標(biāo)為電壓大小。要將這樣的信號(hào)轉(zhuǎn)為 PCM 格式的方法,是使用三個(gè)參數(shù)來表示聲音,它們是:聲道數(shù)采樣位數(shù)采樣頻率

?????????采樣頻率即取樣頻率,指每秒鐘取得聲音樣本的次數(shù)。采樣頻率越高,聲音的質(zhì)量也就越好,聲音的還原也就越真實(shí),但同時(shí)它占的資源比較多。由于人耳的分辨率很有限,太高的頻率并不能分辨出來。在16位聲卡中有22KHz、44KHz等幾級(jí),其中,22KHz相當(dāng)于普通FM廣播的音質(zhì),44KHz已相當(dāng)于CD音質(zhì)了,目前的常用采樣頻率都不超過48KHz。?

????????采樣位數(shù)即采樣值或取樣值(就是將采樣樣本幅度量化)。它是用來衡量聲音波動(dòng)變化的一個(gè)參數(shù),也可以說是聲卡的分辨率。它的數(shù)值越大,分辨率也就越高,所發(fā)出聲音的能力越強(qiáng)。
 
?????????聲道數(shù)很好理解,有單聲道和立體聲之分,單聲道的聲音只能使用一個(gè)喇叭發(fā)聲(有的也處理成兩個(gè)喇叭輸出同一個(gè)聲道的聲音),立體聲的pcm可以使兩個(gè)喇叭都發(fā)聲(一般左右聲道有分工) ,更能感受到空間效果。?
??
  下面再用圖解來看看采樣位數(shù)和采樣頻率的概念。讓我們來看看這幾幅圖。圖中的黑色曲線表示的是pcm文件錄制的自然界的聲波,紅色曲線表示的是pcm文件輸出的聲波,橫坐標(biāo)便是采樣頻率;縱坐標(biāo)便是采樣位數(shù)。這幾幅圖中的格子從左到右,逐漸加密,先是加大橫坐標(biāo)的密度,然后加大縱坐標(biāo)的密度。顯然,當(dāng)橫坐標(biāo)的單位越小即兩個(gè)采樣時(shí)刻的間隔越小,則越有利于保持原始聲音的真實(shí)情況,換句話說,采樣的頻率越大則音質(zhì)越有保證;同理,當(dāng)縱坐標(biāo)的單位越小則越有利于音質(zhì)的提高,即采樣的位數(shù)越大越好。

????????在計(jì)算機(jī)中采樣位數(shù)一般有8位和16位之分,但有一點(diǎn)請(qǐng)大家注意,8位不是說把縱坐標(biāo)分成8份,而是分成2的8次方即256份; 同理16位是把縱坐標(biāo)分成2的16次方65536份; 而采樣頻率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三種。

樣點(diǎn) t1 t2 t3 t4 t5 t6 t7 ... t16 t17 t18 t19 t20
幅值 0011 0101 0111 1001 1011 1101 1110 ... 0110 0110 0101 0011 0000


????????那么,現(xiàn)在我們就可以得到pcm文件所占容量的公式:
     存儲(chǔ)量=(采樣頻率*采樣位數(shù)*聲道)*時(shí)間/8(單位:字節(jié)數(shù))

  例如,數(shù)字激光唱盤(CD-DA,紅皮書標(biāo)準(zhǔn))的標(biāo)準(zhǔn)采樣頻率為44.lkHz,采樣數(shù)位為16位,立體聲(2聲道),可以幾乎無失真地播出頻率高達(dá)22kHz的聲音,這也是人類所能聽到的最高頻率聲音。激光唱盤一分鐘音樂需要的存儲(chǔ)量為:     
     (44.1*1000*l6*2)*60/8=10,584,000(字節(jié))=10.584MBytes
這個(gè)數(shù)值就是pcm聲音文件在硬盤中所占磁盤空間的存儲(chǔ)量。

  計(jì)算機(jī)音頻文件的格式?jīng)Q定了其聲音的品質(zhì),日常生活中電話、收音機(jī)等均為模擬音頻信號(hào),即不存在采樣頻率和采樣位數(shù)的概念,我們可以這樣比較一下:
????????44KHz,16BIT的聲音稱作:CD音質(zhì);
????????22KHz、16Bit的聲音效果近似于立體聲(FM Stereo)廣播,稱作:廣播音質(zhì);
????????11kHz、8Bit的聲音,稱作:電話音質(zhì)。?
????????微軟的WAV文件就是pcm編碼的一種。

?

2.數(shù)字音頻基礎(chǔ)知識(shí)
? 麥克風(fēng)錄音的過程其實(shí)就是將模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào)的過程,其中涉及的一些概念如下:
?1.采樣率(Sampling Rate)
??? 采樣率指聲卡在一秒之中對(duì)聲音(波形)作記錄的次數(shù),根據(jù)研究聲音播出時(shí)的質(zhì)量常常只能達(dá)到采樣率的一半,因此必須采取雙倍的采樣率才能將聲音標(biāo)準(zhǔn)重現(xiàn).也就是只要采樣率大于原始信號(hào)頻率的兩倍以上即可減低錯(cuò)誤,達(dá)到和原始聲音差不多的質(zhì)量.人的聽力大概是20KHZ,所以高品質(zhì)的采樣率應(yīng)為其兩倍以上.
??? 當(dāng)聲音來源為音樂時(shí),因?yàn)樗鶛M跨的頻率變化極為寬廣,通常以44.1KHZ的頻率為CD音樂采樣率的標(biāo)準(zhǔn).但是若以語言為主由于人說話的語音大概是10KHZ,因此加倍采樣,只取22KHZ即可,采樣率越高所記錄下來的音質(zhì)就越清晰,當(dāng)然,越高的采樣所記錄下的文件就越大.
?2.采樣位
??? 解析度決定了采樣的音波是否能保持原來的形狀,越接近原型則需解析度越高,若以8位來采樣的話其能表達(dá)的組合種類是2的8次方,即256,表示用8位的采樣大小能分辨出256個(gè)層次的聲音,若用16位來采樣,則能分辨的差異將高達(dá)2的16次方,為65536,其精度自然大為提高.16位,8位采樣的差別在于動(dòng)態(tài)范圍的寬窄,動(dòng)態(tài)范圍寬廣,音量起伏的大小變化就能夠更精細(xì)的被記錄下來,如此一來不論是細(xì)微的聲音或是強(qiáng)烈的動(dòng)感震撼,都可以表現(xiàn)的淋漓盡致,而CD音質(zhì)的采樣規(guī)格正式16位采樣的規(guī)格.
?3. 量化誤差(Quantization error)?
?????? 在采樣的過程中,不斷連續(xù)變化的模擬信號(hào)要用數(shù)字化的數(shù)值來表示,這樣的過程就會(huì)發(fā)生所謂的量化誤差(Quantization error).所謂的量化誤差指的是實(shí)際的信號(hào)的振幅(smplitude)和數(shù)字化之后所的數(shù)字之間的差異.如果用將數(shù)字信號(hào)還原成模擬信號(hào)的角度看,量化誤差就是失真(Distortion).我們可以用增加采樣大小的方式來降低量化誤差,也就是更多的位(bits)來表示一個(gè)采樣信號(hào),這樣可以提高精度.
?4. 量化(Quantization), 線性量化法(Linear quantization)和非線性量化法(Nonlinear quantization)
?????? 所謂的量化(Quantization)就是將模擬信號(hào)所代表的連續(xù)范圍分成一段一段的區(qū)間(Interval),每一段區(qū)間我們定義一個(gè)數(shù)字化的值.區(qū)間的數(shù)目是跟采樣大小有關(guān),舉例來說,有一種最簡(jiǎn)單的量化法稱為”線性量化法”(Linear quantization),這種量化法采用等距離的間隔空間,架設(shè)一個(gè)訊號(hào)它的最大值是5.0,采樣大小為3位,則每個(gè)量化區(qū)間就時(shí)5.0/2^3,也就是0.625單位.另外一種相反的量化方法就是”非線性量化法”(Nonlinear quantization),這種量化法采用不同的間隔空間.以”對(duì)數(shù)量化法”(Logarithm quantization)為例.低振幅范圍的量化區(qū)間就比高振幅的范圍的區(qū)間較為接近,用這種量化的法產(chǎn)生的結(jié)果就是在低振幅時(shí)我們會(huì)得到佳好的效果.通常如果使用同樣的采樣大小,非線性量化法會(huì)比線性量化法得到更好的聲音品質(zhì).但是如果是要對(duì)聲音做濾波(filtered)或一些運(yùn)算的時(shí)候,使用線性量化法會(huì)比較容易處理.
?5. 聲音強(qiáng)度?
???????? 波形振幅的平方.兩個(gè)聲音強(qiáng)度上的差常以分貝(db)為單位來度量,計(jì)算公式如下:
??? 20*log(A1/A2)分貝,A1,A2為兩個(gè)聲音的振幅.
a.如果采樣大小為8位,則采樣的動(dòng)態(tài)范圍為20*log(256)分貝=48db;
b.如果樣本大小為16位,則采樣動(dòng)態(tài)范圍為20*log(65536)大約是96分貝,接近了人聽覺極限和痛苦極限,是再線音樂的理想范圍,windows同時(shí)支持8位和16位的采樣大小.

?6. 音頻編碼方法
????? 目前已經(jīng)發(fā)展了許多音頻編碼的方法用以減少存儲(chǔ)量或是傳輸?shù)臅r(shí)間,以下所列為兩種較普遍的編碼方法:
?? a.PCM(Pulse code modulation);
脈沖編碼調(diào)制,即對(duì)波形按照固定周期頻率采樣。為了保證采樣后數(shù)據(jù)質(zhì)量,采樣頻率必須是樣本聲音最高頻率的兩倍,這就是Nyquist頻率.
?? b.ADPCM(Adaptive delta pulse modulation).

碼率高低直接影響音質(zhì),碼率高音質(zhì)好,碼率低音質(zhì)差。

碼率就是數(shù)據(jù)傳輸時(shí)單位時(shí)間傳送的數(shù)據(jù)位數(shù),一般我們用的單位是kbps即千位每秒。

通俗一點(diǎn)的理解就是取樣率,單位時(shí)間內(nèi)取樣率越大,精度就越高,處理出來的文件就越接近原始文件,但是文件體積與取樣率是成正比的,所以幾乎所有的編碼格式重視的都是如何用最低的碼率達(dá)到最少的失真,圍繞這個(gè)核心衍生出來的cbr(固定碼率)與vbr(可變碼率),都是在這方面做的文章,不過事情總不是絕對(duì)的,從音頻方面來說,碼率越高,被壓縮的比例越小,音質(zhì)損失越小,與音源的音質(zhì)越接近。
計(jì)算機(jī)中的信息都是二進(jìn)制的0和1來表示,其中每一個(gè)0或1被稱作一個(gè)位,用小寫b表示,即bit(位);大寫B(tài)表示byte,即字節(jié),一個(gè)字節(jié)=八個(gè)位,即1B=8b;前面的大寫K表示千的意思,即千個(gè)位(Kb)或千個(gè)字節(jié)(KB)。表示文件的大小單位,一般都使用字節(jié)(KB)來表示文件的大小。

Kbps:首先要了解的是,ps指的是/s,即每秒。Kbps指的是網(wǎng)絡(luò)速度,也就是每秒鐘傳送多少個(gè)千位的信息(K表示千位,Kb表示的是多少千個(gè)位),為了在直觀上顯得網(wǎng)絡(luò)的傳輸速度較快,一般公司都使用kb(千位)來表示,如果是KBps,則表示每秒傳送多少千字節(jié)。1KBps= 8Kbps。ADSL上網(wǎng)時(shí)的網(wǎng)速是512Kbps,如果轉(zhuǎn)換成字節(jié),就是512/8=64KBps(即64千字節(jié)每秒)。

一幀就是一副靜止的畫面,連續(xù)的幀就形成動(dòng)畫,如電視圖象等。
我們通常說幀數(shù),簡(jiǎn)單地說,就是在1秒鐘時(shí)間里傳輸?shù)膱D片的幀數(shù),也可以理解為圖形處理器每秒鐘能夠刷新幾次,通常用fps(Frames Per Second)表示。每一幀都是靜止的圖象,快速連續(xù)地顯示幀便形成了運(yùn)動(dòng)的假象。高的幀率可以得到更流暢、更逼真的動(dòng)畫。每秒鐘幀數(shù) (fps) 愈多,所顯示的動(dòng)作就會(huì)愈流暢。

何謂音樂的比特率?
也可以叫碼率,無非就是一種音樂每秒播放的數(shù)據(jù)量,單位用bit表示,也就是二進(jìn)制位。 bps就是比特率。b就是比特(bit),s就是秒(second),p就是每(per),一個(gè)字節(jié)相當(dāng)于8個(gè)二進(jìn)制位。也就是說128bps的4分鐘的歌曲的文件大小是這樣計(jì)算的(128/8)*4*60=3840kB=3.8MB,也就是說同樣比特率(bps)的同一歌曲不論是什么格式(如mp3 wma)容量大小都是基本一樣的,這只能代表一種傳輸率,并不能代表音質(zhì),由于壓縮引擎的不同,不同格式的音質(zhì)又千差萬別。但同格式來說比特率也高代表文件也就越大,相對(duì)來說音質(zhì)也就越好。

何謂音樂的采樣率?
采樣率是指在單位時(shí)間的采樣數(shù)。采樣速率為44KHz,說明每秒采樣數(shù)量為44K個(gè),這是也就是用44000個(gè)數(shù)據(jù)來描述1秒內(nèi)的聲音波形。也就是說采樣率越高音質(zhì)也是越好。但是他同比特率是完全不同的兩個(gè)概念。

比特率越高音質(zhì)越高,文件大小也越大,但是源音文件的質(zhì)量決定最終質(zhì)量
從高往低轉(zhuǎn),音質(zhì)會(huì)變差,但從低往高轉(zhuǎn)音質(zhì)最多不變 但是文件卻會(huì)變大很多

一般mp3在128比特率左右為益,也大概在3-4 BM左右的大小

碼率,選擇他直接影響到你的mp3文件尺寸大小和聽感,壓縮比高的失真大,壓縮比小的失真小,但是怎么才能找到一個(gè)我們自己兩方面都能接受的平衡點(diǎn)呢?這就需要在實(shí)驗(yàn)里仔細(xì)摸索,考慮到低碼率的文件聲音素質(zhì)不太適合播放音樂,所以最低定為128kbps,依次使用128、192、256、320共四種固定碼率的文件來進(jìn)行對(duì)比和測(cè)試。

128kbps的壓縮比還是比較粗糙的,高頻部分壓縮后失真非常明顯,聽起來空洞,干癟、刺耳,還時(shí)常有忽悠忽悠的聲音,樂器的質(zhì)感很差,部分樂器都變了味道,甚至可能會(huì)聽錯(cuò),3分39的一段樂曲壓縮后的體積是3414kb,體積雖然不大但是聲音不能讓人滿意,存在比較大的缺陷。


192kbps碼率的壓縮效果比起128來說可是要好多了,首先聲音扎實(shí),至少?zèng)]有那種空洞感,高頻失真也小了很多,聲音緊湊,雜音小,干凈,達(dá)到了相對(duì)比較理想的聽音效果,只是由于壓縮還是比較厲害,細(xì)節(jié)的表現(xiàn)仍舊不是很好,樂器尤其是管樂器的質(zhì)感還是很硬,不真實(shí),缺乏樂感,壓縮后的尺寸是5123kb,我覺得這個(gè)壓縮比例在128~~256m容量的mp3播放器上使用比較好,既可以滿足基本的聽感,也在尺寸上合適,128m大約能存儲(chǔ)95分鐘的音樂,256m則翻倍為190分鐘的音樂。


256kbps的壓縮率比起192自然是在音質(zhì)上更上了一個(gè)臺(tái)階,就拿曲目剛開始的10秒鐘說,大提琴部的低頻明顯顆粒感就小了很多,聲音更加順滑自然,質(zhì)感和紋理也更加清楚一些,細(xì)節(jié)方面多了不少,氣氛的渲染比較突出,后面的曲子進(jìn)行中的聲部輪換也表現(xiàn)力起來許多,大信號(hào)小信號(hào)的清晰度也提升一些,聲音更加細(xì)致耐聽,但是與此同時(shí),文件的體積也一下子增加到了6831kb,這對(duì)于256m的mp3播放器來說還是可以承受的,計(jì)算一下不難知道,按照256的碼率可以存放約135分鐘的音樂,一般來說也是夠用了,128m就有點(diǎn)少了,只能支持一個(gè)小時(shí)多一點(diǎn),所以推薦128m的使用192碼率。


320kbps是lame能夠提供的最大碼率了,最終的生成文件是8592kb,大概就是8.4M,對(duì)比wav文件的37M來說,壓縮比基本為4.5:1,但是生成的mp3文件聽起來已經(jīng)失真非常小了,對(duì)比其他碼率320的自然優(yōu)勢(shì)明顯,音色,細(xì)節(jié)等等都非常細(xì)膩,基本是達(dá)到了原樣復(fù)制了cd的聲音素質(zhì),特別在帶有mp3播放功能的cd播放器上上聽起來,基本沒有什么區(qū)別,不過我使用了比較高檔的耳塞,解析力比較高,再加上我對(duì)音樂和器材的經(jīng)驗(yàn)和能力,對(duì)比wav文件還是聽出了許多不同,首先;壓縮過的mp3聽起來有點(diǎn)縮水的感覺,整體比較干,沒有wav文件聽起來鮮活充滿動(dòng)感,末端細(xì)節(jié)、泛音和空間感上,分離度上也不及wav文件來的素質(zhì)高,不過在音色上已經(jīng)算是相當(dāng)接近了,只是表現(xiàn)力上面差一些,數(shù)碼味道比較濃重。所以如果您使用的是ipod等這類微型硬盤式的隨身聽播放器,那我還是推薦您使用320kbps的壓縮比率,這樣可以得到相對(duì)最好的聆聽感覺,當(dāng)然直接聽wav是最好的啦~~無壓縮,沒損失,可惜現(xiàn)在還沒什么隨身聽支持ape這種無損壓縮,不然又可以多種選擇了。

1、 APE:


APE格式:Monkey""s Audio(www.monkeysaudio.com),簡(jiǎn)單的說ape是一種音頻的無損壓縮格式,大小只有wav文件的一半,但是音質(zhì)沒有絲毫降低。能夠在最大程度上還原CD的音質(zhì),當(dāng)然這也取決于抓軌的質(zhì)量 。如果抓軌的質(zhì)量好,ape的音質(zhì)就會(huì)和CD差不多這是mp3等有損壓縮無法達(dá)到的,當(dāng)然無損的代價(jià)就是體積的增大,1CD從200mb到400不等所以如果有足夠的帶寬的保證,ape給網(wǎng)友交流CD帶來了更多的方便,解決了許多古典音樂愛好者傳送高音質(zhì)CD的需求。一張80分鐘的音樂CD大小大約700M,這么大尺寸的傳輸,顯然是非常不方便的,這時(shí)用Monkey""s Audio-能把WAV文件壓縮成一半大小(甚至更小)的APE文檔,并且在理想狀態(tài)下,當(dāng)你把APE解壓成WAV,音質(zhì)沒有絲毫損失。


優(yōu)點(diǎn):壓縮率高;音質(zhì)無損;裝載插件后,可以用Winamp直接播放,音質(zhì)比任何參數(shù)的Mp3或Mp3 Pro更好。

缺點(diǎn):壓縮及解壓時(shí)間過長(zhǎng)。


2、 MP3 Pro


為了減低失真程度,MP3 Pro這種新MP3格式出現(xiàn)了。它將整個(gè)音頻頻段分離成中低頻和高頻兩個(gè)信道,由傳統(tǒng)MP3編碼器負(fù)責(zé)中低頻部分,而另一個(gè)采用SBR技術(shù)的(Spectral Band Replication/頻段復(fù)制)的譯碼器則負(fù)責(zé)高頻部分,最后兩者在MP3 Pro播放軟件中同時(shí)播放,從而得到顯著超過相同Bitrate的MP3之音質(zhì)。不但高頻細(xì)節(jié)豐富,顫抖的現(xiàn)象亦已不易覺察,與原始WAV文件非常接近。


MP3 Pro采用的SBR技術(shù),并非直接將音樂中的高頻分離出來并編碼那么簡(jiǎn)單,而是根據(jù)對(duì)原來編碼器所傳輸?shù)牡皖l訊號(hào)進(jìn)行分析,從而重新構(gòu)建出高頻訊號(hào)。


3、Real Audio
Real Audio,擴(kuò)展名RA:這種格式真可謂是網(wǎng)絡(luò)的靈魂,強(qiáng)大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計(jì)的,因此主要目標(biāo)是壓縮比和容錯(cuò)性,其次才是音質(zhì)。所以我們一般在網(wǎng)上遇到的新音樂試聽都是使用這中格式的。


3、 WMA

WMA就是Windows Media Audio編碼后的文件格式,由微軟開發(fā),WMA針對(duì)的不是單機(jī)市場(chǎng),是網(wǎng)絡(luò)!競(jìng)爭(zhēng)對(duì)手就是網(wǎng)絡(luò)媒體市場(chǎng)中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達(dá)到接近CD的音質(zhì)。和以往的編碼不同,WMA支持防復(fù)制功能,她支持通過Windows Media Rights Manager 加入保護(hù),可以限制播放時(shí)間和播放次數(shù)甚至于播放的機(jī)器等等。WMA支持流技術(shù),即一邊讀一邊播放,因此WMA可以很輕松的實(shí)現(xiàn)在線廣播,由于是微軟的杰作,因此,微軟在Windows中加入了對(duì)WMA的支持,WMA有著優(yōu)秀的技術(shù)特征,在微軟的大力推廣下,這種格式被越來越多的人所接受。比起ra來說,版權(quán)恐怕是所用用戶最討厭它的地方了。


4、 ACC:


AAC(高級(jí)音頻編碼技術(shù),Advanced Audio Coding)是杜比實(shí)驗(yàn)室為音樂社區(qū)提供的技術(shù)。AAC號(hào)稱「最大能容納48通道的音軌,采樣率達(dá)96 KHz,并且在320Kbps的數(shù)據(jù)速率下能為5.1聲道音樂節(jié)目提供相當(dāng)于ITU-R廣播的品質(zhì)」。和MP3比起來,它的音質(zhì)比較好,也能夠節(jié)省大約30%的儲(chǔ)存空間與帶寬。它是遵循MPEG-2的規(guī)格所開發(fā)的技術(shù)。松下的mp3產(chǎn)品都采用了這種編碼方式,當(dāng)然也兼容mp3格式,我自己使用時(shí)發(fā)現(xiàn)aac是非常好用的音頻格式,128kbps的aac足以和224kbps的mp3抗衡,空間卻小了差不多一半,但是在空間上和結(jié)構(gòu)上aac和mp3編碼出來后的風(fēng)格不太一樣,喜歡與否屬于仁者見仁智者見智的事情。


5、 ATRAC 3/ATRAC 3 plus:


ATRAC3(AdaptiveTransformAcousticCoding3)由日本索尼公司開發(fā),是MD所采用的ATRAC的升級(jí)版,其壓縮率(約為ATRAC的2倍)和音質(zhì)均與MP3相當(dāng)。壓縮原理包括同時(shí)掩蔽、時(shí)效掩蔽和等響度曲線等,與MP3大致相同。ATRAC3的版權(quán)保護(hù)功能采用的是OpenMG。目前,對(duì)應(yīng)ATRAC3的便攜式播放機(jī)主要是索尼公司自己的產(chǎn)品。不過,該公司已于2000年2月與富士通、日立、NEC、Rohm、三洋和TI等半導(dǎo)體制造商簽署了制造并銷售ATRAC3用LSI的專利許可協(xié)議。在mdlp壓縮中錄制cd和mp3相比,ATRAC3還是有一定的聲音優(yōu)勢(shì)的,但是版權(quán)問題使得使用不是很方便,ATRAC 3 plus由于算法先進(jìn),在音質(zhì)上得到了更一步的提高,但是只在sony的產(chǎn)品上有比較廣泛的應(yīng)用,這個(gè)讓人比較郁悶。


6、 VQF:


所謂VQF,是指TwinVQ(Transform-domain Weighted INterleave Vector Quantization),它是日本NTT(Nippon Telegraph and Telephone)集團(tuán)屬下的NTT Human Interface Laboratories開發(fā)的一種音頻壓縮技術(shù)。該技術(shù)受到著名的YAMAHA公司的支持。VQF是其文件的擴(kuò)展名。它和MP3的實(shí)現(xiàn)方法相似,都是通過采用有失真的算法來將聲音進(jìn)行壓縮,不過它與MP3的壓縮技術(shù)相比卻有著本質(zhì)上的不同:VQF的目的是對(duì)音樂而不是聲音進(jìn)行壓縮,因此,VQF所采用的是一種稱為"矢量化編碼(Vector Quantization)"的壓縮技術(shù)。該技術(shù)先將音頻數(shù)據(jù)矢量化,然后對(duì)音頻波形中相類似的波形部分統(tǒng)一與平滑化,并強(qiáng)化突出人耳敏感的部分,最后對(duì)處理后的矢量數(shù)據(jù)標(biāo)量化再進(jìn)行壓縮而成。我自己使用中感覺在低碼率情況下,還是vqf好用很多,比同等音質(zhì)的mp3體積小30%左右,但是高比特率就不太好了,所以也少有人使用它。


總結(jié)

以上是生活随笔為你收集整理的声音编码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。