睡眠音频分割及识别问题(十)--Java读取wav文件
簡介
Waveform Audio File Format(WAVE,又或者是因為擴展名而被大眾所知的 wav),是微軟與 IBM公司所開發(fā)在個人電腦存儲音頻流的編碼格式。
由于項目需要從 wav 文件中讀取音頻數(shù)據(jù),現(xiàn)有許多框架的 API 文檔參差不齊,學習成本過高且復用性不高,所以我們準備拋棄已有的API,利用java基礎(chǔ)io包構(gòu)建自己的API。
wav文件格式
為了利用java 原生 io包中的字節(jié)流讀取文件數(shù)據(jù)實現(xiàn)睡眠音頻的操作,最終在 IOS 平臺復現(xiàn)的目的,我們首先要了解 wav 文件內(nèi)容格式,充分理解wav文件管理音頻的原理。
wav文件遵守資源交換文件格式之規(guī)則,在文件的前 44(或 46)字節(jié)放置頭部(header),使播放器或編輯器能夠簡單掌握文件的基本信息,其內(nèi)容以區(qū)塊(chunk)為最小單位,每一區(qū)塊長度為 4 字節(jié),而區(qū)塊之上則由子區(qū)塊包裹,每一子區(qū)塊長度不拘,但須在前頭先宣告標簽及長度(字節(jié))。頭部的前 3 個區(qū)塊記錄文件格式及長度;接著第一個子區(qū)塊包含 8 個區(qū)塊,記錄聲道數(shù)量、采樣率等信息;接著第二個子區(qū)塊才是真正的音頻資料,長度則視音頻長度而定。內(nèi)容如下圖所示。
須注意的是,每個區(qū)塊的端序不盡相同,而音頻內(nèi)容本身則是采用小端序。
wav文件的讀取(java)
目前已經(jīng)實現(xiàn)數(shù)據(jù)的讀取,可以獲取音頻中的采樣點信息,以及音頻文件的相關(guān)描述信息。結(jié)果示例如下所示:
下一步工作
規(guī)范代碼格式,并嘗試閱讀重采樣原理,使用java源碼實現(xiàn)重采樣。
總結(jié)
以上是生活随笔為你收集整理的睡眠音频分割及识别问题(十)--Java读取wav文件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 先生,要点单吗? (HTTP协议概览)
- 下一篇: java美元兑换,(Java实现) 美元