Acoustics | 声音时间检测:日常声音理解
前言
本文根據書籍:
Computational Analysis of Sound Scenes and Events
翻譯完成,推薦大家去讀原著!
開始
日常生活很少有寧靜的時候,大多數情況下,都會有產生不同聲音的事件不斷出現,在時頻域上重疊后通過傳入麥克風或我們的耳朵,它們可能是從遠處傳來的,或被反射的,或被障礙物衍射后的聲音信號。這種復雜的聲學陣列(acoustic array)即構成了聲音場景(auditory scene)。
比如,幻想你在家里和朋友孩子享受假期。這時的聲音場景是非常集中和嘈雜的,它可能由不同的對話和噪聲組成。然而,作為傾聽者的你卻有能力解析這個特定的場景:你可以從嘈雜的背景中輕易區分并識別出不同的聲音事件(sound events),它們可能是不同的對話、背景音樂、碰杯聲,甚至是孩子玩鬧是弄出的古怪爆破聲。聽你一邊朋友的對話,或者在聽聽另一邊朋友又聊了什么,你甚至能同時聽著你孩子鬧出的動靜,別讓他們捅了簍子。這是典型雞尾酒吧效應(cocktail party effect)。
本節的主要目的在于描述這些不同時間的潛在物理屬性,并對一些基本的心理聲學概念做出總結,同時我們也會概述一些聲學認知模型,闡述他們具有哪些處理、解析和從聲音場景中,感知聲音時間的能力。
雖然人對語音和音樂的感知已經在很長的一段時間內,被當作正式的研究目標,但日常場景和事件的感知的研究才剛剛起步 (Everyday listening)。這里,日常信號指的是非音樂,非語音的,發生在日常環境中的聲音信號。日常聽覺最主要的特征就是其以認知為目標—即其研究的主要目標是感受聽眾身邊的環境,和發生的事情。它通過區分和識別不同的聲音時間,來對不同的聲音環境(場景)進行劃分。相較而言,音樂感知更注重音樂信號的聲音質量(或音色),而不對聲源做精確識別;語音聽覺主要著手于解碼語音中暗含的語言信息,和對說話人進行識別,包括說話人的身份、性別、情緒等。
總結
以上是生活随笔為你收集整理的Acoustics | 声音时间检测:日常声音理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么你的大数据项目会失败?
- 下一篇: 光伏产业红与黑 需求寒冬背后暗藏分布式春