當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Acoustics | 声音时间检测：日常声音理解

發布時間：2023/12/15 编程问答 67 豆豆

生活随笔收集整理的這篇文章主要介紹了 Acoustics | 声音时间检测：日常声音理解小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

本文根據書籍：
Computational Analysis of Sound Scenes and Events
翻譯完成，推薦大家去讀原著！

開始

日常生活很少有寧靜的時候，大多數情況下，都會有產生不同聲音的事件不斷出現，在時頻域上重疊后通過傳入麥克風或我們的耳朵，它們可能是從遠處傳來的，或被反射的，或被障礙物衍射后的聲音信號。這種復雜的聲學陣列(acoustic array)即構成了聲音場景(auditory scene)。

比如，幻想你在家里和朋友孩子享受假期。這時的聲音場景是非常集中和嘈雜的，它可能由不同的對話和噪聲組成。然而，作為傾聽者的你卻有能力解析這個特定的場景：你可以從嘈雜的背景中輕易區分并識別出不同的聲音事件(sound events)，它們可能是不同的對話、背景音樂、碰杯聲，甚至是孩子玩鬧是弄出的古怪爆破聲。聽你一邊朋友的對話，或者在聽聽另一邊朋友又聊了什么，你甚至能同時聽著你孩子鬧出的動靜，別讓他們捅了簍子。這是典型雞尾酒吧效應(cocktail party effect)。

本節的主要目的在于描述這些不同時間的潛在物理屬性，并對一些基本的心理聲學概念做出總結，同時我們也會概述一些聲學認知模型，闡述他們具有哪些處理、解析和從聲音場景中，感知聲音時間的能力。

雖然人對語音和音樂的感知已經在很長的一段時間內，被當作正式的研究目標，但日常場景和事件的感知的研究才剛剛起步 (Everyday listening)。這里，日常信號指的是非音樂，非語音的，發生在日常環境中的聲音信號。日常聽覺最主要的特征就是其以認知為目標—即其研究的主要目標是感受聽眾身邊的環境，和發生的事情。它通過區分和識別不同的聲音時間，來對不同的聲音環境（場景）進行劃分。相較而言，音樂感知更注重音樂信號的聲音質量（或音色），而不對聲源做精確識別；語音聽覺主要著手于解碼語音中暗含的語言信息，和對說話人進行識別，包括說話人的身份、性別、情緒等。

總結

以上是生活随笔為你收集整理的Acoustics | 声音时间检测：日常声音理解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：为什么你的大数据项目会失败？
下一篇：光伏产业红与黑需求寒冬背后暗藏分布式春