人工智能在音频链中找到自己的声音
人工智能在音頻鏈中找到自己的聲音
AI finds its voice in audio chain
硅基silicon-based麥克風(fēng)的出現(xiàn)重塑了音頻領(lǐng)域。但在未來幾年,市場(chǎng)研究公司Yole Dédevelopment堅(jiān)信人工智能將引領(lǐng)市場(chǎng)的演變和變革。
對(duì)話是自然的,這就是為什么正在成為人機(jī)交互的主要界面。基于語音的個(gè)人助理(VPA)在智能手機(jī)、智能揚(yáng)聲器、智能手表、無線耳機(jī)、汽車、智能電視及其遙控器等領(lǐng)域越來越受歡迎。現(xiàn)在甚至有垃圾桶集成了語音識(shí)別。采用曲線將在未來增長,真正的價(jià)值在于高音質(zhì)和對(duì)話筒周圍環(huán)境的了解。
對(duì)于yoledédevelopement(法國里昂)來說,音頻是下一個(gè)被人工智能(AI)入侵的部分。
How AI has found its voice
人工智能如何找到自己的聲音
基于語音的VPA是當(dāng)今音頻行業(yè)的主要驅(qū)動(dòng)力。基于音頻系統(tǒng)的傳統(tǒng)組件,如音頻編解碼器、麥克風(fēng)、微型揚(yáng)聲器和音頻放大器,還使用人工智能來計(jì)算和分析語音數(shù)據(jù)。計(jì)算機(jī)支持復(fù)雜的音頻功能,如語音識(shí)別和源定位。可以在云端執(zhí)行,也可以在消費(fèi)者設(shè)備的邊緣執(zhí)行。分析是在云端進(jìn)行的,需要很高的處理能力和對(duì)大量數(shù)據(jù)的訪問。
“人工智能的附加值用于自然語言處理,”Yole光子學(xué)和傳感部門的技術(shù)和市場(chǎng)分析師Dimitrios Damianos說。“聲音是與機(jī)器互動(dòng)的更自然的方式。不必使用鍵盤。不用用手。不過,要做到這一點(diǎn),還需要做大量的處理才能理解用戶在說什么、語言以及意思。“人工智能正在增加解碼的價(jià)值,并幫助與設(shè)備進(jìn)行通信。”
當(dāng)被問及VPA的快速滲透時(shí),Damianos將其歸因于其便利性和高效性。但是,當(dāng)然,“相信并正在看到的是,像谷歌、蘋果、Facebook、亞馬遜和微軟(統(tǒng)稱為GAFAM)這樣的大型科技公司試圖推廣這些VPA,因?yàn)樘崛〉臄?shù)據(jù)具有真正的價(jià)值。”
對(duì)于用戶來說,音頻比圖像更容易被接受。Yole MEMS和傳感器部門的技術(shù)和市場(chǎng)分析師亞歷克西斯·德布雷(Alexis Debray)繼續(xù)說,認(rèn)為音頻“干擾性較小,因此這是GAFAM(主要業(yè)務(wù)是數(shù)據(jù))向人收集數(shù)據(jù)的好方法。”。“一些公司用數(shù)據(jù)做生意,而另一些公司則用隱私和技術(shù)來確保用戶的隱私。”例如,蘋果鼓吹隱私,并將其作為一種強(qiáng)大的營銷資產(chǎn)。
Damianos說,大型科技公司的實(shí)際價(jià)值在于從環(huán)境中盡可能多地提取信息,這意味著VPA不僅能傾聽用戶的聲音,還可以傾聽周圍的環(huán)境,了解環(huán)境。例如,“如果在廚房里,麥克風(fēng)可以聽到刀架在柜臺(tái)上的聲音,并立即理解在廚房里并提出菜譜建議。”這就是會(huì)話式人工智能。
對(duì)話式人工智能之后的下一步很可能是全意識(shí),虛擬助手,無論是智能揚(yáng)聲器還是智能手表,都能像人類一樣與用戶進(jìn)行交流。達(dá)米亞諾斯說,完全的意識(shí)是概念性的,并伴隨著問號(hào)。“還不知道時(shí)間表,但也許會(huì)在對(duì)話人工智能之后,在5到6年內(nèi)到達(dá)。這將取決于人工智能的進(jìn)步和該領(lǐng)域的公司(不斷發(fā)展)。”
雖然這些始終監(jiān)聽的系統(tǒng)可以挽救汽車人機(jī)界面的生命,但也引起了對(duì)用戶隱私保護(hù)的擔(dān)憂。為了防止可能的誤用,德布雷強(qiáng)調(diào),數(shù)據(jù)處理應(yīng)盡快進(jìn)行,并盡可能靠近麥克風(fēng)。“越靠近麥克風(fēng)進(jìn)行治療,隱私泄露的可能性就越小。”
隱私包括多個(gè)維度,因?yàn)橛脩艨赡芟M[藏其性別、年齡或情感。展望未來,德布雷說,相信麥克風(fēng)、ASIC或應(yīng)用處理器領(lǐng)域的玩家將開發(fā)出保證用戶隱私的技術(shù)。然后,麥克風(fēng)可以消除聲音中的情緒,只呈現(xiàn)音頻數(shù)據(jù)。
Yole分析師預(yù)計(jì),GAFAM將繼續(xù)占據(jù)主導(dǎo)地位,因?yàn)槟壳癎AFAM對(duì)分析至關(guān)重要,但傳感器制造商顯然急于將人工智能納入邊緣領(lǐng)域,并將音頻分析業(yè)務(wù)從云端分流出去。達(dá)米亞諾斯說:“傳感器制造商希望增加收入,從音頻這塊蛋糕中分一杯羹。”。“這不是大公司方面的戰(zhàn)斗。這是傳感器公司的一場(chǎng)戰(zhàn)斗。”
傳感器公司確實(shí)在追求多元化的戰(zhàn)略,“試圖在價(jià)值鏈中移動(dòng),并更加整合,”亞歷克西斯·德布雷評(píng)論道。
在最近的一次采訪中,Vesper Technologies Inc.首席執(zhí)行官馬特·克勞利(Matt
Crowley)表示,該公司正在尋求提高其壓電MEMS話筒的智能化程度。“相信,在未來,將在傳感器中嵌入一些人工智能配對(duì)的傳感器。將能夠?qū)W習(xí)人類和動(dòng)物如何利用感官——不僅僅是視覺、聽覺、味覺、嗅覺和觸覺,還包括運(yùn)動(dòng)或溫度——來了解環(huán)境。長期愿景是,物體將使用多種生物感應(yīng)傳感器來了解其環(huán)境,并盡可能以最佳方式做出響應(yīng)。”
英飛凌公司(Infineon AG)也改變了自己的商業(yè)模式,從向歌爾泰克(Goertek)和AAC(AAC)等播放器銷售麥克風(fēng)芯片,轉(zhuǎn)向銷售整套MEMS話筒。從MEMS麥克風(fēng)制造商到從事制造、包裝、測(cè)試和銷售的集成播放器。“這是一個(gè)戰(zhàn)略上的改變,[…]這可能意味著看到了VPA的動(dòng)向,希望在這個(gè)市場(chǎng)上占據(jù)一席之地。”
同樣,今天在MEMS麥克風(fēng)市場(chǎng)占有39%份額的領(lǐng)導(dǎo)者Knowles最近從Ams AG收購了MEMS麥克風(fēng)ASIC設(shè)計(jì)部門。這是引進(jìn)混合信號(hào)電路設(shè)計(jì)知識(shí)產(chǎn)權(quán)的一種方式,同時(shí)也可以對(duì)抗來自中國公司(如Goertek和AAC)日益激烈的競(jìng)爭(zhēng)。
MEMS microphones pump the volumes
MEMS麥克風(fēng)可以泵送音量
全球音頻市場(chǎng)繼續(xù)增長。由于基于語音的vpa需要更好的信噪比(SNR)來準(zhǔn)確捕捉噪聲環(huán)境中的人聲,MEMS麥克風(fēng)迎來了新的市場(chǎng)機(jī)遇。
據(jù)Yole稱,全球麥克風(fēng)、微型揚(yáng)聲器和音頻IC的消費(fèi)市場(chǎng)預(yù)計(jì)將以6.6%的復(fù)合年增長率健康增長,從2018年的141億美元增長到2024年的208億美元。由于價(jià)格便宜、體積小、易于集成,麥克風(fēng)被廣泛采用并達(dá)到極高的音量。達(dá)米亞諾斯說:“使用大約60億個(gè)麥克風(fēng)。麥克風(fēng)市場(chǎng)目前占17億美元,預(yù)計(jì)2024年復(fù)合年增長率為3%,達(dá)到20億美元。
MEMS麥克風(fēng)市場(chǎng)目前約占總量的70%,將從2018年的12億美元增長到2024年的16億美元。主要驅(qū)動(dòng)市場(chǎng)包括智能手機(jī)、智能音箱和聽筒(如無線耳機(jī))。“在過去的幾年里,智能音箱和聽得見的市場(chǎng)經(jīng)歷了爆炸性的增長,”達(dá)米亞諾斯說。基本上,到2024年,智能音箱中的MEMS麥克風(fēng)將以13%的復(fù)合年增長率增長到12億臺(tái)。在無線耳塞領(lǐng)域,將以29%的復(fù)合年增長率增長,到2024年達(dá)到13億部。
與此同時(shí),據(jù)Yole稱,目前市場(chǎng)規(guī)模達(dá)91億美元的微型揚(yáng)聲器市場(chǎng)預(yù)計(jì)2024年將以3%的復(fù)合年增長率增長至109億美元。
達(dá)米亞諾斯說:“這似乎是一個(gè)溫和的增長。”。但是,在2018年和2019年,智能手機(jī)市場(chǎng)放緩,可能是因?yàn)橹悄苁謾C(jī)越來越貴,用戶在升級(jí)之前等待的時(shí)間更長。繼續(xù)說:“以前每1.5年更換一次手機(jī),現(xiàn)在是每2.5年更換一次,而且還在增加。”。“預(yù)計(jì)麥克風(fēng)和微型揚(yáng)聲器市場(chǎng)會(huì)下降。”事實(shí)上,“聽筒和智能音箱的爆炸式增長抵消了這一差異。VPA正在推動(dòng)所有這些設(shè)備中麥克風(fēng)和微型揚(yáng)聲器的集成。”
達(dá)米亞諾斯總結(jié)道:時(shí)間在變。
總結(jié)
以上是生活随笔為你收集整理的人工智能在音频链中找到自己的声音的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 边缘的人工智能可以满足许多需求
- 下一篇: 定制语音代理(智能体)的背后是什么?