日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2021年1~12月语音合成和语音识别论文月报

發(fā)布時間:2024/1/8 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2021年1~12月语音合成和语音识别论文月报 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

?

論文統(tǒng)計每月更新一次,主要跟蹤語音合成和語音識別的發(fā)展狀況(很多文章都是在會議后才發(fā)出,但不影響統(tǒng)計。統(tǒng)計過程難免存在疏漏,因此統(tǒng)計結(jié)果僅供參考。所有文章語音合成領(lǐng)域統(tǒng)計列表請訪問http://yqli.tech/page/tts_paper.html,語音識別領(lǐng)域論文統(tǒng)計請訪問http://yqli.tech/page/asr_paper.html。如何查找語音資料請參考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。讀者有什么建議可以直接給我發(fā)消息,我將不斷修改該統(tǒng)計。如有轉(zhuǎn)載,請注明出處。歡迎關(guān)注微信公眾號:低調(diào)奮進。


(等兩天將會對語音合成論文進行年度總結(jié)~)

一 語音合成篇

首先,看一下語音合成每月的文章數(shù)量情況。語音合成在12月只有14篇文章,相比10和11月份下降很多。我本以為統(tǒng)計錯了,就重新搜索一次,本月的?合成文章的確很少。

接下來,看一下每個方向的具體情況。表一給出具體分類說明。由表二以及折線圖和柱狀圖可知,語音合成前端研究依然很少,當前在產(chǎn)業(yè)界對前端投入的也越來越少。合成領(lǐng)域在本月的聲學(xué)模型設(shè)計和優(yōu)化方向竟然為0,文章相對較多的方向包括音樂、vc和多模態(tài)都有三篇文章。

表一? 語音合成分類說明

分類

說明

前端

多音字,韻律,g2p等等。

聲學(xué)模型

語言特征轉(zhuǎn)聲學(xué)特征,attention工作,多說話人以及雙重學(xué)習

聲碼器

波形生成

個性化

少數(shù)據(jù),臟數(shù)據(jù)應(yīng)用等自適應(yīng)

多語言

多語言模型

歌唱合成

歌唱和音樂合成

情感

風格和情感

多模態(tài)

talking head等等

聲音轉(zhuǎn)換

基于GAN方案和特征解耦方案

S2S

?speech-to-speech

其它

基于EEG合成,數(shù)據(jù),MOS評測以及語音合成的應(yīng)用

表二 語音合成文章情況表(單位:篇)

接下來是相關(guān)的柱狀圖和折線圖

語音合成的文章列表請訪問http://yqli.tech/page/tts_paper.html

12月份的文章

二?語音識別篇

語音識別的文章分類統(tǒng)計依然在調(diào)整中,目前具體分類參照表三說明,本次添加robust和multichannel分類。表四為每個方向的具體文章數(shù)據(jù)量和本月的文章總量,其中12月份ASR相關(guān)的文章有34篇,跟11月份差不多。

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 表三? 語音識別分類說明

分類

說明

general

包括傳統(tǒng)、混合語音識別,以及對asr的優(yōu)化

ctc

ctc優(yōu)化

rnn-t

rnn-t的優(yōu)化

aed

aed優(yōu)化

dataset

開源數(shù)據(jù)庫

data aug

數(shù)據(jù)增廣

lm

語言模型研究

multilingual

多語音系統(tǒng)以及code-switch

personal

少數(shù)據(jù)量以及個性化ASR

rescoring

多種模型聯(lián)合打分

unsupervised

無監(jiān)督或者自監(jiān)督學(xué)習

accent?,dialect

口音和方言

other

其它方向研究,包括系統(tǒng)評價標準等等

robust魯棒性
multichannel多通道

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表四? 語音識別文章數(shù)量統(tǒng)計(單位:篇)

語音識別的文章列表請訪問http://yqli.tech/page/asr_paper.html

12月份語音識別具體文章

總結(jié)

以上是生活随笔為你收集整理的2021年1~12月语音合成和语音识别论文月报的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。