日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

LC-BLSTM结构快速解读

發布時間:2023/12/20 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 LC-BLSTM结构快速解读 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
參考文獻如下:

(1) A Context-Sensitive-Chunk BPTT Approach to Training Deep LSTM/BLSTM Recurrent Neural Networks for Offline Handwriting Recognition

(2) Training Deep Bidirectional LSTM Acoustic Model for LVCSR by a Context-Sensitive-Chunk BPTT Approach

(3) Improving Latency-Controlled BLSTM Acoustic Models for Online Speech Recogintion

? ? ? ?前言? ? ? ?眾所周知,BLSTM是雙向的LSTM,它可以同時兼容上下文的信息,從而在一般序列任務上的表現很好。但是BLSTM有一個很致命的弱點,那就是因為有逆向LSTM的存在,它需要有后文的后驗,使得它無法在實時的序列任務上也有好的表現。基于實時任務的需求,出現了兩種BLSTM的變體——CSC-BLSTMLC-BLSTM


1. CSC-BLSTM結構解析

? ? ? ?CSC-BLSTM結構全名——Context-Sensitive-Chunk Bidirectional Long Short-Term Memory,是BLSTM的第一種改進版本。請看結構圖:

? ? ? ?CSC-BLSTM首先把序列按照圖示的方法分割成多組chunk,除了首尾位置,其他位置處的都是由Nl+Nc+Nr構成,分割的大小事先給定,一般選做30幀+60幀+30幀的模式。

? ? ? ?其核心思想在于,Nl用來初始化Nc的前向細胞層狀態,Nr用來初始化Nc的后向細胞層狀態。NlNr不參與誤差反向傳播。如下圖:

? ? ? ?很顯然,CSC-BLSTM的這種結構改進可以減小實時任務的延遲,用不著整段話都輸入完畢才有結果。但是從整體上看,它是以犧牲計算量為代價的。因為與BLSTM相比,它多出了NlNr上的計算。在此基礎之上,為了減少這種計算量,又出現了更加簡化了的LC-BLSTM。

2. LC-BLSTM結構解析

? ? ? ?LC-BLSTM結構全名——Latency-Controlled Bidirectional Long Short-Term Memory,它改進了CSC-BLSTM。請看結構圖:

? ? ? ?可以發現,相比于CSC-BLSTM,LC-BLSTM取消了Nl,只保留了Nc+Nr。但是如此在計算上必然有差異。

? ? ? ?原來,LC-BLSTM的計算也并不復雜,同CSC-BLSTM一樣,Nr用來初始化Nc的后向細胞層狀態。但是,Nc的前向細胞層狀態直接由它的前一個Nc的輸出狀態得到。這樣,相比于CSC-BLSTM,LC-BLSTM避免了Nl的計算量。

? ? ? ?But!!!很不幸,通過實驗發現,為了保證準確率,LC-BLSTM必須要保證Nr劃分的足夠大,比如在原論文中,Nc=22的情況下,Nr需要有21,這幾乎使得Nr需要有Nc同樣的大小。在Nc=Nr=30的情況下,LC-BLSTM的計算量是傳統BLSTM的兩倍。

3. 改進的LC-BLSTM

? ? ? ?通過上述分析,LC-BLSTM的表現依然不好。阿里的研究人員改進了這個結構。他們總結LC-BLSTM的結構,多出來的計算量就在于Nr,但是Nr的作用無非兩點:

  • 用于初始化當前Nc的后向細胞狀態;
  • 用做下一層網絡的輸入(因為正常都會使用多層BLSTM)
  • ? ? ? ?于是作者分別采用了兩種簡化的網絡結構代替Nr的BLSTM結構。分別是LC-BLSTM-FABDILC-BLSTM-FABSR

    3.1 LC-BLSTM-FABDI

    ? ? ? ?首先對于時間軸上正向移動的LSTM,去掉了Nr部分的計算。而對于時間軸上反向移動的LSTM,Nr部分的計算主要是為Nc提供cell的初始狀態,作者簡化了這部分的計算,使用正向全連接來代替LSTM,將f()的輸出取平均后作為Nc的初始狀態。

    3.2 LC-BLSTM-FABSR

    ? ? ? ?首先對于時間軸上正向移動的LSTM,同樣去掉了Nr部分的計算。另外作者發現對于BLSTM模型,時間軸上反向傳播的LSTM不如時間軸上正向傳播的LSTM重要,因此使用簡單RNN模型來代替時間軸上反向傳播的LSTM。

    ? ? ? ?但RNN會有梯度爆炸的問題,所以對其進行strict gradient-clipping。同時為了利用未來的信息,加入了target delay

    作者在320小時的Switchboard數據集上進行測試,在不影響wer的情況下,這個兩種方法的解碼速度分別相對提升40%和27%。

    轉載于:https://www.cnblogs.com/machine-lyc/p/10600300.html

    創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

    總結

    以上是生活随笔為你收集整理的LC-BLSTM结构快速解读的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。