日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

5.16-在线词识别程序学习(ASR+IAT)

發布時間:2024/8/26 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 5.16-在线词识别程序学习(ASR+IAT) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一些信息

6.bin文件夾是調試路徑,里面文件的作用如下:

? msc.dllWIN32平臺程序必需的動態庫;

? msc_x64.dllx64平臺程序必需的動態庫;

? msc.cfg包含了配置信息,調試、測試時不需改動,發布產品后可以將倒數第五行的“output=1”改為“output=0”,“output=1”時會輸出運行日志到msc.log,在調試時出現問題可以發給我們幫助你分析,“output=0”時會關閉日志輸出,為用戶節省磁盤空間;

? asr_keywords_utf8.txtasrdemo中用到的命令詞列表,編碼為UTF8,對其內容進行修改時,請不要用系統自帶的記事本程序,建議使用Notepad++UltraEdit等文本編輯軟件;

? gm_continuous_digit.abnfasrdemo_with_abnf中用到的語法文件,編碼為GB2312,對其內容進行修改時,請參照doc文件夾下的《語法開發指南》;

? wav文件夾里面都是事先準備好的錄音文件,分別用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result

? 當運行過樣例程序之后,還會生成一個以md5值為名的文件夾,其中保存的文件內容是程序運行中記錄的性能信息和錯誤信息,將會上傳到服務器,有利于我們改善服務質量,請不要刪除。

7.新增iatdemo_with_user_vocabulary(上傳用戶詞表demo),關鍵詞上傳后,當次會話沒有效果,云端需要一段時間對關鍵詞表進行激活,稍后才能正常使用。

iat(語音聽寫)和asr(語音識別)均可以上傳用戶詞列表,但目前不知道其區別。

ASR上傳命令詞程序學習

TXT文件中添加關鍵詞,重新上傳獲得GID,只需上傳一次即可,記住ID,以便以后使用,若添加了新關鍵詞,則需重新上傳獲得ID

若列表中沒有這個詞語,則顯示結果與此類似:

The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca

對“喂你好我是一名大學生”添加不同種類關鍵詞的影響

添加整句話,識別率高,效率低

長傳新的詞表后"科大訊飛"被識別為"歌華有線",此表中兩個詞語同時存在,將"歌華有線"刪除,重新上傳,將"科大訊飛"識別為"葛洲壩",4,5均無法識別,不知道激活時間有多長

經過一天等待,情況沒有改善,應該仔細審讀程序,消除Grammar的問題。

調整壓縮比等上傳參數,使得識別效果和消耗時間指標比較均衡

?

科大訊飛語音功能小結

科大訊飛的示例demo比較炕爹,它必須在你申請的appid基礎上運行,否則會出錯哦!也就是你必須申請appid,然后才能下載示例demo,很炕爹吧!

?

這里我就不多余重復開發文檔中的了,說一些自己的理解:

1.我之前有一個想法,就是科大訊飛在語音識別的時候,需要你上傳命令詞,詞表或者聯系人,我們可以在注冊開發者的時候在自己的信息中上傳自己的詞庫,然后我們在程序中只需要通過登錄來獲取一個標示token什么的,這樣的話,如果你的詞庫發生變化了,就不需要更改代碼了,只需要在自己的開發者信息下重新上傳一下,不用更改程序了,科大訊飛的技術支持的回復是web端沒有提供這個接口,他們的回復是:我們可以申請一個web端的appid,然后在自己的服務器上做這樣的處理

2. 詞表和聯系人在上傳的時候沒有返回grammerID,在語音識別的時候需要登錄,上傳一次;命令詞和abnf語法上傳也是上傳一次,但是這里會回復一個grammerID這樣就需要在語音識別的時候傳參。

3.命令詞和詞表的區別在于:

? ? ?命令詞:語音識別的時候會只在命令詞的范圍內搜索

? ? ?詞表:語音識別優先從詞表中搜索

4.在添加的框架中如果是在ios5系統下ADSupport.framework要設為optional

5.如果想要自定義UI則須參考無UIdemo,然后在- (void) onVolumeChanged: (int) volume;這個回調里面隨著語音的音量大小來切換圖片

6.grammerID可以跨平臺使用?

?

Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>


轉載于:https://www.cnblogs.com/lizhensheng/p/11241940.html

總結

以上是生活随笔為你收集整理的5.16-在线词识别程序学习(ASR+IAT)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。