自然语言处理笔记9-哈工大 关毅
目錄
文章目錄
- 目錄
- 前言
- 課堂總結(一)
- 課堂總結(二)
- 課堂總結(三)
- 課堂總結(四)
前言
碩士生涯結束,開始專心做一件自己覺得有用的工具,先做工程,后搞理論。
自然語言處理是一個非常難的問題,同時是人工智能皇冠上的明珠。
接下來會記錄一系列自然語言處理的筆記,來自于哈工大老師關毅。
課堂總結(一)
問答系統總結,數據層,搜索引擎控制,信息采集,文本分類,信息索引。
課堂總結(二)
文本分類系統新的結構。國家863項目。
處理精度,魯棒性達到相應的目標。
新一代學習檢索機制,持續學習的能力。
統計詞法分析,外界反饋來學習,機制研究。
實體信息抽取,電子病歷信息抽取。電子健康。基于最大熵的識別系統,CRF模型。
transfer learning模型。句法分析,補償學習,增量學習,主動式學習,在線學習,強化學習。
文本聚類,自組織映射文本系統。
做一個有人用的東西。
課堂總結(三)
把自己做的東西的應用率作為自己的追求目標,忠實的fans。
領域知識的自動構建,單詞變體,縮略語的研究,難度極大,非常有用的應用。
mindmanager 推薦。
思維導圖構成,結構清晰,思路連貫。
開始回顧:
語言-多類文檔。字處理-編碼,輸入輸出。
分詞的難點:every great idea is simple。
頻度統計,很多工作。科學的定量方法。
語料庫的多級加工,n-grams語言模型。
課堂總結(四)
n-gram噪聲信道模型,平滑。
平滑的原則。
隱碼句法淺層句法分析問題。
總結的話:規則+統計結合的思想。
一般性問題和特殊性問題。語義不能這么弄。
分個類:
1搶占高地的研究,先做式。
2解決問題的研究,Hownet。
3填補空白的研究,成熟方法+新事物處理,語義信息在神經中的機制。
總結
以上是生活随笔為你收集整理的自然语言处理笔记9-哈工大 关毅的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 『CV学习笔记』图像处理透视变换(Pyt
- 下一篇: [学习笔记] Matrix tree定理