日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《统计自然语言处理》(宗成庆)学习笔记(一)

發布時間:2023/12/9 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《统计自然语言处理》(宗成庆)学习笔记(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

緒論

一、提出問題

  • 如何讓計算機自動或人機互助的完成語言處理功能?
  • 如何讓計算機對海量信息進行自動處理、知識挖掘,進行有效利用?

二、基本概念
1、語言學與語音學
語言的兩個基本屬性:語音、文字
2、語言學:研究語言的學科,包含語言的本質、結構、發展規律
3、語音學:研究發音特點
4、計算機語言學:計算技術和概念、語言學和語音學問題
5、自然語言處理 or 自然語言理解
關于“理解”的標準:計算機智能——表現、反映、人機交互——圖靈
測試

三、自然語言處理研究的內容和面對的困難
(一)研究內容

  • 機器翻譯
  • 自動文摘
  • 信息檢索
  • 文檔分類
  • 問答系統
  • 信息過濾
  • 信息抽取
  • 文字編輯和自動校對
  • 光讀字符識別OCR
  • 語音識別
  • 文本挖掘
  • 語音識別
  • 語音合成
  • 輿情分析
    等等…
  • (二)自然語言涉及的幾個層次
    1、形態學
    2、語法學:語法規律、句子結構
    3、語義學(根本問題):詞的含義——句的含義——段落篇章的含義
    4、語用學:特定環境的文字用法

    (三)面臨的困難
    1、歧義:語義歧義、結構歧義
    eg:Put the block[ in the box on the table].
    Put [the block in the box] on the table.
    2、未知的語言

    四、自然語言處理的基本方法及其發展
    (一)基本方法

    理性主義經驗主義
    知識來源與生俱來大量的語言數據
    研究對象語言知識結構、符號、規則語言數據
    理論Chomsky的語言原則Shannon的信息論
    應用形式語言統計模型

    (二)發展和現狀
    1、萌芽期(1946年)——發展期(1966年)——繁榮期(20世紀80年代末)
    2、目前已經取得了一定的研究成果,但是根本問題還未解決。
    3、新的研究方向不斷涌現,具有極大發展前景。

    總結

    以上是生活随笔為你收集整理的《统计自然语言处理》(宗成庆)学习笔记(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。