模式识别两种方法:知识和数据
一:關于框架
?????? 在第三版 張學工編著的 《模式識別》 第一章 概論里面第3頁,1.3. 這樣寫著:模式識別解決問題的的主要方法是基于知識的方法和基于數據的方法兩類;
???????(每一個作者都希望自己的所見所聞是正確的,這也僅僅是希望而已。因為這個希望后面有更深層的東西,自己的成果,別人的敬重,以及多年辛苦樹立的權威,以及科學技術人員不能決定自己命運和方向的自卑感。當然這不是學者的錯誤,因為每個人的知識只是知識海洋中的一滴)。
???????基于數據的模式識別方法,是基于統計的模式識別。自從ML興起,PR的方法看起來和ES沒有太大區別,而ES看似更高一層, 專家系統抽取了語義描述,而基于數據的PR也沒能逃出ES的框架。
???????現在的模式識別陷入了分類的汪洋大海,至于哪種是模式哪種是特征已經難以區分?;蛟S我們應該區分,行為模式,思維模式或許更高層次的模式才是重點,DL直接使用DNN,如果能產生更好的結果并突破限制,我們就會失去探索黑箱的機會,也將丟失重建知識體系和思維模型的欲望。如果我們需要的只是一個黑箱,我們需要的只是幾何墨模型,而非代數規則,這并不是好一些人所期望的。
???????模式識別是一種方法,而ES是一種框架。專家系統依靠專家獲取規則,ML方法基于專家設定的規則獲取規則。模式識別系統也是一種專家系統。
???????而真正的AI的實現,靠方法是不行的,應該致力于更好的一種框架。
二:問題域滲透
???????模式識別是AI實現的一種方式?當識別了一種模式,便陷入一種行為,模仿出決策過程。相似于觸發器原理,非條件反射。
???????控制系統才是最終的大頭,一個一個 的決策形成繁雜的邏輯,需要一個頂層的控制系統來進行協調。
三:從語法到語義
?????? C++11最后一章,講語言設計者接下來的任務:
?????????????? OOP方法的基本活動之一是 發明能正在模擬的情形(被稱為問題域)的類。語言怎樣的描述概念?如何構建強大而簡潔的描述規則是著重考慮的問題。
?????? C++11:不僅是一種語言,更是一個由語法規則延伸到語義規則的橋梁。是否要把他們分開呢?
????????????????由標準建類模型到標準語義模型進化,可實現在計算機內部的?智能基礎吧
四:知識專家系統
?????? 專家系統被稱為基于知識的模式識別, 是一個基于知識的描述系統和基于知識的推理系統,一般要求語義完備性。知識被定義為語義的確定性語法描述,作為歸納的結果,知識一般是經驗性的,局限性(概率正確性)。
??????? 哲學上確定,外部原子系統是可遍歷且可完備推理的。但現實的ND系統,由于觀測者的系統映射描述局限性和接口局限性,以及遍歷能力-計算能力,對于外部系統描述都解析為特定的粒度。
??????? 粒度的大小和劃分直接影響到專家系統的概率正確性及是否完備。
??? ??? 1975年Minsky提出了框架結構,框架被定義為類的槽值集合,槽(slot)等同于對象的屬性。一般說來,槽可以包含下列信息:
1、框架名; 2、和其它框架的關系; 3、槽值; 4、默認槽值; 5、槽的取值范圍; 6、處理過程。通常有兩種處理過程被附加到槽上:WHEN CHANGED和WHEN NEEDED。這樣的處理過程被稱為demon。 ??????? 基于框架的專家系統還通過facet的應用對槽-值結構體進行擴展。facet是提供關于框架屬性的擴展知識的一種方法。一般來說,基于框架的專家系統允許我們向屬性附加"值"、"提示"、和"推理"等facet。值facet指定屬性的默認和初始值。提示facet讓終端用戶可以在和專家系統的會話里在線輸入屬性值,推理facet讓我們可以在特定屬性的值改變時停止推理過程。 ??????? 根據問題的本質將其分解成框架,進而分解成槽和facet??蚣芗瓤梢员硎绢?#xff0c;也可以表示對象。通常對象直接有三種關系:泛化(a-kind-of或is-a)、聚合和關聯。 繼承的缺點在于,基于框架的系統不能區分本質屬性(該類必須具備的屬性)和偶然屬性(該類所有實例剛好都具有的屬性)。由于在繼承層次的任何地方都可以覆寫屬性,在多重繼承時并不能表示把幾個類組合在一起的概念。?????? 多數基于框架的專家系統里,也會使用規則,這些規則通常使用模式匹配語句。規則在方法調用時觸發,比如WHEN CHANGED。
四:ML系統
?????? 基于機器學習的專家系統被稱為機器學習系統。機器學習專家系統有相似于知識專家系統的描述。ML系統仍然是一個定義系統,且是封閉的描述系統。
?????? 得知知識的局限性之后,利用數學函數可描述的可學習模型取代專家構建概率知識可用于保持專家系統的完備性。ML專家系統從學習體系中抽取出一般概念,模式識別模型,特征,泛化能力,歸納學習,遍歷和完備性。
基于類的ML系統模型:
1.類標簽,描述為自然數N的子集;
????? ML系統中所有的類可以標記為自然數集合N的真子集,是一個可數集合。在紛覆叢雜的ImageNet上,共有1860個圖像類別。在WebNet上的集合,大致有200萬個類別。
2.和其他類的關系;
??? 類的分層模型。參考林奈分類法的生物分類方法。
3.特征;
??? 類似于框架的槽值,類描述為特征的有序且有結構集合。
4.本征特征;
?? 能夠在一個層次完全分離/區分兩類的特征;
5.特征值區間;
?? 在定義系統內,特征的可取值范圍。
6.特征/模式提取;
?? 對類的操作不僅包含了如何對類進行唯一性標記,即提取類特征;也包含了怎樣對類的特征分布進行描述,即類的模式提取。
不同之處:
????? 根本在于系統構架上。專家系統一般要求固定的槽值,用于描述類和對象。而ML系統,則在合適的時刻可以對特征進行空間變換,進行特征變化和特征選擇。
????? 此外,對于矛盾的處理:專家系統一般使用確定推理方式,在矛盾處進行對象分解,從更小的粒度重新解析矛盾,而ML系統則放松了模型要求,在一定的特征組合層面,滿足PAC概率正確性即可。
?后記:
????? 標準建類體系.....
????? 描述是認知的基礎,感知和決策是基于描述的,AI的實現依賴于問題域的統一,基本要求是基于問題的描述方法統一。
??
總結
以上是生活随笔為你收集整理的模式识别两种方法:知识和数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 股票收盘时间
- 下一篇: 实践:使用FLANN.LSH进行检索