数据结构定义
何謂數據結構
數據結構是在整個計算機科學與技術領域上廣泛被使用的術語。它用來反映一個數據的內部構成,即一個數據由那些成分數據構成,以什么方式構成,呈什么結構。數據結構有邏輯上的數據結構和物理上的數據結構之分。邏輯上的數據結構反映成分數據之間的邏輯關系,而物理上的數據結構反映成分數據在計算機內部的存儲安排。數據結構是數據存在的形式。
數據結構是信息的一種組織方式,其目的是為了提高算法的效率,它通常與一組算法的集合相對應,通過這組算法集合可以對數據結構中的數據進行某種操作。
數據結構主要研究什么?
數據結構作為一門學科主要研究數據的各種邏輯結構和存儲結構,以及對數據的各種操作。因此,主要有三個方面的內容:數據的邏輯結構;數據的物理存儲結構;對數據的操作(或算法)。通常,算法的設計取決于數據的邏輯結構,算法的實現取決于數據的物理存儲結構。
什么是數據結構?什么是邏輯結構和物理結構?
數據是指由有限的符號(比如,"0"和"1",具有其自己的結構、操作、和相應的語義)組成的元素的集合。結構是元素之間的關系的集合。通常來說,一個數據結構DS 可以表示為一個二元組:
DS=(D,S), //i.e., data-structure=(data-part,logic-structure-part)
這里D是數據元素的集合(或者是“結點”,可能還含有“數據項”或“數據域”),S是定義在D(或其他集合)上的關系的集合,S = { R | R : D×D×...},稱之為元素的邏輯結構。
邏輯結構有四種基本類型:集合結構、線性結構、樹狀結構和網絡結構。表和樹是最常用的兩種高效數據結構,許多高效的算法可以用這兩種數據結構來設計實現。表是線性結構的(全序關系),樹(偏序或層次關系)和圖(局部有序(weak/local orders))是非線性結構。
數據結構的物理結構是指邏輯結構的存儲鏡像(image)。數據結構 DS 的物理結構 P 對應于從 DS 的數據元素到存儲區M(維護著邏輯結構S)的一個映射:
P:(D,S) --> M
存儲器模型:一個存儲器 M 是一系列固定大小的存儲單元,每個單元 U 有一個唯一的地址 A(U),該地址被連續地編碼。每個單元 U 有一個唯一的后繼單元 U'=succ(U)。
P 的四種基本映射模型:順序(sequential)、鏈接(linked)、索引(indexed)和散列(hashing)映射。
因此,我們至少可以得到4×4種可能的物理數據結構:
| ??? sequential | (sets) |
| ??? linked | lists |
| ??? indexed | trees |
| ??? hash | graphs |
(并不是所有的可能組合都合理)
數據結構DS上的操作:所有的定義在DS上的操作在改變數據元素(節點)或節點的域時必須保持DS的邏輯和物理結構。
DS上的基本操作:任何其他對DS的高級操作都可以用這些基本操作來實現。最好將DS和他的所有基本操作看作一個整體——稱之為模塊。我們可以進一步將該模塊抽象為數據類型(其中DS的存儲結構被表示為私有成員,基本操作被表示為公共方法),稱之為ADT。作為ADT,堆棧和隊列都是一種特殊的表,他們擁有表的操作的子集。
對于DATs的高級操作可以被設計為(不封裝的)算法,利用基本操作對DS進行處理。
好的和壞的DS:如果一個DS可以通過某種“線性規則”被轉化為線性的DS(例如線性表),則稱它為好的DS。好的DS通常對應于好的(高效的)算法。這是由計算機的計算能力決定的,因為計算機本質上只能存取邏輯連續的內存單元,因此如何沒有線性化的結構邏輯上是不可計算的。比如對一個圖進行操作,要訪問圖的所有結點,則必須按照某種順序來依次訪問所有節點(要形成一個偏序),必須通過某種方式將圖固有的非線性結構轉化為線性結構才能對圖進行操作。
樹是好的DS——它有非常簡單而高效的線性化規則,因此可以利用樹設計出許多非常高效的算法。樹的實現和使用都很簡單,但可以解決大量特殊的復雜問題,因此樹是實際編程中最重要和最有用的一種數據結構。樹的結構本質上有遞歸的性質——每一個葉節點可以被一棵子樹所替代,反之亦然。實際上,每一種遞歸的結構都可以被轉化為(或等價于)樹形結構。
總結
- 上一篇: 信用卡代还注意事项
- 下一篇: .net集合类的研究--链表—ListD