當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

数据结构笔记第六章查找技术

發(fā)布時(shí)間：2024/1/1 编程问答 23 豆豆

生活随笔收集整理的這篇文章主要介紹了数据结构笔记第六章查找技术小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

查找技術(shù)

在計(jì)算機(jī)科學(xué)中定義為:在一些(有序的/無(wú)序的)數(shù)據(jù)元素中，通過(guò)一定的方法找出與給定關(guān)鍵字相同的數(shù)據(jù)元素的過(guò)程叫做查找。也就是根據(jù)給定的某個(gè)值，在查找表中確定一個(gè)關(guān)鍵字等于給定值的記錄或數(shù)據(jù)元素。
線性表的查找技術(shù)
順序查找
順序查找是按照序列原有順序?qū)?shù)組進(jìn)行遍歷比較查詢的基本查找算法。
基本原理:
對(duì)于任意一個(gè)序列以及一個(gè)給定的元素，將給定元素與序列中元素依次比較，直到找出與給定關(guān)鍵字相同的元素，或者將序列中的元素與其都比較完為止。

#include<stdio.h> int Sequence_search(int *a,int n, int key);int main() {int a[10];int i = 1;int key = 0;int n = 0;int return_number;printf("Please Enter how many you want to input numbers！\n");scanf("%d", &n);printf("Please Enter %d numbers!\n", n);for(; i <= n; i++){scanf("%d", &a[i]);}printf("Please Input the search number!\n");scanf("%d", &key);return_number = Sequence_search(a, n, key);if(return_number != 0){printf("查找成功!\n");printf("查找的數(shù)的位序是%d\n", return_number);}else{printf("查找失敗,未找到該數(shù)!\n");}}int Sequence_search(int *a, int n, int key) {a[0] = key;int i = n;for(; i >= 0; i--){if(a[i] == key){return i;}}return 0;}***折半查找*** 二分查找又稱折半查找，優(yōu)點(diǎn)是比較次數(shù)少，查找速度快，平均性能好，占用系統(tǒng)內(nèi)存較少;其缺點(diǎn)是要求待查表為有序表，且插入刪除困難。因此，折半查找方法適用于不經(jīng)常變動(dòng)而查找頻繁的有序列表。首先，假設(shè)表中元素是按升序排列，將表中間位置記錄的關(guān)鍵字與查找關(guān)鍵字比較，如果兩者相等，則查找成功;否則利用中間位置記錄將表分成前、后兩個(gè)子表，如果中間位置記錄的關(guān)鍵字大于查找關(guān)鍵字，則進(jìn)一步查找前一子表，否則進(jìn)一步查找后一子表。重復(fù)以上過(guò)程，直到找到滿足條件的記錄，使查找成功，或直到子表不存在為止，此時(shí)查找不成功。``

void binarySearch(int *arr,int length,int key) {

//數(shù)組左端 int left = 0; //數(shù)組右端 int right = length - 1; //中間 int mid;//在左右指針交換之前，查找還沒(méi)結(jié)束 while (left <= right) {//更新中間的值mid = (left + right) / 2;//查找成功if (arr[mid] == key) {cout << "find it and its index is " << mid;return;}//若還沒(méi)有找到，改變左右區(qū)間繼續(xù)尋找if (arr[mid] < key)left = mid + 1;if (arr[mid] > key)right = mid - 1;}cout << "cannot find it" << endl; return;

}

***樹(shù)表的查找技術(shù) 二叉排序樹(shù)*** 二叉排序樹(shù)（Binary Sort Tree）或者是一棵空樹(shù)；或者是具有下列性質(zhì)的二叉樹(shù)：（1）若左子樹(shù)不空，則左子樹(shù)上所有結(jié)點(diǎn)的值均小于它的根結(jié)點(diǎn)的值；（2）若右子樹(shù)不空，則右子樹(shù)上所有結(jié)點(diǎn)的值均大于它的根結(jié)點(diǎn)的值；（3）左、右子樹(shù)也分別為二叉排序樹(shù)；若根結(jié)點(diǎn)的關(guān)鍵字值等于查找的關(guān)鍵字，成功。否則，若小于根結(jié)點(diǎn)的關(guān)鍵字值，遞歸查左子樹(shù)。若大于根結(jié)點(diǎn)的關(guān)鍵字值，遞歸查右子樹(shù)。若子樹(shù)為空，查找不成功。插入算法：首先執(zhí)行查找算法，找出被插結(jié)點(diǎn)的父親結(jié)點(diǎn)。判斷被插結(jié)點(diǎn)是其父親結(jié)點(diǎn)的左、右兒子。將被插結(jié)點(diǎn)作為葉子結(jié)點(diǎn)插入。若二叉樹(shù)為空。則首先單獨(dú)生成根結(jié)點(diǎn)。注意：新插入的結(jié)點(diǎn)總是葉子結(jié)點(diǎn)。void InsertBST(t，key)//在二叉排序樹(shù)中插入查找關(guān)鍵字key{if(t==NULL){t=new BiTree;t->lchild=t->rchild=NULL;t->data=key;return; }if(keydata ) InsertBST(t->lchild,key);else InsertBST (t->rchild, key );}void CreateBiTree(tree,d【】,n）//n個(gè)數(shù)據(jù)在數(shù)組d中，tree為二叉排序樹(shù)根{tree=NULL;for(i=0;i InsertBST(tree,d);} ***平衡二叉樹(shù)*** 平衡二叉搜索樹(shù)(Self-balancing binary search tree)又被稱為AVL樹(shù)(有別于AVL算法)，且具有以下性質(zhì):它是一棵空樹(shù)或它的左右兩個(gè)子樹(shù)的高度差的絕對(duì)值不超過(guò)1，并且左右兩個(gè)子樹(shù)都是一棵平衡二叉樹(shù)。平衡二叉樹(shù)的常用實(shí)現(xiàn)方法有紅黑樹(shù)、AVL、替罪羊樹(shù)、Treap、伸展樹(shù)等。最小二叉平衡樹(shù)的節(jié)點(diǎn)總數(shù)的公式如下 F(n)=F(n-1)+F(n-2)+1 這個(gè)類(lèi)似于一個(gè)遞歸的數(shù)列，可以參考Fibonacci(斐波那契)數(shù)列，1是根節(jié)點(diǎn)，F(n-1)是左子樹(shù)的節(jié)點(diǎn)數(shù)量，F(n-2)是右子樹(shù)的節(jié)點(diǎn)數(shù)量。 ***紅黑樹(shù)*** 紅黑樹(shù)是一種自平衡二叉查找樹(shù)，是在計(jì)算機(jī)科學(xué)中用到的一種數(shù)據(jù)結(jié)構(gòu)，典型的用途是實(shí)現(xiàn)關(guān)聯(lián)數(shù)組。它是在1972年由Rudolf Bayer發(fā)明的，他稱之為"對(duì)稱二叉B樹(shù)"，它現(xiàn)代的名字是在 Leo J. Guibas 和 Robert Sedgewick 于1978年寫(xiě)的一篇論文中獲得的。它是復(fù)雜的，但它的操作有著良好的最壞情況運(yùn)行時(shí)間，并且在實(shí)踐中是高效的: 它可以在O(log n)時(shí)間內(nèi)做查找，插入和刪除，這里的n是樹(shù)中元素的數(shù)目。***AVL*** AVL是最先發(fā)明的自平衡二叉查找樹(shù)算法。在AVL中任何節(jié)點(diǎn)的兩個(gè)兒子子樹(shù)的高度最大差別為一，所以它也被稱為高度平衡樹(shù)，n個(gè)結(jié)點(diǎn)的AVL樹(shù)最大深度約1.44log2n。查找、插入和刪除在平均和最壞情況下都是O(log n)。增加和刪除可能需要通過(guò)一次或多次樹(shù)旋轉(zhuǎn)來(lái)重新平衡這個(gè)樹(shù)。***Treap*** Treap是一棵二叉排序樹(shù)，它的左子樹(shù)和右子樹(shù)分別是一個(gè)Treap，和一般的二叉排序樹(shù)不同的是，Treap紀(jì)錄一個(gè)額外的數(shù)據(jù)，就是優(yōu)先級(jí)。Treap在以關(guān)鍵碼構(gòu)成二叉排序樹(shù)的同時(shí)，還滿足堆的性質(zhì)(在這里我們假設(shè)節(jié)點(diǎn)的優(yōu)先級(jí)大于該節(jié)點(diǎn)的孩子的優(yōu)先級(jí))。但是這里要注意的是Treap和二叉堆有一點(diǎn)不同，就是二叉堆必須是完全二叉樹(shù)，而Treap并不一定是。***伸展樹(shù)*** 伸展樹(shù)(Splay Tree)是一種二叉排序樹(shù)，它能在O(log n)內(nèi)完成插入、查找和刪除操作。它由Daniel Sleator和Robert Tarjan創(chuàng)造。它的優(yōu)勢(shì)在于不需要記錄用于平衡樹(shù)的冗余信息。在伸展樹(shù)上的一般操作都基于伸展操作。***SBT*** Size Balanced Tree(簡(jiǎn)稱SBT)是一自平衡二叉查找樹(shù)，是在計(jì)算機(jī)科學(xué)中用到的一種數(shù)據(jù)結(jié)構(gòu)。它是由中國(guó)廣東中山紀(jì)念中學(xué)的陳啟峰發(fā)明的。陳啟峰于2006年底完成論文《Size Balanced Tree》，并在2007年的全國(guó)青少年信息學(xué)奧林匹克競(jìng)賽冬令營(yíng)中發(fā)表。由于SBT的拼寫(xiě)很容易找到中文諧音，它常被中國(guó)的信息學(xué)競(jìng)賽選手和ACM/ICPC選手們戲稱為"傻B樹(shù)"、"Super BT"等。相比紅黑樹(shù)、AVL樹(shù)等自平衡二叉查找樹(shù)，SBT更易于實(shí)現(xiàn)。據(jù)陳啟峰在論文中稱，SBT是"目前為止速度最快的高級(jí)二叉搜索樹(shù)"。SBT能在O(log n)的時(shí)間內(nèi)完成所有二叉搜索樹(shù)(BST)的相關(guān)操作，而與普通二叉搜索樹(shù)相比，SBT僅僅加入了簡(jiǎn)潔的核心操作Maintain。由于SBT賴以保持平衡的是size域而不是其他"無(wú)用"的域，它可以很方便地實(shí)現(xiàn)動(dòng)態(tài)順序統(tǒng)計(jì)中的select和rank操作。 ***散列表*** 散列表(Hash table，也叫哈希表)，是根據(jù)關(guān)鍵碼值(Key value)而直接進(jìn)行訪問(wèn)的數(shù)據(jù)結(jié)構(gòu)。也就是說(shuō)，它通過(guò)把關(guān)鍵碼值映射到表中一個(gè)位置來(lái)訪問(wèn)記錄，以加快查找的速度。這個(gè)映射函數(shù)叫做散列函數(shù)，存放記錄的數(shù)組叫做散列表。給定表M，存在函數(shù)f(key)，對(duì)任意給定的關(guān)鍵字值key，代入函數(shù)后若能得到包含該關(guān)鍵字的記錄在表中的地址，則稱表M為哈希(Hash)表，函數(shù)f(key)為哈希(Hash) 函數(shù)。 ***?基本概念*** 若關(guān)鍵字為k，則其值存放在f(k)的存儲(chǔ)位置上。由此，不需比較便可直接取得所查記錄。稱這個(gè)對(duì)應(yīng)關(guān)系f為散列函數(shù)，按這個(gè)思想建立的表為散列表。對(duì)不同的關(guān)鍵字可能得到同一散列地址，即k1≠k2，而f(k1)=f(k2)，這種現(xiàn)象稱為碰撞(英語(yǔ):Collision)。具有相同函數(shù)值的關(guān)鍵字對(duì)該散列函數(shù)來(lái)說(shuō)稱做同義詞。綜上所述，根據(jù)散列函數(shù)f(k)和處理碰撞的方法將一組關(guān)鍵字映射到一個(gè)有限的連續(xù)的地址集(區(qū)間)上，并以關(guān)鍵字在地址集中的"像"作為記錄在表中的存儲(chǔ)位置，這種表便稱為散列表，這一映射過(guò)程稱為散列造表或散列，所得的存儲(chǔ)位置稱散列地址。若對(duì)于關(guān)鍵字集合中的任一個(gè)關(guān)鍵字，經(jīng)散列函數(shù)映象到地址集合中任何一個(gè)地址的概率是相等的，則稱此類(lèi)散列函數(shù)為均勻散列函數(shù)(Uniform Hash function)，這就是使關(guān)鍵字經(jīng)過(guò)散列函數(shù)得到一個(gè)"隨機(jī)的地址"，從而減少碰撞。1. 直接尋址法:取關(guān)鍵字或關(guān)鍵字的某個(gè)線性函數(shù)值為散列地址。即H(key)=key或H(key) = a·key + b，其中a和b為常數(shù)(這種散列函數(shù)叫做自身函數(shù))。若其中H(key)中已經(jīng)有值了，就往下一個(gè)找，直到H(key)中沒(méi)有值了，就放進(jìn)去。2. 數(shù)字分析法:分析一組數(shù)據(jù)，比如一組員工的出生年月日，這時(shí)我們發(fā)現(xiàn)出生年月日的前幾位數(shù)字大體相同，這樣的話，出現(xiàn)沖突的幾率就會(huì)很大，但是我們發(fā)現(xiàn)年月日的后幾位表示月份和具體日期的數(shù)字差別很大，如果用后面的數(shù)字來(lái)構(gòu)成散列地址，則沖突的幾率會(huì)明顯降低。因此數(shù)字分析法就是找出數(shù)字的規(guī)律，盡可能利用這些數(shù)據(jù)來(lái)構(gòu)造沖突幾率較低的散列地址。3. 平方取中法:當(dāng)無(wú)法確定關(guān)鍵字中哪幾位分布較均勻時(shí)，可以先求出關(guān)鍵字的平方值，然后按需要取平方值的中間幾位作為哈希地址。這是因?yàn)?平方后中間幾位和關(guān)鍵字中每一位都相關(guān)，故不同關(guān)鍵字會(huì)以較高的概率產(chǎn)生不同的哈希地址。4. 折疊法:將關(guān)鍵字分割成位數(shù)相同的幾部分，最后一部分位數(shù)可以不同，然后取這幾部分的疊加和(去除進(jìn)位)作為散列地址。數(shù)位疊加可以有移位疊加和間界疊加兩種方法。移位疊加是將分割后的每一部分的最低位對(duì)齊，然后相加;間界疊加是從一端向另一端沿分割界來(lái)回折疊，然后對(duì)齊相加。4. 隨機(jī)數(shù)法:選擇一隨機(jī)函數(shù)，取關(guān)鍵字的隨機(jī)值作為散列地址，通常用于關(guān)鍵字長(zhǎng)度不同的場(chǎng)合。5. 除留余數(shù)法:取關(guān)鍵字被某個(gè)不大于散列表表長(zhǎng)m的數(shù)p除后所得的余數(shù)為散列地址。即 H(key) = key MOD p,p<=m。不僅可以對(duì)關(guān)鍵字直接取模，也可在折疊、平方取中等運(yùn)算之后取模。對(duì)p的選擇很重要，一般取素?cái)?shù)或m，若p選的不好，容易產(chǎn)生同義詞。查找性能散列表的查找過(guò)程基本上和造表過(guò)程相同。一些關(guān)鍵碼可通過(guò)散列函數(shù)轉(zhuǎn)換的地址直接找到，另一些關(guān)鍵碼在散列函數(shù)得到的地址上產(chǎn)生了沖突，需要按處理沖突的方法進(jìn)行查找。在介紹的三種處理沖突的方法中，產(chǎn)生沖突后的查找仍然是給定值與關(guān)鍵碼進(jìn)行比較的過(guò)程。所以，對(duì)散列表查找效率的量度，依然用平均查找長(zhǎng)度來(lái)衡量。查找過(guò)程中，關(guān)鍵碼的比較次數(shù)，取決于產(chǎn)生沖突的多少，產(chǎn)生的沖突少，查找效率就高，產(chǎn)生的沖突多，查找效率就低。因此，影響產(chǎn)生沖突多少的因素，也就是影響查找效率的因素。影響產(chǎn)生沖突多少有以下三個(gè)因素:1. 散列函數(shù)是否均勻;2. 處理沖突的方法;3. 散列表的裝填因子。散列表的裝填因子定義為:α= 填入表中的元素個(gè)數(shù) / 散列表的長(zhǎng)度α是散列表裝滿程度的標(biāo)志因子。由于表長(zhǎng)是定值，α與"填入表中的元素個(gè)數(shù)"成正比，所以，α越大，填入表中的元素較多，產(chǎn)生沖突的可能性就越大;α越小，填入表中的元素較少，產(chǎn)生沖突的可能性就越小。實(shí)際上，散列表的平均查找長(zhǎng)度是裝填因子α的函數(shù)，只是不同處理沖突的方法有不同的函數(shù)。了解了hash基本定義，就不能不提到一些著名的hash算法，MD5 和 SHA-1 可以說(shuō)是目前應(yīng)用最廣泛的Hash算法，而它們都是以 MD4 為基礎(chǔ)設(shè)計(jì)的。那么他們都是什么意思呢?這里簡(jiǎn)單說(shuō)一下:⑴ MD4MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年設(shè)計(jì)的，MD 是 Message Digest 的縮寫(xiě)。它適用在32位字長(zhǎng)的處理器上用高速軟件實(shí)現(xiàn)--它是基于 32 位操作數(shù)的位操作來(lái)實(shí)現(xiàn)的。⑵ MD5MD5(RFC 1321)是 Rivest 于1991年對(duì)MD4的改進(jìn)版本。它對(duì)輸入仍以512位分組，其輸出是4個(gè)32位字的級(jí)聯(lián)，與 MD4 相同。MD5比MD4來(lái)得復(fù)雜，并且速度較之要慢一點(diǎn)，但更安全，在抗分析和抗差分方面表現(xiàn)更好⑶ SHA-1 及其他SHA1是由NIST NSA設(shè)計(jì)為同DSA一起使用的，它對(duì)長(zhǎng)度小于264的輸入，產(chǎn)生長(zhǎng)度為160bit的散列值，因此抗窮舉(brute-force)性更好。SHA-1 設(shè)計(jì)時(shí)基于和MD4相同原理，并且模仿了該算法。那么這些Hash算法到底有什么用呢?Hash算法在信息安全方面的應(yīng)用主要體現(xiàn)在以下的3個(gè)方面:⑴ 文件校驗(yàn)我們比較熟悉的校驗(yàn)算法有奇偶校驗(yàn)和CRC校驗(yàn)，這2種校驗(yàn)并沒(méi)有抗數(shù)據(jù)篡改的能力，它們一定程度上能檢測(cè)出數(shù)據(jù)傳輸中的信道誤碼，但卻不能防止對(duì)數(shù)據(jù)的惡意破壞。MD5 Hash算法的"數(shù)字指紋"特性，使它成為目前應(yīng)用最廣泛的一種文件完整性校驗(yàn)和(Checksum)算法，不少Unix系統(tǒng)有提供計(jì)算md5 checksum的命令。⑵ 數(shù)字簽名Hash 算法也是現(xiàn)代密碼體系中的一個(gè)重要組成部分。由于非對(duì)稱算法的運(yùn)算速度較慢，所以在數(shù)字簽名協(xié)議中，單向散列函數(shù)扮演了一個(gè)重要的角色。對(duì) Hash 值，又稱"數(shù)字摘要"進(jìn)行數(shù)字簽名，在統(tǒng)計(jì)上可以認(rèn)為與對(duì)文件本身進(jìn)行數(shù)字簽名是等效的。而且這樣的協(xié)議還有其他的優(yōu)點(diǎn)。⑶ 鑒權(quán)協(xié)議如下的鑒權(quán)協(xié)議又被稱作挑戰(zhàn)--認(rèn)證模式:在傳輸信道是可被偵聽(tīng)，但不可被篡改的情況下，這是一種簡(jiǎn)單而安全的方法。MD5、SHA1的破解2004年8月17日，在美國(guó)加州圣芭芭拉召開(kāi)的國(guó)際密碼大會(huì)上，山東大學(xué)王小云教授在國(guó)際會(huì)議上首次宣布了她及她的研究小組的研究成果--對(duì)MD5、HAVAL-128、MD4和RIPEMD等四個(gè)著名密碼算法的破譯結(jié)果。2005年2月宣布破解SHA-1密碼。

總結(jié)

以上是生活随笔為你收集整理的数据结构笔记第六章查找技术的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： jsp+ssm计算机毕业设计高校教师教学
下一篇： cad2016中选择全图字体怎么操作_高

编程问答

数据结构笔记 第六章 查找技术

查找技術(shù)

總結(jié)

数据结构笔记第六章查找技术