到底什么是hash?它起什么作用?
生活随笔
收集整理的這篇文章主要介紹了
到底什么是hash?它起什么作用?
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
從emule誕生到現(xiàn)在也已經(jīng)有了兩年左右時(shí)間了,隨著emule的普及,喜歡他的人也越來(lái)越多,但是由于emule對(duì)技術(shù)相應(yīng)有一個(gè)門(mén)檻,不像bt那么容易上手,所以很多朋友很長(zhǎng)時(shí)間以來(lái)一直都有這樣或那樣的疑問(wèn),今天是周末我也獻(xiàn)獻(xiàn)丑,寫(xiě)一篇關(guān)于hash的文章。
大家天天都在使用emule,hash這個(gè)詞是在emule里面出現(xiàn)頻率最高的,那么到底什么是hash呢?
讓我們先來(lái)了解一些基本知識(shí),作作預(yù)熱只有這樣才能更好的了解hash。
Hash,一般翻譯做“散列”,也有直接音譯為"哈希"的,就是把任意長(zhǎng)度的輸入(又叫做預(yù)映射, pre-image),通過(guò)散列算法,變換成固定長(zhǎng)度的輸出,該輸出就是散列值。這種轉(zhuǎn)換是一種壓縮映射,也就是,散列值的空間通常遠(yuǎn)小于輸入的空間,不同的輸入可能會(huì)散列成相同的輸出,而不可能從散列值來(lái)唯一的確定輸入值。
簡(jiǎn)單的說(shuō)就是一種將任意長(zhǎng)度的消息壓縮到某一固定長(zhǎng)度的消息摘要的函數(shù)。
HASH主要用于信息安全領(lǐng)域中加密算法,他把一些不同長(zhǎng)度的信息轉(zhuǎn)化成雜亂的128位的編碼里,叫做HASH值. 也可以說(shuō),hash就是找到一種數(shù)據(jù)內(nèi)容和數(shù)據(jù)存放地址之間的映射關(guān)系
了解了hash基本定義,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以說(shuō)是目前應(yīng)用最廣泛的Hash算法,而它們都是以 MD4 為基礎(chǔ)設(shè)計(jì)的。那么他們都是什么意思呢?
這里簡(jiǎn)單說(shuō)一下:
1) MD4
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年設(shè)計(jì)的,MD 是 Message Digest 的縮寫(xiě)。它適用在32位字長(zhǎng)的處理器上用高速軟件實(shí)現(xiàn)--它是基于 32 位操作數(shù)的位操作來(lái)實(shí)現(xiàn)的。
2) MD5
MD5(RFC 1321)是 Rivest 于1991年對(duì)MD4的改進(jìn)版本。它對(duì)輸入仍以512位分組,其輸出是4個(gè)32位字的級(jí)聯(lián),與 MD4 相同。MD5比MD4來(lái)得復(fù)雜,并且速度較之要慢一點(diǎn),但更安全,在抗分析和抗差分方面表現(xiàn)更好
3) SHA1 及其他
SHA1是由NIST NSA設(shè)計(jì)為同DSA一起使用的,它對(duì)長(zhǎng)度小于264的輸入,產(chǎn)生長(zhǎng)度為160bit的散列值,因此抗窮舉(brute-force)性更好。SHA-1 設(shè)計(jì)時(shí)基于和MD4相同原理,并且模仿了該算法。
那么這些Hash算法到底有什么用呢?
Hash算法在信息安全方面的應(yīng)用主要體現(xiàn)在以下的3個(gè)方面:
1) 文件校驗(yàn)
我們比較熟悉的校驗(yàn)算法有奇偶校驗(yàn)和CRC校驗(yàn),這2種校驗(yàn)并沒(méi)有抗數(shù)據(jù)篡改的能力,它們一定程度上能檢測(cè)并糾正數(shù)據(jù)傳輸中的信道誤碼,但卻不能防止對(duì)數(shù)據(jù)的惡意破壞。
MD5 Hash算法的"數(shù)字指紋"特性,使它成為目前應(yīng)用最廣泛的一種文件完整性校驗(yàn)和(Checksum)算法,不少Unix系統(tǒng)有提供計(jì)算md5 checksum的命令。
2) 數(shù)字簽名
Hash 算法也是現(xiàn)代密碼體系中的一個(gè)重要組成部分。由于非對(duì)稱算法的運(yùn)算速度較慢,所以在數(shù)字簽名協(xié)議中,單向散列函數(shù)扮演了一個(gè)重要的角色。 對(duì) Hash 值,又稱"數(shù)字摘要"進(jìn)行數(shù)字簽名,在統(tǒng)計(jì)上可以認(rèn)為與對(duì)文件本身進(jìn)行數(shù)字簽名是等效的。而且這樣的協(xié)議還有其他的優(yōu)點(diǎn)。
3) 鑒權(quán)協(xié)議
如下的鑒權(quán)協(xié)議又被稱作"挑戰(zhàn)--認(rèn)證模式:在傳輸信道是可被偵聽(tīng),但不可被篡改的情況下,這是一種簡(jiǎn)單而安全的方法。
以上就是一些關(guān)于hash以及其相關(guān)的一些基本預(yù)備知識(shí)。那么在emule里面他具體起到什么作用呢?
什么是文件的hash值呢?
大家都知道emule是基于P2P (Peer-to-peer的縮寫(xiě),指的是點(diǎn)對(duì)點(diǎn)的意思的軟件), 它采用了“多源文件傳輸協(xié)議”(MFTP,the Multisource FileTransfer Protocol)。在協(xié)議中,定義了一系列傳輸、壓縮和打包還有積分的標(biāo)準(zhǔn),emule 對(duì)于每個(gè)文件都有md5-hash的算法設(shè)置,這使得該文件獨(dú)一無(wú)二,并且在整個(gè)網(wǎng)絡(luò)上都可以追蹤得到。
MD5-Hash-文件的數(shù)字文摘通過(guò)Hash函數(shù)計(jì)算得到。不管文件長(zhǎng)度如何,它的Hash函數(shù)計(jì)算結(jié)果是一個(gè)固定長(zhǎng)度的數(shù)字。與加密算法不同,這一個(gè)Hash算法是一個(gè)不可逆的單向函數(shù)。采用安全性高的Hash算法,如MD5、SHA時(shí),兩個(gè)不同的文件幾乎不可能得到相同的Hash結(jié)果。因此,一旦文件被修改,就可檢測(cè)出來(lái)。
當(dāng)我們的文件放到emule里面進(jìn)行共享發(fā)布的時(shí)候,emule會(huì)根據(jù)hash算法自動(dòng)生成這個(gè)文件的hash值,他就是這個(gè)文件唯一的身份標(biāo)志,它包含了這個(gè)文件的基本信息,然后把它提交到所連接的服務(wù)器。當(dāng)有他人想對(duì)這個(gè)文件提出下載請(qǐng)求的時(shí)候, 這個(gè)hash值可以讓他人知道他正在下載的文件是不是就是他所想要的。尤其是在文件的其他屬性被更改之后(如名稱等)這個(gè)值就更顯得重要。而且服務(wù)器還提供了,這個(gè)文件當(dāng)前所在的用戶的地址,端口等信息,這樣emule就知道到哪里去下載了.
一般來(lái)講我們要搜索一個(gè)文件,emule在得到了這個(gè)信息后,會(huì)向被添加的服務(wù)器發(fā)出請(qǐng)求,要求得到有相同hash值的文件。而服務(wù)器則返回持有這個(gè)文件的用戶信息。這樣我們的客戶端就可以直接的和擁有那個(gè)文件的用戶溝通,看看是不是可以從他那里下載所需的文件。
對(duì)于emule中文件的hash值是固定的,也是唯一的,它就相當(dāng)于這個(gè)文件的信息摘要,無(wú)論這個(gè)文件在誰(shuí)的機(jī)器上,他的hash值都是不變的,無(wú)論過(guò)了多長(zhǎng)時(shí)間,這個(gè)值始終如一,當(dāng)我們?cè)谶M(jìn)行文件的下載上傳過(guò)程中,emule都是通過(guò)這個(gè)值來(lái)確定文件。
那么什么是userhash呢?
道理同上,當(dāng)我們?cè)诘谝淮问褂胑mule的時(shí)候,emule會(huì)自動(dòng)生成一個(gè)值,這個(gè)值也是唯一的,它是我們?cè)趀mule世界里面的標(biāo)志,只要你不卸載,不刪除config,你的userhash值也就永遠(yuǎn)不變,積分制度就是通過(guò)這個(gè)值在起作用,emule里面的積分保存,身份識(shí)別,都是使用這個(gè)值,而和你的id和你的用戶名無(wú)關(guān),你隨便怎么改這些東西,你的userhash值都是不變的,這也充分保證了公平性。其實(shí)他也是一個(gè)信息摘要,只不過(guò)保存的不是文件信息,而是我們每個(gè)人的信息。
那么什么是hash文件呢?
我們經(jīng)常在emule日至里面看到,emule正在hash文件,這里就是利用了hash算法的文件校驗(yàn)性這個(gè)功能了,文章前面已經(jīng)說(shuō)了一些這些功能,其實(shí)這部分是一個(gè)非常復(fù)雜的過(guò)程,目前在ftp,bt等軟件里面都是用的這個(gè)基本原理,emule里面是采用文件分塊傳輸,這樣傳輸?shù)拿恳粔K都要進(jìn)行對(duì)比校驗(yàn),如果錯(cuò)誤則要進(jìn)行重新下載,這期間這些相關(guān)信息寫(xiě)入met文件,直到整個(gè)任務(wù)完成,這個(gè)時(shí)候part文件進(jìn)行重新命名,然后使用move命令,把它傳送到incoming文件里面,然后met文件自動(dòng)刪除,所以我們有的時(shí)候會(huì)遇到hash文件失敗,就是指的是met里面的信息出了錯(cuò)誤不能夠和part文件匹配,另外有的時(shí)候開(kāi)機(jī)也要瘋狂hash,有兩種情況一種是你在第一次使用,這個(gè)時(shí)候要hash提取所有文件信息,還有一種情況就是上一次你非法關(guān)機(jī),那么這個(gè)時(shí)候就是要進(jìn)行排錯(cuò)校驗(yàn)了。
關(guān)于hash的算法研究,一直是信息科學(xué)里面的一個(gè)前沿,尤其在網(wǎng)絡(luò)技術(shù)普及的今天,他的重要性越來(lái)越突出,其實(shí)我們每天在網(wǎng)上進(jìn)行的信息交流安全驗(yàn)證,我們?cè)谑褂玫牟僮飨到y(tǒng)密鑰原理,里面都有它的身影,特別對(duì)于那些研究信息安全有興趣的朋友,這更是一個(gè)打開(kāi)信息世界的鑰匙,他在hack世界里面也是一個(gè)研究的焦點(diǎn)
大家天天都在使用emule,hash這個(gè)詞是在emule里面出現(xiàn)頻率最高的,那么到底什么是hash呢?
讓我們先來(lái)了解一些基本知識(shí),作作預(yù)熱只有這樣才能更好的了解hash。
Hash,一般翻譯做“散列”,也有直接音譯為"哈希"的,就是把任意長(zhǎng)度的輸入(又叫做預(yù)映射, pre-image),通過(guò)散列算法,變換成固定長(zhǎng)度的輸出,該輸出就是散列值。這種轉(zhuǎn)換是一種壓縮映射,也就是,散列值的空間通常遠(yuǎn)小于輸入的空間,不同的輸入可能會(huì)散列成相同的輸出,而不可能從散列值來(lái)唯一的確定輸入值。
簡(jiǎn)單的說(shuō)就是一種將任意長(zhǎng)度的消息壓縮到某一固定長(zhǎng)度的消息摘要的函數(shù)。
HASH主要用于信息安全領(lǐng)域中加密算法,他把一些不同長(zhǎng)度的信息轉(zhuǎn)化成雜亂的128位的編碼里,叫做HASH值. 也可以說(shuō),hash就是找到一種數(shù)據(jù)內(nèi)容和數(shù)據(jù)存放地址之間的映射關(guān)系
了解了hash基本定義,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以說(shuō)是目前應(yīng)用最廣泛的Hash算法,而它們都是以 MD4 為基礎(chǔ)設(shè)計(jì)的。那么他們都是什么意思呢?
這里簡(jiǎn)單說(shuō)一下:
1) MD4
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年設(shè)計(jì)的,MD 是 Message Digest 的縮寫(xiě)。它適用在32位字長(zhǎng)的處理器上用高速軟件實(shí)現(xiàn)--它是基于 32 位操作數(shù)的位操作來(lái)實(shí)現(xiàn)的。
2) MD5
MD5(RFC 1321)是 Rivest 于1991年對(duì)MD4的改進(jìn)版本。它對(duì)輸入仍以512位分組,其輸出是4個(gè)32位字的級(jí)聯(lián),與 MD4 相同。MD5比MD4來(lái)得復(fù)雜,并且速度較之要慢一點(diǎn),但更安全,在抗分析和抗差分方面表現(xiàn)更好
3) SHA1 及其他
SHA1是由NIST NSA設(shè)計(jì)為同DSA一起使用的,它對(duì)長(zhǎng)度小于264的輸入,產(chǎn)生長(zhǎng)度為160bit的散列值,因此抗窮舉(brute-force)性更好。SHA-1 設(shè)計(jì)時(shí)基于和MD4相同原理,并且模仿了該算法。
那么這些Hash算法到底有什么用呢?
Hash算法在信息安全方面的應(yīng)用主要體現(xiàn)在以下的3個(gè)方面:
1) 文件校驗(yàn)
我們比較熟悉的校驗(yàn)算法有奇偶校驗(yàn)和CRC校驗(yàn),這2種校驗(yàn)并沒(méi)有抗數(shù)據(jù)篡改的能力,它們一定程度上能檢測(cè)并糾正數(shù)據(jù)傳輸中的信道誤碼,但卻不能防止對(duì)數(shù)據(jù)的惡意破壞。
MD5 Hash算法的"數(shù)字指紋"特性,使它成為目前應(yīng)用最廣泛的一種文件完整性校驗(yàn)和(Checksum)算法,不少Unix系統(tǒng)有提供計(jì)算md5 checksum的命令。
2) 數(shù)字簽名
Hash 算法也是現(xiàn)代密碼體系中的一個(gè)重要組成部分。由于非對(duì)稱算法的運(yùn)算速度較慢,所以在數(shù)字簽名協(xié)議中,單向散列函數(shù)扮演了一個(gè)重要的角色。 對(duì) Hash 值,又稱"數(shù)字摘要"進(jìn)行數(shù)字簽名,在統(tǒng)計(jì)上可以認(rèn)為與對(duì)文件本身進(jìn)行數(shù)字簽名是等效的。而且這樣的協(xié)議還有其他的優(yōu)點(diǎn)。
3) 鑒權(quán)協(xié)議
如下的鑒權(quán)協(xié)議又被稱作"挑戰(zhàn)--認(rèn)證模式:在傳輸信道是可被偵聽(tīng),但不可被篡改的情況下,這是一種簡(jiǎn)單而安全的方法。
以上就是一些關(guān)于hash以及其相關(guān)的一些基本預(yù)備知識(shí)。那么在emule里面他具體起到什么作用呢?
什么是文件的hash值呢?
大家都知道emule是基于P2P (Peer-to-peer的縮寫(xiě),指的是點(diǎn)對(duì)點(diǎn)的意思的軟件), 它采用了“多源文件傳輸協(xié)議”(MFTP,the Multisource FileTransfer Protocol)。在協(xié)議中,定義了一系列傳輸、壓縮和打包還有積分的標(biāo)準(zhǔn),emule 對(duì)于每個(gè)文件都有md5-hash的算法設(shè)置,這使得該文件獨(dú)一無(wú)二,并且在整個(gè)網(wǎng)絡(luò)上都可以追蹤得到。
MD5-Hash-文件的數(shù)字文摘通過(guò)Hash函數(shù)計(jì)算得到。不管文件長(zhǎng)度如何,它的Hash函數(shù)計(jì)算結(jié)果是一個(gè)固定長(zhǎng)度的數(shù)字。與加密算法不同,這一個(gè)Hash算法是一個(gè)不可逆的單向函數(shù)。采用安全性高的Hash算法,如MD5、SHA時(shí),兩個(gè)不同的文件幾乎不可能得到相同的Hash結(jié)果。因此,一旦文件被修改,就可檢測(cè)出來(lái)。
當(dāng)我們的文件放到emule里面進(jìn)行共享發(fā)布的時(shí)候,emule會(huì)根據(jù)hash算法自動(dòng)生成這個(gè)文件的hash值,他就是這個(gè)文件唯一的身份標(biāo)志,它包含了這個(gè)文件的基本信息,然后把它提交到所連接的服務(wù)器。當(dāng)有他人想對(duì)這個(gè)文件提出下載請(qǐng)求的時(shí)候, 這個(gè)hash值可以讓他人知道他正在下載的文件是不是就是他所想要的。尤其是在文件的其他屬性被更改之后(如名稱等)這個(gè)值就更顯得重要。而且服務(wù)器還提供了,這個(gè)文件當(dāng)前所在的用戶的地址,端口等信息,這樣emule就知道到哪里去下載了.
一般來(lái)講我們要搜索一個(gè)文件,emule在得到了這個(gè)信息后,會(huì)向被添加的服務(wù)器發(fā)出請(qǐng)求,要求得到有相同hash值的文件。而服務(wù)器則返回持有這個(gè)文件的用戶信息。這樣我們的客戶端就可以直接的和擁有那個(gè)文件的用戶溝通,看看是不是可以從他那里下載所需的文件。
對(duì)于emule中文件的hash值是固定的,也是唯一的,它就相當(dāng)于這個(gè)文件的信息摘要,無(wú)論這個(gè)文件在誰(shuí)的機(jī)器上,他的hash值都是不變的,無(wú)論過(guò)了多長(zhǎng)時(shí)間,這個(gè)值始終如一,當(dāng)我們?cè)谶M(jìn)行文件的下載上傳過(guò)程中,emule都是通過(guò)這個(gè)值來(lái)確定文件。
那么什么是userhash呢?
道理同上,當(dāng)我們?cè)诘谝淮问褂胑mule的時(shí)候,emule會(huì)自動(dòng)生成一個(gè)值,這個(gè)值也是唯一的,它是我們?cè)趀mule世界里面的標(biāo)志,只要你不卸載,不刪除config,你的userhash值也就永遠(yuǎn)不變,積分制度就是通過(guò)這個(gè)值在起作用,emule里面的積分保存,身份識(shí)別,都是使用這個(gè)值,而和你的id和你的用戶名無(wú)關(guān),你隨便怎么改這些東西,你的userhash值都是不變的,這也充分保證了公平性。其實(shí)他也是一個(gè)信息摘要,只不過(guò)保存的不是文件信息,而是我們每個(gè)人的信息。
那么什么是hash文件呢?
我們經(jīng)常在emule日至里面看到,emule正在hash文件,這里就是利用了hash算法的文件校驗(yàn)性這個(gè)功能了,文章前面已經(jīng)說(shuō)了一些這些功能,其實(shí)這部分是一個(gè)非常復(fù)雜的過(guò)程,目前在ftp,bt等軟件里面都是用的這個(gè)基本原理,emule里面是采用文件分塊傳輸,這樣傳輸?shù)拿恳粔K都要進(jìn)行對(duì)比校驗(yàn),如果錯(cuò)誤則要進(jìn)行重新下載,這期間這些相關(guān)信息寫(xiě)入met文件,直到整個(gè)任務(wù)完成,這個(gè)時(shí)候part文件進(jìn)行重新命名,然后使用move命令,把它傳送到incoming文件里面,然后met文件自動(dòng)刪除,所以我們有的時(shí)候會(huì)遇到hash文件失敗,就是指的是met里面的信息出了錯(cuò)誤不能夠和part文件匹配,另外有的時(shí)候開(kāi)機(jī)也要瘋狂hash,有兩種情況一種是你在第一次使用,這個(gè)時(shí)候要hash提取所有文件信息,還有一種情況就是上一次你非法關(guān)機(jī),那么這個(gè)時(shí)候就是要進(jìn)行排錯(cuò)校驗(yàn)了。
關(guān)于hash的算法研究,一直是信息科學(xué)里面的一個(gè)前沿,尤其在網(wǎng)絡(luò)技術(shù)普及的今天,他的重要性越來(lái)越突出,其實(shí)我們每天在網(wǎng)上進(jìn)行的信息交流安全驗(yàn)證,我們?cè)谑褂玫牟僮飨到y(tǒng)密鑰原理,里面都有它的身影,特別對(duì)于那些研究信息安全有興趣的朋友,這更是一個(gè)打開(kāi)信息世界的鑰匙,他在hack世界里面也是一個(gè)研究的焦點(diǎn)
總結(jié)
以上是生活随笔為你收集整理的到底什么是hash?它起什么作用?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 怎么焖猪脚最好吃
- 下一篇: 淘宝网7年变化图--建议非美工UED人员